Jak exportovat data z R.
V tomto kurzu se naučíme, jak exportovat data z prostředí R do různých formátů.
Chcete-li exportovat data na pevný disk, potřebujete cestu k souboru a příponu. Nejprve je cesta místem, kde budou data uložena. V tomto tutoriálu uvidíte, jak ukládat data na:
- Pevný disk
- Disk Google
- Dropbox
Za druhé, R umožňuje uživatelům exportovat data do různých typů souborů. Pokrýváme základní příponu souboru:
- CSV
- xlsx
- RDS
- SAS
- SPSS
- STATA
Celkově není obtížné exportovat data z R.
V tomto výukovém programu se naučíte
- Export na pevný disk
- Jak exportovat datový rámec do souboru CSV v R.
- Jak exportovat data z R do souboru Excel
- Export dat z R do jiného softwaru
- Export dat ze souboru R do souboru SAS
- Jak exportovat data z R do souboru STATA
- Interakce s cloudovými službami
- Disk Google
- Export do Dropboxu
Export na pevný disk
Nejprve můžete data uložit přímo do pracovního adresáře. Následující kód vytiskne cestu k vašemu pracovnímu adresáři:
directory <-getwd()directory
Výstup:
## [1] "/Users/15_Export_to_do"
Ve výchozím nastavení se soubor uloží do níže uvedené cesty.
Pro Mac OS:
/Users/USERNAME/Downloads/
Pro Windows:
C:\Users\USERNAME\Documents\
Samozřejmě můžete nastavit jinou cestu. Můžete například změnit cestu ke složce pro stahování.
Vytvořte datový rámec
Nejprve importujme datovou sadu mtcars a získáme průměr mpg a disp seskupený podle zařízení.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Výstup :
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
Tabulka obsahuje tři řádky a tři sloupce. Soubor CSV můžete vytvořit pomocí funkce write.csv v R.
Jak exportovat datový rámec do souboru CSV v R.
Základní syntaxe write.csv v R pro export DataFrame do CSV v R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Příklad:
write.csv(df, "table_car.csv")
Vysvětlení kódu
- write.csv (df, "table_car.csv"): Vytvořte soubor CSV na pevném disku:
- df: název datového rámce v prostředí
- "table_car.csv": Pojmenujte soubor table_car a uložte jej jako csv
Poznámka : Funkci write.csv v R můžete použít jako write.csv2 () k oddělení řádků středníkem pro export R do dat csv.
write.csv2(df, "table_car.csv")
Poznámka : Pouze pro pedagogické účely jsme vytvořili funkci nazvanou open_folder (), která vám otevře adresářovou složku. Musíte pouze spustit níže uvedený kód a zjistit, kde je uložen soubor CSV. Měli byste vidět názvy souborů table_car.csv pro export dat R do csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Jak exportovat data z R do souboru Excel
Nyní se naučíme, jak exportovat data z R do Excelu:
Export dat z R do Excelu je pro uživatele Windows triviální a pro uživatele Mac OS složitější. Oba uživatelé použijí knihovnu xlsx k vytvoření souboru Excel. Mírný rozdíl pochází z instalace knihovny. Ve skutečnosti knihovna xlsx používá k vytvoření souboru Javu. Pro export dat R do aplikace Excel je třeba nainstalovat Java, pokud není ve vašem zařízení k dispozici.
Uživatelé Windows
Pokud jste uživatelem systému Windows, můžete nainstalovat knihovnu přímo s conda a exportovat datový rámec do aplikace Excel R:
conda install -c r r-xlsx
Po instalaci knihovny můžete použít funkci write.xlsx (). V pracovním adresáři je vytvořen nový sešit aplikace Excel pro export R do dat aplikace Excel
library(xlsx)write.xlsx(df, "table_car.xlsx")
Pokud jste uživatelem systému Mac OS, musíte postupovat podle těchto kroků:
- Krok 1: Nainstalujte nejnovější verzi prostředí Java
- Krok 2: Nainstalujte knihovnu rJava
- Krok 3: Nainstalujte knihovnu xlsx
Krok 1) Můžete si stáhnout Javu z oficiálních stránek Oracle a nainstalovat ji.
Můžete se vrátit do Rstudia a zkontrolovat, která verze Java je nainstalována.
system("java -version")
V době výuky je nejnovější verze Javy 9.0.4.
Krok 2) Musíte nainstalovat rjava do R. Doporučili jsme vám nainstalovat R a Rstudio pomocí Anacondy. Anaconda spravuje závislosti mezi knihovnami. V tomto smyslu bude Anaconda řešit složitost instalace rJava.
Nejprve musíte aktualizovat conda a poté nainstalovat knihovnu. Další dva řádky kódu můžete zkopírovat a vložit do terminálu.
conda - conda updateconda install -c r r-rjava
Dále otevřete rjavu v Rstudiu
library(rJava)
Krok 3) Konečně je čas nainstalovat xlsx. Opět můžete k tomu použít conda:
conda install -c r r-xlsx
Stejně jako uživatelé systému Windows můžete data ukládat pomocí funkce write.xlsx ()
library(xlsx)
Výstup:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Export dat z R do jiného softwaru
Export dat do jiného softwaru je stejně jednoduchý jako jejich import. Knihovna „útočiště“ poskytuje pohodlný způsob exportu dat
- spss
- sas
- Stata
Nejprve importujte knihovnu. Pokud nemáte „útočiště“, můžete jej nainstalovat zde.
library(haven)
Soubor SPSS
Níže je uveden kód pro export dat do softwaru SPSS:
write_sav(df, "table_car.sav")
Export dat ze souboru R do souboru SAS
Stejně jednoduché jako spss můžete exportovat do sas
write_sas(df, "table_car.sas7bdat")
Jak exportovat data z R do souboru STATA
Nakonec útočiště knihovna umožňuje psaní souboru .dta.
write_dta(df, "table_car.dta")
R
Pokud chcete uložit datový rámec nebo jakýkoli jiný objekt R, můžete použít funkci save ().
save(df, file ='table_car.RData')
Soubory vytvořené výše můžete zkontrolovat v tomto pracovním adresáři
Interakce s cloudovými službami
V neposlední řadě je R vybaven fantastickými knihovnami pro interakci s cloudovými výpočetními službami. Poslední část tohoto tutoriálu se zabývá exportem / importem souborů z:
- Disk Google
- Dropbox
Poznámka : Tato část tutoriálu předpokládá, že máte účet u Google a Dropbox. Pokud ne, můžete si jej rychle vytvořit pro - Disk Google: https://accounts.google.com/SignUp?hl=cs - Dropbox: https://www.dropbox.com/h
Disk Google
Musíte mít nainstalovanou knihovnu googledrive pro přístup k funkci umožňující interakci s Diskem Google.
Knihovna zatím není v Anacondě k dispozici. Můžete jej nainstalovat pomocí níže uvedeného kódu v konzole.
install.packages("googledrive")
a otevřete knihovnu.
library(googledrive)
Pro uživatele bez Condy je instalace knihovny snadná, můžete použít funkci install.packages ('NAME OF PACKAGE) s názvem balíčku uvnitř závorky. Nezapomeňte na ''. Všimněte si, že R má nainstalovat balíček do `libPaths () automaticky. Stojí za to vidět to v akci.
Nahrajte na Disk Google
Chcete-li nahrát soubor na disk Google, musíte použít funkci drive_upload ().
Pokaždé, když restartujete Rstudio, budete vyzváni k povolení uklizeného přístupu na Disk Google.
Základní syntaxe drive_upload () je
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Po spuštění kódu musíte potvrdit několik otázek
drive_upload%<("table_car.csv", name ="table_car")
Výstup:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
Zadejte 1 do konzoly pro potvrzení přístupu
Poté budete přesměrováni na rozhraní Google API, abyste přístup povolili. Klikněte na Povolit.
Po dokončení ověřování můžete prohlížeč ukončit.
V konzole Rstudio vidíte souhrn provedeného kroku. Google úspěšně nahrál soubor umístěný místně na Disk. Google každému souboru na jednotce přidělil ID.
Tento soubor můžete vidět v tabulce Google.
drive_browse("table_car")
Výstup:
Budete přesměrováni do tabulky Google
Import z Disku Google
Nahrávání souboru z Disku Google s ID je pohodlné. Pokud znáte název souboru, můžete jeho ID získat následovně:
Poznámka : V závislosti na vašem připojení k internetu a velikosti vašeho Disku to nějakou dobu trvá.
x <-drive_get("table_car")as_id(x)
ID jste uložili do proměnné x. Funkce drive_download () umožňuje stažení souboru z Disku Google.
Základní syntaxe je:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Soubor si můžete konečně stáhnout:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Vysvětlení kódu
- drive_download (): Funkce pro stažení souboru z Disku Google
- as_id (x): Použijte ID k procházení souboru na Disku Google
- overwrite = TRUE: Pokud soubor existuje, přepište jej, jinak bylo provádění zastaveno Chcete-li lokálně zobrazit název souboru, můžete použít:
Výstup:
Soubor je uložen ve vašem pracovním adresáři. Nezapomeňte, že pro otevření v R. musíte přidat příponu souboru. Celé jméno můžete vytvořit pomocí funkce paste () (tj. Table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Výstup:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Nakonec můžete soubor odebrat z disku Google.
## remove filedrive_find("table_car") %>%drive_rm()
Výstup:
Je to pomalý proces. Odstranění nějakou dobu trvá
Export do Dropboxu
R interaguje s Dropboxem prostřednictvím knihovny rdrop2. Knihovna není k dispozici také v Anacondě. Můžete jej nainstalovat pomocí konzoly
install.packages('rdrop2')
library(rdrop2)
Musíte poskytnout dočasný přístup k Dropboxu pomocí svých přihlašovacích údajů. Po dokončení identifikace může R vytvořit, odebrat upload a download do vašeho Dropboxu.
Nejprve musíte dát přístup ke svému účtu. Pověření se ukládají do mezipaměti během celé relace.
drop_auth()
Budete přesměrováni na Dropbox, abyste potvrdili ověření.
Zobrazí se stránka s potvrzením. Můžete jej zavřít a vrátit se k R
Složku můžete vytvořit pomocí funkce drop_create ().
- drop_create ('my_first_drop'): Vytvořte složku v první větvi Dropboxu
- drop_create ('First_branch / my_first_drop'): Vytvořte složku uvnitř existující složky First_branch.
drop_create('my_first_drop')
Výstup:
V DropBoxu
Chcete-li nahrát soubor CSV do Dropboxu, použijte funkci drop_upload ().
Základní syntaxe:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Výstup:
Na DropBoxu
Soubor csv můžete číst z Dropboxu pomocí funkce drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Výstup:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Až budete soubor používat a chcete jej smazat. Musíte napsat cestu k souboru ve funkci drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Výstup:
Je také možné odstranit složku
drop_delete('my_first_drop')
Výstup:
souhrn
Můžeme shrnout všechny funkce v tabulce níže
Knihovna |
Objektivní |
Funkce |
---|---|---|
základna |
Export csv |
write.csv () |
xlsx |
Exportovat Excel |
write.xlsx () |
útočiště |
Exportovat spss |
write_sav () |
útočiště |
Exportovat sas |
write_sas () |
útočiště |
Exportovat údaje |
write_dta () |
základna |
Exportovat R. |
Uložit() |
Disk Google |
Nahrajte Disk Google |
drive_upload () |
Disk Google |
Otevřít na Disku Google |
drive_browse () |
Disk Google |
Načíst ID souboru |
drive_get (as_id ()) |
Disk Google |
Stáhnout z Disku Google |
download_google () |
Disk Google |
Odebrat soubor z Disku Google |
drive_rm () |
rdrop2 |
Ověřování |
drop_auth () |
rdrop2 |
Vytvořte složku |
drop_create () |
rdrop2 |
Nahrajte do Dropboxu |
drop_upload () |
rdrop2 |
Přečtěte si CSV z Dropboxu |
drop_read_csv |
rdrop2 |
Odstraňte soubor z Dropboxu |
drop_delete () |