Export dat z R: Jak exportovat data z R do CSV, Excel

Obsah:

Anonim

Jak exportovat data z R.

V tomto kurzu se naučíme, jak exportovat data z prostředí R do různých formátů.

Chcete-li exportovat data na pevný disk, potřebujete cestu k souboru a příponu. Nejprve je cesta místem, kde budou data uložena. V tomto tutoriálu uvidíte, jak ukládat data na:

  • Pevný disk
  • Disk Google
  • Dropbox

Za druhé, R umožňuje uživatelům exportovat data do různých typů souborů. Pokrýváme základní příponu souboru:

  • CSV
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Celkově není obtížné exportovat data z R.

V tomto výukovém programu se naučíte

  • Export na pevný disk
  • Jak exportovat datový rámec do souboru CSV v R.
  • Jak exportovat data z R do souboru Excel
  • Export dat z R do jiného softwaru
  • Export dat ze souboru R do souboru SAS
  • Jak exportovat data z R do souboru STATA
  • Interakce s cloudovými službami
  • Disk Google
  • Export do Dropboxu

Export na pevný disk

Nejprve můžete data uložit přímo do pracovního adresáře. Následující kód vytiskne cestu k vašemu pracovnímu adresáři:

directory <-getwd()directory

Výstup:

## [1] "/Users/15_Export_to_do" 

Ve výchozím nastavení se soubor uloží do níže uvedené cesty.

Pro Mac OS:

/Users/USERNAME/Downloads/ 

Pro Windows:

C:\Users\USERNAME\Documents\

Samozřejmě můžete nastavit jinou cestu. Můžete například změnit cestu ke složce pro stahování.

Vytvořte datový rámec

Nejprve importujme datovou sadu mtcars a získáme průměr mpg a disp seskupený podle zařízení.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Výstup :

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Tabulka obsahuje tři řádky a tři sloupce. Soubor CSV můžete vytvořit pomocí funkce write.csv v R.

Jak exportovat datový rámec do souboru CSV v R.

Základní syntaxe write.csv v R pro export DataFrame do CSV v R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Příklad:

write.csv(df, "table_car.csv")

Vysvětlení kódu

  • write.csv (df, "table_car.csv"): Vytvořte soubor CSV na pevném disku:
    • df: název datového rámce v prostředí
    • "table_car.csv": Pojmenujte soubor table_car a uložte jej jako csv

Poznámka : Funkci write.csv v R můžete použít jako write.csv2 () k oddělení řádků středníkem pro export R do dat csv.

write.csv2(df, "table_car.csv")

Poznámka : Pouze pro pedagogické účely jsme vytvořili funkci nazvanou open_folder (), která vám otevře adresářovou složku. Musíte pouze spustit níže uvedený kód a zjistit, kde je uložen soubor CSV. Měli byste vidět názvy souborů table_car.csv pro export dat R do csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Jak exportovat data z R do souboru Excel

Nyní se naučíme, jak exportovat data z R do Excelu:

Export dat z R do Excelu je pro uživatele Windows triviální a pro uživatele Mac OS složitější. Oba uživatelé použijí knihovnu xlsx k vytvoření souboru Excel. Mírný rozdíl pochází z instalace knihovny. Ve skutečnosti knihovna xlsx používá k vytvoření souboru Javu. Pro export dat R do aplikace Excel je třeba nainstalovat Java, pokud není ve vašem zařízení k dispozici.

Uživatelé Windows

Pokud jste uživatelem systému Windows, můžete nainstalovat knihovnu přímo s conda a exportovat datový rámec do aplikace Excel R:

conda install -c r r-xlsx

Po instalaci knihovny můžete použít funkci write.xlsx (). V pracovním adresáři je vytvořen nový sešit aplikace Excel pro export R do dat aplikace Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Pokud jste uživatelem systému Mac OS, musíte postupovat podle těchto kroků:

  • Krok 1: Nainstalujte nejnovější verzi prostředí Java
  • Krok 2: Nainstalujte knihovnu rJava
  • Krok 3: Nainstalujte knihovnu xlsx

Krok 1) Můžete si stáhnout Javu z oficiálních stránek Oracle a nainstalovat ji.

Můžete se vrátit do Rstudia a zkontrolovat, která verze Java je nainstalována.

system("java -version")

V době výuky je nejnovější verze Javy 9.0.4.

Krok 2) Musíte nainstalovat rjava do R. Doporučili jsme vám nainstalovat R a Rstudio pomocí Anacondy. Anaconda spravuje závislosti mezi knihovnami. V tomto smyslu bude Anaconda řešit složitost instalace rJava.

Nejprve musíte aktualizovat conda a poté nainstalovat knihovnu. Další dva řádky kódu můžete zkopírovat a vložit do terminálu.

conda - conda updateconda install -c r r-rjava

Dále otevřete rjavu v Rstudiu

library(rJava)

Krok 3) Konečně je čas nainstalovat xlsx. Opět můžete k tomu použít conda:

conda install -c r r-xlsx

Stejně jako uživatelé systému Windows můžete data ukládat pomocí funkce write.xlsx ()

library(xlsx)

Výstup:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Export dat z R do jiného softwaru

Export dat do jiného softwaru je stejně jednoduchý jako jejich import. Knihovna „útočiště“ poskytuje pohodlný způsob exportu dat

  • spss
  • sas
  • Stata

Nejprve importujte knihovnu. Pokud nemáte „útočiště“, můžete jej nainstalovat zde.

library(haven) 

Soubor SPSS

Níže je uveden kód pro export dat do softwaru SPSS:

write_sav(df, "table_car.sav") 

Export dat ze souboru R do souboru SAS

Stejně jednoduché jako spss můžete exportovat do sas

write_sas(df, "table_car.sas7bdat")

Jak exportovat data z R do souboru STATA

Nakonec útočiště knihovna umožňuje psaní souboru .dta.

write_dta(df, "table_car.dta")

R

Pokud chcete uložit datový rámec nebo jakýkoli jiný objekt R, můžete použít funkci save ().

save(df, file ='table_car.RData')

Soubory vytvořené výše můžete zkontrolovat v tomto pracovním adresáři

Interakce s cloudovými službami

V neposlední řadě je R vybaven fantastickými knihovnami pro interakci s cloudovými výpočetními službami. Poslední část tohoto tutoriálu se zabývá exportem / importem souborů z:

  • Disk Google
  • Dropbox

Poznámka : Tato část tutoriálu předpokládá, že máte účet u Google a Dropbox. Pokud ne, můžete si jej rychle vytvořit pro - Disk Google: https://accounts.google.com/SignUp?hl=cs - Dropbox: https://www.dropbox.com/h

Disk Google

Musíte mít nainstalovanou knihovnu googledrive pro přístup k funkci umožňující interakci s Diskem Google.

Knihovna zatím není v Anacondě k dispozici. Můžete jej nainstalovat pomocí níže uvedeného kódu v konzole.

install.packages("googledrive") 

a otevřete knihovnu.

library(googledrive)

Pro uživatele bez Condy je instalace knihovny snadná, můžete použít funkci install.packages ('NAME OF PACKAGE) s názvem balíčku uvnitř závorky. Nezapomeňte na ''. Všimněte si, že R má nainstalovat balíček do `libPaths () automaticky. Stojí za to vidět to v akci.

Nahrajte na Disk Google

Chcete-li nahrát soubor na disk Google, musíte použít funkci drive_upload ().

Pokaždé, když restartujete Rstudio, budete vyzváni k povolení uklizeného přístupu na Disk Google.

Základní syntaxe drive_upload () je

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Po spuštění kódu musíte potvrdit několik otázek

drive_upload%<("table_car.csv", name ="table_car")

Výstup:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Zadejte 1 do konzoly pro potvrzení přístupu

Poté budete přesměrováni na rozhraní Google API, abyste přístup povolili. Klikněte na Povolit.

Po dokončení ověřování můžete prohlížeč ukončit.

V konzole Rstudio vidíte souhrn provedeného kroku. Google úspěšně nahrál soubor umístěný místně na Disk. Google každému souboru na jednotce přidělil ID.

Tento soubor můžete vidět v tabulce Google.

drive_browse("table_car")

Výstup:

Budete přesměrováni do tabulky Google

Import z Disku Google

Nahrávání souboru z Disku Google s ID je pohodlné. Pokud znáte název souboru, můžete jeho ID získat následovně:

Poznámka : V závislosti na vašem připojení k internetu a velikosti vašeho Disku to nějakou dobu trvá.

x <-drive_get("table_car")as_id(x)

ID jste uložili do proměnné x. Funkce drive_download () umožňuje stažení souboru z Disku Google.

Základní syntaxe je:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Soubor si můžete konečně stáhnout:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Vysvětlení kódu

  • drive_download (): Funkce pro stažení souboru z Disku Google
  • as_id (x): Použijte ID k procházení souboru na Disku Google
  • overwrite = TRUE: Pokud soubor existuje, přepište jej, jinak bylo provádění zastaveno Chcete-li lokálně zobrazit název souboru, můžete použít:

Výstup:

Soubor je uložen ve vašem pracovním adresáři. Nezapomeňte, že pro otevření v R. musíte přidat příponu souboru. Celé jméno můžete vytvořit pomocí funkce paste () (tj. Table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Výstup:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Nakonec můžete soubor odebrat z disku Google.

## remove filedrive_find("table_car") %>%drive_rm()

Výstup:

Je to pomalý proces. Odstranění nějakou dobu trvá

Export do Dropboxu

R interaguje s Dropboxem prostřednictvím knihovny rdrop2. Knihovna není k dispozici také v Anacondě. Můžete jej nainstalovat pomocí konzoly

install.packages('rdrop2')
library(rdrop2)

Musíte poskytnout dočasný přístup k Dropboxu pomocí svých přihlašovacích údajů. Po dokončení identifikace může R vytvořit, odebrat upload a download do vašeho Dropboxu.

Nejprve musíte dát přístup ke svému účtu. Pověření se ukládají do mezipaměti během celé relace.

drop_auth()

Budete přesměrováni na Dropbox, abyste potvrdili ověření.

Zobrazí se stránka s potvrzením. Můžete jej zavřít a vrátit se k R

Složku můžete vytvořit pomocí funkce drop_create ().

  • drop_create ('my_first_drop'): Vytvořte složku v první větvi Dropboxu
  • drop_create ('First_branch / my_first_drop'): Vytvořte složku uvnitř existující složky First_branch.
drop_create('my_first_drop')

Výstup:

V DropBoxu

Chcete-li nahrát soubor CSV do Dropboxu, použijte funkci drop_upload ().

Základní syntaxe:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Výstup:

Na DropBoxu

Soubor csv můžete číst z Dropboxu pomocí funkce drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Výstup:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Až budete soubor používat a chcete jej smazat. Musíte napsat cestu k souboru ve funkci drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Výstup:

Je také možné odstranit složku

drop_delete('my_first_drop')

Výstup:

souhrn

Můžeme shrnout všechny funkce v tabulce níže

Knihovna

Objektivní

Funkce

základna

Export csv

write.csv ()

xlsx

Exportovat Excel

write.xlsx ()

útočiště

Exportovat spss

write_sav ()

útočiště

Exportovat sas

write_sas ()

útočiště

Exportovat údaje

write_dta ()

základna

Exportovat R.

Uložit()

Disk Google

Nahrajte Disk Google

drive_upload ()

Disk Google

Otevřít na Disku Google

drive_browse ()

Disk Google

Načíst ID souboru

drive_get (as_id ())

Disk Google

Stáhnout z Disku Google

download_google ()

Disk Google

Odebrat soubor z Disku Google

drive_rm ()

rdrop2

Ověřování

drop_auth ()

rdrop2

Vytvořte složku

drop_create ()

rdrop2

Nahrajte do Dropboxu

drop_upload ()

rdrop2

Přečtěte si CSV z Dropboxu

drop_read_csv

rdrop2

Odstraňte soubor z Dropboxu

drop_delete ()