R (juga dikenal sebagai GNU S) adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik. Terhubung dengan sebuah data merupakan hal paling mendasar dalam proses olah data (Data Science). Dibawah ini akan di jelaskan bagaimana proses antarmuka data yang paling sederhana menggunakan R. Secara singkatnya, R dapat membaca data dari file yang disimpan didalam ataupun diluar direktorinya.Sistem operasi R juga dapat menyimpan dan membaca data dalam berbagai format file seperti csv, excel, txt, rds, xml, json, dan lain-lain.
Impor/Ekspor csv
Beikut ini adalah beberapa cara yang dapat dilakukan dalam impor/ekspor data menggunakan R.
Cara 1
Menggunakan fungsi getwd() untuk mengetahui direktori yang sedang digunakan.
print(getwd())
## [1] "C:/Users/MASTER/Documents/Algoritmabaru"
getwd()
## [1] "C:/Users/MASTER/Documents/Algoritmabaru"
setwd() digunakan untuk mengatur direktori kerja baru.
setwd(getwd())
Kemudian, mengimpor data CSV menggunakan fungsi read.csv().
# impor datadf1 <-read.csv("INPUT/input1.csv",sep =",") # format pemisah koma df2 <-read.csv("INPUT/input2.csv",sep =";") # format pemisah titik koma
write.csv() fungsi yang digunakan untuk mengekspor data yang diinginkan ke direktori.
# ekspor data write.csv(df1, file.path(WD, "OUTPUT", "output1"))write.csv(df1, file.path(WD, "OUTPUT", "output2"))
Cara 3
Cara terakhir tidak perlu melakukan pengaturan direktori terlebih dahulu sebelum melakukan proses mengimpor data hanya perlu memilih data yang tersimpan di pc.
# digunakan untuk memilih datadf3 <-read.csv(file.choose())
Impor/Ekspor Exel
Fungsi readxl dapat membaca langsung file data dari exel yang tersimpan dalam format xls/xlsl.
# untuk menginstall packages readxl, writexl, dan pacman pacman::p_load(readxl, writexl)
# impor datadf3<-read_excel('INPUT/input4.xls') # impor data xls (97-2003)df4<-read_excel("INPUT/input3.xlsx",sheet=1)# impor data xlsx (2003-up)
Saat melakukan impor/ekspor disarankan menggunakan format TXT atau RDS karena ukuran file lebih kecil dibandingkan CSV atau XLSX. Sehingga dapat dengan cepat melakukan impor/ekspor data.
# cara untuk mengimpor data df5 <-read.table("INPUT/input5.txt") # format TXT (notepad)df6 <-source("INPUT/input6.Rdmpd") # format TXT (Rdmp)df7 <-readRDS("INPUT/input7.rds") # format binary RDSdf8 <-readRDS("INPUT/input8.ascii") # format binary ASCII
# cara untuk mengekspor datawrite.table(df5,"OUTPUT/output5.txt")dump("df6", "OUTPUT/output6.Rdmp")saveRDS(df7, "OUTPUT/output7.rds")saveRDS(df8, "OUTPUT/output8.ascii", ascii =TRUE)
Impor/Ekspor XML
XML merupakan kumpulan dari berbagai format file dan data di World Wide Web, intranet menggunakan teks ASCII standar.
Sebelum melakukan impor/ekspor data Install packages terlebih dahulu seperti dibawah ini.
library("XML")library("kulife")library("methods")
# impor data ke XMLdf9 <-xmlParse("INPUT/input9.xml")
# konversi ke data framexml_df <-xmlToDataFrame(df9)
# ekspor data ke XMLwrite.xml(xml_df, "OUTPUT/output9.xml")
Impor/Ekspor JSON
JSON adalah singkatan dari JavaScript Object Notation. Fungsi jsonlite di R dapat membaca file JSON.
Sistem basis data merupakan sebuah data yang di relasional dan disimpan dalam format yang dinormalisasi. R bisa terhubung dengan mudah ke banyak database relasional seperti MySql, Oracle, SQL Server, dan lain-lain.
Menambang Data Web
Menambang data web atau Webscraping Data merupakan sebuah proses menggunakan bot untuk mengekstrak konten dan data dari suatu situs web. Web Scraping dapat mengekstrak suatu kode HTML dasar yang pada dasarnya disimpan dalam database.