Salah satu hal dasar dalam pengolahan data yaitu terhubung dengan data. Untuk mengetahui caranya, kita akan mempelajari proses antarmuka data menggunakan program R. Sebagai pemula, kita cukup mengetahui proses sederhananya terlebih dahulu. Program R dapat membaca data dari suatu file yang tersimpan dimanapun serta dalam berbagai formatnya seperti csv, excel, txt, rds, xml, json, dan lain-lain serta dapat menyimpannya kembali.
Impor/Ekspor CSV
Proses impor/ekspor data menggunakan R bisa dengan berbagai cara. Hal ini juga harus diperhatikan format filenya karena tiap format menggunakan cara yang berbeda. Untuk file yang berformat csv bisa menggunakan 3 cara berikut ini :
Cara 1
Mula-mula kita perhatikan apakah direktori kerjanya sudah benar atau belum yaitu dengan memeriksannya menggunakan fungsi ‘getwd()’. Setelah itu, kita sudah bisa mengatur direktori kerja baru dengan fungsi ‘setwd()’. Kemudian, impor data tersebut dengan fungsi ‘read.csv()’. Sedangkan, untuk mengekspor data tersebut bisa menggunakan fungsi ‘write.csv()’ dan setelahnya yaitu bisa menggunakan fungsi ‘write.csv2()’. Sesuaikan juga dengan pemisahnya antara koma ‘(“,”)’ atau semicolon ‘(“;”)’.
print(getwd())
## [1] "C:/Users/Lenovo/Documents/data"
getwd()
## [1] "C:/Users/Lenovo/Documents/data"
setwd(getwd())df1 <-read.csv("input/input1.csv",sep =",") # format pemisah koma df2 <-read.csv("input/input2.csv",sep =";") # format pemisah titik komawrite.csv(df1,"output/test1.csv", row.names =TRUE)write.csv(df2,"output/test2.csv", row.names =TRUE)
Cara 2
Cara kedua merupakan cara yang bijak dan praktis yaitu koneksi direktorinya secara automatis. Simak caranya berikut ini :
Cara ketiga dapat digunakan kita yang menggunakan file atau data yang tersimpan di komputer. Berbeda dengan sebelumnya yang memerlukan koneksi direktori, cukup memilih file yang diperlukan maka kita bisa melakukan proses impor data.
df3 <-read.csv(file.choose())
Untuk proses antarmuka data lainnya hanya menggunakan satu cara saja.
Impor/Ekspor Excel
Microsoft excel sering digunakan untuk menyimpan data. Biasanya data tersimpan dalam format .xls atau .xlsx. Untuk mengimpor atau mengekspor excel menggunakan R bisa menggunakan cara sebagai berikut :
Ukuran file TXT dan RDS lebih ringan daripada CSV ataupun XLSX. Maka, cara ini sangat sesuai dengan kita yang tidak ingin menyimpan file dengan ukuran besar. Berikut cara impor/ekspor TXT dan RDS :
# impor datadf5 <-read.table("input/input5.txt") # format TXT (notepad)df6 <-source("input/input6.Rdmpd") # format TXT (Rdmpd)df7 <-readRDS("input/input7.rds") # format binary RDSdf8 <-readRDS("input/input8.ascii") # format binary ASCII# ekspor datawrite.table(df5,"output/output5.txt")dump("df6", "output/output6.Rdmpd")saveRDS(df7, "output/output7.rds")saveRDS(df8, "output/output8.ascii", ascii =TRUE)
Impor/Ekspor XML
Extensible Markup Language (XML) bisa membantu kita memahami struktur data dasar suatu file. XML mirip dengan HTML hanya saja fungsinya berbeda. XML berfungsi untuk menyimpan dan mengirimkan data (impor/ekspor). Sedangkan, HTML berfungsi untuk menampilkan data. Untuk mengetahui proses impor/ekspor XML, perhatikan cara berikut ini :
JavaScript Object Notation (JSON) biasanya digunakan untuk mentransfer data dan bisa dibaca oleh penerima data. Untuk membaca file JSON bisa menggunakan R dengan paket ‘jsonlite’. Perhatikan cara impor/ekspor berikut ini :
Dalam internet terdapat website yang memberikan informasi suatu data. Biasanya data tersebut digunakan oleh penggunanya. Kita bisa mengimpor data tersebut menggunakan R dengan cara berikut ini :
Sistem ialah kumpulan komponen saling berhubungan yang disatukan dengan suatu tujuan. Basis data ialah objek yang membutuhkan program sebagai pengelolanya. Maka dihasilkanlah sistem basis data dari basis data dan program tersebut. Sistem basis data adalah sistem yang terdiri atas kumpulan tabel data yang saling berhubungan dan kumpulan program yang memungkinkan beberapa pemakai atau program lain untuk mengakses dan memanipulasi tabel tabel data tersebut.
Kita bisa menghubungkan suatu data ke database relasional misalnya MySql, Oracle, SQL Server, dan sebagainya menggunakan R. Lalu kita ubah basis datanya menjadi data frame. Jika data sudah terdapat dalam R, data tersebut bisa dianalisis bahkan dimanipulasi.
Menambang Data Web
Webscraping Data ialah proses pengambilan data dari sebuah website. Berbeda dengan web scraping (hanya menyalin piksel yang ditampilkan), web scraping mengekstrak kode HTML yang mendasarinya yang pada dasarnya disimpan dalam database. Pengikisan data ini dapat mereplikasi seluruh konten dari berbagai situs web yang target.