Algoritma & Struktur Data

~ Antarmuka Data dengan R ~


Kontak : \(\downarrow\)
Email
Jurusan Fisika Medis
RPubs https://rpubs.com/sharongracia/

Hal mendasar yang diperlukan dalam olah data adalah terhubung dengan data.

Berikut adalah cara impor/ekspor data dalam berbagai format file:

Impor/Ekspor CSV

Terdapat tiga cara yang paling sering dilakukan dalam impor/ekspor data CSV di R:

Cara 1

print(getwd())
## [1] "C:/Users/YEPRI/Desktop/data"
getwd()
## [1] "C:/Users/YEPRI/Desktop/data"
setwd(getwd())
df1 <-read.csv("input/input1.csv", sep = ",")                       # format pemisah tanda 'koma'
df2 <-read.csv("input/input2.csv", sep = ";")                       # format pemisah tanda 'titik koma'

write.csv(df1,"output/output1.csv", row.names = TRUE)
write.csv2(df2,"output/output2.csv", row.names = TRUE)

Cara 2

#pengaturan direkori
(WD <- getwd())
## [1] "C:/Users/YEPRI/Desktop/data"
if (!is.null(WD)) setwd(WD)

#impor data
df3 <-read.csv(file.path(WD, 'input', 'input1.csv'))
df4 <-read.csv(file.path(WD, 'input', 'input2.csv'))

#ekspor data
write.csv(df3, file.path(WD, 'output', 'output3.csv'),row.names = FALSE)
write.csv(df4, file.path(WD, 'output', 'output4.csv'),row.names = FALSE)

Cara 3

df5 <- read.csv(file.choose())

Impor/Ekspor Excel

Ms.Excel Merupakan suatu program yang banyak digunakan untuk mentimpan data dalam bentuk format .xls atau .xlsx .

Berikut adalah cara impor/ekspor data Excel:

# menjalankan package 'readxl' dan 'writexl'
pacman::p_load(readxl,writexl)

# impor data
df5 <- read_excel("input/input3.xlsx", sheet = 1)
df6 <- read_excel("input/input4.xls")

# ekspor data 
write_xlsx(df5, "output/output5.xlsx")
write_xlsx(df6, "output/output6.xls")

Impor/Ekspor TXT and RDS

File TXT atau binary sangat menguntungkan dalam impor/ekspor data. Karena ukuran file yang lebih kecil dibanding CSV atau XLSX, sehingga membutuhkan waktu yang lebih sedikit.

Berikut adalah cara impor/ekspor data TXT dan RDS:

# impor data
df7 <- read.table("input/input5.txt")
df8 <- source("input/input6.Rdmpd")
df9 <- readRDS("input/input7.rds")
df10 <- readRDS("input/input8.ascii")

# ekspor data
write.table(df7,"output/output7.txt")
dump("df8", "output/output8.Rdmpd")
saveRDS(df9, "output/output9.rds")
saveRDS(df10, "output/output10.ascii", ascii=TRUE)

Impor/Ekspor XML

XML merupakan kumpulan dari berbagai format file serta data di Word Wide Web, Internet, dan lainnya. XML merupakan singkaran dari eXtensible Markup Language.

Berikut adalah cara impor/ekspor data XML:

library("XML")
library("kulife")
library("methods")

# impor data
df11 <- xmlParse("input/input9.xml")

# mengubah data menjadi dataframe
dfxml <- xmlToDataFrame(df11)

# ekspor data
write.xml(dfxml, "output/output11.xml")

Impor/Ekspor JSON

File JSON menyimpan data sebagai teks dengan format yang mampu dibaca oleh manusia. Json merupakan singkatan dari JavaScript Object Notation. Dengan bantuan package jsonlite , R mampu membaca file JSON.

Berikut adalah cara impor/ekspor data JSON:

library("jsonlite")

# impor data
df12 <- fromJSON("input/input10.json")

# mengubah data menjadi dataframe
dfjson <- as.data.frame(df12)

# ekspor data
write_json(dfjson, "output/output12.json")

Impor Data dari Web

Terdapat banyak sekali website yang menyediakan data untuk dapat diperoleh penggunanya. Program ini mampu mengekstrak data secara spesifik dari sebuah situs web secara terprogram.

CSV

csvweb <- read.csv("https://github.com/Bakti-Siregar/dataset/raw/master/Bookdown-Data-Science-for-Beginners/csv1.csv")

XLSX

library(rio)
install_formats()
## [1] TRUE
xlsxweb <- rio::import("https://github.com/Bakti-Siregar/dataset/raw/master/Bookdown-Data-Science-for-Beginners/xlsx1.xlsx?raw=true")

Basis Data R

Sistem basis data merupakan suatu data relasional yang disimpan dalam bentuk format yang kemudian dinormalisasikan. Sehingga akan membutuhkan query SQL yang sangat canggih dan kompleks. Basis data biasanya akan diubah menjadi sebuah data frame.

Menambang Data Web

Pengikisan data dari web merupakan proses pengekstrakan suatu data dari web menggunakan sebuah bot. Pengikisan data ini mampu mengekstrak kode HTML yang mendasari web tersebut (pada umumnya disimpan pada database).