Algoritma dan Struktur Data

~ Antarmuka Data ~


Kontak : \(\downarrow\)
Email
Instagram https://www.instagram.com/nbrigittag/
RPubs https://rpubs.com/naftalibrigitta/

Import / Eksport CSV

Cara 1

Memeriksa direktori kerja menggunakan fungsi ‘getwd()’ , dan mengatur direktori kerja baru menggunakan fungsi ‘setwd()’

print(getwd())
## [1] "C:/Users/Naftali Brigitta/Documents/Data"
getwd()
## [1] "C:/Users/Naftali Brigitta/Documents/Data"
setwd(getwd())

# impor data
datfrem1 <-read.csv("input/input1.csv",sep = ",")            # format pemisah koma
datfrem2 <-read.csv("input/input2.csv",sep = ";")            # format pemisah titik koma

# ekspor data
write.csv(datfrem1,"output/gunsout1.csv", row.names = TRUE)
write.csv(datfrem2,"output/gunsout2.csv", row.names = TRUE) 

Cara 2

Menggunakan cara direktori secara otomatis.

# setting direktori
(WD <- getwd())
## [1] "C:/Users/Naftali Brigitta/Documents/Data"
if (!is.null(WD)) setwd(WD)

# impor data
datfrem1 <- read.csv(file.path(WD, 'input', 'input1.csv'))
datfrem2 <- read.csv(file.path(WD, 'input', 'input2.csv'))

# ekspor data
write.csv(datfrem1, file.path(WD, 'output', 'output1.csv'),row.names = FALSE)
write.csv(datfrem2, file.path(WD, 'output', 'output2.csv'),row.names = FALSE)

Cara 3

Memilih data yang tersimpan di komputer (PC) tanpa harus melakukan pengaturan direktori terlebih dahulu sebelum melakukan proses impor data.

# untuk memilih data, kita tuliskan 'file.choose'
# df3 <- read.csv(file.choose())

Import / Eksport Excel

Microsoft Excel adalah program spreadsheet yang paling banyak digunakan yang menyimpan data dalam format ‘.xls’ atau ‘.xlsx’. R dapat membaca langsung dari file-file ini menggunakan paket ‘readxl’.

# install.packages(c("readxl", "writexl"))                # install `readxl & writexl` 
pacman::p_load(readxl, writexl)                           # load `readxl & writexl`

# impor data
df3<-read_excel("input/input4.xls")                       # impor data xls (97-2003)
df4<-read_excel("input/input3.xlsx",sheet=1)              # impor data xlsx (2003-up)

# ekspor data
write_xlsx(df3,"output/gunsout3.xls") 
write_xlsx(df4,"output/gunsout4.xlsx")

Import / Eksport TXT and RDS

Format data paling umum yang sering digunakan untuk impor/ekspor data adalah file CSV dan XLSX. Namun, ukuran file CSV atau XLSX cendrung lebih besar dibanding format yang lainya seperti TXT atau file biner R (RDS), Sehingga, ini akan membutuhkan tambahan waktu pada saat anda melakukan impor/ekspor data.

# impor data
datfrem5 <- read.table("input/input5.txt")             # format TXT (notepad) 
datfrem6 <- source("input/input6.Rdmpd")               # format TXT (Rdmpd) 
datfrem7 <- readRDS("input/input7.rds")                # format binary
datfrem8 <- readRDS("input/input8.ascii")              # format binary

# ekspor data
write.table(datfrem5, "output/gunsout5.txt")
dump("datfrem6", "output/gunsout6.Rdmpd")
saveRDS(datfrem7, "output/gunsout7.rds")
saveRDS(datfrem8, "output/gunsout8.ascii", ascii=TRUE)

Catatan: Format binary sangat lazim digunakan untuk meringkas file yang berukuran besar, terutama menggunakan sistem kontrol (API) seperti halnya Git.

Import / Eksport XML

XML adalah kumpulan berbagi format file dan data di World Wide Web, intranet, dan di tempat lain menggunakan teks ASCII standar. XML adalah singkatan dari eXtensible Markup Language.

library("XML")
library("kulife")
library("methods")

datfrem9 <- xmlParse("input/input9.xml")           # impor data XML
xml_df <- xmlToDataFrame(datfrem9)                 # konversi ke DataFrame
write.xml(xml_df, "output/gunsout9.xml")           # ekspor data XML

Import / Eksport JSON

File JSON menyimpan data sebagai teks dalam format yang dapat dibaca manusia, Json adalah singkatan dari JavaScript Object Notation. R dapat membaca file JSON menggunakan paket jsonlite.

library("jsonlite")                                 # load paket JSON

datfrem10 <- fromJSON("input/input10.json")         # impor data
json_df <- as.data.frame(datfrem10)                 # konversi ke data frame
write_json(json_df, "output/gunsout10.json")        # ekspor data JSON

Import Data dari Web

CSV

web_csv <- read.csv("https://bookdown.org/BaktiSiregar/data-science-for-beginners/")

XLSX

library(rio)
install_formats()
## [1] TRUE

Basis Data R

Sistem basis data adalah data relasional yang disimpan dalam format yang dinormalisasi. Jadi, untuk melakukan komputasi statistik kita akan membutuhkan query SQL yang sangat canggih dan kompleks. Tetapi R dapat terhubung dengan mudah ke banyak database relasional seperti MySql, Oracle, SQL Server, dll. Selanjutnya biasanya, kita akan mengubah basis data tersebut menjadi bingkai data (data frame). Setelah data tersedia di lingkungan R, kemudian dimanipulasi atau dilakukan analisis lebih lanjut.

Menambang Data Web

Pengikisan data dari web (Webscraping Data) adalah proses menggunakan bot untuk mengekstrak konten dan data dari situs web. Tidak seperti screen scraping, yang hanya menyalin piksel yang ditampilkan di layar, web scraping mengekstrak kode HTML yang mendasarinya yang pada dasarnya disimpan dalam database. Pengikisan data ini dapat mereplikasi seluruh konten dari berbagai situs web yang target.