Algoritma & Struktur Data

~ Tugas Pertemuan 10 ~

Kontak : \(\downarrow\)
Email
Instagram https://www.instagram.com/m_naufalardiansyah/
RPubs https://www.rpubs.com/muhammad_naufal/

Pendahuluan

Menghubungkan suatu data pada saat pengolahan data di data science sangatlah penting dimana data tersebut dapat di simpan dalam bentuk csv, excel, txt, rds, xml, json, dan lainnya yang dapat di baca maupun dijalankan menggunakan R yang tersimpan baik di luar maupun di dalma direktori. Berikut beberapa cara yang dapat diterapkan pada R.

Impor/Ekspor Data CSV

Berikut 3 cara untuk impor maupun ekspor data pada R.

Cara 1

# memanggil direktori dengan 
print(getwd())
## [1] "C:/logaritma"
getwd()
## [1] "C:/logaritma"

Selain itu, adapun proses impor data dalam bentuk CSV dengan fungsi read.csv()

setwd(getwd())

df1 <-read.csv("Input/input1.csv",sep = ",") # format pemisah koma 
df1
df2 <-read.csv("Input/input2.csv",sep = ";") # format pemisah titik koma

Adapun proses ekspor data dalam bentuk CSV dengan menggunakan fungsi write.csv()

write.csv(df1,"Output/output1.csv", row.names = FALSE) # tanda pemisah koma yaitu ","
write.csv(df2,"Output/output2.csv", row.names = FALSE) # tanda pemisah koma yaitu ";"

Cara 2

Dengan menggunakan cara praktis dalam mengundang direktori otomatis.

(WD= getwd()) # yang digunakan untuk menyeting direktori
## [1] "C:/logaritma"
if (!is.null(WD)) setwd(WD)

Cara mengimpor data

df1 <-read.csv(file.path(WD, 'input', 'input1.csv'))  
df2 <-read.csv(file.path(WD, 'input', 'input1.csv'))

Cara engekspor data

write.csv(df1, file.path(WD, 'input', 'input1.csv'), row.names=FALSE)  
write.csv(df2, file.path(WD, 'input', 'input1.csv'), row.names=FALSE)

Cara 3

Pada cara ke-3 ini merupakan cara alternatif yang dilakukan tanpa adanya pengaturan direktori sebelum pengimporan data.

df3<-read.csv(file.choose())
df3

Impor/Ekspor Data Pada Excel

Dengan Excel data dapat di simpan melalui format .xls atau .xlsx dan R dapat membaca menggunakan funsi readxl

#install.packages(c("readxl", "writexl"))       # install `readxl & writexl` 
pacman::p_load(readxl, writexl)                 # load `readxl & writexl`
# impor data
df3<-read_excel("Input/input4.xls")             # impor data xls (97-2003)
df4<-read_excel("Input/input3.xlsx",sheet=1)    # impor data xlsx (2003-up)
# ekspor data
write_xlsx(df3,"Output/output3.xls") 
write_xlsx(df4,"Output/output4.xlsx")

Impor/Ekspor Data Pada TXT dan RDS

Dengan adanya impor maupun ekspor pada file CSV dan XLSX dimana data cenderung lebih besar dibandingakan dengan TXT dan RDS maka data dapat di impor maupun ekspor menggunakan format txt atau binary.

Berikut adalah fungsi untuk impor data.

df5<-read.table("Input/input5.txt") # dimana ini merupakan format txt-notepad
df6<-source("Input/input6.Rdmpd")   # dimana ini merupakan format txt-rdmpd
df7<-readRDS("Input/input7.rds")    # dimana ini merupakan format binary-RDS
df8<-readRDS("Input/input8.ascii")  # dimana ini merupakan format binary-ASCII

Berikut adalah fungsi untuk ekspor data.

write.table(df5, "Output/output5.txt")
dump("df6", "Output/output6.Rdmpd")
saveRDS(df7, "Output/output7.rds")
saveRDS(df8, "Output/output8.ascii", ascii=TRUE)

Impor/Ekspor Data Pada XML

Data XML ini tidak jauh beda dengan HTML namun pada XMl sintaks dalam tag markup pada HTML tidaklah sama. Pada format file dan data di World Wide Web, INternet, dan lainnya.

library("XML")     # load packages XML
library("kulife")  # load packages kulife
library("methods") # packages kondisional
df9<-xmlParse("Input/input9.xml")       # proses impor data XML
xml_df<-xmlToDataFrame(df9)             # konversi ke data frame
write.xml(xml_df, "Output/output9.xml") # proses ekspor dara XML

Impor/Ekspor Data Pada JSON

JSON merupakan Java Script Object Natation pada R dapat digunakan dengan format data jsonlite dengan cara sebagai berikut.

library("jsonlite")

Cara mengimpor data json

df10<-fromJSON("Input/input10.json")
json_df<-as.data.frame(df10)    # proses konversi ke data frame

Cara mengekspor data json

write_json(json_df, "Output/output10.json")

Impor Data dari WEB

Dalam mengimpor data tidak selalu melalui file namun juga bisa didapatkan dari website yang ada dengan cara sebagai berikut.

Dengan format CSV

web_csv<-read.csv("https://github.com/Bakti-Siregar/dataset/raw/master/Bookdown-Data-Science-for-Beginners/csv1.csv")

Dengan format XLSX

#install.package("Rio")
library(rio)      # mengimpor data dari github
install_formats() # memeriksa aut packages yang disarankan
## [1] TRUE

Basis Data R

Basis data ini merupkaan penormalisasian suatu data yang disimpan dengan relasional dengan bantuan query SQL saat komputasi statistik. R ini dapat terhubungan dengan database relasional pada umumnya seperti MySql, Oracle, SQL erver, dan lainnya yang dapat diubah ke bentuk data frame dan dilakukannya proses analisis yang lebih lanjut.

Menambang Data WEB

Webscraping data atau bisa disebut dengan pengikisan data dari website ini merupakan suatu proses pengekstrakan konten dan data baik kode HTML yang dilakukan dengna menggunakan bot pada suatu website.