Algoritma & Struktur Data

~ Antarmuka Data dengan R ~


Kontak : \(\downarrow\)
Email
Instagram https://www.instagram.com/novia_labola/
RPubs https://rpubs.com/noviaanita/

Pendahuluan

R (juga dikenal sebagai GNU S) adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik. Terhubung dengan sebuah data merupakan hal paling mendasar dalam proses olah data (Data Science). Dibawah ini akan di jelaskan bagaimana proses antarmuka data yang paling sederhana menggunakan R. Secara singkatnya, R dapat membaca data dari file yang disimpan didalam ataupun diluar direktorinya.Sistem operasi R juga dapat menyimpan dan membaca data dalam berbagai format file seperti csv, excel, txt, rds, xml, json, dan lain-lain.

Impor/Ekspor csv

Beikut ini adalah beberapa cara yang dapat dilakukan dalam impor/ekspor data menggunakan R.

Cara 1

Menggunakan fungsi getwd() untuk mengetahui direktori yang sedang digunakan.

print(getwd())
## [1] "C:/Users/MASTER/Documents/Algoritmabaru"
getwd()
## [1] "C:/Users/MASTER/Documents/Algoritmabaru"

setwd() digunakan untuk mengatur direktori kerja baru.

setwd(getwd())

Kemudian, mengimpor data CSV menggunakan fungsi read.csv().

# impor data
df1 <-read.csv("INPUT/input1.csv",sep = ",") # format pemisah koma 
df2 <-read.csv("INPUT/input2.csv",sep = ";") # format pemisah titik koma

write.csv() fungsi yang digunakan untuk mengekspor data yang diinginkan ke direktori.

# ekspor data
write.csv(df1,"OUTPUT/output1.csv", row.names = FALSE)
write.csv(df2,"OUTPUT/output2.csv", row.names = FALSE)

Cara 2

Menggunakan koneksi direktori secara otomatis.

(WD <- getwd())
## [1] "C:/Users/MASTER/Documents/Algoritmabaru"
if (!is.null(WD)) setwd(WD)
# impor data
df1 <- read.csv(file.path(WD, "INPUT", 'input1.csv'))
df2 <- read.csv(file.path(WD, "INPUT", 'input2.csv'))
# ekspor data 
write.csv(df1, file.path(WD, "OUTPUT", "output1"))
write.csv(df1, file.path(WD, "OUTPUT", "output2"))

Cara 3

Cara terakhir tidak perlu melakukan pengaturan direktori terlebih dahulu sebelum melakukan proses mengimpor data hanya perlu memilih data yang tersimpan di pc.

# digunakan untuk memilih data
df3 <- read.csv(file.choose())

Impor/Ekspor Exel

Fungsi readxl dapat membaca langsung file data dari exel yang tersimpan dalam format xls/xlsl.

# untuk menginstall packages readxl, writexl, dan pacman 
pacman::p_load(readxl, writexl)                  
# impor data
df3<-read_excel('INPUT/input4.xls')         # impor data xls (97-2003)
df4<-read_excel("INPUT/input3.xlsx",sheet=1)# impor data xlsx (2003-up)
# ekspor data
write_xlsx(df3,"OUTPUT/output3.xls") 
write_xlsx(df4,"OUTPUT/output4.xlsx")

Impor/Ekspor TXT and RDS

Saat melakukan impor/ekspor disarankan menggunakan format TXT atau RDS karena ukuran file lebih kecil dibandingkan CSV atau XLSX. Sehingga dapat dengan cepat melakukan impor/ekspor data.

# cara untuk mengimpor data 
df5 <- read.table("INPUT/input5.txt")       # format TXT (notepad)
df6 <- source("INPUT/input6.Rdmpd")         # format TXT (Rdmp)
df7 <- readRDS("INPUT/input7.rds")          # format binary RDS
df8 <- readRDS("INPUT/input8.ascii")        # format binary ASCII
# cara untuk mengekspor data
write.table(df5,"OUTPUT/output5.txt")
dump("df6", "OUTPUT/output6.Rdmp")
saveRDS(df7, "OUTPUT/output7.rds")
saveRDS(df8, "OUTPUT/output8.ascii", ascii = TRUE)

Impor/Ekspor XML

XML merupakan kumpulan dari berbagai format file dan data di World Wide Web, intranet menggunakan teks ASCII standar.

Sebelum melakukan impor/ekspor data Install packages terlebih dahulu seperti dibawah ini.

library("XML")
library("kulife")
library("methods")
# impor data ke XML
df9 <- xmlParse("INPUT/input9.xml")
# konversi ke data frame
xml_df <- xmlToDataFrame(df9)
# ekspor data ke XML
write.xml(xml_df, "OUTPUT/output9.xml")

Impor/Ekspor JSON

JSON adalah singkatan dari JavaScript Object Notation. Fungsi jsonlite di R dapat membaca file JSON.

# install library jsonlite terlebih dahulu
library("jsonlite")
# cara untuk mengimpor data JSON
df10 <- fromJSON("INPUT/input10.json")
# mengubah data menjadi data frame
json_df <- as.data.frame(df10)
# cara untuk mengekspor data JSON
write_json(json_df, "OUTPUT/output10.json")

Impor Data dari Web

Mengimpor data dari suatu situs web.

CSV

Impor data Web menggunakan CSV.

web_csv <- read.csv("https://www.liputan6.com/global/read/4625845/pohon-hantu-ini-5-hal-menakjubkan-di-alam-yang-sulit-dipercaya/csv1.csv")

XLSX

Impor data web menggunakan XLSX.Jika mengimpor data dari repositori GitHub. Maka terlebih dahulu menginstall packages rio.

library(rio)
install_formats()
## [1] TRUE
web_xlsx <- rio::import("https://github.com/Bakti-Siregar/dataset/blob/master/Bookdown-Data-Science-for-Beginners/xlsx1.xlsx?raw=true")

Dan jika tidak dari repositori GitHub maka langsung saja menggunakan read.csv()

read.csv("https://www.liputan6.com/global/read/4625845/pohon-hantu-ini-5-hal-menakjubkan-di-alam-yang-sulit-dipercaya/xlsx1.xlsx?raw=true")

Basis Data R

Sistem basis data merupakan sebuah data yang di relasional dan disimpan dalam format yang dinormalisasi. R bisa terhubung dengan mudah ke banyak database relasional seperti MySql, Oracle, SQL Server, dan lain-lain.

Menambang Data Web

Menambang data web atau Webscraping Data merupakan sebuah proses menggunakan bot untuk mengekstrak konten dan data dari suatu situs web. Web Scraping dapat mengekstrak suatu kode HTML dasar yang pada dasarnya disimpan dalam database.

---
title: "Algoritma & Struktur Data"
subtitle: "~ Antarmuka Data dengan R ~"
author: "Novia Anita (20214520008)"
date:  "`r format(Sys.Date(), '%B %d, %Y')`"
output:
  rmdformats::robobook:   # https://github.com/juba/rmdformats
    self_contained: true
    thumbnails: true
    lightbox: true
    gallery: true
    lib_dir: libs
    df_print: "paged"
    code_folding: "show"
    code_download: yes
    css: "style.css"

---


<br>

<img style="float: right; margin: -50px 50px 0px 50px; width:25%" src="novia.JPG"/> 

|
:---- |:----
**Kontak**| **: $\downarrow$**
Email| noviaalbl02@gmail.com
Instagram | https://www.instagram.com/novia_labola/ 
RPubs  | https://rpubs.com/noviaanita/ 

***


# Pendahuluan 

R (juga dikenal sebagai GNU S) adalah bahasa pemrograman dan perangkat lunak untuk analisis statistika dan grafik. Terhubung dengan sebuah data merupakan hal paling mendasar dalam proses olah data (Data Science). Dibawah ini akan di jelaskan bagaimana proses antarmuka data yang paling sederhana menggunakan R. Secara singkatnya, R dapat membaca data dari file yang disimpan didalam ataupun diluar direktorinya.Sistem operasi R juga dapat menyimpan dan membaca data dalam berbagai format file seperti csv, excel, txt, rds, xml, json, dan lain-lain.

```{r image1, echo=FALSE,fig.align='center', out.width = '100%'}
knitr::include_graphics ("download.PNG")
```


# Impor/Ekspor csv  

Beikut ini adalah beberapa cara yang dapat dilakukan dalam impor/ekspor data menggunakan R.

## Cara 1  {.tabset .tabset-pills}

Menggunakan fungsi getwd() untuk mengetahui direktori yang sedang digunakan.
```{r}
print(getwd())
getwd()
```
setwd() digunakan untuk mengatur direktori kerja baru.
```{r}
setwd(getwd())
```

Kemudian, mengimpor data CSV menggunakan fungsi read.csv().
```{r}
# impor data
df1 <-read.csv("INPUT/input1.csv",sep = ",") # format pemisah koma 
df2 <-read.csv("INPUT/input2.csv",sep = ";") # format pemisah titik koma
```

write.csv() fungsi yang digunakan untuk mengekspor data yang diinginkan ke direktori. 
```{r}
# ekspor data
write.csv(df1,"OUTPUT/output1.csv", row.names = FALSE)
write.csv(df2,"OUTPUT/output2.csv", row.names = FALSE)
```

## Cara 2

Menggunakan koneksi direktori secara otomatis.
```{r}
(WD <- getwd())
if (!is.null(WD)) setwd(WD)
```

```{r}
# impor data
df1 <- read.csv(file.path(WD, "INPUT", 'input1.csv'))
df2 <- read.csv(file.path(WD, "INPUT", 'input2.csv'))
```

```{r}
# ekspor data 
write.csv(df1, file.path(WD, "OUTPUT", "output1"))
write.csv(df1, file.path(WD, "OUTPUT", "output2"))
```

## Cara 3

Cara terakhir tidak perlu melakukan pengaturan direktori terlebih dahulu sebelum melakukan proses mengimpor data hanya perlu memilih data yang tersimpan di pc.
```{r}
# digunakan untuk memilih data
df3 <- read.csv(file.choose())
```

# Impor/Ekspor Exel 

Fungsi readxl dapat membaca langsung file data dari exel yang tersimpan dalam format xls/xlsl.  

```{r}
# untuk menginstall packages readxl, writexl, dan pacman 
pacman::p_load(readxl, writexl)                  
```

```{r}
# impor data
df3<-read_excel('INPUT/input4.xls')         # impor data xls (97-2003)
df4<-read_excel("INPUT/input3.xlsx",sheet=1)# impor data xlsx (2003-up)
```


```{r}
# ekspor data
write_xlsx(df3,"OUTPUT/output3.xls") 
write_xlsx(df4,"OUTPUT/output4.xlsx")
```


# Impor/Ekspor TXT and RDS 

Saat melakukan impor/ekspor disarankan menggunakan format TXT atau RDS karena ukuran file lebih kecil dibandingkan CSV atau XLSX. Sehingga dapat dengan cepat melakukan impor/ekspor data.
```{r}
# cara untuk mengimpor data 
df5 <- read.table("INPUT/input5.txt")       # format TXT (notepad)
df6 <- source("INPUT/input6.Rdmpd")         # format TXT (Rdmp)
df7 <- readRDS("INPUT/input7.rds")          # format binary RDS
df8 <- readRDS("INPUT/input8.ascii")        # format binary ASCII
```

```{r}
# cara untuk mengekspor data
write.table(df5,"OUTPUT/output5.txt")
dump("df6", "OUTPUT/output6.Rdmp")
saveRDS(df7, "OUTPUT/output7.rds")
saveRDS(df8, "OUTPUT/output8.ascii", ascii = TRUE)
```


# Impor/Ekspor XML

XML merupakan kumpulan dari berbagai format file dan data di World Wide Web, intranet menggunakan teks ASCII standar.

Sebelum melakukan impor/ekspor data Install packages terlebih dahulu seperti dibawah ini.
```{r}
library("XML")
library("kulife")
library("methods")
```

```{r}
# impor data ke XML
df9 <- xmlParse("INPUT/input9.xml")
```

```{r}
# konversi ke data frame
xml_df <- xmlToDataFrame(df9)
```

```{r}
# ekspor data ke XML
write.xml(xml_df, "OUTPUT/output9.xml")
```


# Impor/Ekspor JSON 

JSON adalah singkatan dari JavaScript Object Notation. Fungsi jsonlite di R dapat membaca file JSON.
```{r}
# install library jsonlite terlebih dahulu
library("jsonlite")
```

```{r}
# cara untuk mengimpor data JSON
df10 <- fromJSON("INPUT/input10.json")
```

```{r}
# mengubah data menjadi data frame
json_df <- as.data.frame(df10)
```

```{r}
# cara untuk mengekspor data JSON
write_json(json_df, "OUTPUT/output10.json")
```

# Impor Data dari Web

Mengimpor data dari suatu situs web.

## CSV  {.tabset .tabset-pills}
Impor data Web menggunakan CSV.
```{r}
web_csv <- read.csv("https://www.liputan6.com/global/read/4625845/pohon-hantu-ini-5-hal-menakjubkan-di-alam-yang-sulit-dipercaya/csv1.csv")
```

## XLSX
Impor data web menggunakan XLSX.Jika mengimpor data dari repositori GitHub. Maka terlebih dahulu menginstall packages rio.
```{r}
library(rio)
install_formats()
```
```{r}
web_xlsx <- rio::import("https://github.com/Bakti-Siregar/dataset/blob/master/Bookdown-Data-Science-for-Beginners/xlsx1.xlsx?raw=true")
```

Dan jika tidak dari repositori GitHub maka langsung saja menggunakan read.csv()
```{r}
read.csv("https://www.liputan6.com/global/read/4625845/pohon-hantu-ini-5-hal-menakjubkan-di-alam-yang-sulit-dipercaya/xlsx1.xlsx?raw=true")
```

# Basis Data R

Sistem basis data merupakan sebuah data yang di relasional dan disimpan dalam format yang dinormalisasi. R bisa terhubung dengan mudah ke banyak database relasional seperti MySql, Oracle, SQL Server, dan lain-lain.


# Menambang Data Web

Menambang data web atau Webscraping Data merupakan sebuah proses menggunakan bot untuk mengekstrak konten dan data dari suatu situs web. Web Scraping dapat mengekstrak suatu kode HTML dasar yang pada dasarnya disimpan dalam database. 


# Referensi 

1. https://id.wikipedia.org/wiki/R_(bahasa_pemrograman) 
2. https://daryusman.wordpress.com/2018/04/25/working-directory-di-pemrograman-r/

