Algoritma & Struktur Data

~ Ujian Tengah Semester ~


Kontak : \(\downarrow\)
Email
Instagram https://www.instagram.com/saram.05/
RPubs https://rpubs.com/sausanramadhani/

Pendahuluan

Salah satu hal dasar dalam pengolahan data yaitu terhubung dengan data. Untuk mengetahui caranya, kita akan mempelajari proses antarmuka data menggunakan program R. Sebagai pemula, kita cukup mengetahui proses sederhananya terlebih dahulu. Program R dapat membaca data dari suatu file yang tersimpan dimanapun serta dalam berbagai formatnya seperti csv, excel, txt, rds, xml, json, dan lain-lain serta dapat menyimpannya kembali.

Impor/Ekspor CSV

Proses impor/ekspor data menggunakan R bisa dengan berbagai cara. Hal ini juga harus diperhatikan format filenya karena tiap format menggunakan cara yang berbeda. Untuk file yang berformat csv bisa menggunakan 3 cara berikut ini :

Cara 1

Mula-mula kita perhatikan apakah direktori kerjanya sudah benar atau belum yaitu dengan memeriksannya menggunakan fungsi ‘getwd()’. Setelah itu, kita sudah bisa mengatur direktori kerja baru dengan fungsi ‘setwd()’. Kemudian, impor data tersebut dengan fungsi ‘read.csv()’. Sedangkan, untuk mengekspor data tersebut bisa menggunakan fungsi ‘write.csv()’ dan setelahnya yaitu bisa menggunakan fungsi ‘write.csv2()’. Sesuaikan juga dengan pemisahnya antara koma ‘(“,”)’ atau semicolon ‘(“;”)’.

print(getwd())
## [1] "C:/Users/Lenovo/Documents/data"
getwd()
## [1] "C:/Users/Lenovo/Documents/data"
setwd(getwd())

df1 <-read.csv("input/input1.csv",sep = ",")          # format pemisah koma 
df2 <-read.csv("input/input2.csv",sep = ";")          # format pemisah titik koma

write.csv(df1,"output/test1.csv", row.names = TRUE)
write.csv(df2,"output/test2.csv", row.names = TRUE) 

Cara 2

Cara kedua merupakan cara yang bijak dan praktis yaitu koneksi direktorinya secara automatis. Simak caranya berikut ini :

# setting direktori
(WD <- getwd())
## [1] "C:/Users/Lenovo/Documents/data"
if (!is.null(WD)) setwd(WD)

# impor data
df1 <- read.csv(file.path(WD, 'input', 'input1.csv'))
df2 <- read.csv(file.path(WD, 'input', 'input2.csv'))

# ekspor data
write.csv(df1, file.path(WD, 'output', 'output1.csv'), row.names = FALSE)
write.csv(df2, file.path(WD, 'output', 'output2.csv'), row.names = FALSE)

cara 3

Cara ketiga dapat digunakan kita yang menggunakan file atau data yang tersimpan di komputer. Berbeda dengan sebelumnya yang memerlukan koneksi direktori, cukup memilih file yang diperlukan maka kita bisa melakukan proses impor data.

df3 <- read.csv(file.choose())

Untuk proses antarmuka data lainnya hanya menggunakan satu cara saja.

Impor/Ekspor Excel

Microsoft excel sering digunakan untuk menyimpan data. Biasanya data tersimpan dalam format .xls atau .xlsx. Untuk mengimpor atau mengekspor excel menggunakan R bisa menggunakan cara sebagai berikut :

#install.packages(c("readxl", "writexl"))       # install `readxl & writexl` 
pacman::p_load(readxl, writexl)                 # load `readxl & writexl`

# impor data
df3<-read_excel("input/input4.xls")             # impor data xls (97-2003)
df4<-read_excel("input/input3.xlsx",sheet=1)    # impor data xlsx (2003-up)

# ekspor data
write_xlsx(df3,"output/output4.xls") 
write_xlsx(df4,"output/output3.xlsx")

Impor/Ekspor TXT and RDS

Ukuran file TXT dan RDS lebih ringan daripada CSV ataupun XLSX. Maka, cara ini sangat sesuai dengan kita yang tidak ingin menyimpan file dengan ukuran besar. Berikut cara impor/ekspor TXT dan RDS :

# impor data
df5 <- read.table("input/input5.txt")                # format TXT (notepad)
df6 <- source("input/input6.Rdmpd")                  # format TXT (Rdmpd)
df7 <- readRDS("input/input7.rds")                   # format binary RDS
df8 <- readRDS("input/input8.ascii")                 # format binary ASCII

# ekspor data
write.table(df5,"output/output5.txt")
dump("df6", "output/output6.Rdmpd")
saveRDS(df7, "output/output7.rds")
saveRDS(df8, "output/output8.ascii", ascii = TRUE)

Impor/Ekspor XML

Extensible Markup Language (XML) bisa membantu kita memahami struktur data dasar suatu file. XML mirip dengan HTML hanya saja fungsinya berbeda. XML berfungsi untuk menyimpan dan mengirimkan data (impor/ekspor). Sedangkan, HTML berfungsi untuk menampilkan data. Untuk mengetahui proses impor/ekspor XML, perhatikan cara berikut ini :

library("XML")
library("kulife")
library("methods")

df9 <- xmlParse("input/input9.xml")
xml_dataframe <- xmlToDataFrame(df9)
write.xml(xml_dataframe, "output/output9.xml")

Impor/Ekspor JSON

JavaScript Object Notation (JSON) biasanya digunakan untuk mentransfer data dan bisa dibaca oleh penerima data. Untuk membaca file JSON bisa menggunakan R dengan paket ‘jsonlite’. Perhatikan cara impor/ekspor berikut ini :

library("jsonlite")

df10 <- fromJSON("input/input10.json")
json_dataframe <- as.data.frame(df10)
write_json(json_dataframe, "output/output10.json")

Impor Data dari Web

Dalam internet terdapat website yang memberikan informasi suatu data. Biasanya data tersebut digunakan oleh penggunanya. Kita bisa mengimpor data tersebut menggunakan R dengan cara berikut ini :

CSV

web_csv <- read.csv("https://github.com/Bakti-Siregar/dataset/raw/master/Bookdown-Data-Science-for-Beginners/csv1.csv")

XLSX

library(rio)
install_formats()
## [1] TRUE
web_xlsx <- rio::import("https://github.com/Bakti-Siregar/dataset/blob/master/Bookdown-Data-Science-for-Beginners/xlsx1.xlsx?raw=true")

Basis Data R

Sistem ialah kumpulan komponen saling berhubungan yang disatukan dengan suatu tujuan. Basis data ialah objek yang membutuhkan program sebagai pengelolanya. Maka dihasilkanlah sistem basis data dari basis data dan program tersebut. Sistem basis data adalah sistem yang terdiri atas kumpulan tabel data yang saling berhubungan dan kumpulan program yang memungkinkan beberapa pemakai atau program lain untuk mengakses dan memanipulasi tabel tabel data tersebut.

Kita bisa menghubungkan suatu data ke database relasional misalnya MySql, Oracle, SQL Server, dan sebagainya menggunakan R. Lalu kita ubah basis datanya menjadi data frame. Jika data sudah terdapat dalam R, data tersebut bisa dianalisis bahkan dimanipulasi.

Menambang Data Web

Webscraping Data ialah proses pengambilan data dari sebuah website. Berbeda dengan web scraping (hanya menyalin piksel yang ditampilkan), web scraping mengekstrak kode HTML yang mendasarinya yang pada dasarnya disimpan dalam database. Pengikisan data ini dapat mereplikasi seluruh konten dari berbagai situs web yang target.

---
title: "Algoritma & Struktur Data"
subtitle: "~ Ujian Tengah Semester ~"
author: "Sausan Ramadhani"
date:  "`r format(Sys.Date(), '%B %d, %Y')`"
output:
  rmdformats::robobook:   # https://github.com/juba/rmdformats
    self_contained: true
    thumbnails: true
    lightbox: true
    gallery: true
    lib_dir: libs
    df_print: "paged"
    code_folding: "show"
    code_download: yes
    css: "style.css"

---

```{r include=FALSE}
knitr::opts_chunk$set(class.source = "nocopy",
                      class.output = "nocopy",
                      message = F,
                      warning = F)

library(reticulate)
library(Rcpp)
use_condaenv("py38", required = TRUE)
```

<br>

<img style="float: right; margin: -50px 50px 0px 50px; width:25%" src="logomatana.png"/>

|
:---- |:----
**Kontak**| **: $\downarrow$**
Email| mugemisausan05@gmail.com
Instagram | https://www.instagram.com/saram.05/ 
RPubs  | https://rpubs.com/sausanramadhani/ 

***

# Pendahuluan

Salah satu hal dasar dalam pengolahan data yaitu terhubung dengan data. Untuk mengetahui caranya, kita akan mempelajari proses antarmuka data menggunakan program R. Sebagai pemula, kita cukup mengetahui proses sederhananya terlebih dahulu. Program R dapat membaca data dari suatu file yang tersimpan dimanapun serta dalam berbagai formatnya seperti csv, excel, txt, rds, xml, json, dan lain-lain serta dapat menyimpannya kembali.

# Impor/Ekspor CSV

Proses impor/ekspor data menggunakan R bisa dengan berbagai cara. Hal ini juga harus diperhatikan format filenya karena tiap format menggunakan cara yang berbeda. Untuk file yang berformat csv bisa menggunakan 3 cara berikut ini :

## Cara 1

Mula-mula kita perhatikan apakah direktori kerjanya sudah benar atau belum yaitu dengan memeriksannya menggunakan fungsi 'getwd()'. Setelah itu, kita sudah bisa mengatur direktori kerja baru dengan fungsi 'setwd()'. Kemudian, impor data tersebut dengan fungsi 'read.csv()'. Sedangkan, untuk mengekspor data tersebut bisa menggunakan fungsi 'write.csv()' dan setelahnya yaitu bisa menggunakan fungsi 'write.csv2()'. Sesuaikan juga dengan pemisahnya antara koma '(",")' atau semicolon '(";")'.

```{r}
print(getwd())
getwd()
setwd(getwd())

df1 <-read.csv("input/input1.csv",sep = ",")          # format pemisah koma 
df2 <-read.csv("input/input2.csv",sep = ";")          # format pemisah titik koma

write.csv(df1,"output/test1.csv", row.names = TRUE)
write.csv(df2,"output/test2.csv", row.names = TRUE) 
```

## Cara 2

Cara kedua merupakan cara yang bijak dan praktis yaitu koneksi direktorinya secara automatis. Simak caranya berikut ini :

```{r}
# setting direktori
(WD <- getwd())
if (!is.null(WD)) setwd(WD)

# impor data
df1 <- read.csv(file.path(WD, 'input', 'input1.csv'))
df2 <- read.csv(file.path(WD, 'input', 'input2.csv'))

# ekspor data
write.csv(df1, file.path(WD, 'output', 'output1.csv'), row.names = FALSE)
write.csv(df2, file.path(WD, 'output', 'output2.csv'), row.names = FALSE)
```

## cara 3

Cara ketiga dapat digunakan kita yang menggunakan file atau data yang tersimpan di komputer. Berbeda dengan sebelumnya yang memerlukan koneksi direktori, cukup memilih file yang diperlukan maka kita bisa melakukan proses impor data.

```{r}
df3 <- read.csv(file.choose())
```

Untuk proses antarmuka data lainnya hanya menggunakan satu cara saja.

# Impor/Ekspor Excel

Microsoft excel sering digunakan untuk menyimpan data. Biasanya data tersimpan dalam format .xls atau .xlsx. Untuk mengimpor atau mengekspor excel menggunakan R bisa menggunakan cara sebagai berikut :

```{r}
#install.packages(c("readxl", "writexl"))       # install `readxl & writexl` 
pacman::p_load(readxl, writexl)                 # load `readxl & writexl`

# impor data
df3<-read_excel("input/input4.xls")             # impor data xls (97-2003)
df4<-read_excel("input/input3.xlsx",sheet=1)    # impor data xlsx (2003-up)

# ekspor data
write_xlsx(df3,"output/output4.xls") 
write_xlsx(df4,"output/output3.xlsx")
```

# Impor/Ekspor TXT and RDS

Ukuran file TXT dan RDS lebih ringan daripada CSV ataupun XLSX. Maka, cara ini sangat sesuai dengan kita yang tidak ingin menyimpan file dengan ukuran besar. Berikut cara impor/ekspor TXT dan RDS :

```{r}
# impor data
df5 <- read.table("input/input5.txt")                # format TXT (notepad)
df6 <- source("input/input6.Rdmpd")                  # format TXT (Rdmpd)
df7 <- readRDS("input/input7.rds")                   # format binary RDS
df8 <- readRDS("input/input8.ascii")                 # format binary ASCII

# ekspor data
write.table(df5,"output/output5.txt")
dump("df6", "output/output6.Rdmpd")
saveRDS(df7, "output/output7.rds")
saveRDS(df8, "output/output8.ascii", ascii = TRUE)
```

# Impor/Ekspor XML

Extensible Markup Language (XML) bisa membantu kita memahami struktur data dasar suatu file. XML mirip dengan HTML hanya saja fungsinya berbeda. XML berfungsi untuk menyimpan dan mengirimkan data (impor/ekspor). Sedangkan, HTML berfungsi untuk menampilkan data. Untuk mengetahui proses impor/ekspor XML, perhatikan cara berikut ini :

```{r}
library("XML")
library("kulife")
library("methods")

df9 <- xmlParse("input/input9.xml")
xml_dataframe <- xmlToDataFrame(df9)
write.xml(xml_dataframe, "output/output9.xml")
```

# Impor/Ekspor JSON

JavaScript Object Notation (JSON) biasanya digunakan untuk mentransfer data dan bisa dibaca oleh penerima data. Untuk membaca file JSON bisa menggunakan R dengan paket 'jsonlite'. Perhatikan cara impor/ekspor berikut ini :

```{r}
library("jsonlite")

df10 <- fromJSON("input/input10.json")
json_dataframe <- as.data.frame(df10)
write_json(json_dataframe, "output/output10.json")
```

# Impor Data dari Web

Dalam internet terdapat website yang memberikan informasi suatu data. Biasanya data tersebut digunakan oleh penggunanya. Kita bisa mengimpor data tersebut menggunakan R dengan cara berikut ini :

## CSV

```{r}
web_csv <- read.csv("https://github.com/Bakti-Siregar/dataset/raw/master/Bookdown-Data-Science-for-Beginners/csv1.csv")
```

## XLSX

```{r}
library(rio)
install_formats()

web_xlsx <- rio::import("https://github.com/Bakti-Siregar/dataset/blob/master/Bookdown-Data-Science-for-Beginners/xlsx1.xlsx?raw=true")
```

# Basis Data R

Sistem ialah kumpulan komponen saling berhubungan yang disatukan dengan suatu tujuan. Basis data ialah objek yang membutuhkan program sebagai pengelolanya. Maka dihasilkanlah sistem basis data dari basis data dan program tersebut. Sistem basis data adalah sistem yang terdiri atas kumpulan tabel data yang saling berhubungan dan kumpulan program yang memungkinkan beberapa pemakai atau program lain untuk mengakses dan memanipulasi tabel tabel data tersebut.

Kita bisa menghubungkan suatu data ke database relasional misalnya MySql, Oracle, SQL Server, dan sebagainya menggunakan R. Lalu kita ubah basis datanya menjadi data frame. Jika data sudah terdapat dalam R, data tersebut bisa dianalisis bahkan dimanipulasi.

# Menambang Data Web

Webscraping Data ialah proses pengambilan data dari sebuah website. Berbeda dengan web scraping (hanya menyalin piksel yang ditampilkan), web scraping mengekstrak kode HTML yang mendasarinya yang pada dasarnya disimpan dalam database. Pengikisan data ini dapat mereplikasi seluruh konten dari berbagai situs web yang target.