Algoritma & Struktur Data


RPubs | https://rpubs.com/ainun/ ***

Import/Ekspor Excel

Proses Import adalah proses mengambil data atau file dari luar aplikasi atau dari aplikasi lain untuk dibuka di aplikasi yang berhubungan.Proses Export ialah proses mengeluarkan dan menyimpan data supaya dapat di Import di aplikasi lain. Namun kali ini akan membahas cara mengekspor dan mengimpor menggunakan CSV pada Rstudio. Sebelum mengekspor/mengimpor harus menginstall library terlebih dahulu agar bisa diakses.

print(getwd())  # Menginstall getwd
## [1] "C:/Users/lenovo/Documents/data"
getwd()         # Getwd terinstall
## [1] "C:/Users/lenovo/Documents/data"
setwd(getwd())  # Menyetting getwd   

d1 <- read.csv("C:/Users/lenovo/Documents/data/input/input1.csv", sep = ",")
d2 <- read.csv( "C:/Users/lenovo/Documents/data/input/input2.csv",sep = ";")

write.csv(d1,"C:/Users/lenovo/Documents/data/output/output1.csv", row.names = FALSE)
write.csv(d2,"C:/Users/lenovo/Documents/data/output/output2.csv", row.names = FALSE)         

Cara Kedua

# d1 <- read.csv(file.choose())

EKSPOR/IMPORT EXCEL

# install.packages("readxl", "writexl)  # Menginstall packages read excel dan write excel
pacman:: p_load(readxl)

d1 <- read_excel("C:/Users/lenovo/Documents/data/input/input3.xlsx", sheet = 1)  # Import excel 
d2 <- read_excel("C:/Users/lenovo/Documents/data/input/input4.xls")

writexl::write_xlsx(d1,"C:/Users/lenovo/Documents/data/output/output3.xlsx" )     # Ekspor excel
writexl::write_xlsx(d2,"C:/Users/lenovo/Documents/data/output/output4.xls")

TXT atau Binarry

TXT atau file biner R (RDS) tidak jauh beda dengan excel maupun CSV. Namun, ukuran fle nya tergolong lebih kecil. Ukuran file sangat mempengaruhi dalam kecepatan impor/ekspor data.

getwd()
## [1] "C:/Users/lenovo/Documents/data"
setwd(getwd())

df5 = read.table("C:/Users/lenovo/Documents/data/input/input5.txt")   # Import data txt
write.table("C:/Users/lenovo/Documents/data/output/output5.txt")      # Ekspor data txt
## "x"
## "1" "C:/Users/lenovo/Documents/data/output/output5.txt"
df6 = source("C:/Users/lenovo/Documents/data/input/input6 .Rdmpd")    # Import data Rdmpd
dump("df6", "C:/Users/lenovo/Documents/data/output/outpu6.rmpd")      # Ekspor data menjadi rmpd

df7 = readRDS("C:/Users/lenovo/Documents/data/input/input7 .rds")     # Import data rds
saveRDS(df7, "C:/Users/lenovo/Documents/data/output/output7.rds")     # Ekspor data rds

df8 = readRDS("C:/Users/lenovo/Documents/data/input/input8 .ascii")   # Import data ascii
saveRDS(df8, "C:/Users/lenovo/Documents/data/output/output8.ascii", ascii = TRUE) # Ekspor data ascii

IMPORT ATAU EXPORT DATA XML

Xml (Extensible Markup Language) adalah bahasa markup yang diciptakan oleh Konsorsium World Wide Web (W3C). Bahasa ini berfungsi untuk menyederhanakan proses penyimpanan dan pengiriman data antarserver.Fungsi utama XML adalah untuk menyimpan dan mengirimkan data. Sedangkan fungsi utama HTML adalah untuk menampilkan data.

Berikut cara untuk mengekspor ataupun mengimpor file xml :

library("XML")
library("kulife")
library("methods")

df9 <- xmlParse("C:/Users/lenovo/Documents/data/input/input9.xml")  # Import file XML

# Mengubah xml menjadi data frame

xml_df <- xmlToDataFrame(df9)
write.xml(xml_df, "C:/Users/lenovo/Documents/data/output/output9..xml")  # Mengekspor data XML

JSON

JSON adalah singkatan dari JavaScript Object Notation JSON adalah format ringan untuk menyimpan dan mengangkut data JSON sering digunakan ketika data dikirim dari server ke halaman web JSON “mendeskripsikan diri sendiri” dan mudah dimengerti.

# install.packages("jsonlite")
library(jsonlite)

df10 <- fromJSON("C:/Users/lenovo/Documents/data/input/input10 .json")  # Import data json
dfjson = as.data.frame(df10)                                            # mengubah data json menjadi data frame

write_json(dfjson, "C:/Users/lenovo/Documents/data/output/output10.json") # mengekspor data

Import Data Dari Web

web.csv <- read.csv("https://bookdown.org/aepstk/intror/importdata.html")

BASIS DATA R

Basis data merupakan objek yang tidak dapat bergerak sendiri yang artinya membutuhkaan program/aplikasi penggerak atau pengelolaannya. Sehingga gabungan keduanya dapat menghasilkan sebuah sistem.Basis data juga merupakan tempat penyimpanan elektronik, seperti arsip yang tersusun rapih agar tidak ada penggulangan.

MENAMBANG DATA WEB

Metode penambangan data web dapat dikelompokkan dalam tiga bidang: web content mining, web structure mining, serta web usage mining. Dalam web content mining, tahapan dalam preprocessingnya akan menerapkan seperti yang dilakukan dalam text mining pada umumnya. Hanya saja yang perlu untuk ditekankan di sini adalah harus dapat membuang semua elemen yang dirasa tidak penting terhadap content (misalnya elemen format bold, italic, dsb.).

Dalam pembersihan ini, elemen-elemen yang dapat memberi arti lebih terhadap isi web harus juga diperhatikan, seperti elemen meta, ataupun jika dalam halaman web mengandung metadata ataupun microdata dan microformat. Setelah bersih dan dilakukan tokenisasi ataupun parsing, biasanya akan digunakan metode information retrieval ataupun data mining seperti clustering dan klasifikasi. Semua metode tersebut digunakan untuk dapat menemukan pola informasi yang tidak langsung terlihat jika hanya menggunakan proses statistik dasar.

Web Structure Mining akan lebih fokus pada analisis graf yang terbentuk dari struktur tautan dalam satu lingkungan atau batasan satu atau beberapa web. Setelah graf jejaring web terbentuk, maka kita dapat menganalisis graf tersebut. Misalnya dengan menggunakan PageRank, kita dapat mengetahui web mana yang lebih dipercaya. Algoritma HITS juga dapat digunakan untuk mengetahui web mana yang menjadi sumber utama dalam satu topik tertentu. Penerapan pencocokan graf juga dapat diterapkan untuk melihat kemiripan struktur antar web. Bahkan kita dapat menggunakan metode Social Network Analysis untuk menemukan centrality misalnya diantara kerumunan jejaring web. Dengan kata lain alogitma graf dapat digunakan untuk analisis jejaring web tersebut.

Terakhir adalah Web Usage Mining yang akan fokus menganalisis transaksi yang diproses dari data log yang dihasilkan web server. Analisis transaksi misalnya asosiasi dan analisis pola urutan akses web. Namun pemanfaatan hanya dari log server tidaklah cukup dapat dihandalkan untuk digunakan dalam hak analisis transaksi. Salah satu penyebabnya adalah adanya proxy server dan caching pada web browser yang menyebabkan catatan log server menjadi tidak lengkap. Dalam hal ini perlu dipertimbangkan pemanfaatan cookie dan klik dari user berdasar sesi dalam web browser.