Pendahuluan

Dokumen ini berisi proses pengambilan data (web scraping) dari file Excel (.xlsx) yang tersedia di GitHub menggunakan R.

Instalasi & Persiapan

Pastikan kita memiliki package yang diperlukan untuk mengambil data dari GitHub.

# Load library yang diperlukan
library(httr)
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
# URL langsung ke file raw GitHub
file_url <- "https://raw.githubusercontent.com/dsciencelabs/dataset/master/Rekap_Kuesioner.xlsx"

# Mengunduh file sementara
temp_file <- tempfile(fileext = ".xlsx")
GET(file_url, write_disk(temp_file, overwrite = TRUE))
## Response [https://raw.githubusercontent.com/dsciencelabs/dataset/master/Rekap_Kuesioner.xlsx]
##   Date: 2025-03-10 08:55
##   Status: 200
##   Content-Type: application/octet-stream
##   Size: 1.23 MB
## <ON DISK>  C:\Users\NABILA~1\AppData\Local\Temp\RtmpY9rXUW\file24544c00987.xlsx
# Membaca file Excel
data <- read_excel(temp_file)
## New names:
## • `` -> `...2`
## • `` -> `...3`
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
## • `` -> `...7`
## • `` -> `...8`
## • `` -> `...9`
## • `` -> `...10`
## • `` -> `...11`
## • `` -> `...12`
## • `` -> `...13`
# Menampilkan 5 baris pertama dari dataset
head(data)
## # A tibble: 6 × 13
##   `Hasil Kuisioner`  ...2  ...3  ...4  ...5  ...6  ...7  ...8  ...9  ...10 ...11
##   <chr>              <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 Semester : Gasal … <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA> 
## 2 Sesi : Semua       <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA> 
## 3 <NA>               <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA> 
## 4 Kelas              DP11… <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA> 
## 5 Mata Kuliah        Nirm… <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA> 
## 6 Program Studi      DESA… <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA>  <NA> 
## # ℹ 2 more variables: ...12 <chr>, ...13 <chr>
# Menampilkan tabel dalam format rapi seperti Excel
library(knitr)  # Pastikan library knitr sudah dimuat
kable(head(data, 10))  # Menampilkan 10 baris pertama dalam tabel
Hasil Kuisioner …2 …3 …4 …5 …6 …7 …8 …9 …10 …11 …12 …13
Semester : Gasal 2023/2024 NA NA NA NA NA NA NA NA NA NA NA NA
Sesi : Semua NA NA NA NA NA NA NA NA NA NA NA NA
NA NA NA NA NA NA NA NA NA NA NA NA NA
Kelas DP1111 Nirmana I NA NA NA NA NA NA NA NA NA NA NA
Mata Kuliah Nirmana I NA NA NA NA NA NA NA NA NA NA NA
Program Studi DESAIN PRODUK (S1) NA NA NA NA NA NA NA NA NA NA NA
Dosen I KETUT SUARNA, S.Sn., M.Ds. NA NA NA NA NA NA NA NA NA NA NA
NA NA NA NA NA NA NA NA NA NA NA NA NA
NA NA NA NA NA NA NA NA NA NA NA NA NA
No. Responden Kode Pertanyaan NA NA NA NA NA NA NA NA NA NA NA
# Simpan data ke file CSV
write.csv(data, "Rekap_Kuesioner.csv", row.names = FALSE)