Dokumen ini berisi proses pengambilan data (web scraping) dari file Excel (.xlsx) yang tersedia di GitHub menggunakan R.
Pastikan kita memiliki package yang diperlukan untuk mengambil data dari GitHub.
# Load library yang diperlukan
library(httr)
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.3
# URL langsung ke file raw GitHub
file_url <- "https://raw.githubusercontent.com/dsciencelabs/dataset/master/Rekap_Kuesioner.xlsx"
# Mengunduh file sementara
temp_file <- tempfile(fileext = ".xlsx")
GET(file_url, write_disk(temp_file, overwrite = TRUE))
## Response [https://raw.githubusercontent.com/dsciencelabs/dataset/master/Rekap_Kuesioner.xlsx]
## Date: 2025-03-10 08:55
## Status: 200
## Content-Type: application/octet-stream
## Size: 1.23 MB
## <ON DISK> C:\Users\NABILA~1\AppData\Local\Temp\RtmpY9rXUW\file24544c00987.xlsx
# Membaca file Excel
data <- read_excel(temp_file)
## New names:
## • `` -> `...2`
## • `` -> `...3`
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
## • `` -> `...7`
## • `` -> `...8`
## • `` -> `...9`
## • `` -> `...10`
## • `` -> `...11`
## • `` -> `...12`
## • `` -> `...13`
# Menampilkan 5 baris pertama dari dataset
head(data)
## # A tibble: 6 × 13
## `Hasil Kuisioner` ...2 ...3 ...4 ...5 ...6 ...7 ...8 ...9 ...10 ...11
## <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 Semester : Gasal … <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
## 2 Sesi : Semua <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
## 3 <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
## 4 Kelas DP11… <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
## 5 Mata Kuliah Nirm… <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
## 6 Program Studi DESA… <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
## # ℹ 2 more variables: ...12 <chr>, ...13 <chr>
# Menampilkan tabel dalam format rapi seperti Excel
library(knitr) # Pastikan library knitr sudah dimuat
kable(head(data, 10)) # Menampilkan 10 baris pertama dalam tabel
Hasil Kuisioner | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …10 | …11 | …12 | …13 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Semester : Gasal 2023/2024 | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
Sesi : Semua | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
Kelas | DP1111 Nirmana I | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
Mata Kuliah | Nirmana I | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
Program Studi | DESAIN PRODUK (S1) | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
Dosen | I KETUT SUARNA, S.Sn., M.Ds. | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
No. Responden | Kode Pertanyaan | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA | NA |
# Simpan data ke file CSV
write.csv(data, "Rekap_Kuesioner.csv", row.names = FALSE)