Package readxl memudahkan untuk mengambil data dari Excel ke R. Dibandingkan dengan banyak paket yang ada (misalnya gdata, xlsx, xlsReadWrite) readxl tidak memiliki ketergantungan eksternal, sehingga mudah untuk diinstal dan digunakan di semua sistem operasi. Ini dirancang untuk bekerja dengan data tabular.
install.packages("readxl", repos= "http://cran.r-project.org")
## package 'readxl' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Administrator\AppData\Local\Temp\RtmpEL0BLR\downloaded_packages
Jenis file yang digunakan adalah file Excel. Sehingga untuk menampilkan data dalam Rstudio dengan menggunakan package {readxl} dengan fungsi read_excel untuk import data dari file Excel.
library (readxl)
datanilai <- read_excel("E:/MK12/Statistik/Nilai mahasiswa.xlsx")
datanilai
## # A tibble: 30 × 4
## No NIM NAMA Nilai
## <dbl> <dbl> <chr> <dbl>
## 1 1 1815051111 DIKA 80
## 2 2 1815051112 JODI 85
## 3 3 1815051113 RIYAN 90
## 4 4 1815051114 PUPUT 100
## 5 5 1815051115 DONI 92
## 6 6 1815051116 DANI 84
## 7 7 1815051117 DINA 88
## 8 8 1815051118 DIPA 80
## 9 9 1815051119 DIMAS 78
## 10 10 1815051120 JORDAN 76
## # ℹ 20 more rows
Rata-rata aritmatik dari suatu sampel dilakukan dengan menjumlahkan
seluruh nilai, kemudian dibagi dengan jumlah sampel tersebut. R telah
menyediakan function untuk menghitung nilai rata-rata aritmatik, yaitu
function mean. Berikut contoh perhitungan dengan
menggunakan function tersebut:
mean(datanilai$Nilai)
## [1] 82.5
Nilai median merupakan nilai tengah dari data yang telah diurutkan. Apabila banyak data ganjil, median meruapakan data ke n+12. Apabila banyak data genap, mdeian merupakan rata-rata dari data ke n2 dan n2+1. Median seringkali digunakan untuk mempresentasikan data menceng kanan maupun menceng kiri. R telah menyediakan function untuk menghitung median, yaitu function median.
median(datanilai$Nilai)
## [1] 83
Nilai median merupakan nilai yang paling sering muncul pada sekumpulan data. R tidak menyediakan function untuk menghitung median. Berikut contoh perhitungan dengan menggunakan function yang dibangun sendiri pada R.
mode(datanilai$Nilai)
## [1] "numeric"
Nilai minimal adalah nilai terkecil dalam data sedangkan nilai maksimal merupakan nilai terbesar dalam data.
min(datanilai$Nilai)
## [1] 62
max(datanilai$Nilai)
## [1] 100
Standar deviasi atau simpangan baku adalah ukuran sebaran data yang mengukur bagaimana setiap nilai dalam data tersebar.
sd(datanilai$Nilai)
## [1] 9.250349
Kuartil adalah bilangan yang membagi data menjadi empat bagian. Terdiri dari kuartil 1 (25%), kuartil 2(50%) dan kuartil 3 (75%).
quantile(datanilai$Nilai)
## 0% 25% 50% 75% 100%
## 62.0 78.0 83.0 89.5 100.0
Ringkasnya, bisa juga dengan menuliskan syntax summary(), yang akan menampilkan nilai rata-rata(mean), nilai minimal, nilai maksimal serta kuartil pertama, kedua dan ketiga.
summary(datanilai)
## No NIM NAMA Nilai
## Min. : 1.00 Min. :1.815e+09 Length:30 Min. : 62.0
## 1st Qu.: 8.25 1st Qu.:1.815e+09 Class :character 1st Qu.: 78.0
## Median :15.50 Median :1.815e+09 Mode :character Median : 83.0
## Mean :15.50 Mean :1.815e+09 Mean : 82.5
## 3rd Qu.:22.75 3rd Qu.:1.815e+09 3rd Qu.: 89.5
## Max. :30.00 Max. :1.815e+09 Max. :100.0