NIM: 52250001
NIM: 52250018
NIM: 52250004
NIM: 52250023
NIM: 52250021
Statistik adalah ilmu yang mempelajari metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data untuk menghasilkan informasi yang bermakna serta mendukung pengambilan keputusan di bawah kondisi ketidakpastian. Statistik digunakan untuk memahami pola dan variasi dalam data, serta untuk menarik kesimpulan dan membuat prediksi mengenai suatu populasi berdasarkan data yang tersedia.
Permasalahan statistik utama berkaitan dengan bagaimana data dapat diolah dan dianalisis secara sistematis agar menghasilkan informasi yang akurat dan dapat dipercaya. Data yang tersedia sering kali mengandung variasi, ketidakpastian, serta jumlah yang besar, sehingga diperlukan metode statistik untuk merangkum data, memahami pola yang muncul, dan mengurangi kesalahan dalam penarikan kesimpulan. Statistik membantu menjembatani data mentah menjadi dasar yang rasional dalam pengambilan keputusan.
Statistik secara umum terbagi menjadi dua jenis utama, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif digunakan untuk menggambarkan dan meringkas data melalui ukuran pemusatan, ukuran penyebaran, serta visualisasi data. Sementara itu, statistik inferensial digunakan untuk menarik kesimpulan atau membuat estimasi mengenai suatu populasi berdasarkan data sampel, dengan memanfaatkan konsep peluang, interval kepercayaan, dan pengujian hipotesis.
Eksplorasi Data adalah tahap awal analisis statistik untuk memahami karakteristik, struktur, dan kualitas data sebelum analisis lanjutan, sehingga membantu menghindari kesalahan interpretasi dan menghasilkan keputusan yang lebih akurat.
| Jenis.Data | Bentuk.Data | Tipe | Deskripsi |
|---|---|---|---|
| Data Numerik (Kuantitatif) | Berupa angka | Diskrit | Data hasil hitungan, biasanya berupa bilangan bulat |
| Kontinu | Data hasil pengukuran, dapat berupa bilangan pecahan | ||
| Data Kategorikal (Kualitatif) | Berupa kategori | Nominal | Data kategori tanpa urutan tertentu |
| Ordinal | Data kategori yang memiliki urutan atau tingkatan |
Pada tahap eksplorasi data, variabel numerik diringkas menggunakan statistik deskriptif untuk memberikan gambaran awal terhadap data. Ringkasan statistik ini meliputi ukuran pemusatan seperti mean dan median, serta ukuran penyebaran seperti nilai minimum, maksimum, range, varians, dan standar deviasi.
Selain itu, eksplorasi data juga bertujuan untuk mengidentifikasi pola awal, yaitu kecenderungan umum yang muncul dalam data, tren, yaitu perubahan nilai data apabila diamati berdasarkan urutan tertentu, serta anomali (outlier), yaitu nilai yang menyimpang jauh dari sebagian besar data. Informasi ini menjadi dasar penting dalam memahami perilaku data dan menentukan metode analisis statistik selanjutnya.
Visualisasi data adalah proses mengubah data mentah menjadi informasi yang jelas dan bermakna, sehingga mudah dipahami dan membantu penyampaian pesan secara tepat.
Line chart adalah alat visualisasi data yang digunakan untuk menunjukkan bagaimana nilai berubah secara berurutan, biasanya dari waktu ke waktu.
Contoh Kasus: Menampilkan tren penjualan bulanan toko online selama tahun 2024 untuk melihat bulan mana yang memiliki performa terbaik.
Bar chart adalah grafik batang untuk menampilkan data kategorikal. Tinggi atau panjang batang menunjukkan nilai tiap kategori sehingga mudah dibandingkan.
Contoh Kasus: Membandingkan total penjualan antar kategori produk untuk mengetahui produk mana yang paling laris.
Histogram adalah grafik batang untuk menunjukkan sebaran data numerik dalam beberapa interval.
Contoh Kasus : Distribusi Nilai Ujian Mahasiswa
Central Tendency adalah ukuran statistik yang merepresentasikan nilai tipikal atau sentral dari dataset. Bertujuan memberikan satu nilai yang paling mewakili keseluruhan data. Ada Tiga Ukuran Utama yaitu:
Rata-rata adalah nilai yang diperoleh dengan membagi jumlah seluruh data dengan banyaknya data, dan digunakan untuk data bertipe interval dan rasio.
Rumus: \(\bar{x} = \frac{\sum x}{n}\)
Nilai Tengah adalah nilai tengah dari data yang telah diurutkan dan cocok digunakan untuk data bertipe ordinal, interval, dan rasio.
Rumus: \(\text{Median} = \begin{cases} x_{\left(\frac{n+1}{2}\right)}, & \text{jika } n \text{ ganjil} \\ \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}, & \text{jika } n \text{ genap} \end{cases}\)
Nilai tengah adalah nilai yang paling sering muncul dalam suatu kumpulan data dan dapat digunakan untuk data bertipe nominal, ordinal, interval, maupun rasio.
Rumus: \(\text{Mode} = x \;\; \text{dengan frekuensi tertinggi}\)
Menghitung ukuran pemusatan data dari nilai siswa pada 2 mata
pelajaran:
- Nilai Fisika: 85, 78, 92, 85, 76, 88, 85, 90, 72, 85,
95, 80, 85, 88, 70
- Nilai Bahasa: 80, 75, 88, 82, 78, 85, 80, 90, 74, 82,
92, 78, 80, 85, 76
Perhitungan Menggunakan Kode R
| Variabel | Mean | Median | Modus |
|---|---|---|---|
| Fisika | 83.60 | 85 | 85 |
| Bahasa Indonesia | 81.67 | 80 | 80 |
Interpretasi dan Perbandingan Hasil Kedua Nilai
Siswa:
1. Rata-rata: Nilai rata-rata Fisika (83,60) lebih
tinggi dibandingkan Bahasa Indonesia (81,67), sehingga performa siswa
pada Fisika lebih baik.
2. Nilai Tengah: Median Fisika sebesar 85 lebih tinggi
daripada Bahasa Indonesia sebesar 80, menunjukkan nilai tengah Fisika
berada pada tingkat lebih tinggi.
3. Modus (nilai paling sering muncul): Modus Fisika
adalah 85, sedangkan Bahasa Indonesia 80, yang berarti nilai yang paling
sering muncul pada Fisika lebih tinggi.
Kesimpulan: Secara keseluruhan, hasil belajar siswa pada mata pelajaran Fisika lebih baik dibandingkan Bahasa Indonesia, baik dilihat dari rata-rata, nilai tengah, maupun nilai yang paling sering muncul.
Statistical dispersion adalah ukuran yang menunjukkan seberapa
tersebar atau bervariasi data dari suatu kumpulan nilai. Semakin besar
nilai dispersi, semakin tidak seragam datanya, sedangkan semakin kecil
nilai dispersi, semakin homogen data tersebut.
Pengukuran tingkat dispersi data umumnya dilakukan menggunakan beberapa
ukuran utama, yaitu jangkauan (range), varians, dan simpangan baku
Range adalah ukuran penyebaran paling sederhana yang menunjukkan selisih antara nilai maksimum dan minimum dalam data.
Rumus: \(Range = X_{max} - X_{min}\)
Contoh Perhitungan:
Data: 5, 7, 10, 12, 15
Range = 15 − 5 = 10
Definisi: Varians menunjukkan rata-rata kuadrat selisih setiap data terhadap nilai rata-rata (mean).
Rumus:
Populasi:
\(\sigma^2 = \frac{\sum (x_i -
\mu)^2}{n}\)
Sampel:
\(s^2 = \frac{\sum (x_i - \bar{x})^2}{n -
1}\)
Contoh Perhitungan
Diketahui data: 46, 50, 54, 48, 52
\(\bar{X} = \frac{250}{5} = 50\)
\(\sum (X_i - \bar{X})^2 = 40\)
\(s^2 = \frac{40}{4} = 10\)
Definisi
Standar deviasi adalah akar kuadrat dari varians
dan menunjukkan rata-rata jarak data terhadap mean.
Rumus
\(s =
\sqrt{s^2}\)
Contoh Perhitungan
\(s^2 =
10\)
\(s = \sqrt{10} \approx
3,16\)
Secara umum, ukuran dispersi digunakan untuk menilai tingkat keragaman data dalam suatu kumpulan pengamatan. Nilai range, varians, dan standar deviasi yang relatif kecil menunjukkan bahwa data cenderung terkonsentrasi di sekitar nilai rata-rata, sehingga variasi antar data tidak terlalu besar. Sebaliknya, nilai dispersi yang besar mengindikasikan adanya perbedaan yang cukup signifikan antar nilai pengamatan, yang mencerminkan tingkat heterogenitas data yang lebih tinggi.
Probabilitas adalah ukuran peluang terjadinya suatu peristiwa.
Nilainya berada antara 0 sampai 1, di mana:
0 → kejadian mustahil
1 → kejadian pasti
Rumus dasar:
\(P(A) = \frac{\text{Jumlah hasil yang
menguntungkan}}{\text{Jumlah seluruh hasil dalam ruang
sampel}}\)
Ruang sampel (S) adalah seluruh kemungkinan hasil dari suatu
percobaan.
Kejadian (event) adalah bagian dari ruang sampel yang diperhatikan.
Contoh:
Melempar koin 2 kali:
\(S = \{HH, HT, TH, TT\}\)
Dua aturan utama:
- Nilai probabilitas selalu \(0 \le P(A) \le
1\)
- Total probabilitas seluruh hasil dalam ruang sampel = 1
Aturan ini digunakan untuk mencari peluang kejadian tidak
terjadi.
Rumus:
\(P(A^c) = 1 - P(A)\)
Independen: satu kejadian tidak memengaruhi kejadian lain.
\(P(A \cap B) = P(A) \times P(B)\)
Dependen: satu kejadian memengaruhi kejadian berikutnya.
\(P(A \cap B) = P(A) \times P(B|A)\)
Gabungan (Union): kejadian A atau B.
\(P(A \cup B) = P(A) + P(B) - P(A \cap
B)\)
Saling lepas (Mutually Exclusive): tidak bisa terjadi bersamaan.
Menyeluruh (Exhaustive): mencakup seluruh ruang sampel.
Eksperimen binomial memiliki 4 syarat:
Jumlah percobaan tetap
Dua hasil (sukses/gagal)
Peluang sukses tetap
Percobaan saling
independen
Rumus binomial:
\(P(k) = \binom{n}{k}
p^k (1-p)^{n-k}\)
Muncul setidaknya satu Ekor saat koin dilempar 2 kali
Ruang Sampel \(S = \{HH,
HT, TH, TT\}\)
Jumlah total hasil = 4
Hasil yang Mendukung Event A
\(\{HT, TH, TT\}\) → jumlah = 3
Perhitungan Peluang
\(P(A) = \frac{3}{4} = 0.75\)
Probabilitas 0.75 (75%) berarti bahwa:
Dari banyak percobaan
melempar koin 2 kali,
Sekitar 75% percobaan akan menghasilkan
setidaknya satu Ekor.
Artinya, kejadian ini cukup besar
kemungkinannya dan lebih sering terjadi dibandingkan tidak terjadi.
Distribusi probabilitas menggambarkan bagaimana nilai suatu variabel numerik tersebar dalam data. Konsep ini digunakan untuk memahami pola sebaran data dan kecenderungan nilai yang sering muncul.
Distribusi durasi belajar mahasiswa (dalam menit) divisualisasikan menggunakan kurva distribusi (density plot). Berdasarkan visualisasi tersebut, distribusi data cenderung miring ke kanan, yang menunjukkan bahwa sebagian besar mahasiswa memiliki durasi belajar pada rentang menengah, sementara hanya sedikit mahasiswa dengan durasi belajar yang sangat tinggi.
Interval kepercayaan adalah rentang nilai yang digunakan untuk memperkirakan parameter populasi berdasarkan data sampel dengan tingkat keyakinan tertentu. Interval ini menunjukkan sejauh mana estimasi dari sampel dapat mewakili kondisi populasi yang sebenarnya.
Misalkan dilakukan pengambilan sampel terhadap 25 mahasiswa untuk mengukur rata-rata waktu belajar harian. Dari sampel tersebut diperoleh:
Dengan tingkat kepercayaan 95% dan menggunakan distribusi t, diperoleh nilai kritis \(t_{0.025,24} \approx 2.064\).
Interval kepercayaan 95% dihitung sebagai: \(CI = \bar{x} \pm t_{\alpha/2,\,df} \left( \frac{s}{\sqrt{n}} \right)\)
Sehingga diperoleh interval: \[ \begin{aligned} CI &= 120 \pm 2.064 \left( \frac{20}{\sqrt{25}} \right) = 120 \pm 2.064 \times 4 = 120 \pm 8.256 \\ CI &= (111.74, 128.26) \end{aligned} \]
Interpretasi:
Dengan tingkat keyakinan 95%, dapat disimpulkan bahwa rata-rata waktu
belajar harian mahasiswa dalam populasi diperkirakan berada antara
111.74 hingga 128.26 menit. Interval ini memberikan gambaran tingkat
ketelitian estimasi serta menunjukkan adanya ketidakpastian yang masih
melekat dalam proses penarikan kesimpulan berdasarkan data sampel.
Inferensi statistik adalah proses penarikan kesimpulan tentang suatu populasi berdasarkan data sampel. Konsep ini digunakan untuk melakukan generalisasi, prediksi, dan pengambilan keputusan dalam kondisi ketidakpastian.
H₀: tidak ada efek atau perbedaan.
H₁: ada efek
atau perbedaan.
Hipotesis alternatif dapat berupa uji dua
arah (tanpa arah khusus) atau uji satu arah (arah efek
ditentukan sebelumnya).
Tipe I (α): menolak H₀ yang benar (false positive).
Tipe II (β): gagal menolak H₀ yang salah (false
negative).
Power = 1 − β, menunjukkan kemampuan uji
mendeteksi efek nyata.
Uji T: rata-rata, σ tidak diketahui, sampel kecil.
Uji
Z: rata-rata, σ diketahui atau n ≥ 30.
Chi-Square (χ²):
data kategorikal.
Perbedaan utama terletak pada jenis data dan
asumsi statistik.
Keputusan dibuat berdasarkan nilai p-value.
p ≤
α → H₀ ditolak.
p > α → H₀ gagal ditolak.
Pendekatan ini memastikan keputusan objektif dan terkontrol.
Contoh Kasus: Sebuah produsen minuman mengklaim bahwa rata-rata volume isi botol produknya lebih dari 500 ml. (Sampel diambil sebanyak 10 botol dengan \(α\) = 0.05)
Hipotesis:
H₀: μ ≤ 500 ml
H₁: μ > 500 ml
Uji satu arah digunakan karena arah klaim telah ditentukan.
Statistik Uji:
Uji t satu sampel digunakan karena data
numerik dan simpangan baku populasi tidak diketahui.
Kemudian dari sampel diperoleh rata-rata 504,2 ml dengan simpangan baku
3,7 ml.
Kesimpulan:
Hasil pengujian menghasilkan p-value < 0,05
sehingga H₀ ditolak. Dengan demikian, rata-rata volume
isi botol secara signifikan lebih besar dari 500
ml.
Metode nonparametrik adalah teknik inferensi statistik yang tidak bergantung pada asumsi distribusi tertentu, seperti normalitas atau parameter populasi yang diketahui. Metode ini digunakan ketika data berskala ordinal/kategorikal, berukuran kecil, atau mengandung nilai pencilan.
Metode nonparametrik digunakan sebagai alternatif ketika asumsi metode parametrik tidak terpenuhi.
Fokus inferensi meliputi:
- median
- peringkat
- frekuensi
Direkomendasikan ketika:
- distribusi data tidak normal
- ukuran sampel kecil
- terdapat outlier
- data berskala ordinal atau nominal
Parametrik: asumsi distribusi ketat, sensitif terhadap
outlier.
Nonparametrik: asumsi minimal, lebih robust namun power lebih
rendah.
Contoh Kasus:
Peneliti membandingkan tingkat kepuasan
pelanggan antara dua layanan transportasi online. Data kepuasan
diperoleh menggunakan skala ordinal (1–5) dari masing-masing 8
responden.
Alasan Pemilihan Uji:
Uji nonparametrik dipilih karena data berskala ordinal dan ukuran sampel
kecil.
Statistik Uji: Uji Mann–Whitney U digunakan karena data berskala ordinal, ukuran sampel kecil, dan kedua kelompok pelanggan bersifat independen. Uji ini merupakan alternatif nonparametrik dari uji-t dua sampel untuk membandingkan kecenderungan pusat dua kelompok tanpa asumsi distribusi normal.
Kesimpulan: Berdasarkan hasil uji Mann–Whitney U, diperoleh bukti adanya perbedaan tingkat kepuasan pelanggan antara kedua layanan transportasi online, sehingga hipotesis nol ditolak.
Dalam beberapa tahun terakhir, proses pembelajaran mengalami perubahan seiring dengan pemanfaatan teknologi digital dalam kegiatan belajar-mengajar. Pembelajaran tidak lagi hanya dilakukan melalui pertemuan tatap muka (luring), tetapi juga mulai mengombinasikan pembelajaran daring sebagai alternatif dalam pelaksanaannya.
Namun, efektivitas suatu metode pembelajaran tidak dapat ditentukan hanya dari cara penyampaiannya. Keberhasilan program pembelajaran juga dipengaruhi oleh beberapa faktor penting, antara lain:
Oleh karena itu, diperlukan analisis berbasis data untuk mengevaluasi bagaimana karakteristik pembelajaran tersebut memengaruhi performa peserta secara kuantitatif.
Pada analisis ini, digunakan dataset kelas intensif statistik yang memuat informasi aktivitas belajar mingguan serta beberapa indikator penilaian yang relevan. Dataset ini dianalisis untuk menilai dan mengevaluasi efektivitas kelas intensif statistik secara kuantitatif dan menjadi dasar dalam penyusunan strategi pembelajaran yang lebih efektif serta sesuai dengan kebutuhan pengguna.
Dataset yang digunakan dalam analisis ini terdiri dari beberapa variabel yang merepresentasikan karakteristik peserta, aktivitas pembelajaran, serta capaian hasil belajar dalam kelas intensif statistik. Adapun penjelasan masing-masing variabel adalah sebagai berikut:
| Nama Variabel | Jenis Variabel | Deskripsi Singkat |
|---|---|---|
| ID Mahasiswa | Kategorikal – Nominal | Identitas unik setiap mahasiswa peserta kelas intensif statistik |
| Minggu ke- | Numerik – Jangka Waktu | Menunjukkan urutan minggu pelaksanaan pembelajaran |
| Materi Pembelajaran | Kategorikal – Nominal | Topik statistik yang dipelajari |
| Mode Pembelajaran | Kategorikal – Nominal | Metode pembelajaran yang digunakan (luring atau daring) |
| Durasi Belajar (Menit) | Numerik – Kontinu | Durasi waktu belajar peserta dalam satuan menit |
| Skor Fokus | Numerik – Diskrit | Skor tingkat fokus mahasiswa selama proses pembelajaran |
| Skor Kuis 1 | Numerik – Kontinu | Nilai kuis yang diperoleh sebelum mengikuti kelas intensif |
| Skor Kuis 2 | Numerik – Kontinu | Nilai kuis yang diperoleh setelah mengikuti kelas intensif |
| Tingkat Kepuasan | Kategorikal – Ordinal | Tingkat kepuasan mahasiswa terhadap proses pembelajaran |
Pada analisis ini, visualisasi menggunakan pie chart dipilih karena bertujuan untuk menampilkan proporsi tingkat kepuasan mahasiswa pada setiap kategori secara jelas dan mudah dipahami. Pie chart efektif digunakan untuk menunjukkan perbandingan persentase antar kategori dalam satu variabel kategorikal, sehingga memudahkan pembaca dalam melihat distribusi kepuasan mahasiswa secara keseluruhan.
Tingkat kepuasan mahasiswa menggambarkan sejauh mana mahasiswa merasa puas terhadap proses pembelajaran yang telah diterapkan. Berdasarkan pie chart di samping, mayoritas mahasiswa berada pada kategori “Puas” dan “Sangat Puas”, yang menunjukkan bahwa sebagian besar mahasiswa memiliki persepsi positif terhadap kualitas pembelajaran.
Namun demikian, masih terdapat mahasiswa yang berada pada kategori “Cukup Puas” dan “Tidak Puas”, yang menandakan bahwa meskipun tingkat kepuasan secara umum sudah baik, tetap diperlukan upaya peningkatan kualitas pembelajaran secara berkelanjutan.
Line chart digunakan pada analisis ini karena mampu menampilkan perubahan nilai rata-rata skor kuis dari waktu ke waktu secara jelas. Visualisasi ini bertujuan untuk membandingkan tren skor kuis sebelum dan sesudah pembelajaran setiap minggu, sehingga memudahkan dalam mengamati pola peningkatan atau penurunan hasil belajar mahasiswa.
Berdasarkan grafik, rata-rata skor kuis sesudah pembelajaran selalu lebih tinggi dibandingkan sebelum pembelajaran pada setiap minggu pengamatan. Hal ini menunjukkan bahwa pembelajaran yang diberikan memberikan dampak positif terhadap peningkatan hasil belajar. Peningkatan skor terlihat semakin stabil setelah minggu ke-7.
Analisis central tendency digunakan untuk menggambarkan nilai pusat dari skor kuis sesudah pembelajaran. Ukuran seperti mean dan median membantu mengetahui skor yang paling mewakili performa mahasiswa secara keseluruhan serta menilai kecenderungan umum hasil belajar setelah proses pembelajaran.
Interpretasi Histogram
Histogram menunjukkan bahwa skor
kuis sesudah pembelajaran terkonsentrasi pada nilai tinggi (sekitar
90–98). Distribusi tampak sedikit miring ke kiri, ditandai dengan nilai
mean yang lebih kecil dari median, yang mengindikasikan adanya beberapa
skor rendah meskipun mayoritas mahasiswa memperoleh nilai tinggi.
Interpretasi Boxplot
Boxplot menunjukkan median skor yang
tinggi dengan rentang antar kuartil yang relatif sempit, menandakan
konsistensi hasil belajar. Terdapat beberapa outlier pada skor rendah,
yang menunjukkan sebagian kecil mahasiswa memiliki capaian di bawah
mayoritas peserta.
Berdasarkan kedua visualisasi, skor kuis mahasiswa umumnya berada pada nilai tinggi dan relatif konsisten, menunjukkan efektivitas pembelajaran yang diterapkan. Meskipun terdapat beberapa nilai pencilan yang rendah, secara keseluruhan hasil belajar tetap terpusat pada skor tinggi, dengan kebutuhan pendampingan bagi sebagian kecil mahasiswa.
Pada analisis ini, ukuran penyebaran digunakan untuk melihat seberapa beragam skor kuis sesudah pembelajaran pada setiap mode dan materi pembelajaran. Analisis ini bertujuan untuk menilai tingkat konsistensi hasil belajar mahasiswa, bukan hanya melihat nilai rata-rata.
Histogram
Histogram menunjukkan distribusi skor kuis
sesudah pada mode pembelajaran luring dan daring. Meskipun rata-rata
skor relatif berdekatan, bentuk kurva density memperlihatkan perbedaan
tingkat variasi penyebaran skor antar mode pembelajaran, yang
menunjukkan bahwa tingkat konsistensi hasil belajar mahasiswa dapat
berbeda tergantung pada mode pembelajaran yang digunakan.
Violin & Boxplot
Violin plot dan boxplot menunjukkan
bahwa penyebaran skor kuis sesudah berbeda pada setiap materi
pembelajaran. Violin yang lebih lebar menandakan variasi skor yang lebih
tinggi, sedangkan boxplot dengan IQR yang lebih sempit menunjukkan hasil
belajar yang lebih konsisten, meskipun masih terdapat beberapa nilai
pencilan yang menandakan adanya mahasiswa dengan capaian yang jauh di
bawah mayoritas.
Pada analisis ini, distribusi probabilitas digunakan untuk melihat pola sebaran skor kuis sesudah pembelajaran pada setiap mode pembelajaran. Analisis ini bertujuan untuk memahami bagaimana peluang mahasiswa memperoleh skor tertentu tersebar dalam data, sehingga tidak hanya berfokus pada nilai rata-rata, tetapi juga pada pola dan konsistensi capaian hasil belajar.
Violin plot menunjukkan distribusi probabilitas skor kuis sesudah berdasarkan mode pembelajaran daring dan luring. Lebar violin merepresentasikan kepadatan data, sehingga bagian yang lebih lebar menunjukkan peluang mahasiswa memperoleh skor pada rentang nilai tertentu lebih besar.
Boxplot di dalam violin memperlihatkan nilai median dan rentang antar kuartil (IQR), yang menggambarkan sebaran utama skor kuis sesudah, sementara titik mean merepresentasikan nilai harapan (expected value).
Perbedaan bentuk dan lebar sebaran antara pembelajaran daring dan luring menunjukkan variasi pola distribusi peluang serta tingkat konsistensi capaian skor, meskipun secara umum kedua mode pembelajaran sama-sama menunjukkan kecenderungan hasil belajar yang relatif baik.
Program kelas intensif statistik diikuti oleh mahasiswa untuk
meningkatkan pemahaman materi statistika. Setelah menyelesaikan program,
mahasiswa mengikuti kuis evaluasi.
Berdasarkan data skor kuis sesudah mengikuti kelas, dilakukan
perhitungan interval keyakinan 95% untuk
mengestimasi rata-rata skor kuis mahasiswa yang
mengikuti program kelas intensif statistik.
Analisis ini bertujuan untuk mengestimasi rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik. Sehingga sampel pada analisis ini terdiri dari 50 skor kuis mahasiswa setelah mengikuti kelas, di mana setiap skor merepresentasikan hasil kuis satu mahasiswa.
Karena data yang digunakan merupakan data sampel dan simpangan baku populasi tidak diketahui, maka interval keyakinan untuk rata-rata dihitung menggunakan distribusi t dengan simpangan baku sampel. Interval keyakinan 95% digunakan karena tingkat keyakinan ini umum dipakai dan memberikan estimasi rata-rata yang cukup akurat tanpa menghasilkan interval yang terlalu lebar.
Rata-rata sampel (\(\bar{x}\)): \[ \begin{aligned} \bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348 \end{aligned} \] Simpangan Baku Sampel: \[ \begin{aligned} s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{ \frac{1131.078}{49}} = 4.804501 \end{aligned} \] Derajat Kebebasan: \(df = n - 1 = 50 - 1 = 49\)
Hitung \(t_{\alpha/2,\,df}\) untuk tingkat keyakinan 95% \[ \begin{aligned} \alpha &= 1 - 0.95 = 0.05 \\ \alpha/2 &= 0.025 \\ df &= 49 \\ t_{0.025,49} &= 2.009575 \end{aligned} \] Hitung Kesalahan Margin \[ \begin{aligned} ME &= t_{\alpha/2,df}\left(\frac{s}{\sqrt{n}}\right) = 2.009575\left(\frac{4.804501}{\sqrt{50}}\right) = 1.3654 \end{aligned} \] Interval Keyakinan 95% adalah: \[ \begin{aligned} CI_{95\%} &= \bar{x} \pm ME \\ UCI &= 92.5348 + 1.3654 = 93.9002 \\ LCI &= 92.5348 - 1.3654 = 91.1698 \\ CI_{95\%} &= (93.8998,\; 91.1694) \end{aligned} \]
| CL | Alpha | Mean | SD | t | SE | MoE | LCI | UCI |
|---|---|---|---|---|---|---|---|---|
| 95% | 0.05 | 92.5348 | 4.8045 | 2.01 | 0.6795 | 1.3654 | 91.1694 | 93.9002 |
Berdasarkan perhitungan interval keyakinan 95%, diperoleh bahwa rata-rata skor kuis mahasiswa setelah mengikuti program kelas intensif statistik berada pada rentang 91.1698 hingga 93.9002. Dengan tingkat keyakinan 95%, dapat diyakini bahwa rata-rata skor kuis populasi mahasiswa berada dalam interval tersebut.
Rentang interval yang relatif sempit serta posisi rata-rata sampel yang berada di dalam interval keyakinan menunjukkan bahwa skor kuis sesudah pembelajaran berada pada tingkat yang relatif stabil. Dengan demikian, hasil ini mengindikasikan bahwa capaian pembelajaran pada kelas intensif statistik menunjukkan konsistensi performa antar mahasiswa setelah mengikuti program pembelajaran.
Hasil interval keyakinan yang diperoleh menunjukkan bahwa sistem pembelajaran pada program kelas intensif statistik memberikan hasil yang relatif konsisten. Dengan demikian, sistem pembelajaran ini perlu dipertahankan serta ditingkatkan agar kualitas dan konsistensi hasil belajar mahasiswa dapat terus terjaga pada periode pembelajaran berikutnya.
Program kelas intensif statistik menerapkan evaluasi berupa kuis sesudah pembelajaran untuk mengukur perubahan hasil belajar mahasiswa.Berdasarkan data skor kuis mahasiswa setelah mengikuti kelas intensif statistika, dilakukan pengujian hipotesis untuk mengetahui apakah rata-rata skor kuis mahasiswa secara signifikan lebih tinggi dari nilai 80.
Uji statistik yang digunakan adalah uji t satu sampel satu
sisi.
Uji ini dipilih karena tujuan analisis adalah untuk menguji apakah
rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik
secara signifikan lebih tinggi dari nilai acuan 80
berdasarkan satu sampel data mahasiswa. Data yang digunakan merupakan
data sampel, dan simpangan baku populasi tidak
diketahui, sehingga simpangan baku diestimasi menggunakan
simpangan baku sampel.
Taraf signifikansi yang digunakan adalah \(α = 0,05\), karena merupakan tingkat signifikansi yang umum digunakan dalam penelitian statistik. Pengujian dilakukan satu sisi karena fokus analisis adalah untuk menguji apakah rata-rata skor lebih besar dari 80, bukan sekadar berbeda.
Dalam studi kasus ini, nilai 80 digunakan sebagai nilai pembanding (baseline) yang merepresentasikan standar pencapaian skor kuis yang diharapkan.
Hipotesis Nol (H₀):
Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif
statistika sama dengan atau tidak lebih tinggi dari 80. \[
H_0 : \mu \le 80
\]
Hipotesis Alternatif (H₁):
Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif
statistika lebih tinggi dari 80. \[
H_1 : \mu > 80
\]
Rata-rata sampel (\(\bar{x}\)): \[ \begin{aligned} \bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348 \end{aligned} \] Simpangan Baku Sampel: \[ \begin{aligned} s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{ \frac{1131.078}{49}} = 4.804501 \end{aligned} \] Standar Kesalahan: \[ \begin{aligned} SE &= \frac{s}{\sqrt{n}} = \frac{4.804501}{\sqrt{50}} = 0.679 \end{aligned} \]
Statistik Uji t:
\[
\begin{aligned}
t &= \frac{\bar{x} - \mu_0}{SE} = \frac{92.5348 - 80}{0.679} =
\frac{12.5348}{0.679} \approx 18.45
\end{aligned}
\]
| n | Mean | SD | SE | t_statistic | df | p_value | Alpha | Keputusan |
|---|---|---|---|---|---|---|---|---|
| 50 | 92.5348 | 4.8045 | 0.6795 | 18.4482 | 49 | 0 | 0.05 | Tolak H0 |
Hitung p-value:
Rumus p-value uji t satu arah adalah: \(\begin{aligned} p\text{-value} &= P(t \ge
t_{\text{hitung}}) \end{aligned}\) dengan derajat kebebasan \(df = 49\), maka
\[ \begin{aligned} p\text{-value} &= P\left(t_{49} \ge 18.45\right) \end{aligned} \]
Hasil perhitungan menggunakan kode R memberikan nilai: \(\begin{aligned} p\text{-value} &= 5.206043 \times 10^{-24} \end{aligned}\)
Nilai tersebut sangat kecil dan secara praktis dapat dinyatakan sebagai: \(\begin{aligned} p\text{-value} &< 0.0001 \end{aligned}\)
Karena nilai \(p\)-value jauh lebih kecil dari tingkat signifikansi yang digunakan, yaitu \(\alpha = 0.05\), maka keputusan yang diambil adalah menolak hipotesis nol (\(H_0\)).
Dengan demikian, terdapat bukti statistik yang sangat kuat untuk menyimpulkan bahwa rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan lebih tinggi dari 80.
Hasil ini menunjukkan bahwa program kelas intensif statistik memberikan dampak positif yang signifikan terhadap peningkatan skor kuis mahasiswa. Oleh karena itu, hasil ini mengindikasikan bahwa pendekatan kelas intensif statistik layak untuk dipertahankan sebagai metode pembelajaran dalam meningkatkan performa akademik mahasiswa.
Sebuah program kelas intensif statistika berlangsung selama 12 minggu dengan evaluasi berupa kuis mingguan. Untuk menilai efektivitas program, dilakukan pengukuran skor kuis sebelum dan sesudah mengikuti kelas pada kelompok mahasiswa yang sama.
\[\begin{aligned} H_0 &: \text{Median perbedaan skor kuis sebelum dan sesudah} = 0 \\ H_1 &: \text{Median perbedaan skor kuis sebelum dan sesudah} \neq 0 \end{aligned}\]
Berdasarkan hasil uji asumsi, data skor kuis tidak berdistribusi normal, sehingga metode parametrik seperti uji-t berpasangan tidak memenuhi syarat. Oleh karena itu, digunakan pendekatan nonparametrik yang lebih sesuai dengan karakteristik data.
Tujuan analisis ini adalah untuk mengetahui apakah terdapat perbedaan median skor kuis mahasiswa sebelum dan sesudah mengikuti kelas intensif statistika.
Uji Wilcoxon Signed-Rank dipilih karena sesuai untuk membandingkan dua pengukuran berpasangan pada kelompok yang sama ketika asumsi normalitas tidak terpenuhi. Metode ini mempertimbangkan arah dan besar perbedaan, sehingga memberikan hasil yang lebih kuat dibandingkan uji tanda.
Pada langkah ini, dihitung perbedaan skor kuis sebelum dan sesudah pembelajaran untuk setiap mahasiswa. Perbedaan berpasangan didefinisikan sebagai selisih antara skor kuis sesudah dan skor kuis sebelum pembelajaran.
| id_mahasiswa | skor_kuis_sebelum | skor_kuis_sesudah | perbedaan |
|---|---|---|---|
| M001 | 81.28 | 92.81 | 11.53 |
| M002 | 75.42 | 87.57 | 12.15 |
| M003 | 83.46 | 97.34 | 13.88 |
| M004 | 83.92 | 96.90 | 12.98 |
| M005 | 77.96 | 91.12 | 13.16 |
| M006 | 76.07 | 92.82 | 16.75 |
| M007 | 81.43 | 98.87 | 17.44 |
| M008 | 76.01 | 86.57 | 10.56 |
| M009 | 79.25 | 90.92 | 11.67 |
| M010 | 81.06 | 96.43 | 15.37 |
| M011 | 83.37 | 96.24 | 12.87 |
| M012 | 86.94 | 98.97 | 12.03 |
| M013 | 78.17 | 90.53 | 12.36 |
| M014 | 73.46 | 86.04 | 12.58 |
| M015 | 79.68 | 96.47 | 16.79 |
| M016 | 83.80 | 94.89 | 11.09 |
| M017 | 71.06 | 86.73 | 15.67 |
| M018 | 77.81 | 92.23 | 14.42 |
| M019 | 79.79 | 92.16 | 12.37 |
| M020 | 70.26 | 83.62 | 13.36 |
| M021 | 84.66 | 96.71 | 12.05 |
| M022 | 81.65 | 96.54 | 14.89 |
| M023 | 81.26 | 91.91 | 10.65 |
| M024 | 73.46 | 83.50 | 10.04 |
| M025 | 81.93 | 96.95 | 15.02 |
| M026 | 81.39 | 92.94 | 11.55 |
| M027 | 69.38 | 79.95 | 10.57 |
| M028 | 85.36 | 98.53 | 13.17 |
| M029 | 85.76 | 96.17 | 10.41 |
| M030 | 73.96 | 91.05 | 17.09 |
| M031 | 87.01 | 97.23 | 10.22 |
| M032 | 82.71 | 97.34 | 14.63 |
| M033 | 67.95 | 81.46 | 13.51 |
| M034 | 79.77 | 95.15 | 15.38 |
| M035 | 83.87 | 96.50 | 12.63 |
| M036 | 85.62 | 96.86 | 11.24 |
| M037 | 79.99 | 97.84 | 17.85 |
| M038 | 77.51 | 94.22 | 16.71 |
| M039 | 71.11 | 87.99 | 16.88 |
| M040 | 84.35 | 96.35 | 12.00 |
| M041 | 80.53 | 90.84 | 10.31 |
| M042 | 75.34 | 87.77 | 12.43 |
| M043 | 83.44 | 97.74 | 14.30 |
| M044 | 75.30 | 87.91 | 12.61 |
| M045 | 74.37 | 90.99 | 16.62 |
| M046 | 74.94 | 87.11 | 12.17 |
| M047 | 74.00 | 91.72 | 17.72 |
| M048 | 79.28 | 92.94 | 13.66 |
| M049 | 77.64 | 94.38 | 16.74 |
| M050 | 79.36 | 90.92 | 11.56 |
Pada langkah ini, observasi dengan nilai perbedaan sama dengan nol dihapus dari analisis, karena pasangan dengan perbedaan nol tidak memberikan informasi mengenai arah perubahan.
| id_mahasiswa | skor_kuis_sebelum | skor_kuis_sesudah | perbedaan |
|---|---|---|---|
| M001 | 81.28 | 92.81 | 11.53 |
| M002 | 75.42 | 87.57 | 12.15 |
| M003 | 83.46 | 97.34 | 13.88 |
| M004 | 83.92 | 96.90 | 12.98 |
| M005 | 77.96 | 91.12 | 13.16 |
| M006 | 76.07 | 92.82 | 16.75 |
| M007 | 81.43 | 98.87 | 17.44 |
| M008 | 76.01 | 86.57 | 10.56 |
| M009 | 79.25 | 90.92 | 11.67 |
| M010 | 81.06 | 96.43 | 15.37 |
| M011 | 83.37 | 96.24 | 12.87 |
| M012 | 86.94 | 98.97 | 12.03 |
| M013 | 78.17 | 90.53 | 12.36 |
| M014 | 73.46 | 86.04 | 12.58 |
| M015 | 79.68 | 96.47 | 16.79 |
| M016 | 83.80 | 94.89 | 11.09 |
| M017 | 71.06 | 86.73 | 15.67 |
| M018 | 77.81 | 92.23 | 14.42 |
| M019 | 79.79 | 92.16 | 12.37 |
| M020 | 70.26 | 83.62 | 13.36 |
| M021 | 84.66 | 96.71 | 12.05 |
| M022 | 81.65 | 96.54 | 14.89 |
| M023 | 81.26 | 91.91 | 10.65 |
| M024 | 73.46 | 83.50 | 10.04 |
| M025 | 81.93 | 96.95 | 15.02 |
| M026 | 81.39 | 92.94 | 11.55 |
| M027 | 69.38 | 79.95 | 10.57 |
| M028 | 85.36 | 98.53 | 13.17 |
| M029 | 85.76 | 96.17 | 10.41 |
| M030 | 73.96 | 91.05 | 17.09 |
| M031 | 87.01 | 97.23 | 10.22 |
| M032 | 82.71 | 97.34 | 14.63 |
| M033 | 67.95 | 81.46 | 13.51 |
| M034 | 79.77 | 95.15 | 15.38 |
| M035 | 83.87 | 96.50 | 12.63 |
| M036 | 85.62 | 96.86 | 11.24 |
| M037 | 79.99 | 97.84 | 17.85 |
| M038 | 77.51 | 94.22 | 16.71 |
| M039 | 71.11 | 87.99 | 16.88 |
| M040 | 84.35 | 96.35 | 12.00 |
| M041 | 80.53 | 90.84 | 10.31 |
| M042 | 75.34 | 87.77 | 12.43 |
| M043 | 83.44 | 97.74 | 14.30 |
| M044 | 75.30 | 87.91 | 12.61 |
| M045 | 74.37 | 90.99 | 16.62 |
| M046 | 74.94 | 87.11 | 12.17 |
| M047 | 74.00 | 91.72 | 17.72 |
| M048 | 79.28 | 92.94 | 13.66 |
| M049 | 77.64 | 94.38 | 16.74 |
| M050 | 79.36 | 90.92 | 11.56 |
Pada langkah ini, dihitung nilai absolut dari perbedaan berpasangan. Selanjutnya, nilai absolut tersebut diberi peringkat dari yang terkecil hingga terbesar. Jika terdapat nilai yang sama (ties), maka diberikan peringkat rata-rata.
| id_mahasiswa | skor_kuis_sebelum | skor_kuis_sesudah | perbedaan | abs_perbedaan | peringkat |
|---|---|---|---|---|---|
| M001 | 81.28 | 92.81 | 11.53 | 11.53 | 10 |
| M002 | 75.42 | 87.57 | 12.15 | 12.15 | 17 |
| M003 | 83.46 | 97.34 | 13.88 | 13.88 | 32 |
| M004 | 83.92 | 96.90 | 12.98 | 12.98 | 26 |
| M005 | 77.96 | 91.12 | 13.16 | 13.16 | 27 |
| M006 | 76.07 | 92.82 | 16.75 | 16.75 | 44 |
| M007 | 81.43 | 98.87 | 17.44 | 17.44 | 48 |
| M008 | 76.01 | 86.57 | 10.56 | 10.56 | 5 |
| M009 | 79.25 | 90.92 | 11.67 | 11.67 | 13 |
| M010 | 81.06 | 96.43 | 15.37 | 15.37 | 38 |
| M011 | 83.37 | 96.24 | 12.87 | 12.87 | 25 |
| M012 | 86.94 | 98.97 | 12.03 | 12.03 | 15 |
| M013 | 78.17 | 90.53 | 12.36 | 12.36 | 19 |
| M014 | 73.46 | 86.04 | 12.58 | 12.58 | 22 |
| M015 | 79.68 | 96.47 | 16.79 | 16.79 | 45 |
| M016 | 83.80 | 94.89 | 11.09 | 11.09 | 8 |
| M017 | 71.06 | 86.73 | 15.67 | 15.67 | 40 |
| M018 | 77.81 | 92.23 | 14.42 | 14.42 | 34 |
| M019 | 79.79 | 92.16 | 12.37 | 12.37 | 20 |
| M020 | 70.26 | 83.62 | 13.36 | 13.36 | 29 |
| M021 | 84.66 | 96.71 | 12.05 | 12.05 | 16 |
| M022 | 81.65 | 96.54 | 14.89 | 14.89 | 36 |
| M023 | 81.26 | 91.91 | 10.65 | 10.65 | 7 |
| M024 | 73.46 | 83.50 | 10.04 | 10.04 | 1 |
| M025 | 81.93 | 96.95 | 15.02 | 15.02 | 37 |
| M026 | 81.39 | 92.94 | 11.55 | 11.55 | 11 |
| M027 | 69.38 | 79.95 | 10.57 | 10.57 | 6 |
| M028 | 85.36 | 98.53 | 13.17 | 13.17 | 28 |
| M029 | 85.76 | 96.17 | 10.41 | 10.41 | 4 |
| M030 | 73.96 | 91.05 | 17.09 | 17.09 | 47 |
| M031 | 87.01 | 97.23 | 10.22 | 10.22 | 2 |
| M032 | 82.71 | 97.34 | 14.63 | 14.63 | 35 |
| M033 | 67.95 | 81.46 | 13.51 | 13.51 | 30 |
| M034 | 79.77 | 95.15 | 15.38 | 15.38 | 39 |
| M035 | 83.87 | 96.50 | 12.63 | 12.63 | 24 |
| M036 | 85.62 | 96.86 | 11.24 | 11.24 | 9 |
| M037 | 79.99 | 97.84 | 17.85 | 17.85 | 50 |
| M038 | 77.51 | 94.22 | 16.71 | 16.71 | 42 |
| M039 | 71.11 | 87.99 | 16.88 | 16.88 | 46 |
| M040 | 84.35 | 96.35 | 12.00 | 12.00 | 14 |
| M041 | 80.53 | 90.84 | 10.31 | 10.31 | 3 |
| M042 | 75.34 | 87.77 | 12.43 | 12.43 | 21 |
| M043 | 83.44 | 97.74 | 14.30 | 14.30 | 33 |
| M044 | 75.30 | 87.91 | 12.61 | 12.61 | 23 |
| M045 | 74.37 | 90.99 | 16.62 | 16.62 | 41 |
| M046 | 74.94 | 87.11 | 12.17 | 12.17 | 18 |
| M047 | 74.00 | 91.72 | 17.72 | 17.72 | 49 |
| M048 | 79.28 | 92.94 | 13.66 | 13.66 | 31 |
| M049 | 77.64 | 94.38 | 16.74 | 16.74 | 43 |
| M050 | 79.36 | 90.92 | 11.56 | 11.56 | 12 |
Pada langkah ini, tanda peringkat ditentukan berdasarkan arah perbedaan. Jika perbedaan bernilai positif, maka peringkat diberi tanda positif. Jika perbedaan bernilai negatif, maka peringkat diberi tanda negatif.
| id_mahasiswa | skor_kuis_sebelum | skor_kuis_sesudah | perbedaan | abs_perbedaan | peringkat | peringkat_bertanda |
|---|---|---|---|---|---|---|
| M001 | 81.28 | 92.81 | 11.53 | 11.53 | 10 | 10 |
| M002 | 75.42 | 87.57 | 12.15 | 12.15 | 17 | 17 |
| M003 | 83.46 | 97.34 | 13.88 | 13.88 | 32 | 32 |
| M004 | 83.92 | 96.90 | 12.98 | 12.98 | 26 | 26 |
| M005 | 77.96 | 91.12 | 13.16 | 13.16 | 27 | 27 |
| M006 | 76.07 | 92.82 | 16.75 | 16.75 | 44 | 44 |
| M007 | 81.43 | 98.87 | 17.44 | 17.44 | 48 | 48 |
| M008 | 76.01 | 86.57 | 10.56 | 10.56 | 5 | 5 |
| M009 | 79.25 | 90.92 | 11.67 | 11.67 | 13 | 13 |
| M010 | 81.06 | 96.43 | 15.37 | 15.37 | 38 | 38 |
| M011 | 83.37 | 96.24 | 12.87 | 12.87 | 25 | 25 |
| M012 | 86.94 | 98.97 | 12.03 | 12.03 | 15 | 15 |
| M013 | 78.17 | 90.53 | 12.36 | 12.36 | 19 | 19 |
| M014 | 73.46 | 86.04 | 12.58 | 12.58 | 22 | 22 |
| M015 | 79.68 | 96.47 | 16.79 | 16.79 | 45 | 45 |
| M016 | 83.80 | 94.89 | 11.09 | 11.09 | 8 | 8 |
| M017 | 71.06 | 86.73 | 15.67 | 15.67 | 40 | 40 |
| M018 | 77.81 | 92.23 | 14.42 | 14.42 | 34 | 34 |
| M019 | 79.79 | 92.16 | 12.37 | 12.37 | 20 | 20 |
| M020 | 70.26 | 83.62 | 13.36 | 13.36 | 29 | 29 |
| M021 | 84.66 | 96.71 | 12.05 | 12.05 | 16 | 16 |
| M022 | 81.65 | 96.54 | 14.89 | 14.89 | 36 | 36 |
| M023 | 81.26 | 91.91 | 10.65 | 10.65 | 7 | 7 |
| M024 | 73.46 | 83.50 | 10.04 | 10.04 | 1 | 1 |
| M025 | 81.93 | 96.95 | 15.02 | 15.02 | 37 | 37 |
| M026 | 81.39 | 92.94 | 11.55 | 11.55 | 11 | 11 |
| M027 | 69.38 | 79.95 | 10.57 | 10.57 | 6 | 6 |
| M028 | 85.36 | 98.53 | 13.17 | 13.17 | 28 | 28 |
| M029 | 85.76 | 96.17 | 10.41 | 10.41 | 4 | 4 |
| M030 | 73.96 | 91.05 | 17.09 | 17.09 | 47 | 47 |
| M031 | 87.01 | 97.23 | 10.22 | 10.22 | 2 | 2 |
| M032 | 82.71 | 97.34 | 14.63 | 14.63 | 35 | 35 |
| M033 | 67.95 | 81.46 | 13.51 | 13.51 | 30 | 30 |
| M034 | 79.77 | 95.15 | 15.38 | 15.38 | 39 | 39 |
| M035 | 83.87 | 96.50 | 12.63 | 12.63 | 24 | 24 |
| M036 | 85.62 | 96.86 | 11.24 | 11.24 | 9 | 9 |
| M037 | 79.99 | 97.84 | 17.85 | 17.85 | 50 | 50 |
| M038 | 77.51 | 94.22 | 16.71 | 16.71 | 42 | 42 |
| M039 | 71.11 | 87.99 | 16.88 | 16.88 | 46 | 46 |
| M040 | 84.35 | 96.35 | 12.00 | 12.00 | 14 | 14 |
| M041 | 80.53 | 90.84 | 10.31 | 10.31 | 3 | 3 |
| M042 | 75.34 | 87.77 | 12.43 | 12.43 | 21 | 21 |
| M043 | 83.44 | 97.74 | 14.30 | 14.30 | 33 | 33 |
| M044 | 75.30 | 87.91 | 12.61 | 12.61 | 23 | 23 |
| M045 | 74.37 | 90.99 | 16.62 | 16.62 | 41 | 41 |
| M046 | 74.94 | 87.11 | 12.17 | 12.17 | 18 | 18 |
| M047 | 74.00 | 91.72 | 17.72 | 17.72 | 49 | 49 |
| M048 | 79.28 | 92.94 | 13.66 | 13.66 | 31 | 31 |
| M049 | 77.64 | 94.38 | 16.74 | 16.74 | 43 | 43 |
| M050 | 79.36 | 90.92 | 11.56 | 11.56 | 12 | 12 |
Pada langkah ini, dihitung jumlah peringkat bertanda positif (W⁺) dan jumlah peringkat bertanda negatif (W⁻). Statistik uji Wilcoxon didefinisikan sebagai nilai minimum dari W⁺ dan W⁻.
| W_Positif | W_Negatif | Statistik_Uji_W |
|---|---|---|
| 1275 | 0 | 0 |
Pada langkah ini, dilakukan uji Wilcoxon Signed-Rank menggunakan
fungsi wilcox.test() di R. Keputusan diambil berdasarkan
nilai p-value dengan tingkat signifikansi \(α
= 0.05\). Jika p-value \(<
α\), maka H₀ ditolak.
| Statistik_Uji | P_Value | Keputusan | |
|---|---|---|---|
| V | 1275 | 0 | Tolak H₀ |
Jika p-value < 0.05, maka hipotesis nol (H₀) ditolak, yang berarti terdapat perbedaan median skor kuis sebelum dan sesudah mengikuti kelas intensif statistika. Hal ini menunjukkan bahwa program kelas intensif statistika memberikan pengaruh yang signifikan terhadap perubahan skor kuis mahasiswa.
Secara praktis, hasil ini mengindikasikan bahwa pendekatan pembelajaran yang diterapkan dalam program tersebut efektif dalam meningkatkan pemahaman mahasiswa terhadap materi statistika. Oleh karena itu, program kelas intensif dapat dipertahankan dan dipertimbangkan untuk dikembangkan lebih lanjut sebagai strategi pembelajaran yang mendukung peningkatan prestasi akademik.
---
title: "UAS StatDas"
output:
flexdashboard::flex_dashboard:
vertical_layout: scroll
theme: yeti
source_code: embed
css: style.uas.css
---
```{r setup, include=FALSE}
packages <- c(
"flexdashboard",
"tidyverse",
"highcharter",
"viridis",
"DT",
"gapminder",
"jsonlite"
)
installed <- packages %in% rownames(installed.packages())
if (any(!installed)) {
install.packages(packages[!installed])
}
# Load library
library(flexdashboard)
library(tidyverse)
library(highcharter)
library(viridis)
library(DT)
library(gapminder)
library(jsonlite)
```
Anggota Kelompok {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
<div class="members-container">
<div class="members-left">
<img src="logo_ITSB.png" class="logo">
<div class="student-tags">
<span class="tag blue">R Programming</span>
<span class="tag navy">Statistics</span>
</div>
<div class="student-assignment"><b>Final Exam – Mr. Bakti Siregar, M.Sc., CDS</b></div>
<div class="student-info">
<div class="group-title">Foto Kelompok</div>
</div><img src="gurlspict.jpeg" class="group-photo"></div>
<div class="members-divider"></div>
<div class="members-grid">
<div class="member-card">
<img src="FotoAngel.jpeg" class="member-photo">
<div class="member-info">
<b>Angelique Kiyoshi Lakeisha Bahrul Ulum</b>
<p>NIM: 52250001</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 9 & 10</li>
<li>Interval Keyakinan</li>
<li>Bagian Dataset</li>
<li>Desain Kartu Anggota Kelompok</li>
</ul>
</div>
</div>
<div class="member-card">
<img src="fotonisa.jpg" class="member-photo">
<div class="member-info">
<b>Khafizatun Nisa</b>
<p>NIM: 52250018</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 1 & 2</li>
<li>Visualisasi Statistika Dasar (Sentral Tendensi, Dispersi Statistik, Distribusi Probabilitas)</li>
</ul>
</div>
</div>
<div class="member-card">
<img src="fotoadel.jpg" class="member-photo">
<div class="member-info">
<b>Naychilla Adelia Zahrah</b>
<p>NIM: 52250004</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 7 & 8</li>
<li>Metode Nonparametrik</li>
</ul>
</div>
</div>
<div class="member-card">
<img src="fotonara.jpg" class="member-photo">
<div class="member-info">
<b>Nakeisha Aulia Zahra</b>
<p>NIM: 52250023</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 5 & 6</li>
<li>Visualisasi Statistika Dasar (Diagram Lingkaran, Batang, dan Garis)</li>
<li>Desain Foto Kelompok</li>
</ul>
</div>
</div>
</div>
<div class="member-tall">
<img src="fotovero.jpg">
<h3><b>Veronica Maria Lucia Ferreira Xavier</b></h3>
<p>NIM: 52250021</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 3 & 4</li>
<li>Inferensi Statistik</li>
</ul>
</div>
</div>
Ringkasan Statistika Dasar {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
### Bab 1 {data-width=1200}
<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistik adalah ilmu yang mempelajari metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data untuk menghasilkan informasi yang bermakna serta mendukung pengambilan keputusan di bawah kondisi ketidakpastian.
Statistik digunakan untuk memahami pola dan variasi dalam data, serta untuk menarik kesimpulan dan membuat prediksi mengenai suatu populasi berdasarkan data yang tersedia.
:::
</div>
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<h4><b>Permasalahan Statistik Utama</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Permasalahan statistik utama berkaitan dengan bagaimana data dapat diolah dan dianalisis secara sistematis agar menghasilkan informasi yang akurat dan dapat dipercaya. Data yang tersedia sering kali mengandung variasi, ketidakpastian, serta jumlah yang besar, sehingga diperlukan metode statistik untuk merangkum data, memahami pola yang muncul, dan mengurangi kesalahan dalam penarikan kesimpulan. Statistik membantu menjembatani data mentah menjadi dasar yang rasional dalam pengambilan keputusan.
:::
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Jenis Statistik yang Digunakan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistik secara umum terbagi menjadi dua jenis utama, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif digunakan untuk menggambarkan dan meringkas data melalui ukuran pemusatan, ukuran penyebaran, serta visualisasi data. Sementara itu, statistik inferensial digunakan untuk menarik kesimpulan atau membuat estimasi mengenai suatu populasi berdasarkan data sampel, dengan memanfaatkan konsep peluang, interval kepercayaan, dan pengujian hipotesis.
:::
</div>
</div>
### Bab 2 {data-width=1200}
<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Eksplorasi Data adalah tahap awal analisis statistik untuk memahami karakteristik, struktur, dan kualitas data sebelum analisis lanjutan, sehingga membantu menghindari kesalahan interpretasi dan menghasilkan keputusan yang lebih akurat.
:::
</div>
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<h4><b>Jenis Variabel Data</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
```{r}
library(knitr)
library(kableExtra)
data_tipe <- data.frame(
`Jenis Data` = c("Data Numerik (Kuantitatif)",
"Data Numerik (Kuantitatif)",
"Data Kategorikal (Kualitatif)",
"Data Kategorikal (Kualitatif)"),
`Bentuk Data` = c("Berupa angka",
"Berupa angka",
"Berupa kategori",
"Berupa kategori"),
`Tipe` = c("Diskrit",
"Kontinu",
"Nominal",
"Ordinal"),
`Deskripsi` = c("Data hasil hitungan, biasanya berupa bilangan bulat",
"Data hasil pengukuran, dapat berupa bilangan pecahan",
"Data kategori tanpa urutan tertentu",
"Data kategori yang memiliki urutan atau tingkatan")
)
kable(
data_tipe,
align = "l"
) %>%
kable_styling(
bootstrap_options = c("hover", "condensed"),
full_width = TRUE
) %>%
column_spec(1, background = "#e7f0ff", bold = TRUE) %>%
column_spec(2, background = "#e7f0ff") %>%
column_spec(3, background = "#e7f0ff") %>%
column_spec(4, background = "#e7f0ff") %>%
collapse_rows(columns = c(1, 2), valign = "middle")
```
:::
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Deskripsi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada tahap eksplorasi data, variabel numerik diringkas menggunakan statistik deskriptif untuk memberikan gambaran awal terhadap data. Ringkasan statistik ini meliputi ukuran pemusatan seperti mean dan median, serta ukuran penyebaran seperti nilai minimum, maksimum, range, varians, dan standar deviasi.
Selain itu, eksplorasi data juga bertujuan untuk mengidentifikasi pola awal, yaitu kecenderungan umum yang muncul dalam data, tren, yaitu perubahan nilai data apabila diamati berdasarkan urutan tertentu, serta anomali (outlier), yaitu nilai yang menyimpang jauh dari sebagian besar data. Informasi ini menjadi dasar penting dalam memahami perilaku data dan menentukan metode analisis statistik selanjutnya.
:::
</div>
</div>
### Bab 3 {data-width=1200}
::: {.text-justify}
**Visualisasi data** adalah proses mengubah data mentah menjadi informasi yang
jelas dan bermakna, sehingga mudah dipahami dan membantu penyampaian pesan
secara tepat.
:::
<div class="chapter3-grid">
<div class="chapter3-box">
<h4>Line Chart</h4>
Line chart adalah alat visualisasi data yang digunakan untuk menunjukkan bagaimana nilai berubah secara berurutan, biasanya dari waktu ke waktu.
**Contoh Kasus**: Menampilkan tren penjualan bulanan toko online selama tahun 2024 untuk melihat bulan mana yang memiliki performa terbaik.
```{r}
library(plotly)
# Data: Penjualan per bulan
sales_trend <- data.frame(
Bulan = c("Jan", "Feb", "Mar", "Apr", "Mei", "Jun",
"Jul", "Agu", "Sep", "Oct", "Nov", "Des"),
Total_Penjualan = c(15, 18, 22, 19, 25, 28, 26, 30, 32, 29, 35, 40)
)
plot_ly(
data = sales_trend,
x = ~Bulan,
y = ~Total_Penjualan,
type = 'scatter',
mode = 'lines+markers',
line = list(color = 'steelblue', width = 2.5),
marker = list(
color = 'darkorange',
size = 7,
line = list(color = 'white', width = 1.5)
),
hovertemplate = paste(
'<b>%{x}</b><br>',
'Penjualan: Rp %{y} juta<br>',
'<extra></extra>'
)
) %>%
layout(
title = list(
text = "<b>Tren Penjualan Bulanan 2024</b>",
font = list(size = 14, color = '#2c3e50')
),
xaxis = list(
title = "<b>Bulan</b>",
titlefont = list(size = 11),
tickfont = list(size = 10)
),
yaxis = list(
title = "<b>Penjualan (juta IDR)</b>",
titlefont = list(size = 11),
tickfont = list(size = 10)
),
hovermode = 'x unified',
plot_bgcolor = '#ffffff',
paper_bgcolor = '#f8f9fa',
width = 500,
height = 300,
margin = list(l = 50, r = 20, t = 50, b = 40)
)
```
</div>
<div class="chapter3-box">
<h4>Bar Chart</h4>
Bar chart adalah grafik batang untuk menampilkan data kategorikal. Tinggi atau panjang batang menunjukkan nilai tiap kategori sehingga mudah dibandingkan.
**Contoh Kasus**: Membandingkan total penjualan antar kategori produk untuk mengetahui produk mana yang paling laris.
```{r}
library(plotly)
# Data: Penjualan per kategori
sales_kategori <- data.frame(
Kategori = c("Fashion", "Kecantikan", "Makanan", "Elektronik", "Furniture"),
Total_Penjualan = c(120, 110, 95, 85, 70)
)
sales_kategori <- sales_kategori %>%
arrange(desc(Total_Penjualan))
# Buat bar chart
plot_ly(
data = sales_kategori,
x = ~Kategori,
y = ~Total_Penjualan,
type = 'bar',
marker = list(
color = c('#e74c3c', '#9b59b6', '#2ecc71', '#3498db', '#f39c12'),
line = list(color = 'white', width = 1.5)
),
hovertemplate = paste(
'<b>%{x}</b><br>',
'Penjualan: Rp %{y} juta<br>',
'<extra></extra>'
)
) %>%
layout(
title = list(
text = "<b>Penjualan per Kategori Produk</b>",
font = list(size = 14, color = '#2c3e50')
),
xaxis = list(
title = "<b>Kategori</b>",
titlefont = list(size = 11),
tickfont = list(size = 10),
categoryorder = "array",
categoryarray = sales_kategori$Kategori
),
yaxis = list(
title = "<b>Penjualan (juta IDR)</b>",
titlefont = list(size = 11),
tickfont = list(size = 10)
),
plot_bgcolor = '#ffffff',
paper_bgcolor = '#f8f9fa',
width = 400,
height = 285,
margin = list(l = 50, r = 20, t = 50, b = 40)
)
```
</div>
<div class="chapter3-box">
<h4>Histogram</h4>
Histogram adalah grafik batang untuk menunjukkan sebaran data numerik dalam beberapa interval.
**Contoh Kasus** : Distribusi Nilai Ujian Mahasiswa
```{r}
library(plotly)
set.seed(123)
nilai_ujian <- data.frame(
Nilai = round(rnorm(100, mean = 75, sd = 8))
)
plot_ly(
data = nilai_ujian,
x = ~Nilai,
type = "histogram",
nbinsx = 12,
hovertemplate = paste(
"Nilai: %{x}<br>",
"Frekuensi: %{y}<extra></extra>"
),
marker = list(
color = "#3498db",
line = list(color = "#ffffff", width = 1)
),
opacity = 0.85
) %>%
layout(
title = list(
text = "<b>Distribusi Nilai Ujian Mahasiswa</b>",
x = 0.5,
font = list(size = 14)
),
xaxis = list(
title = "Nilai",
tickfont = list(size = 10)
),
yaxis = list(
title = "Frekuensi",
tickfont = list(size = 10)
),
width = 400,
height = 300,
plot_bgcolor = "#f8f9fa",
paper_bgcolor = "#ffffff",
margin = list(l = 50, r = 20, t = 50, b = 50)
)
```
</div>
</div>
### Bab 4 {data-width=1200}
::: {.text-justify}
**Central Tendency** adalah ukuran statistik yang merepresentasikan nilai tipikal atau
sentral dari dataset. Bertujuan memberikan satu nilai yang paling mewakili keseluruhan data. **Ada Tiga Ukuran Utama yaitu:**
:::
<div class="chapter3-grid">
<div class="chapter3-box">
<h4>Rata-rata</h4>
::: {.text-justify}
Rata-rata adalah nilai yang diperoleh dengan membagi jumlah seluruh data dengan banyaknya data, dan digunakan untuk data bertipe interval dan rasio.
**Rumus:**
$\bar{x} = \frac{\sum x}{n}$
:::
</div>
<div class="chapter3-box">
<h4>Nilai Tengah</h4>
::: {.text-justify}
Nilai Tengah adalah nilai tengah dari data yang telah diurutkan dan cocok digunakan
untuk data bertipe ordinal, interval, dan rasio.
**Rumus:** \(\text{Median} =
\begin{cases}
x_{\left(\frac{n+1}{2}\right)}, & \text{jika } n \text{ ganjil} \\
\frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}, & \text{jika } n \text{ genap}
\end{cases}\)
:::
</div>
<div class="chapter3-box">
<h4>Nilai Tengah</h4>
::: {.text-justify}
Nilai tengah adalah nilai yang paling sering muncul dalam suatu kumpulan data dan dapat
digunakan untuk data bertipe nominal, ordinal, interval, maupun rasio.
**Rumus:** \(\text{Mode} = x \;\; \text{dengan frekuensi tertinggi}\)
:::
</div>
</div>
<div class="light-box">
<div class="two-column">
<div class="col section-text">
Menghitung ukuran pemusatan data dari nilai siswa pada 2 mata pelajaran:
- **Nilai Fisika:** 85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70
- **Nilai Bahasa:** 80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76
**Perhitungan Menggunakan Kode R**
```{r, echo=FALSE, warning=FALSE, message=FALSE, fig.align='center'}
library(dplyr)
library(knitr)
library(kableExtra)
# Data nilai
nilai_fisika <- c(85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70)
nilai_bahasa <- c(80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76)
# Fungsi modus
hitung_mode <- function(x) {
frek <- table(x)
paste(names(frek)[frek == max(frek)], collapse = ", ")
}
# Tabel sentral tendensi
tabel_sentral <- data.frame(
Variabel = c("Fisika", "Bahasa Indonesia"),
Mean = c(mean(nilai_fisika), mean(nilai_bahasa)),
Median = c(median(nilai_fisika), median(nilai_bahasa)),
Modus = c(hitung_mode(nilai_fisika), hitung_mode(nilai_bahasa))
)
# Tampilkan tabel (FULL WIDTH & CENTER)
tabel_sentral %>%
kable(
digits = 2,
align = "c"
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"),
full_width = TRUE,
position = "center"
) %>%
row_spec(
0,
bold = TRUE,
color = "white",
background = "#1f77b4"
)
```
</div>
<div class="divider"></div>
<div class="col section-text">
**Interpretasi dan Perbandingan Hasil Kedua Nilai Siswa:**
1. **Rata-rata:** Nilai rata-rata Fisika (83,60) lebih tinggi dibandingkan Bahasa Indonesia (81,67), sehingga performa siswa pada Fisika lebih baik.
2. **Nilai Tengah:** Median Fisika sebesar 85 lebih tinggi daripada Bahasa Indonesia sebesar 80, menunjukkan nilai tengah Fisika berada pada tingkat lebih tinggi.
3. **Modus (nilai paling sering muncul):** Modus Fisika adalah 85, sedangkan Bahasa Indonesia 80, yang berarti nilai yang paling sering muncul pada Fisika lebih tinggi.
**Kesimpulan:** Secara keseluruhan, hasil belajar siswa pada mata pelajaran Fisika lebih baik dibandingkan Bahasa Indonesia, baik dilihat dari rata-rata, nilai tengah, maupun nilai yang paling sering muncul.
</div>
</div>
</div>
### Bab 5 {data-width=1200}
<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistical dispersion adalah ukuran yang menunjukkan seberapa tersebar atau bervariasi data dari suatu kumpulan nilai. Semakin besar nilai dispersi, semakin tidak seragam datanya, sedangkan semakin kecil nilai dispersi, semakin homogen data tersebut.
Pengukuran tingkat dispersi data umumnya dilakukan menggunakan beberapa ukuran utama, yaitu jangkauan (range), varians, dan simpangan baku
:::
</div>
<div class="chapter5-grid">
<div class="chapter-box">
<h4><b>Range</b></h4>
Range adalah ukuran penyebaran paling sederhana yang menunjukkan selisih antara
nilai maksimum dan minimum dalam data.
**Rumus:**
$Range = X_{max} - X_{min}$
**Contoh Perhitungan:**
Data: 5, 7, 10, 12, 15
Range = 15 − 5 = **10**
</div>
<div class="chapter-box">
<h4><b>Varians</b></h4>
**Definisi:**
Varians menunjukkan rata-rata kuadrat selisih setiap data terhadap nilai rata-rata
(mean).
**Rumus:**
Populasi:
$\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}$
Sampel:
$s^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1}$
**Contoh Perhitungan**
Diketahui data: 46, 50, 54, 48, 52
$\bar{X} = \frac{250}{5} = 50$
$\sum (X_i - \bar{X})^2 = 40$
$s^2 = \frac{40}{4} = 10$
</div>
<div class="chapter-box">
<h4><b>Standar Deviasi</b></h4>
<b>Definisi</b><br>
Standar deviasi adalah akar kuadrat dari varians dan menunjukkan rata-rata jarak
data terhadap mean.<br><br>
<b>Rumus</b><br>
$s = \sqrt{s^2}$<br><br>
<b>Contoh Perhitungan</b><br>
$s^2 = 10$<br>
$s = \sqrt{10} \approx 3,16$
</div>
<div class="chapter-box">
<h4><b>Interpretasi Tingkat Penyebaran Data</b></h4>
<ul>
<li>Range kecil → data tidak terlalu menyebar</li>
<li>Varians kecil → data mendekati rata-rata</li>
<li>Standar deviasi kecil → data homogen</li>
<li>Dispersi besar → data heterogen</li>
</ul>
::: {.text-justify}
Secara umum, ukuran dispersi digunakan untuk menilai tingkat keragaman data dalam suatu kumpulan pengamatan. Nilai range, varians, dan standar deviasi yang relatif kecil menunjukkan bahwa data cenderung terkonsentrasi di sekitar nilai rata-rata, sehingga variasi antar data tidak terlalu besar. Sebaliknya, nilai dispersi yang besar mengindikasikan adanya perbedaan yang cukup signifikan antar nilai pengamatan, yang mencerminkan tingkat heterogenitas data yang lebih tinggi.
:::
</div>
</div>
### Bab 6 {data-width=1200}
<div class="chapter5-grid">
<div class="chapter-box">
<h4><b>Definisi Probabilitas</b></h4>
Probabilitas adalah ukuran peluang terjadinya suatu peristiwa. Nilainya berada antara 0 sampai 1, di mana:
0 → kejadian mustahil
1 → kejadian pasti
Rumus dasar:
$P(A) = \frac{\text{Jumlah hasil yang menguntungkan}}{\text{Jumlah seluruh hasil dalam ruang sampel}}$
</div>
<div class="chapter-box">
<h4><b>Konsep Dasar & Ruang Sampel</b></h4>
Ruang sampel (S) adalah seluruh kemungkinan hasil dari suatu percobaan.
Kejadian (event) adalah bagian dari ruang sampel yang diperhatikan.
Contoh:
Melempar koin 2 kali:
$S = \{HH, HT, TH, TT\}$
</div>
<div class="chapter-box">
<h4><b>Aturan Probabilitas</b></h4>
Dua aturan utama:
- Nilai probabilitas selalu $0 \le P(A) \le 1$
- Total probabilitas seluruh hasil dalam ruang sampel = 1
<h4><b>Aturan Komplemen</b></h4>
Aturan ini digunakan untuk mencari peluang kejadian tidak terjadi.
Rumus:
$P(A^c) = 1 - P(A)$
</div>
<div class="chapter-box">
<h4><b>Kejadian Independen dan Dependen</b></h4>
Independen: satu kejadian tidak memengaruhi kejadian lain.<br>
$P(A \cap B) = P(A) \times P(B)$
Dependen: satu kejadian memengaruhi kejadian berikutnya.<br>
$P(A \cap B) = P(A) \times P(B|A)$
</div>
<div class="chapter-box">
<h4><b>Penyatuan, Saling Lepas, dan Menyeluruh</b></h4>
Gabungan (Union): kejadian A atau B.<br>
$P(A \cup B) = P(A) + P(B) - P(A \cap B)$
Saling lepas (Mutually Exclusive): tidak bisa terjadi bersamaan.<br>
Menyeluruh (Exhaustive): mencakup seluruh ruang sampel.
</div>
<div class="chapter-box">
<h4><b>Percobaan & Distribusi Binomial</b></h4>
Eksperimen binomial memiliki 4 syarat:<br>
Jumlah percobaan tetap<br>
Dua hasil (sukses/gagal)<br>
Peluang sukses tetap<br>
Percobaan saling independen<br><br>
Rumus binomial:<br>
$P(k) = \binom{n}{k} p^k (1-p)^{n-k}$
</div>
<div class="chapter-box">
<h4><b>Contoh Kejadian</b></h4>
Muncul setidaknya satu Ekor saat koin dilempar 2 kali
**Ruang Sampel**
$S = \{HH, HT, TH, TT\}$
Jumlah total hasil = 4
**Hasil yang Mendukung Event A**
$\{HT, TH, TT\}$ → jumlah = 3
**Perhitungan Peluang**
$P(A) = \frac{3}{4} = 0.75$
</div>
<div class="chapter-box">
<h4><b>Interpretasi Hasil dari Contoh Kejadian</b></h4>
Probabilitas 0.75 (75%) berarti bahwa:<br>
Dari banyak percobaan melempar koin 2 kali,<br>
Sekitar 75% percobaan akan menghasilkan setidaknya satu Ekor.<br>
Artinya, kejadian ini cukup besar kemungkinannya dan lebih sering terjadi dibandingkan tidak terjadi.
</div>
</div>
### Bab 7 {data-width=1200}
<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Distribusi probabilitas menggambarkan bagaimana nilai suatu variabel numerik tersebar dalam data. Konsep ini digunakan untuk memahami pola sebaran data dan kecenderungan nilai yang sering muncul.
:::
</div>
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<h4><b>Visualisasi Distribusi Variabel Numerik</b></h4>
<div class="section-divider"></div>
```{r, fig.height=3, fig.width=5, fig.align='center'}
library(readr)
library(dplyr)
library(ggplot2)
df <- read_csv("dataset_uas.csv", show_col_types = FALSE) %>%
dplyr::distinct(id_mahasiswa, minggu, materi_pembelajaran, .keep_all = TRUE)
ggplot(df, aes(x = jam_belajar_menit)) +
geom_density(
fill = "#1f77b4",
color = "#1f77b4",
alpha = 0.35,
size = 1
) +
labs(
title = "Distribusi Durasi Belajar Mahasiswa",
x = "Durasi Belajar (Menit)",
y = "Kepadatan"
) +
theme_minimal(base_size = 10)
```
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justtify}
Distribusi durasi belajar mahasiswa (dalam menit) divisualisasikan menggunakan kurva distribusi (density plot). Berdasarkan visualisasi tersebut, distribusi data cenderung miring ke kanan, yang menunjukkan bahwa sebagian besar mahasiswa memiliki durasi belajar pada rentang menengah, sementara hanya sedikit mahasiswa dengan durasi belajar yang sangat tinggi.
:::
</div>
</div>
### Bab 8 {data-width=1200}
<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Interval kepercayaan adalah rentang nilai yang digunakan untuk memperkirakan parameter populasi berdasarkan data sampel dengan tingkat keyakinan tertentu. Interval ini menunjukkan sejauh mana estimasi dari sampel dapat mewakili kondisi populasi yang sebenarnya.
:::
</div>
<div class="section-divider"></div>
<h4><b>Contoh Perhitungan Interval Keyakinan 95%</b></h4>
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
Misalkan dilakukan pengambilan sampel terhadap 25 mahasiswa untuk mengukur rata-rata waktu belajar harian. Dari sampel tersebut diperoleh:
- Rata-rata waktu belajar ($\bar{x}$) = 120 menit
- Simpangan baku sampel ($s$) = 20 menit
- Ukuran sampel ($n$) = 25
Dengan tingkat kepercayaan 95% dan menggunakan distribusi t, diperoleh nilai kritis $t_{0.025,24} \approx 2.064$.
Interval kepercayaan 95% dihitung sebagai: \(CI = \bar{x} \pm t_{\alpha/2,\,df} \left( \frac{s}{\sqrt{n}} \right)\)
</div>
<div class="divider"></div>
<div class="col section-text">
Sehingga diperoleh interval:
\[
\begin{aligned}
CI &= 120 \pm 2.064 \left( \frac{20}{\sqrt{25}} \right) = 120 \pm 2.064 \times 4 = 120 \pm 8.256 \\
CI &= (111.74, 128.26)
\end{aligned}
\]
**Interpretasi:**
Dengan tingkat keyakinan 95%, dapat disimpulkan bahwa rata-rata waktu belajar harian mahasiswa dalam populasi diperkirakan berada antara 111.74 hingga 128.26 menit. Interval ini memberikan gambaran tingkat ketelitian estimasi serta menunjukkan adanya ketidakpastian yang masih melekat dalam proses penarikan kesimpulan berdasarkan data sampel.
</div>
</div>
### Bab 9 {data-width=1200}
::: {.text-justify}
Inferensi statistik adalah proses penarikan kesimpulan tentang suatu populasi berdasarkan data sampel. Konsep ini digunakan untuk melakukan generalisasi, prediksi, dan pengambilan keputusan dalam kondisi ketidakpastian.
:::
<div class="chapter9-grid">
<div class="chapter9-box">
<h4>Hipotesis Statistik</h4>
<b>H₀</b>: tidak ada efek atau perbedaan.<br>
<b>H₁</b>: ada efek atau perbedaan.<br><br>
Hipotesis alternatif dapat berupa <i>uji dua arah</i> (tanpa arah khusus) atau <i>uji satu arah</i> (arah efek ditentukan sebelumnya).
</div>
<div class="chapter9-box">
<h4>Tipe Kesalahan I dan II</h4>
<b>Tipe I (α)</b>: menolak H₀ yang benar (<i>false positive</i>).<br>
<b>Tipe II (β)</b>: gagal menolak H₀ yang salah (<i>false negative</i>).<br><br>
<b>Power</b> = 1 − β, menunjukkan kemampuan uji mendeteksi efek nyata.
</div>
<div class="chapter9-box">
<h4>Metode Uji Hipotesis</h4>
<b>Uji T</b>: rata-rata, σ tidak diketahui, sampel kecil.<br>
<b>Uji Z</b>: rata-rata, σ diketahui atau n ≥ 30.<br>
<b>Chi-Square (χ²)</b>: data kategorikal.<br><br>
Perbedaan utama terletak pada jenis data dan asumsi statistik.
</div>
<div class="chapter9-box">
<h4>Pengambilan Keputusan Statistik</h4>
Keputusan dibuat berdasarkan nilai <i>p-value</i>.<br><br>
<b>p ≤ α</b> → H₀ ditolak.<br>
<b>p > α</b> → H₀ gagal ditolak.<br><br>
Pendekatan ini memastikan keputusan objektif dan terkontrol.
</div>
</div>
<div class="chapter9-test-grid">
<div class="chapter9-test-box">
**Contoh Kasus:** Sebuah produsen minuman mengklaim bahwa rata-rata volume isi botol produknya **lebih dari 500 ml**. (Sampel diambil sebanyak 10 botol dengan $α$ = 0.05)
<b>Hipotesis:</b><br>
H₀: μ ≤ 500 ml<br>
H₁: μ > 500 ml<br>
Uji satu arah digunakan karena arah klaim telah ditentukan.
</div>
<div class="chapter9-test-box">
<b>Statistik Uji:</b><br>
Uji t satu sampel digunakan karena data numerik dan simpangan baku populasi tidak diketahui.
Kemudian dari sampel diperoleh rata-rata 504,2 ml dengan simpangan baku 3,7 ml.
<b>Kesimpulan:</b><br>
Hasil pengujian menghasilkan p-value < 0,05 sehingga **H₀ ditolak**.
Dengan demikian, rata-rata volume isi botol secara signifikan **lebih besar dari 500 ml**.
</div>
</div>
### Bab 10 {data-width=1200}
::: {.text-justify}
Metode nonparametrik adalah teknik inferensi statistik yang tidak bergantung
pada asumsi distribusi tertentu, seperti normalitas atau parameter populasi
yang diketahui. Metode ini digunakan ketika data berskala ordinal/kategorikal,
berukuran kecil, atau mengandung nilai pencilan.
:::
<div class="chapter9-grid">
<div class="chapter9-box">
<h4>Peran Nonparametrik</h4>
Metode nonparametrik digunakan sebagai alternatif
ketika asumsi metode parametrik tidak terpenuhi.
Fokus inferensi meliputi:
- median
- peringkat
- frekuensi
</div>
<div class="chapter9-box">
<h4>Kapan Digunakan?</h4>
Direkomendasikan ketika:
- distribusi data tidak normal
- ukuran sampel kecil
- terdapat outlier
- data berskala ordinal atau nominal
</div>
<div class="chapter9-box">
<h4>Perbandingan Metode</h4>
<b>Parametrik</b>: asumsi distribusi ketat, sensitif terhadap outlier.
<b>Nonparametrik</b>: asumsi minimal, lebih robust namun power lebih rendah.
</div>
<div class="chapter9-box">
<h4>Uji Nonparametrik Umum</h4>
- Tes Tanda
- Wilcoxon Signed-Rank
- Mann–Whitney U
- Kruskal–Wallis
- Friedman
- Chi-Square
</div>
</div>
<div class="chapter9-test-grid">
<div class="chapter9-test-box">
<b>Contoh Kasus:</b><br>
Peneliti membandingkan tingkat kepuasan pelanggan antara dua layanan
transportasi online. Data kepuasan diperoleh menggunakan skala ordinal (1–5)
dari masing-masing 8 responden.
**Alasan Pemilihan Uji:**
Uji nonparametrik dipilih karena data berskala ordinal dan ukuran sampel kecil.
</div>
<div class="chapter9-test-box">
**Statistik Uji:**
Uji Mann–Whitney U digunakan karena data berskala ordinal, ukuran sampel kecil, dan kedua kelompok pelanggan bersifat independen. Uji ini merupakan alternatif nonparametrik dari uji-t dua sampel untuk membandingkan kecenderungan pusat dua kelompok tanpa asumsi distribusi normal.
**Kesimpulan:**
Berdasarkan hasil uji Mann–Whitney U, diperoleh bukti adanya perbedaan tingkat kepuasan pelanggan antara kedua layanan transportasi online, sehingga hipotesis nol ditolak.
</div>
</div>
Dataset {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
### Pendahuluan dan Deskripsi Dataset {data-height=520}
<div class="two-column">
<div class="col section-text">
Dalam beberapa tahun terakhir, proses pembelajaran mengalami perubahan seiring dengan pemanfaatan teknologi digital dalam kegiatan belajar-mengajar. Pembelajaran tidak lagi hanya dilakukan melalui pertemuan tatap muka (luring), tetapi juga mulai mengombinasikan pembelajaran daring sebagai alternatif dalam pelaksanaannya.
Namun, efektivitas suatu metode pembelajaran tidak dapat ditentukan hanya dari cara penyampaiannya. Keberhasilan program pembelajaran juga dipengaruhi oleh beberapa faktor penting, antara lain:
- Durasi belajar peserta
- Tingkat fokus selama proses pembelajaran
- Capaian hasil belajar
- Tingkat kepuasan pengguna
Oleh karena itu, diperlukan analisis berbasis data untuk mengevaluasi bagaimana karakteristik pembelajaran tersebut memengaruhi performa peserta secara kuantitatif.
Pada analisis ini, digunakan dataset kelas intensif statistik yang memuat informasi aktivitas belajar mingguan serta beberapa indikator penilaian yang relevan. Dataset ini dianalisis untuk menilai dan mengevaluasi efektivitas kelas intensif statistik secara kuantitatif dan menjadi dasar dalam penyusunan strategi pembelajaran yang lebih efektif serta sesuai dengan kebutuhan pengguna.
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Deskripsi Dataset</b></h4>
Dataset yang digunakan dalam analisis ini terdiri dari beberapa variabel yang merepresentasikan karakteristik peserta, aktivitas pembelajaran, serta capaian hasil belajar dalam kelas intensif statistik. Adapun penjelasan masing-masing variabel adalah sebagai berikut:
```{r}
library(knitr)
library(kableExtra)
library(tibble)
deskripsi_variabel <- tibble::tibble(
variabel = c(
"ID Mahasiswa",
"Minggu ke-",
"Materi Pembelajaran",
"Mode Pembelajaran",
"Durasi Belajar (Menit)",
"Skor Fokus",
"Skor Kuis 1",
"Skor Kuis 2",
"Tingkat Kepuasan"
),
jenis_variabel = c(
"Kategorikal – Nominal",
"Numerik – Jangka Waktu",
"Kategorikal – Nominal",
"Kategorikal – Nominal",
"Numerik – Kontinu",
"Numerik – Diskrit",
"Numerik – Kontinu",
"Numerik – Kontinu",
"Kategorikal – Ordinal"
),
deskripsi = c(
"Identitas unik setiap mahasiswa peserta kelas intensif statistik",
"Menunjukkan urutan minggu pelaksanaan pembelajaran",
"Topik statistik yang dipelajari",
"Metode pembelajaran yang digunakan (luring atau daring)",
"Durasi waktu belajar peserta dalam satuan menit",
"Skor tingkat fokus mahasiswa selama proses pembelajaran",
"Nilai kuis yang diperoleh sebelum mengikuti kelas intensif",
"Nilai kuis yang diperoleh setelah mengikuti kelas intensif",
"Tingkat kepuasan mahasiswa terhadap proses pembelajaran"
)
)
kable(
deskripsi_variabel,
col.names = c("Nama Variabel", "Jenis Variabel", "Deskripsi Singkat"),
align = c("l", "l", "l")
) %>%
kable_styling(
full_width = TRUE,
position = "center"
) %>%
# ISI SELANG SELING (MANUAL, AMAN)
row_spec(
seq(1, nrow(deskripsi_variabel), 2),
background = "#E6F0FA"
) %>%
row_spec(
seq(2, nrow(deskripsi_variabel), 2),
background = "#CFE2F3"
) %>%
# GARIS KIRI & KANAN TABEL
column_spec(1, border_left = FALSE, border_right = FALSE) %>%
column_spec(2, border_right = FALSE) %>%
column_spec(3, border_right = FALSE)
```
</div>
</div>
### Tabel Dataset {data-height=520}
```{r}
df <- readr::read_csv(
"dataset_uas.csv",
show_col_types = FALSE
) %>%
dplyr::distinct(id_mahasiswa, minggu, materi_pembelajaran, .keep_all = TRUE)
```
```{r}
df1 <- df %>%
dplyr::filter(kepuasan >= 0) %>%
dplyr::arrange(desc(skor_kuis_sesudah)) %>%
dplyr::select(
id_mahasiswa,
minggu,
materi_pembelajaran,
mode_pembelajaran,
jam_belajar_menit,
skor_fokus,
skor_kuis_sebelum,
skor_kuis_sesudah,
kepuasan
)
DT::datatable(
df1,
colnames = c(
"ID Mahasiswa",
"Minggu Ke-",
"Materi Pembelajaran",
"Mode Pembelajaran",
"Durasi Belajar (Menit)",
"Skor Fokus",
"Skor Kuis 1",
"Skor Kuis 2",
"Tingkat Kepuasan"
),
options = list(
pageLength = 10,
lengthChange = TRUE,
searching = TRUE,
ordering = TRUE,
paging = TRUE,
info = TRUE,
drawCallback = JS(
"function(settings) {",
"$('table thead th').css({",
" 'background-color': '#0B3C5D',",
" 'color': 'white',",
" 'font-weight': 'bold',",
" 'text-align': 'center'",
"});",
"$('table tbody tr:odd').css({",
" 'background-color': '#E6F0FA'",
"});",
"$('table tbody tr:even').css({",
" 'background-color': '#CFE2F3'",
"});",
"}"
)
),
caption = htmltools::tags$caption(
style = 'caption-side: bottom; text-align: center;',
'Tabel: ',
htmltools::em('Sampel Kelas Intensif Statistik')
)
)
```
Visualisasi Statistika Dasar {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
### Diagram Lingkaran {data-width=600 data-height=510}
<div class="two-column">
<div class="col section-text">
```{r pie-kepuasan, echo=FALSE, message=FALSE, warning=FALSE, fig.width=11, fig.height=11, out.width="100%"}
library(readr)
library(dplyr)
library(highcharter)
# Baca dataset
df <- read_csv("dataset_uas.csv", show_col_types = FALSE)
# Rekode kepuasan numerik -> kategori
kepuasan_df <- df %>%
mutate(
kategori = case_when(
kepuasan == 5 ~ "Tidak Puas",
kepuasan == 4 ~ "Cukup Puas",
kepuasan == 3 ~ "Puas",
kepuasan == 2 ~ "Sangat Puas",
)
) %>%
count(kategori) %>%
mutate(
persentase = round(n / sum(n) * 100, 1)
)
# Pie chart interaktif
highchart() %>%
hc_chart(
type = "pie",
animation = list(duration = 1000),
height = 350
) %>%
hc_title(text = "Tingkat Kepuasan Mahasiswa") %>%
hc_add_series(
name = "Persentase",
data = list_parse(
transform(kepuasan_df,
name = kategori,
y = persentase)
)
) %>%
hc_plotOptions(
pie = list(
size = "70%",
allowPointSelect = TRUE,
cursor = "pointer",
dataLabels = list(
enabled = TRUE,
format = "<b>{point.name}</b>: {point.y}%"
),
showInLegend = FALSE
)
)
```
</div>
<div class="divider"></div>
<div class="col section-text">
<div class="section-divider"></div>
::: {.text-justify}
Pada analisis ini, visualisasi menggunakan pie chart dipilih karena bertujuan untuk menampilkan proporsi tingkat kepuasan mahasiswa pada setiap kategori secara jelas dan mudah dipahami. Pie chart efektif digunakan untuk menunjukkan perbandingan persentase antar kategori dalam satu variabel kategorikal, sehingga memudahkan pembaca dalam melihat distribusi kepuasan mahasiswa secara keseluruhan.
:::
<div class="section-divider"></div>
<div class="visualisasi-box">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Tingkat kepuasan mahasiswa menggambarkan sejauh mana mahasiswa merasa puas terhadap proses pembelajaran yang telah diterapkan. Berdasarkan pie chart di samping, **mayoritas** mahasiswa berada pada kategori **“Puas”** dan **“Sangat Puas”**, yang menunjukkan bahwa sebagian besar mahasiswa memiliki persepsi positif terhadap kualitas pembelajaran.
Namun demikian, masih terdapat mahasiswa yang berada pada kategori **“Cukup Puas”** dan **“Tidak Puas”**, yang menandakan bahwa meskipun tingkat kepuasan secara umum sudah baik, tetap diperlukan upaya peningkatan kualitas pembelajaran secara berkelanjutan.
:::
</div>
</div>
</div>
### Diagram Batang {data-width=600 data-height=510}
```{r plot-mode, message=FALSE, warning=FALSE}
library(tidyverse)
library(grid)
library(gridExtra)
data <- read.csv("dataset_uas.csv")
mode_summary <- data %>%
group_by(mode_pembelajaran) %>%
summarise(
n = n()
)
plot_mode <- ggplot(mode_summary,
aes(x = mode_pembelajaran,
y = n,
fill = mode_pembelajaran)) +
geom_col(width = 0.5, color = "black", alpha = 0.85) +
geom_text(aes(label = n),
vjust = -0.6, size = 4) +
scale_fill_brewer(palette = "Set2") +
scale_y_continuous(
expand = expansion(mult = c(0, 0.1))
) +
labs(
title = "Distribusi Mode Pembelajaran",
subtitle = "Jumlah mahasiswa berdasarkan mode pembelajaran",
x = "Mode Pembelajaran",
y = "Jumlah Mahasiswa"
) +
theme_minimal(base_size = 8) +
theme(
plot.title = element_text(face = "bold", size = 13),
plot.subtitle = element_text(size = 11),
axis.title = element_text(face = "bold"),
panel.grid.minor = element_blank(),
legend.position = "none"
)
```
```{r plot-materi, message=FALSE, warning=FALSE}
materi_summary <- data %>%
group_by(materi_pembelajaran) %>%
summarise(
n = n()
)
plot_materi <- ggplot(materi_summary,
aes(x = reorder(materi_pembelajaran, n),
y = n,
fill = materi_pembelajaran)) +
geom_col(width = 0.55, color = "black", alpha = 0.85) +
geom_text(aes(label = n),
hjust = -0.15, size = 3.8) +
coord_flip() +
scale_fill_brewer(palette = "Pastel1") +
scale_y_continuous(
expand = expansion(mult = c(0, 0.1))
) +
labs(
title = "Distribusi Materi Pembelajaran",
subtitle = "Jumlah mahasiswa pada masing-masing materi pembelajaran",
x = "Materi Pembelajaran",
y = "Jumlah Mahasiswa"
) +
theme_minimal(base_size = 8) +
theme(
plot.title = element_text(face = "bold", size = 13),
plot.subtitle = element_text(size = 11),
axis.title = element_text(face = "bold"),
legend.position = "none",
panel.grid.minor = element_blank()
)
```
```{r}
library(grid)
box_bg <- roundrectGrob(
r = unit(6, "pt"),
gp = gpar(
fill = "#f8fbff",
col = "#8cb6ff",
lwd = 1
)
)
Alasan <- textGrob(
"Bar chart digunakan dalam analisis ini karena efektif untuk menampilkan dan
membandingkan jumlah mahasiswa pada setiap kategori secara langsung.
Visualisasi ini bertujuan untuk memudahkan identifikasi perbedaan distribusi
mahasiswa berdasarkan mode dan materi pembelajaran
Kedua visualisasi menunjukkan bahwa mahasiswa cenderung memilih
pembelajaran luring dan materi yang bersifat praktis. Dominasi mode
luring mengindikasikan kebutuhan akan interaksi langsung dalam proses
belajar, sementara tingginya minat pada Pemrograman R dan SQL & Python
menegaskan bahwa mahasiswa lebih tertarik pada keterampilan yang
aplikatif dan relevan dengan kebutuhan dunia data. Insight ini
menyiratkan bahwa pembelajaran akan lebih efektif jika difokuskan pada
tatap muka untuk materi teknis dan praktik langsung, dengan penyesuaian
metode pada materi yang kurang diminati.",
gp = gpar(fontsize = 9.5, lineheight = 1.25),
just = c("left", "top"),
x = unit(0.04, "npc"),
y = unit(0.87, "npc")
)
judul2 <- textGrob(
"Interpretasi Visualisasi",
gp = gpar(fontsize = 11, fontface = "bold"),
just = c("left", "top"),
x = unit(0.04, "npc"),
y = unit(0.95, "npc")
)
visualisasi <- textGrob(
"Bar chart digunakan dalam analisis ini karena efektif untuk menampilkan dan
membandingkan jumlah mahasiswa pada setiap kategori secara langsung.
Visualisasi ini bertujuan untuk memudahkan identifikasi perbedaan distribusi
mahasiswa berdasarkan mode dan materi pembelajaran",
gp = gpar(fontsize = 9.5, lineheight = 1.25),
just = c("left", "top"),
x = unit(0.04, "npc"),
y = unit(0.87, "npc")
)
interpretasi <- grobTree(
box_bg,
Alasan,
judul2,
visualisasi
)
```
```{r plot-gabungan, fig.width=15, fig.height=4, message=FALSE, warning=FALSE}
gridExtra::grid.arrange(
plot_mode,
plot_materi,
interpretasi,
ncol = 3,
widths = c(1.1, 1.4, 1.2)
)
```
### Diagram Garis {data-width=600 data-height=510}
<div class="two-column">
<div class="col section-text">
```{r line-chart-sebelum-sesudah, echo=FALSE, message=FALSE, warning=FALSE, fig.width=12, fig.height=7, out.width="100%"}
library(tidyverse)
data <- read.csv("dataset_uas.csv")
data_line <- data %>%
group_by(minggu) %>%
summarise(
skor_sebelum = mean(skor_kuis_sebelum),
skor_sesudah = mean(skor_kuis_sesudah)
)
data_long <- data_line %>%
pivot_longer(
cols = c(skor_sebelum, skor_sesudah),
names_to = "waktu",
values_to = "rata_skor"
)
ggplot(data_long, aes(x = minggu, y = rata_skor, color = waktu)) +
geom_line(linewidth = 1.2) +
geom_point(size = 3) +
labs(
title = "Perbandingan Rata-rata Skor Kuis Sebelum dan Sesudah",
x = "Minggu",
y = "Rata-rata Skor Kuis",
color = "Waktu Pengukuran"
) +
scale_color_manual(
values = c(
"skor_sebelum" = "#E5533D",
"skor_sesudah" = "#2C7BE5"
),
labels = c("Sebelum Pembelajaran", "Sesudah Pembelajaran")
) +
theme_minimal()
```
</div>
<div class="divider"></div>
<div class="col section-text">
<div class="section-divider"></div>
::: {.text-justify}
Line chart digunakan pada analisis ini karena mampu menampilkan perubahan nilai rata-rata skor kuis dari waktu ke waktu secara jelas. Visualisasi ini bertujuan untuk membandingkan tren skor kuis sebelum dan sesudah pembelajaran setiap minggu, sehingga memudahkan dalam mengamati pola peningkatan atau penurunan hasil belajar mahasiswa.
:::
<div class="section-divider"></div>
<div class="visualisasi-box">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan grafik, rata-rata skor kuis sesudah pembelajaran selalu lebih tinggi dibandingkan sebelum pembelajaran pada setiap minggu pengamatan. Hal ini menunjukkan bahwa pembelajaran yang diberikan memberikan dampak positif terhadap peningkatan hasil belajar. Peningkatan skor terlihat semakin stabil setelah minggu ke-7.
:::
</div>
</div>
</div>
### Sentral Tendensi
Analisis central tendency digunakan untuk menggambarkan nilai pusat dari skor kuis sesudah pembelajaran. Ukuran seperti mean dan median membantu mengetahui skor yang paling mewakili performa mahasiswa secara keseluruhan serta menilai kecenderungan umum hasil belajar setelah proses pembelajaran.
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
```{r ct_visual_lr, echo=FALSE, fig.width=9, fig.height=5, out.width="100%", fig.align='center'}
library(ggplot2)
library(patchwork)
hist_plot <- ggplot(df, aes(x = skor_kuis_sesudah)) +
geom_histogram(aes(y = after_stat(density)),
bins = 10,
fill = "#80b1d3",
color = "white",
alpha = 0.8) +
geom_density(color = "#1f78b4", linewidth = 1) +
geom_vline(xintercept = mean(df$skor_kuis_sesudah),
color = "red", linewidth = 1) +
geom_vline(xintercept = median(df$skor_kuis_sesudah),
color = "darkgreen", linewidth = 1,
linetype = "dashed") +
labs(title = "Histogram Skor Kuis Sesudah",
x = "Skor Kuis", y = "Density") +
theme_minimal(base_size = 11)
box_plot <- ggplot(df, aes(y = skor_kuis_sesudah)) +
geom_boxplot(fill = "#fdd0a2",
color = "gray30",
width = 0.4,
outlier.color = "red") +
labs(title = "Boxplot Skor Kuis Sesudah",
y = "Skor Kuis", x = NULL) +
theme_minimal(base_size = 11)
hist_plot | box_plot
```
</div>
<div class="divider"></div>
<div class="col section-text">
<div class="visualisasi-box">
<b>Interpretasi Histogram</b><br>
Histogram menunjukkan bahwa skor kuis sesudah pembelajaran terkonsentrasi pada nilai tinggi (sekitar 90–98). Distribusi tampak sedikit miring ke kiri, ditandai dengan nilai mean yang lebih kecil dari median, yang mengindikasikan adanya beberapa skor rendah meskipun mayoritas mahasiswa memperoleh nilai tinggi.
<b>Interpretasi Boxplot</b><br>
Boxplot menunjukkan median skor yang tinggi dengan rentang antar kuartil yang relatif sempit, menandakan konsistensi hasil belajar. Terdapat beberapa outlier pada skor rendah, yang menunjukkan sebagian kecil mahasiswa memiliki capaian di bawah mayoritas peserta.
<div class="section-divider"></div>
Berdasarkan kedua visualisasi, skor kuis mahasiswa umumnya berada pada nilai tinggi dan relatif konsisten, menunjukkan efektivitas pembelajaran yang diterapkan. Meskipun terdapat beberapa nilai pencilan yang rendah, secara keseluruhan hasil belajar tetap terpusat pada skor tinggi, dengan kebutuhan pendampingan bagi sebagian kecil mahasiswa.
</div>
</div>
</div>
### Statistik Dispersi
<div style="display:flex; gap:20px; align-items:flex-start;">
<div style="width:65%;">
```{r fig.width=9.5, fig.height=5, echo=FALSE}
library(ggplot2)
library(dplyr)
library(patchwork)
# Histogram + density
p_hist <- ggplot(df, aes(x = skor_kuis_sesudah, fill = mode_pembelajaran)) +
geom_histogram(
aes(y = after_stat(density)),
bins = 10,
alpha = 0.5,
color = "black",
position = "identity"
) +
geom_density(alpha = 0.4, linewidth = 1) +
facet_wrap(~mode_pembelajaran, ncol = 1) +
labs(
title = "Distribusi Skor Kuis Sesudah",
x = "Skor Kuis Sesudah",
y = "Kepadatan"
) +
theme_minimal() +
theme(
legend.position = "none",
plot.title = element_text(size = 11, face = "bold")
)
# Violin + boxplot
p_violin <- ggplot(df, aes(
x = materi_pembelajaran,
y = skor_kuis_sesudah,
fill = materi_pembelajaran
)) +
geom_violin(alpha = 0.4, trim = FALSE) +
geom_boxplot(width = 0.15, alpha = 0.7, outlier.color = "red") +
stat_summary(fun = mean, geom = "point", shape = 23, size = 2.5, fill = "blue") +
labs(
title = "Sebaran Skor Kuis Berdasarkan Materi",
x = "Materi",
y = "Skor Kuis"
) +
theme_minimal() +
theme(
legend.position = "none",
plot.title = element_text(size = 10, face = "bold"),
axis.text.x = element_text(angle = 20, hjust = 1)
)
# SEJAJAR KIRI–KANAN
p_hist | p_violin
```
</div>
<div style="width:40%;">
::: {.text-justify}
Pada analisis ini, ukuran penyebaran digunakan untuk melihat seberapa beragam skor kuis sesudah pembelajaran pada setiap mode dan materi pembelajaran. Analisis ini bertujuan untuk menilai tingkat konsistensi hasil belajar mahasiswa, bukan hanya melihat nilai rata-rata.
:::
<div class="section-divider"></div>
<div style="background-color:#f8f9fa; padding:16px; border-radius:10px; border-left:6px solid #0d6efd; text-align:justify; font-size:14px;">
<b>Histogram</b><br>
Histogram menunjukkan distribusi skor kuis sesudah pada mode pembelajaran luring dan daring. Meskipun rata-rata skor relatif berdekatan, bentuk kurva density memperlihatkan perbedaan tingkat variasi penyebaran skor antar mode pembelajaran, yang menunjukkan bahwa tingkat konsistensi hasil belajar mahasiswa dapat berbeda tergantung pada mode pembelajaran yang digunakan.
<br><br>
<b>Violin & Boxplot</b><br>
Violin plot dan boxplot menunjukkan bahwa penyebaran skor kuis sesudah berbeda pada setiap materi pembelajaran. Violin yang lebih lebar menandakan variasi skor yang lebih tinggi, sedangkan boxplot dengan IQR yang lebih sempit menunjukkan hasil belajar yang lebih konsisten, meskipun masih terdapat beberapa nilai pencilan yang menandakan adanya mahasiswa dengan capaian yang jauh di bawah mayoritas.
</div>
</div>
</div>
### Distribusi Probabilitas
Pada analisis ini, distribusi probabilitas digunakan untuk melihat pola sebaran skor kuis sesudah pembelajaran pada setiap mode pembelajaran. Analisis ini bertujuan untuk memahami bagaimana peluang mahasiswa memperoleh skor tertentu tersebar dalam data, sehingga tidak hanya berfokus pada nilai rata-rata, tetapi juga pada pola dan konsistensi capaian hasil belajar.
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
```{r probability_distribution, echo=FALSE, fig.width=8.5, fig.height=4.8}
library(ggplot2)
ggplot(df, aes(
x = mode_pembelajaran,
y = skor_kuis_sesudah,
fill = mode_pembelajaran
)) +
geom_violin(
trim = FALSE,
alpha = 0.55,
color = NA
) +
geom_boxplot(
width = 0.15,
alpha = 0.75,
outlier.color = "red"
) +
stat_summary(
fun = mean,
geom = "point",
shape = 23,
size = 3,
fill = "blue",
color = "black"
) +
labs(
title = "Distribusi Skor Kuis Sesudah Berdasarkan Mode Pembelajaran",
subtitle = "Visualisasi Probability Distribution",
x = "Mode Pembelajaran",
y = "Skor Kuis Sesudah"
) +
scale_x_discrete(expand = expansion(add = 0.6)) +
theme_minimal(base_size = 12) +
theme(
legend.position = "none",
plot.margin = margin(5, 5, 5, 5),
plot.title = element_text(face = "bold")
)
```
</div>
<div class="divider"></div>
<div class="col section-text">
<div class="visualisasi-box">
<h4><b>Interpretasi Visual:</b></h4>
Violin plot menunjukkan distribusi probabilitas skor kuis sesudah berdasarkan mode pembelajaran daring dan luring. Lebar violin merepresentasikan kepadatan data, sehingga bagian yang lebih lebar menunjukkan peluang mahasiswa memperoleh skor pada rentang nilai tertentu lebih besar.
Boxplot di dalam violin memperlihatkan nilai median dan rentang antar kuartil (IQR), yang menggambarkan sebaran utama skor kuis sesudah, sementara titik mean merepresentasikan nilai harapan (expected value).
Perbedaan bentuk dan lebar sebaran antara pembelajaran daring dan luring menunjukkan variasi pola distribusi peluang serta tingkat konsistensi capaian skor, meskipun secara umum kedua mode pembelajaran sama-sama menunjukkan kecenderungan hasil belajar yang relatif baik.
</div>
</div>
</div>
Interval Keyakinan {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
### Studi Kasus dan Identifikasi Uji {data-height=520}
<div class="skyblue-box">
<h4><b>Studi Kasus Dataset:</b></h4>
::: {.text-justify}
Program kelas intensif statistik diikuti oleh mahasiswa untuk meningkatkan pemahaman materi statistika. Setelah menyelesaikan program, mahasiswa mengikuti kuis evaluasi.
Berdasarkan data skor kuis sesudah mengikuti kelas, dilakukan perhitungan **interval keyakinan 95%** untuk **mengestimasi rata-rata skor kuis** mahasiswa yang mengikuti program kelas intensif statistik.
:::
</div>
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<div class="blue-box">
<h4><b>Identifikasi Metode dan Uji Statistik yang Tepat:</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Analisis ini bertujuan untuk **mengestimasi rata-rata skor kuis** mahasiswa **setelah** mengikuti kelas intensif statistik. Sehingga sampel pada analisis ini terdiri dari **50** skor kuis mahasiswa setelah mengikuti kelas, di mana setiap skor merepresentasikan hasil kuis satu mahasiswa.
Karena data yang digunakan merupakan **data sampel** dan **simpangan baku populasi tidak diketahui**, maka interval keyakinan untuk rata-rata dihitung menggunakan **distribusi t** dengan **simpangan baku sampel**. Interval keyakinan **95%** digunakan karena tingkat keyakinan ini umum dipakai dan memberikan estimasi rata-rata yang cukup akurat tanpa menghasilkan interval yang terlalu lebar.
:::
</div>
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Persiapan Perhitungan Analisis</b></h4>
Rata-rata sampel (\(\bar{x}\)):
\[
\begin{aligned}
\bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348
\end{aligned}
\]
Simpangan Baku Sampel:
\[
\begin{aligned}
s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{
\frac{1131.078}{49}} = 4.804501
\end{aligned}
\]
Derajat Kebebasan: \(df = n - 1 = 50 - 1 = 49\)
</div>
</div>
### Hitungan dan Visualisasi {data-height=520}
<div class="two-column">
<div class="col section-text">
<h4><b>Hitung Interval Keyakinan 95% Menggunakan Rumus \(t = \bar{x} \pm t_{\alpha/2,\,df}\left(\frac{s}{\sqrt{n}}\right)\)</b></h4>
<div class="section-divider"></div>
Hitung \(t_{\alpha/2,\,df}\) untuk tingkat keyakinan 95%
\[
\begin{aligned}
\alpha &= 1 - 0.95 = 0.05 \\
\alpha/2 &= 0.025 \\
df &= 49 \\
t_{0.025,49} &= 2.009575
\end{aligned}
\]
Hitung Kesalahan Margin
\[
\begin{aligned}
ME &= t_{\alpha/2,df}\left(\frac{s}{\sqrt{n}}\right) = 2.009575\left(\frac{4.804501}{\sqrt{50}}\right) = 1.3654
\end{aligned}
\]
Interval Keyakinan 95% adalah:
\[
\begin{aligned}
CI_{95\%} &= \bar{x} \pm ME \\
UCI &= 92.5348 + 1.3654 = 93.9002 \\
LCI &= 92.5348 - 1.3654 = 91.1698 \\
CI_{95\%} &= (93.8998,\; 91.1694)
\end{aligned}
\]
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Hitung Interval Keyakinan 95% Menggunakan Kode R</b></h4>
<div class="section-divider"></div>
```{r echo=FALSE, message=FALSE, warning=FALSE,}
library(readr)
library(dplyr)
library(knitr)
library(kableExtra)
df <- read_csv("dataset_uas.csv", show_col_types = FALSE)
x <- df$skor_kuis_sesudah
x <- x[!is.na(x)]
CL <- 0.95
alpha <- 1 - CL
n <- length(x)
dfree <- n - 1
xbar <- mean(x)
s <- sd(x)
SE <- s / sqrt(n)
t_crit <- qt(1 - alpha/2, df = dfree)
MoE <- t_crit * SE
LCI <- xbar - MoE
UCI <- xbar + MoE
ci_table <- data.frame(
CL = "95%",
Alpha = round(alpha, 2),
Mean = round(xbar, 4),
SD = round(s, 4),
t = round(t_crit, 3),
SE = round(SE, 4),
MoE = round(MoE, 4),
LCI = round(LCI, 4),
UCI = round(UCI, 4)
)
ci_table %>%
kable(
align = "c"
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"),
full_width = TRUE,
position = "center"
) %>%
row_spec(0, bold = TRUE, color = "white", background = "#1f77b4")
```
```{r echo=FALSE, message=FALSE, warning=FALSE}
library(plotly)
# Data CI
ci_plot <- data.frame(
label = "CI 95%",
mean = xbar,
lci = LCI,
uci = UCI
)
plot_ly() %>%
# Garis CI
add_segments(
data = ci_plot,
x = ~lci, xend = ~uci,
y = 0, yend = 0,
line = list(color = "#1f77b4", width = 6),
name = "Confidence Interval 95%",
hoverinfo = "text",
text = ~paste0(
"CI 95%<br>",
"Lower: ", round(lci, 3), "<br>",
"Upper: ", round(uci, 3)
)
) %>%
# Titik Mean
add_markers(
data = ci_plot,
x = ~mean,
y = 0,
marker = list(
color = "#d62728",
size = 14
),
name = "Rata-rata Sampel",
hoverinfo = "text",
text = ~paste0(
"Mean: ", round(mean, 3)
)
) %>%
layout(
title = list(
text = "Visualisasi Interval Kepercayaan 95%<br>Skor Kuis Sesudah",
x = 0.5,
plot_bgcolor = "#b7d4ff"
),
xaxis = list(
title = "Skor Kuis Sesudah",
range = c(91, 94),
tick0 = 90,
dtick = 0.5
),
yaxis = list(
visible = FALSE
),
legend = list(
orientation = "h",
x = 0.5,
xanchor = "center",
y = -0.25
),
showlegend = TRUE,
height = 350
)
```
</div>
</div>
### Kesimpulan Analisis {data-height=520}
<div class="blue-box">
<h4><b>Hasil Interval Keyakinan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan perhitungan interval keyakinan **95%**, diperoleh bahwa rata-rata skor kuis mahasiswa setelah mengikuti program kelas intensif statistik berada pada **rentang 91.1698 hingga 93.9002**. Dengan tingkat keyakinan 95%, dapat diyakini bahwa rata-rata skor kuis populasi mahasiswa **berada dalam interval tersebut**.
:::
</div>
<div class="skyblue-box">
<h4><b>Interpretasi Statistik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Rentang interval yang **relatif sempit** serta posisi **rata-rata sampel** yang berada **di dalam** interval keyakinan menunjukkan bahwa skor kuis sesudah pembelajaran berada pada tingkat yang **relatif stabil**. Dengan demikian, hasil ini mengindikasikan bahwa capaian pembelajaran pada kelas intensif statistik menunjukkan konsistensi performa antar mahasiswa setelah mengikuti program pembelajaran.
:::
</div>
<div class="blue-box">
<h4><b>Insight</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Hasil interval keyakinan yang diperoleh menunjukkan bahwa sistem pembelajaran pada program kelas intensif statistik memberikan hasil yang **relatif konsisten**. Dengan demikian, sistem pembelajaran ini perlu dipertahankan serta ditingkatkan agar kualitas dan konsistensi hasil belajar mahasiswa dapat terus terjaga pada periode pembelajaran berikutnya.
:::
</div>
Statistik Inferensi {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
### Studi Kasus dan Identifikasi Uji {data-height=520}
<div class="skyblue-box">
::: {.text-justify}
<h4><b>Studi Kasus Dataset:</b></h4>
Program kelas intensif statistik menerapkan evaluasi berupa kuis sesudah pembelajaran untuk mengukur perubahan hasil belajar mahasiswa.Berdasarkan data skor kuis mahasiswa setelah mengikuti kelas intensif statistika, dilakukan pengujian hipotesis untuk mengetahui apakah rata-rata skor kuis mahasiswa secara signifikan lebih tinggi dari nilai 80.
:::
</div>
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<div class="blue-box">
<h4><b>Identifikasi Uji</b></h4>
Uji statistik yang digunakan adalah **uji t satu sampel satu sisi**.
Uji ini dipilih karena tujuan analisis adalah untuk menguji apakah rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan **lebih tinggi dari nilai acuan 80** berdasarkan satu sampel data mahasiswa. Data yang digunakan merupakan data sampel, dan **simpangan baku populasi tidak diketahui**, sehingga simpangan baku diestimasi menggunakan simpangan baku sampel.
Taraf signifikansi yang digunakan adalah $α = 0,05$, karena merupakan tingkat signifikansi yang umum digunakan dalam penelitian statistik.
Pengujian dilakukan **satu sisi** karena fokus analisis adalah untuk menguji apakah rata-rata skor **lebih besar dari 80**, bukan sekadar berbeda.
</div>
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Menentukan Hipotesis</b></h4>
Dalam studi kasus ini, nilai 80 digunakan sebagai nilai pembanding (baseline) yang merepresentasikan standar pencapaian skor kuis yang diharapkan.
- **Hipotesis Nol (H₀):**
Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika sama dengan atau tidak lebih tinggi dari 80.
\[
H_0 : \mu \le 80
\]
- **Hipotesis Alternatif (H₁):**
Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika lebih tinggi dari 80.
\[
H_1 : \mu > 80
\]
</div>
</div>
### Perhitungan Uji T & Kesimpulan {data-height=520}
<div class="two-column">
<div class="col section-text">
Rata-rata sampel (\(\bar{x}\)):
\[
\begin{aligned}
\bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348
\end{aligned}
\]
Simpangan Baku Sampel:
\[
\begin{aligned}
s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{
\frac{1131.078}{49}} = 4.804501
\end{aligned}
\]
Standar Kesalahan:
\[
\begin{aligned}
SE &= \frac{s}{\sqrt{n}} = \frac{4.804501}{\sqrt{50}} = 0.679
\end{aligned}
\]
**Statistik Uji t**:
\[
\begin{aligned}
t &= \frac{\bar{x} - \mu_0}{SE} = \frac{92.5348 - 80}{0.679} = \frac{12.5348}{0.679} \approx 18.45
\end{aligned}
\]
```{r echo=FALSE, message=FALSE, warning=FALSE}
library(readr)
library(dplyr)
library(knitr)
library(kableExtra)
# Load data
df <- read_csv("dataset_uas.csv", show_col_types = FALSE)
# Variabel
x <- df$skor_kuis_sesudah
x <- x[!is.na(x)]
# Parameter uji
mu0 <- 80 # nilai yang diklaim (GANTI SESUAI SOAL)
alpha <- 0.05
n <- length(x)
dfree <- n - 1
xbar <- mean(x)
s <- sd(x)
SE <- s / sqrt(n)
# Statistik uji t
t_hit <- (xbar - mu0) / SE
# p-value dua arah
p_value <- 2 * pt(-abs(t_hit), df = dfree)
# Tabel hasil uji
test_table <- data.frame(
n = n,
Mean = round(xbar, 4),
SD = round(s, 4),
SE = round(SE, 4),
t_statistic = round(t_hit, 4),
df = dfree,
p_value = round(p_value, 4),
Alpha = alpha,
Keputusan = ifelse(p_value > alpha,
"Gagal menolak H0",
"Tolak H0")
)
# Tabel biru
test_table %>%
kable(align = "c") %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"),
full_width = TRUE,
position = "center"
) %>%
row_spec(0, bold = TRUE, color = "white", background = "#1f77b4")
```
</div>
<div class="divider"></div>
<div class="col section-text">
**Hitung p-value**:
Rumus p-value uji t satu arah adalah: \(\begin{aligned} p\text{-value} &= P(t \ge t_{\text{hitung}}) \end{aligned}\) dengan derajat kebebasan $df = 49$, maka
\[
\begin{aligned}
p\text{-value}
&= P\left(t_{49} \ge 18.45\right)
\end{aligned}
\]
Hasil perhitungan menggunakan kode R memberikan nilai:
\(
\begin{aligned}
p\text{-value}
&= 5.206043 \times 10^{-24}
\end{aligned}
\)
Nilai tersebut sangat kecil dan secara praktis dapat dinyatakan sebagai:
\(
\begin{aligned}
p\text{-value} &< 0.0001
\end{aligned}
\)
<div class="blue-box">
<h4><b>Kesimpulan</b></h4>
<div class="section-divider"></div>
Karena nilai $p$-value jauh lebih kecil dari tingkat signifikansi yang digunakan, yaitu $\alpha = 0.05$, maka keputusan yang diambil adalah **menolak hipotesis nol ($H_0$)**.
Dengan demikian, terdapat bukti statistik yang sangat kuat untuk menyimpulkan bahwa rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik **secara signifikan lebih tinggi dari 80**.
Hasil ini menunjukkan bahwa program kelas intensif statistik memberikan dampak positif yang signifikan terhadap peningkatan skor kuis mahasiswa. Oleh karena itu, hasil ini mengindikasikan bahwa pendekatan kelas intensif statistik layak untuk dipertahankan sebagai metode pembelajaran dalam meningkatkan performa akademik mahasiswa.
</div>
</div>
</div>
Metode Nonparametrik {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
### Studi Kasus dan Identifikasi Uji {data-height=520}
<div class="skyblue-box">
<div class="two-column">
<div class="col section-text">
<h4><b>Studi Kasus</b></h4>
<div class="section-divider"></div>
Sebuah program kelas intensif statistika berlangsung selama 12 minggu dengan evaluasi berupa kuis mingguan. Untuk menilai efektivitas program, dilakukan pengukuran skor kuis sebelum dan sesudah mengikuti kelas pada kelompok mahasiswa yang sama.
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Hipotesis</b></h4>
<div class="section-divider"></div>
\[\begin{aligned}
H_0 &: \text{Median perbedaan skor kuis sebelum dan sesudah} = 0 \\
H_1 &: \text{Median perbedaan skor kuis sebelum dan sesudah} \neq 0
\end{aligned}\]
</div>
</div>
</div>
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<div class="blue-box">
<h4><b>Alasan Menggunakan Analisis Nonparametrik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan hasil uji asumsi, data skor kuis tidak berdistribusi normal, sehingga metode parametrik seperti uji-t berpasangan tidak memenuhi syarat. Oleh karena itu, digunakan pendekatan nonparametrik yang lebih sesuai dengan karakteristik data.
:::
<h4><b>Tujuan Analisis</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Tujuan analisis ini adalah untuk mengetahui apakah terdapat perbedaan median skor kuis mahasiswa sebelum dan sesudah mengikuti kelas intensif statistika.
:::
</div>
</div>
<div class="divider"></div>
<div class="col section-text">
<div class="blue-box">
<h4><b>Alasan menggunakan Uji Wilcoxon</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Uji Wilcoxon Signed-Rank dipilih karena sesuai untuk membandingkan dua pengukuran berpasangan pada kelompok yang sama ketika asumsi normalitas tidak terpenuhi. Metode ini mempertimbangkan arah dan besar perbedaan, sehingga memberikan hasil yang lebih kuat dibandingkan uji tanda.
:::
</div>
</div>
### Step Wilcoxon {data-height=520}
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<h4><b>Langkah 1: Menghitung Perbedaan Berpasangan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung perbedaan skor kuis sebelum dan sesudah pembelajaran untuk setiap mahasiswa. Perbedaan berpasangan didefinisikan sebagai selisih antara skor kuis sesudah dan skor kuis sebelum pembelajaran.
:::
```{r wilcoxon-step1, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)
step1 <- df %>%
select(id_mahasiswa, skor_kuis_sebelum, skor_kuis_sesudah) %>%
mutate(
perbedaan = skor_kuis_sesudah - skor_kuis_sebelum
)
kable(
step1
) %>%
kable_styling(full_width = TRUE) %>%
scroll_box(height = "95px", width = "700px", )
```
<div class="section-divider"></div>
<h4><b>Langkah 2: Hapus Perbedaan Nol</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, observasi dengan nilai perbedaan sama dengan nol dihapus dari analisis, karena pasangan dengan perbedaan nol tidak memberikan informasi mengenai arah perubahan.
:::
```{r wilcoxon-step2, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)
step2 <- step1 %>%
filter(perbedaan != 0)
kable(
step2
) %>%
kable_styling(full_width = TRUE) %>%
scroll_box(height = "95px", width = "700px")
```
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Langkah 3: Peringkat Perbedaan Absolut</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung nilai absolut dari perbedaan berpasangan. Selanjutnya, nilai absolut tersebut diberi peringkat dari yang terkecil hingga terbesar. Jika terdapat nilai yang sama (ties), maka diberikan peringkat rata-rata.
:::
```{r wilcoxon-step3, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)
step3 <- step2 %>%
mutate(
abs_perbedaan = abs(perbedaan),
peringkat = rank(abs_perbedaan, ties.method = "average")
)
kable(step3) %>%
kable_styling(full_width = TRUE) %>%
scroll_box(height = "95px", width = "700px")
```
<div class="section-divider"></div>
<h4><b>Langkah 4: Menentukan Tanda Peringkat</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, tanda peringkat ditentukan berdasarkan arah perbedaan. Jika perbedaan bernilai positif, maka peringkat diberi tanda positif. Jika perbedaan bernilai negatif, maka peringkat diberi tanda negatif.
:::
```{r wilcoxon-step4, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)
step4 <- step3 %>%
mutate(
peringkat_bertanda = ifelse(perbedaan > 0, peringkat, -peringkat)
)
kable(step4) %>%
kable_styling(full_width = TRUE) %>%
scroll_box(height = "95px", width = "700px")
```
</div>
</div>
### Step Wilcoxon & Interpretasi {data-height=520}
<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">
<h4><b>Langkah 5: Menghitung Statistik Uji</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung jumlah peringkat bertanda positif (W⁺) dan jumlah peringkat bertanda negatif (W⁻).
Statistik uji Wilcoxon didefinisikan sebagai nilai minimum dari W⁺ dan W⁻.
:::
```{r wilcoxon-step5, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)
W_pos <- sum(step4$peringkat[step4$perbedaan > 0])
W_neg <- sum(step4$peringkat[step4$perbedaan < 0])
W_stat <- min(W_pos, W_neg)
hasil_W <- data.frame(
W_Positif = W_pos,
W_Negatif = W_neg,
Statistik_Uji_W = W_stat
)
kable(hasil_W) %>%
kable_styling(full_width = TRUE)
```
</div>
<div class="divider"></div>
<div class="col section-text">
<h4><b>Langkah 6: Pengambilan Keputusan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dilakukan uji Wilcoxon Signed-Rank menggunakan fungsi `wilcox.test()` di R. Keputusan diambil berdasarkan nilai p-value dengan tingkat signifikansi $α = 0.05$.
Jika p-value $< α$, maka H₀ ditolak.
:::
```{r wilcoxon-step6, echo=FALSE, message=FALSE, warning=FALSE}
library(knitr)
library(kableExtra)
uji_wilcoxon <- wilcox.test(
df$skor_kuis_sesudah,
df$skor_kuis_sebelum,
paired = TRUE,
alternative = "two.sided",
exact = TRUE
)
hasil_uji <- data.frame(
Statistik_Uji = uji_wilcoxon$statistic,
P_Value = uji_wilcoxon$p.value,
Keputusan = ifelse(uji_wilcoxon$p.value < 0.05, "Tolak H₀", "Gagal Menolak H₀")
)
kable(hasil_uji) %>%
kable_styling(full_width = TRUE)
```
</div>
</div>
<div class="blue-box">
<h4><b>Interpretasi Statistik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Jika **p-value < 0.05**, maka hipotesis nol **(H₀) ditolak**, yang berarti **terdapat perbedaan median** skor kuis sebelum dan sesudah mengikuti kelas intensif statistika. Hal ini menunjukkan bahwa program kelas intensif statistika memberikan pengaruh yang signifikan terhadap perubahan skor kuis mahasiswa.
Secara praktis, hasil ini mengindikasikan bahwa pendekatan pembelajaran yang diterapkan dalam program tersebut efektif dalam meningkatkan pemahaman mahasiswa terhadap materi statistika. Oleh karena itu, program kelas intensif dapat dipertahankan dan dipertimbangkan untuk dikembangkan lebih lanjut sebagai strategi pembelajaran yang mendukung peningkatan prestasi akademik.
:::
</div>