Anggota Kelompok

## Column

R Programming Statistics

Final Exam – Mr. Bakti Siregar, M.Sc., CDS

Foto Kelompok

Angelique Kiyoshi Lakeisha Bahrul Ulum

NIM: 52250001

Ringkasan Bab 9 & 10
Interval Keyakinan
Bagian Dataset
Desain Kartu Anggota Kelompok

Khafizatun Nisa

NIM: 52250018

Ringkasan Bab 1 & 2
Visualisasi Statistika Dasar (Sentral Tendensi, Dispersi Statistik, Distribusi Probabilitas)

Naychilla Adelia Zahrah

NIM: 52250004

Ringkasan Bab 7 & 8
Metode Nonparametrik

Nakeisha Aulia Zahra

NIM: 52250023

Ringkasan Bab 5 & 6
Visualisasi Statistika Dasar (Diagram Lingkaran, Batang, dan Garis)
Desain Foto Kelompok

Veronica Maria Lucia Ferreira Xavier

NIM: 52250021

Ringkasan Bab 3 & 4
Inferensi Statistik

Ringkasan Statistika Dasar

## Column

Bab 1

Definisi

Statistik adalah ilmu yang mempelajari metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data untuk menghasilkan informasi yang bermakna serta mendukung pengambilan keputusan di bawah kondisi ketidakpastian. Statistik digunakan untuk memahami pola dan variasi dalam data, serta untuk menarik kesimpulan dan membuat prediksi mengenai suatu populasi berdasarkan data yang tersedia.

Permasalahan Statistik Utama

Permasalahan statistik utama berkaitan dengan bagaimana data dapat diolah dan dianalisis secara sistematis agar menghasilkan informasi yang akurat dan dapat dipercaya. Data yang tersedia sering kali mengandung variasi, ketidakpastian, serta jumlah yang besar, sehingga diperlukan metode statistik untuk merangkum data, memahami pola yang muncul, dan mengurangi kesalahan dalam penarikan kesimpulan. Statistik membantu menjembatani data mentah menjadi dasar yang rasional dalam pengambilan keputusan.

Jenis Statistik yang Digunakan

Statistik secara umum terbagi menjadi dua jenis utama, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif digunakan untuk menggambarkan dan meringkas data melalui ukuran pemusatan, ukuran penyebaran, serta visualisasi data. Sementara itu, statistik inferensial digunakan untuk menarik kesimpulan atau membuat estimasi mengenai suatu populasi berdasarkan data sampel, dengan memanfaatkan konsep peluang, interval kepercayaan, dan pengujian hipotesis.

Bab 2

Definisi

Eksplorasi Data adalah tahap awal analisis statistik untuk memahami karakteristik, struktur, dan kualitas data sebelum analisis lanjutan, sehingga membantu menghindari kesalahan interpretasi dan menghasilkan keputusan yang lebih akurat.

Jenis Variabel Data

Jenis.Data	Bentuk.Data	Tipe	Deskripsi
Data Numerik (Kuantitatif)	Berupa angka	Diskrit	Data hasil hitungan, biasanya berupa bilangan bulat
Data Numerik (Kuantitatif)	Berupa angka	Kontinu	Data hasil pengukuran, dapat berupa bilangan pecahan
Data Kategorikal (Kualitatif)	Berupa kategori	Nominal	Data kategori tanpa urutan tertentu
Data Kategorikal (Kualitatif)	Berupa kategori	Ordinal	Data kategori yang memiliki urutan atau tingkatan

Deskripsi

Pada tahap eksplorasi data, variabel numerik diringkas menggunakan statistik deskriptif untuk memberikan gambaran awal terhadap data. Ringkasan statistik ini meliputi ukuran pemusatan seperti mean dan median, serta ukuran penyebaran seperti nilai minimum, maksimum, range, varians, dan standar deviasi.

Selain itu, eksplorasi data juga bertujuan untuk mengidentifikasi pola awal, yaitu kecenderungan umum yang muncul dalam data, tren, yaitu perubahan nilai data apabila diamati berdasarkan urutan tertentu, serta anomali (outlier), yaitu nilai yang menyimpang jauh dari sebagian besar data. Informasi ini menjadi dasar penting dalam memahami perilaku data dan menentukan metode analisis statistik selanjutnya.

Bab 3

Visualisasi data adalah proses mengubah data mentah menjadi informasi yang jelas dan bermakna, sehingga mudah dipahami dan membantu penyampaian pesan secara tepat.

Line Chart

Line chart adalah alat visualisasi data yang digunakan untuk menunjukkan bagaimana nilai berubah secara berurutan, biasanya dari waktu ke waktu.

Contoh Kasus: Menampilkan tren penjualan bulanan toko online selama tahun 2024 untuk melihat bulan mana yang memiliki performa terbaik.

Bar Chart

Bar chart adalah grafik batang untuk menampilkan data kategorikal. Tinggi atau panjang batang menunjukkan nilai tiap kategori sehingga mudah dibandingkan.

Contoh Kasus: Membandingkan total penjualan antar kategori produk untuk mengetahui produk mana yang paling laris.

Histogram

Histogram adalah grafik batang untuk menunjukkan sebaran data numerik dalam beberapa interval.

Contoh Kasus : Distribusi Nilai Ujian Mahasiswa

Bab 4

Central Tendency adalah ukuran statistik yang merepresentasikan nilai tipikal atau sentral dari dataset. Bertujuan memberikan satu nilai yang paling mewakili keseluruhan data. Ada Tiga Ukuran Utama yaitu:

Rata-rata

Rata-rata adalah nilai yang diperoleh dengan membagi jumlah seluruh data dengan banyaknya data, dan digunakan untuk data bertipe interval dan rasio.

Rumus: \(\bar{x} = \frac{\sum x}{n}\)

Nilai Tengah

Nilai Tengah adalah nilai tengah dari data yang telah diurutkan dan cocok digunakan untuk data bertipe ordinal, interval, dan rasio.

Rumus: \(\text{Median} = \begin{cases} x_{\left(\frac{n+1}{2}\right)}, & \text{jika } n \text{ ganjil} \\ \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}, & \text{jika } n \text{ genap} \end{cases}\)

Nilai Tengah

Nilai tengah adalah nilai yang paling sering muncul dalam suatu kumpulan data dan dapat digunakan untuk data bertipe nominal, ordinal, interval, maupun rasio.

Rumus: \(\text{Mode} = x \;\; \text{dengan frekuensi tertinggi}\)

Menghitung ukuran pemusatan data dari nilai siswa pada 2 mata pelajaran:
- Nilai Fisika: 85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70
- Nilai Bahasa: 80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76

Perhitungan Menggunakan Kode R

Variabel	Mean	Median	Modus
Fisika	83.60	85	85
Bahasa Indonesia	81.67	80	80

Interpretasi dan Perbandingan Hasil Kedua Nilai Siswa:
1. Rata-rata: Nilai rata-rata Fisika (83,60) lebih tinggi dibandingkan Bahasa Indonesia (81,67), sehingga performa siswa pada Fisika lebih baik.
2. Nilai Tengah: Median Fisika sebesar 85 lebih tinggi daripada Bahasa Indonesia sebesar 80, menunjukkan nilai tengah Fisika berada pada tingkat lebih tinggi.
3. Modus (nilai paling sering muncul): Modus Fisika adalah 85, sedangkan Bahasa Indonesia 80, yang berarti nilai yang paling sering muncul pada Fisika lebih tinggi.

Kesimpulan: Secara keseluruhan, hasil belajar siswa pada mata pelajaran Fisika lebih baik dibandingkan Bahasa Indonesia, baik dilihat dari rata-rata, nilai tengah, maupun nilai yang paling sering muncul.

Bab 5

Definisi

Statistical dispersion adalah ukuran yang menunjukkan seberapa tersebar atau bervariasi data dari suatu kumpulan nilai. Semakin besar nilai dispersi, semakin tidak seragam datanya, sedangkan semakin kecil nilai dispersi, semakin homogen data tersebut.
Pengukuran tingkat dispersi data umumnya dilakukan menggunakan beberapa ukuran utama, yaitu jangkauan (range), varians, dan simpangan baku

Range

Range adalah ukuran penyebaran paling sederhana yang menunjukkan selisih antara nilai maksimum dan minimum dalam data.

Rumus: \(Range = X_{max} - X_{min}\)

Contoh Perhitungan:
Data: 5, 7, 10, 12, 15
Range = 15 − 5 = 10

Varians

Definisi: Varians menunjukkan rata-rata kuadrat selisih setiap data terhadap nilai rata-rata (mean).

Rumus:
Populasi:
\(\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}\)
Sampel:
\(s^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1}\)

Contoh Perhitungan
Diketahui data: 46, 50, 54, 48, 52
\(\bar{X} = \frac{250}{5} = 50\)
\(\sum (X_i - \bar{X})^2 = 40\)
\(s^2 = \frac{40}{4} = 10\)

Standar Deviasi

Definisi
Standar deviasi adalah akar kuadrat dari varians dan menunjukkan rata-rata jarak data terhadap mean.

Rumus
\(s = \sqrt{s^2}\)

Contoh Perhitungan
\(s^2 = 10\)
\(s = \sqrt{10} \approx 3,16\)

Interpretasi Tingkat Penyebaran Data

Range kecil → data tidak terlalu menyebar
Varians kecil → data mendekati rata-rata
Standar deviasi kecil → data homogen
Dispersi besar → data heterogen

Secara umum, ukuran dispersi digunakan untuk menilai tingkat keragaman data dalam suatu kumpulan pengamatan. Nilai range, varians, dan standar deviasi yang relatif kecil menunjukkan bahwa data cenderung terkonsentrasi di sekitar nilai rata-rata, sehingga variasi antar data tidak terlalu besar. Sebaliknya, nilai dispersi yang besar mengindikasikan adanya perbedaan yang cukup signifikan antar nilai pengamatan, yang mencerminkan tingkat heterogenitas data yang lebih tinggi.

Bab 6

Definisi Probabilitas

Probabilitas adalah ukuran peluang terjadinya suatu peristiwa. Nilainya berada antara 0 sampai 1, di mana:
0 → kejadian mustahil
1 → kejadian pasti

Rumus dasar:
\(P(A) = \frac{\text{Jumlah hasil yang menguntungkan}}{\text{Jumlah seluruh hasil dalam ruang sampel}}\)

Konsep Dasar & Ruang Sampel

Ruang sampel (S) adalah seluruh kemungkinan hasil dari suatu percobaan.
Kejadian (event) adalah bagian dari ruang sampel yang diperhatikan.

Contoh:
Melempar koin 2 kali:
\(S = \{HH, HT, TH, TT\}\)

Aturan Probabilitas

Dua aturan utama:
- Nilai probabilitas selalu \(0 \le P(A) \le 1\)
- Total probabilitas seluruh hasil dalam ruang sampel = 1

Aturan Komplemen

Aturan ini digunakan untuk mencari peluang kejadian tidak terjadi.
Rumus:
\(P(A^c) = 1 - P(A)\)

Kejadian Independen dan Dependen

Independen: satu kejadian tidak memengaruhi kejadian lain.
\(P(A \cap B) = P(A) \times P(B)\)

Dependen: satu kejadian memengaruhi kejadian berikutnya.
\(P(A \cap B) = P(A) \times P(B|A)\)

Penyatuan, Saling Lepas, dan Menyeluruh

Gabungan (Union): kejadian A atau B.
\(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)

Saling lepas (Mutually Exclusive): tidak bisa terjadi bersamaan.
Menyeluruh (Exhaustive): mencakup seluruh ruang sampel.

Percobaan & Distribusi Binomial

Eksperimen binomial memiliki 4 syarat:
Jumlah percobaan tetap
Dua hasil (sukses/gagal)
Peluang sukses tetap
Percobaan saling independen

Rumus binomial:
\(P(k) = \binom{n}{k} p^k (1-p)^{n-k}\)

Contoh Kejadian

Muncul setidaknya satu Ekor saat koin dilempar 2 kali

Ruang Sampel \(S = \{HH, HT, TH, TT\}\)
Jumlah total hasil = 4

Hasil yang Mendukung Event A
\(\{HT, TH, TT\}\) → jumlah = 3

Perhitungan Peluang
\(P(A) = \frac{3}{4} = 0.75\)

Interpretasi Hasil dari Contoh Kejadian

Probabilitas 0.75 (75%) berarti bahwa:
Dari banyak percobaan melempar koin 2 kali,
Sekitar 75% percobaan akan menghasilkan setidaknya satu Ekor.
Artinya, kejadian ini cukup besar kemungkinannya dan lebih sering terjadi dibandingkan tidak terjadi.

Bab 7

Definisi

Distribusi probabilitas menggambarkan bagaimana nilai suatu variabel numerik tersebar dalam data. Konsep ini digunakan untuk memahami pola sebaran data dan kecenderungan nilai yang sering muncul.

Visualisasi Distribusi Variabel Numerik

Interpretasi Visualisasi

Distribusi durasi belajar mahasiswa (dalam menit) divisualisasikan menggunakan kurva distribusi (density plot). Berdasarkan visualisasi tersebut, distribusi data cenderung miring ke kanan, yang menunjukkan bahwa sebagian besar mahasiswa memiliki durasi belajar pada rentang menengah, sementara hanya sedikit mahasiswa dengan durasi belajar yang sangat tinggi.

Bab 8

Definisi

Interval kepercayaan adalah rentang nilai yang digunakan untuk memperkirakan parameter populasi berdasarkan data sampel dengan tingkat keyakinan tertentu. Interval ini menunjukkan sejauh mana estimasi dari sampel dapat mewakili kondisi populasi yang sebenarnya.

Contoh Perhitungan Interval Keyakinan 95%

Misalkan dilakukan pengambilan sampel terhadap 25 mahasiswa untuk mengukur rata-rata waktu belajar harian. Dari sampel tersebut diperoleh:

Rata-rata waktu belajar (\(\bar{x}\)) = 120 menit
Simpangan baku sampel (\(s\)) = 20 menit
Ukuran sampel (\(n\)) = 25

Dengan tingkat kepercayaan 95% dan menggunakan distribusi t, diperoleh nilai kritis \(t_{0.025,24} \approx 2.064\).

Interval kepercayaan 95% dihitung sebagai: \(CI = \bar{x} \pm t_{\alpha/2,\,df} \left( \frac{s}{\sqrt{n}} \right)\)

Sehingga diperoleh interval: \[ \begin{aligned} CI &= 120 \pm 2.064 \left( \frac{20}{\sqrt{25}} \right) = 120 \pm 2.064 \times 4 = 120 \pm 8.256 \\ CI &= (111.74, 128.26) \end{aligned} \]

Interpretasi:
Dengan tingkat keyakinan 95%, dapat disimpulkan bahwa rata-rata waktu belajar harian mahasiswa dalam populasi diperkirakan berada antara 111.74 hingga 128.26 menit. Interval ini memberikan gambaran tingkat ketelitian estimasi serta menunjukkan adanya ketidakpastian yang masih melekat dalam proses penarikan kesimpulan berdasarkan data sampel.

Bab 9

Inferensi statistik adalah proses penarikan kesimpulan tentang suatu populasi berdasarkan data sampel. Konsep ini digunakan untuk melakukan generalisasi, prediksi, dan pengambilan keputusan dalam kondisi ketidakpastian.

Hipotesis Statistik

H₀: tidak ada efek atau perbedaan.
H₁: ada efek atau perbedaan.

Hipotesis alternatif dapat berupa uji dua arah (tanpa arah khusus) atau uji satu arah (arah efek ditentukan sebelumnya).

Tipe Kesalahan I dan II

Tipe I (α): menolak H₀ yang benar (false positive).
Tipe II (β): gagal menolak H₀ yang salah (false negative).

Power = 1 − β, menunjukkan kemampuan uji mendeteksi efek nyata.

Metode Uji Hipotesis

Uji T: rata-rata, σ tidak diketahui, sampel kecil.
Uji Z: rata-rata, σ diketahui atau n ≥ 30.
Chi-Square (χ²): data kategorikal.

Perbedaan utama terletak pada jenis data dan asumsi statistik.

Pengambilan Keputusan Statistik

Keputusan dibuat berdasarkan nilai p-value.

p ≤ α → H₀ ditolak.
p > α → H₀ gagal ditolak.

Pendekatan ini memastikan keputusan objektif dan terkontrol.

Contoh Kasus: Sebuah produsen minuman mengklaim bahwa rata-rata volume isi botol produknya lebih dari 500 ml. (Sampel diambil sebanyak 10 botol dengan \(α\) = 0.05)

Hipotesis:
H₀: μ ≤ 500 ml
H₁: μ > 500 ml

Uji satu arah digunakan karena arah klaim telah ditentukan.

Statistik Uji:
Uji t satu sampel digunakan karena data numerik dan simpangan baku populasi tidak diketahui.
Kemudian dari sampel diperoleh rata-rata 504,2 ml dengan simpangan baku 3,7 ml.

Kesimpulan:
Hasil pengujian menghasilkan p-value < 0,05 sehingga H₀ ditolak. Dengan demikian, rata-rata volume isi botol secara signifikan lebih besar dari 500 ml.

Bab 10

Metode nonparametrik adalah teknik inferensi statistik yang tidak bergantung pada asumsi distribusi tertentu, seperti normalitas atau parameter populasi yang diketahui. Metode ini digunakan ketika data berskala ordinal/kategorikal, berukuran kecil, atau mengandung nilai pencilan.

Peran Nonparametrik

Metode nonparametrik digunakan sebagai alternatif ketika asumsi metode parametrik tidak terpenuhi.

Fokus inferensi meliputi:
- median
- peringkat
- frekuensi

Kapan Digunakan?

Direkomendasikan ketika:
- distribusi data tidak normal
- ukuran sampel kecil
- terdapat outlier
- data berskala ordinal atau nominal

Perbandingan Metode

Parametrik: asumsi distribusi ketat, sensitif terhadap outlier.
Nonparametrik: asumsi minimal, lebih robust namun power lebih rendah.

Uji Nonparametrik Umum

Tes Tanda
Wilcoxon Signed-Rank
Mann–Whitney U
Kruskal–Wallis
Friedman
Chi-Square

Contoh Kasus:
Peneliti membandingkan tingkat kepuasan pelanggan antara dua layanan transportasi online. Data kepuasan diperoleh menggunakan skala ordinal (1–5) dari masing-masing 8 responden.

Alasan Pemilihan Uji:
Uji nonparametrik dipilih karena data berskala ordinal dan ukuran sampel kecil.

Statistik Uji: Uji Mann–Whitney U digunakan karena data berskala ordinal, ukuran sampel kecil, dan kedua kelompok pelanggan bersifat independen. Uji ini merupakan alternatif nonparametrik dari uji-t dua sampel untuk membandingkan kecenderungan pusat dua kelompok tanpa asumsi distribusi normal.

Kesimpulan: Berdasarkan hasil uji Mann–Whitney U, diperoleh bukti adanya perbedaan tingkat kepuasan pelanggan antara kedua layanan transportasi online, sehingga hipotesis nol ditolak.

Dataset

## Column

Pendahuluan dan Deskripsi Dataset

Dalam beberapa tahun terakhir, proses pembelajaran mengalami perubahan seiring dengan pemanfaatan teknologi digital dalam kegiatan belajar-mengajar. Pembelajaran tidak lagi hanya dilakukan melalui pertemuan tatap muka (luring), tetapi juga mulai mengombinasikan pembelajaran daring sebagai alternatif dalam pelaksanaannya.

Namun, efektivitas suatu metode pembelajaran tidak dapat ditentukan hanya dari cara penyampaiannya. Keberhasilan program pembelajaran juga dipengaruhi oleh beberapa faktor penting, antara lain:

Durasi belajar peserta
Tingkat fokus selama proses pembelajaran
Capaian hasil belajar
Tingkat kepuasan pengguna

Oleh karena itu, diperlukan analisis berbasis data untuk mengevaluasi bagaimana karakteristik pembelajaran tersebut memengaruhi performa peserta secara kuantitatif.

Pada analisis ini, digunakan dataset kelas intensif statistik yang memuat informasi aktivitas belajar mingguan serta beberapa indikator penilaian yang relevan. Dataset ini dianalisis untuk menilai dan mengevaluasi efektivitas kelas intensif statistik secara kuantitatif dan menjadi dasar dalam penyusunan strategi pembelajaran yang lebih efektif serta sesuai dengan kebutuhan pengguna.

Deskripsi Dataset

Dataset yang digunakan dalam analisis ini terdiri dari beberapa variabel yang merepresentasikan karakteristik peserta, aktivitas pembelajaran, serta capaian hasil belajar dalam kelas intensif statistik. Adapun penjelasan masing-masing variabel adalah sebagai berikut:

Nama Variabel	Jenis Variabel	Deskripsi Singkat
ID Mahasiswa	Kategorikal – Nominal	Identitas unik setiap mahasiswa peserta kelas intensif statistik
Minggu ke-	Numerik – Jangka Waktu	Menunjukkan urutan minggu pelaksanaan pembelajaran
Materi Pembelajaran	Kategorikal – Nominal	Topik statistik yang dipelajari
Mode Pembelajaran	Kategorikal – Nominal	Metode pembelajaran yang digunakan (luring atau daring)
Durasi Belajar (Menit)	Numerik – Kontinu	Durasi waktu belajar peserta dalam satuan menit
Skor Fokus	Numerik – Diskrit	Skor tingkat fokus mahasiswa selama proses pembelajaran
Skor Kuis 1	Numerik – Kontinu	Nilai kuis yang diperoleh sebelum mengikuti kelas intensif
Skor Kuis 2	Numerik – Kontinu	Nilai kuis yang diperoleh setelah mengikuti kelas intensif
Tingkat Kepuasan	Kategorikal – Ordinal	Tingkat kepuasan mahasiswa terhadap proses pembelajaran

Tabel Dataset

Visualisasi Statistika Dasar

## Column

Diagram Lingkaran

Pada analisis ini, visualisasi menggunakan pie chart dipilih karena bertujuan untuk menampilkan proporsi tingkat kepuasan mahasiswa pada setiap kategori secara jelas dan mudah dipahami. Pie chart efektif digunakan untuk menunjukkan perbandingan persentase antar kategori dalam satu variabel kategorikal, sehingga memudahkan pembaca dalam melihat distribusi kepuasan mahasiswa secara keseluruhan.

Interpretasi Visualisasi

Tingkat kepuasan mahasiswa menggambarkan sejauh mana mahasiswa merasa puas terhadap proses pembelajaran yang telah diterapkan. Berdasarkan pie chart di samping, mayoritas mahasiswa berada pada kategori “Puas” dan “Sangat Puas”, yang menunjukkan bahwa sebagian besar mahasiswa memiliki persepsi positif terhadap kualitas pembelajaran.

Namun demikian, masih terdapat mahasiswa yang berada pada kategori “Cukup Puas” dan “Tidak Puas”, yang menandakan bahwa meskipun tingkat kepuasan secara umum sudah baik, tetap diperlukan upaya peningkatan kualitas pembelajaran secara berkelanjutan.

Diagram Batang

Diagram Garis

Line chart digunakan pada analisis ini karena mampu menampilkan perubahan nilai rata-rata skor kuis dari waktu ke waktu secara jelas. Visualisasi ini bertujuan untuk membandingkan tren skor kuis sebelum dan sesudah pembelajaran setiap minggu, sehingga memudahkan dalam mengamati pola peningkatan atau penurunan hasil belajar mahasiswa.

Interpretasi Visualisasi

Berdasarkan grafik, rata-rata skor kuis sesudah pembelajaran selalu lebih tinggi dibandingkan sebelum pembelajaran pada setiap minggu pengamatan. Hal ini menunjukkan bahwa pembelajaran yang diberikan memberikan dampak positif terhadap peningkatan hasil belajar. Peningkatan skor terlihat semakin stabil setelah minggu ke-7.

Sentral Tendensi

Analisis central tendency digunakan untuk menggambarkan nilai pusat dari skor kuis sesudah pembelajaran. Ukuran seperti mean dan median membantu mengetahui skor yang paling mewakili performa mahasiswa secara keseluruhan serta menilai kecenderungan umum hasil belajar setelah proses pembelajaran.

Interpretasi Histogram
Histogram menunjukkan bahwa skor kuis sesudah pembelajaran terkonsentrasi pada nilai tinggi (sekitar 90–98). Distribusi tampak sedikit miring ke kiri, ditandai dengan nilai mean yang lebih kecil dari median, yang mengindikasikan adanya beberapa skor rendah meskipun mayoritas mahasiswa memperoleh nilai tinggi.

Interpretasi Boxplot
Boxplot menunjukkan median skor yang tinggi dengan rentang antar kuartil yang relatif sempit, menandakan konsistensi hasil belajar. Terdapat beberapa outlier pada skor rendah, yang menunjukkan sebagian kecil mahasiswa memiliki capaian di bawah mayoritas peserta.

Berdasarkan kedua visualisasi, skor kuis mahasiswa umumnya berada pada nilai tinggi dan relatif konsisten, menunjukkan efektivitas pembelajaran yang diterapkan. Meskipun terdapat beberapa nilai pencilan yang rendah, secara keseluruhan hasil belajar tetap terpusat pada skor tinggi, dengan kebutuhan pendampingan bagi sebagian kecil mahasiswa.

Statistik Dispersi

Pada analisis ini, ukuran penyebaran digunakan untuk melihat seberapa beragam skor kuis sesudah pembelajaran pada setiap mode dan materi pembelajaran. Analisis ini bertujuan untuk menilai tingkat konsistensi hasil belajar mahasiswa, bukan hanya melihat nilai rata-rata.

Histogram
Histogram menunjukkan distribusi skor kuis sesudah pada mode pembelajaran luring dan daring. Meskipun rata-rata skor relatif berdekatan, bentuk kurva density memperlihatkan perbedaan tingkat variasi penyebaran skor antar mode pembelajaran, yang menunjukkan bahwa tingkat konsistensi hasil belajar mahasiswa dapat berbeda tergantung pada mode pembelajaran yang digunakan.

Violin & Boxplot
Violin plot dan boxplot menunjukkan bahwa penyebaran skor kuis sesudah berbeda pada setiap materi pembelajaran. Violin yang lebih lebar menandakan variasi skor yang lebih tinggi, sedangkan boxplot dengan IQR yang lebih sempit menunjukkan hasil belajar yang lebih konsisten, meskipun masih terdapat beberapa nilai pencilan yang menandakan adanya mahasiswa dengan capaian yang jauh di bawah mayoritas.

Distribusi Probabilitas

Pada analisis ini, distribusi probabilitas digunakan untuk melihat pola sebaran skor kuis sesudah pembelajaran pada setiap mode pembelajaran. Analisis ini bertujuan untuk memahami bagaimana peluang mahasiswa memperoleh skor tertentu tersebar dalam data, sehingga tidak hanya berfokus pada nilai rata-rata, tetapi juga pada pola dan konsistensi capaian hasil belajar.

Interpretasi Visual:

Violin plot menunjukkan distribusi probabilitas skor kuis sesudah berdasarkan mode pembelajaran daring dan luring. Lebar violin merepresentasikan kepadatan data, sehingga bagian yang lebih lebar menunjukkan peluang mahasiswa memperoleh skor pada rentang nilai tertentu lebih besar.

Boxplot di dalam violin memperlihatkan nilai median dan rentang antar kuartil (IQR), yang menggambarkan sebaran utama skor kuis sesudah, sementara titik mean merepresentasikan nilai harapan (expected value).

Perbedaan bentuk dan lebar sebaran antara pembelajaran daring dan luring menunjukkan variasi pola distribusi peluang serta tingkat konsistensi capaian skor, meskipun secara umum kedua mode pembelajaran sama-sama menunjukkan kecenderungan hasil belajar yang relatif baik.

Interval Keyakinan

## Column

Studi Kasus dan Identifikasi Uji

Studi Kasus Dataset:

Program kelas intensif statistik diikuti oleh mahasiswa untuk meningkatkan pemahaman materi statistika. Setelah menyelesaikan program, mahasiswa mengikuti kuis evaluasi.
Berdasarkan data skor kuis sesudah mengikuti kelas, dilakukan perhitungan interval keyakinan 95% untuk mengestimasi rata-rata skor kuis mahasiswa yang mengikuti program kelas intensif statistik.

Identifikasi Metode dan Uji Statistik yang Tepat:

Analisis ini bertujuan untuk mengestimasi rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik. Sehingga sampel pada analisis ini terdiri dari 50 skor kuis mahasiswa setelah mengikuti kelas, di mana setiap skor merepresentasikan hasil kuis satu mahasiswa.

Karena data yang digunakan merupakan data sampel dan simpangan baku populasi tidak diketahui, maka interval keyakinan untuk rata-rata dihitung menggunakan distribusi t dengan simpangan baku sampel. Interval keyakinan 95% digunakan karena tingkat keyakinan ini umum dipakai dan memberikan estimasi rata-rata yang cukup akurat tanpa menghasilkan interval yang terlalu lebar.

Persiapan Perhitungan Analisis

Rata-rata sampel (\(\bar{x}\)): \[ \begin{aligned} \bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348 \end{aligned} \] Simpangan Baku Sampel: \[ \begin{aligned} s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{ \frac{1131.078}{49}} = 4.804501 \end{aligned} \] Derajat Kebebasan: \(df = n - 1 = 50 - 1 = 49\)

Hitungan dan Visualisasi

Hitung Interval Keyakinan 95% Menggunakan Rumus \(t = \bar{x} \pm t_{\alpha/2,\,df}\left(\frac{s}{\sqrt{n}}\right)\)

Hitung \(t_{\alpha/2,\,df}\) untuk tingkat keyakinan 95% \[ \begin{aligned} \alpha &= 1 - 0.95 = 0.05 \\ \alpha/2 &= 0.025 \\ df &= 49 \\ t_{0.025,49} &= 2.009575 \end{aligned} \] Hitung Kesalahan Margin \[ \begin{aligned} ME &= t_{\alpha/2,df}\left(\frac{s}{\sqrt{n}}\right) = 2.009575\left(\frac{4.804501}{\sqrt{50}}\right) = 1.3654 \end{aligned} \] Interval Keyakinan 95% adalah: \[ \begin{aligned} CI_{95\%} &= \bar{x} \pm ME \\ UCI &= 92.5348 + 1.3654 = 93.9002 \\ LCI &= 92.5348 - 1.3654 = 91.1698 \\ CI_{95\%} &= (93.8998,\; 91.1694) \end{aligned} \]

Hitung Interval Keyakinan 95% Menggunakan Kode R

CL	Alpha	Mean	SD	t	SE	MoE	LCI	UCI
95%	0.05	92.5348	4.8045	2.01	0.6795	1.3654	91.1694	93.9002

Kesimpulan Analisis

Hasil Interval Keyakinan

Berdasarkan perhitungan interval keyakinan 95%, diperoleh bahwa rata-rata skor kuis mahasiswa setelah mengikuti program kelas intensif statistik berada pada rentang 91.1698 hingga 93.9002. Dengan tingkat keyakinan 95%, dapat diyakini bahwa rata-rata skor kuis populasi mahasiswa berada dalam interval tersebut.

Interpretasi Statistik

Rentang interval yang relatif sempit serta posisi rata-rata sampel yang berada di dalam interval keyakinan menunjukkan bahwa skor kuis sesudah pembelajaran berada pada tingkat yang relatif stabil. Dengan demikian, hasil ini mengindikasikan bahwa capaian pembelajaran pada kelas intensif statistik menunjukkan konsistensi performa antar mahasiswa setelah mengikuti program pembelajaran.

Insight

Hasil interval keyakinan yang diperoleh menunjukkan bahwa sistem pembelajaran pada program kelas intensif statistik memberikan hasil yang relatif konsisten. Dengan demikian, sistem pembelajaran ini perlu dipertahankan serta ditingkatkan agar kualitas dan konsistensi hasil belajar mahasiswa dapat terus terjaga pada periode pembelajaran berikutnya.

Statistik Inferensi

## Column

Studi Kasus dan Identifikasi Uji

Studi Kasus Dataset:

Program kelas intensif statistik menerapkan evaluasi berupa kuis sesudah pembelajaran untuk mengukur perubahan hasil belajar mahasiswa.Berdasarkan data skor kuis mahasiswa setelah mengikuti kelas intensif statistika, dilakukan pengujian hipotesis untuk mengetahui apakah rata-rata skor kuis mahasiswa secara signifikan lebih tinggi dari nilai 80.

Identifikasi Uji

Uji statistik yang digunakan adalah uji t satu sampel satu sisi.
Uji ini dipilih karena tujuan analisis adalah untuk menguji apakah rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan lebih tinggi dari nilai acuan 80 berdasarkan satu sampel data mahasiswa. Data yang digunakan merupakan data sampel, dan simpangan baku populasi tidak diketahui, sehingga simpangan baku diestimasi menggunakan simpangan baku sampel.

Taraf signifikansi yang digunakan adalah \(α = 0,05\), karena merupakan tingkat signifikansi yang umum digunakan dalam penelitian statistik. Pengujian dilakukan satu sisi karena fokus analisis adalah untuk menguji apakah rata-rata skor lebih besar dari 80, bukan sekadar berbeda.

Menentukan Hipotesis

Dalam studi kasus ini, nilai 80 digunakan sebagai nilai pembanding (baseline) yang merepresentasikan standar pencapaian skor kuis yang diharapkan.

Hipotesis Nol (H₀):
Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika sama dengan atau tidak lebih tinggi dari 80. \[ H_0 : \mu \le 80 \]
Hipotesis Alternatif (H₁):
Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika lebih tinggi dari 80. \[ H_1 : \mu > 80 \]

Perhitungan Uji T & Kesimpulan

Statistik Uji t:
\[ \begin{aligned} t &= \frac{\bar{x} - \mu_0}{SE} = \frac{92.5348 - 80}{0.679} = \frac{12.5348}{0.679} \approx 18.45 \end{aligned} \]

n	Mean	SD	SE	t_statistic	df	p_value	Alpha	Keputusan
50	92.5348	4.8045	0.6795	18.4482	49	0	0.05	Tolak H0

Hitung p-value:
Rumus p-value uji t satu arah adalah: \(\begin{aligned} p\text{-value} &= P(t \ge t_{\text{hitung}}) \end{aligned}\) dengan derajat kebebasan \(df = 49\), maka

\[ \begin{aligned} p\text{-value} &= P\left(t_{49} \ge 18.45\right) \end{aligned} \]

Hasil perhitungan menggunakan kode R memberikan nilai: \(\begin{aligned} p\text{-value} &= 5.206043 \times 10^{-24} \end{aligned}\)

Nilai tersebut sangat kecil dan secara praktis dapat dinyatakan sebagai: \(\begin{aligned} p\text{-value} &< 0.0001 \end{aligned}\)

Kesimpulan

Karena nilai \(p\)-value jauh lebih kecil dari tingkat signifikansi yang digunakan, yaitu \(\alpha = 0.05\), maka keputusan yang diambil adalah menolak hipotesis nol (\(H_0\)).

Dengan demikian, terdapat bukti statistik yang sangat kuat untuk menyimpulkan bahwa rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan lebih tinggi dari 80.

Hasil ini menunjukkan bahwa program kelas intensif statistik memberikan dampak positif yang signifikan terhadap peningkatan skor kuis mahasiswa. Oleh karena itu, hasil ini mengindikasikan bahwa pendekatan kelas intensif statistik layak untuk dipertahankan sebagai metode pembelajaran dalam meningkatkan performa akademik mahasiswa.

Metode Nonparametrik

## Column

Studi Kasus dan Identifikasi Uji

Studi Kasus

Sebuah program kelas intensif statistika berlangsung selama 12 minggu dengan evaluasi berupa kuis mingguan. Untuk menilai efektivitas program, dilakukan pengukuran skor kuis sebelum dan sesudah mengikuti kelas pada kelompok mahasiswa yang sama.

Hipotesis

\[\begin{aligned} H_0 &: \text{Median perbedaan skor kuis sebelum dan sesudah} = 0 \\ H_1 &: \text{Median perbedaan skor kuis sebelum dan sesudah} \neq 0 \end{aligned}\]

Alasan Menggunakan Analisis Nonparametrik

Berdasarkan hasil uji asumsi, data skor kuis tidak berdistribusi normal, sehingga metode parametrik seperti uji-t berpasangan tidak memenuhi syarat. Oleh karena itu, digunakan pendekatan nonparametrik yang lebih sesuai dengan karakteristik data.

Tujuan Analisis

Tujuan analisis ini adalah untuk mengetahui apakah terdapat perbedaan median skor kuis mahasiswa sebelum dan sesudah mengikuti kelas intensif statistika.

Alasan menggunakan Uji Wilcoxon

Uji Wilcoxon Signed-Rank dipilih karena sesuai untuk membandingkan dua pengukuran berpasangan pada kelompok yang sama ketika asumsi normalitas tidak terpenuhi. Metode ini mempertimbangkan arah dan besar perbedaan, sehingga memberikan hasil yang lebih kuat dibandingkan uji tanda.

Step Wilcoxon

Langkah 1: Menghitung Perbedaan Berpasangan

Pada langkah ini, dihitung perbedaan skor kuis sebelum dan sesudah pembelajaran untuk setiap mahasiswa. Perbedaan berpasangan didefinisikan sebagai selisih antara skor kuis sesudah dan skor kuis sebelum pembelajaran.

id_mahasiswa	skor_kuis_sebelum	skor_kuis_sesudah	perbedaan
M001	81.28	92.81	11.53
M002	75.42	87.57	12.15
M003	83.46	97.34	13.88
M004	83.92	96.90	12.98
M005	77.96	91.12	13.16
M006	76.07	92.82	16.75
M007	81.43	98.87	17.44
M008	76.01	86.57	10.56
M009	79.25	90.92	11.67
M010	81.06	96.43	15.37
M011	83.37	96.24	12.87
M012	86.94	98.97	12.03
M013	78.17	90.53	12.36
M014	73.46	86.04	12.58
M015	79.68	96.47	16.79
M016	83.80	94.89	11.09
M017	71.06	86.73	15.67
M018	77.81	92.23	14.42
M019	79.79	92.16	12.37
M020	70.26	83.62	13.36
M021	84.66	96.71	12.05
M022	81.65	96.54	14.89
M023	81.26	91.91	10.65
M024	73.46	83.50	10.04
M025	81.93	96.95	15.02
M026	81.39	92.94	11.55
M027	69.38	79.95	10.57
M028	85.36	98.53	13.17
M029	85.76	96.17	10.41
M030	73.96	91.05	17.09
M031	87.01	97.23	10.22
M032	82.71	97.34	14.63
M033	67.95	81.46	13.51
M034	79.77	95.15	15.38
M035	83.87	96.50	12.63
M036	85.62	96.86	11.24
M037	79.99	97.84	17.85
M038	77.51	94.22	16.71
M039	71.11	87.99	16.88
M040	84.35	96.35	12.00
M041	80.53	90.84	10.31
M042	75.34	87.77	12.43
M043	83.44	97.74	14.30
M044	75.30	87.91	12.61
M045	74.37	90.99	16.62
M046	74.94	87.11	12.17
M047	74.00	91.72	17.72
M048	79.28	92.94	13.66
M049	77.64	94.38	16.74
M050	79.36	90.92	11.56

Langkah 2: Hapus Perbedaan Nol

Pada langkah ini, observasi dengan nilai perbedaan sama dengan nol dihapus dari analisis, karena pasangan dengan perbedaan nol tidak memberikan informasi mengenai arah perubahan.

id_mahasiswa	skor_kuis_sebelum	skor_kuis_sesudah	perbedaan
M001	81.28	92.81	11.53
M002	75.42	87.57	12.15
M003	83.46	97.34	13.88
M004	83.92	96.90	12.98
M005	77.96	91.12	13.16
M006	76.07	92.82	16.75
M007	81.43	98.87	17.44
M008	76.01	86.57	10.56
M009	79.25	90.92	11.67
M010	81.06	96.43	15.37
M011	83.37	96.24	12.87
M012	86.94	98.97	12.03
M013	78.17	90.53	12.36
M014	73.46	86.04	12.58
M015	79.68	96.47	16.79
M016	83.80	94.89	11.09
M017	71.06	86.73	15.67
M018	77.81	92.23	14.42
M019	79.79	92.16	12.37
M020	70.26	83.62	13.36
M021	84.66	96.71	12.05
M022	81.65	96.54	14.89
M023	81.26	91.91	10.65
M024	73.46	83.50	10.04
M025	81.93	96.95	15.02
M026	81.39	92.94	11.55
M027	69.38	79.95	10.57
M028	85.36	98.53	13.17
M029	85.76	96.17	10.41
M030	73.96	91.05	17.09
M031	87.01	97.23	10.22
M032	82.71	97.34	14.63
M033	67.95	81.46	13.51
M034	79.77	95.15	15.38
M035	83.87	96.50	12.63
M036	85.62	96.86	11.24
M037	79.99	97.84	17.85
M038	77.51	94.22	16.71
M039	71.11	87.99	16.88
M040	84.35	96.35	12.00
M041	80.53	90.84	10.31
M042	75.34	87.77	12.43
M043	83.44	97.74	14.30
M044	75.30	87.91	12.61
M045	74.37	90.99	16.62
M046	74.94	87.11	12.17
M047	74.00	91.72	17.72
M048	79.28	92.94	13.66
M049	77.64	94.38	16.74
M050	79.36	90.92	11.56

Langkah 3: Peringkat Perbedaan Absolut

Pada langkah ini, dihitung nilai absolut dari perbedaan berpasangan. Selanjutnya, nilai absolut tersebut diberi peringkat dari yang terkecil hingga terbesar. Jika terdapat nilai yang sama (ties), maka diberikan peringkat rata-rata.

id_mahasiswa	skor_kuis_sebelum	skor_kuis_sesudah	perbedaan	abs_perbedaan	peringkat
M001	81.28	92.81	11.53	11.53	10
M002	75.42	87.57	12.15	12.15	17
M003	83.46	97.34	13.88	13.88	32
M004	83.92	96.90	12.98	12.98	26
M005	77.96	91.12	13.16	13.16	27
M006	76.07	92.82	16.75	16.75	44
M007	81.43	98.87	17.44	17.44	48
M008	76.01	86.57	10.56	10.56	5
M009	79.25	90.92	11.67	11.67	13
M010	81.06	96.43	15.37	15.37	38
M011	83.37	96.24	12.87	12.87	25
M012	86.94	98.97	12.03	12.03	15
M013	78.17	90.53	12.36	12.36	19
M014	73.46	86.04	12.58	12.58	22
M015	79.68	96.47	16.79	16.79	45
M016	83.80	94.89	11.09	11.09	8
M017	71.06	86.73	15.67	15.67	40
M018	77.81	92.23	14.42	14.42	34
M019	79.79	92.16	12.37	12.37	20
M020	70.26	83.62	13.36	13.36	29
M021	84.66	96.71	12.05	12.05	16
M022	81.65	96.54	14.89	14.89	36
M023	81.26	91.91	10.65	10.65	7
M024	73.46	83.50	10.04	10.04	1
M025	81.93	96.95	15.02	15.02	37
M026	81.39	92.94	11.55	11.55	11
M027	69.38	79.95	10.57	10.57	6
M028	85.36	98.53	13.17	13.17	28
M029	85.76	96.17	10.41	10.41	4
M030	73.96	91.05	17.09	17.09	47
M031	87.01	97.23	10.22	10.22	2
M032	82.71	97.34	14.63	14.63	35
M033	67.95	81.46	13.51	13.51	30
M034	79.77	95.15	15.38	15.38	39
M035	83.87	96.50	12.63	12.63	24
M036	85.62	96.86	11.24	11.24	9
M037	79.99	97.84	17.85	17.85	50
M038	77.51	94.22	16.71	16.71	42
M039	71.11	87.99	16.88	16.88	46
M040	84.35	96.35	12.00	12.00	14
M041	80.53	90.84	10.31	10.31	3
M042	75.34	87.77	12.43	12.43	21
M043	83.44	97.74	14.30	14.30	33
M044	75.30	87.91	12.61	12.61	23
M045	74.37	90.99	16.62	16.62	41
M046	74.94	87.11	12.17	12.17	18
M047	74.00	91.72	17.72	17.72	49
M048	79.28	92.94	13.66	13.66	31
M049	77.64	94.38	16.74	16.74	43
M050	79.36	90.92	11.56	11.56	12

Langkah 4: Menentukan Tanda Peringkat

Pada langkah ini, tanda peringkat ditentukan berdasarkan arah perbedaan. Jika perbedaan bernilai positif, maka peringkat diberi tanda positif. Jika perbedaan bernilai negatif, maka peringkat diberi tanda negatif.

id_mahasiswa	skor_kuis_sebelum	skor_kuis_sesudah	perbedaan	abs_perbedaan	peringkat	peringkat_bertanda
M001	81.28	92.81	11.53	11.53	10	10
M002	75.42	87.57	12.15	12.15	17	17
M003	83.46	97.34	13.88	13.88	32	32
M004	83.92	96.90	12.98	12.98	26	26
M005	77.96	91.12	13.16	13.16	27	27
M006	76.07	92.82	16.75	16.75	44	44
M007	81.43	98.87	17.44	17.44	48	48
M008	76.01	86.57	10.56	10.56	5	5
M009	79.25	90.92	11.67	11.67	13	13
M010	81.06	96.43	15.37	15.37	38	38
M011	83.37	96.24	12.87	12.87	25	25
M012	86.94	98.97	12.03	12.03	15	15
M013	78.17	90.53	12.36	12.36	19	19
M014	73.46	86.04	12.58	12.58	22	22
M015	79.68	96.47	16.79	16.79	45	45
M016	83.80	94.89	11.09	11.09	8	8
M017	71.06	86.73	15.67	15.67	40	40
M018	77.81	92.23	14.42	14.42	34	34
M019	79.79	92.16	12.37	12.37	20	20
M020	70.26	83.62	13.36	13.36	29	29
M021	84.66	96.71	12.05	12.05	16	16
M022	81.65	96.54	14.89	14.89	36	36
M023	81.26	91.91	10.65	10.65	7	7
M024	73.46	83.50	10.04	10.04	1	1
M025	81.93	96.95	15.02	15.02	37	37
M026	81.39	92.94	11.55	11.55	11	11
M027	69.38	79.95	10.57	10.57	6	6
M028	85.36	98.53	13.17	13.17	28	28
M029	85.76	96.17	10.41	10.41	4	4
M030	73.96	91.05	17.09	17.09	47	47
M031	87.01	97.23	10.22	10.22	2	2
M032	82.71	97.34	14.63	14.63	35	35
M033	67.95	81.46	13.51	13.51	30	30
M034	79.77	95.15	15.38	15.38	39	39
M035	83.87	96.50	12.63	12.63	24	24
M036	85.62	96.86	11.24	11.24	9	9
M037	79.99	97.84	17.85	17.85	50	50
M038	77.51	94.22	16.71	16.71	42	42
M039	71.11	87.99	16.88	16.88	46	46
M040	84.35	96.35	12.00	12.00	14	14
M041	80.53	90.84	10.31	10.31	3	3
M042	75.34	87.77	12.43	12.43	21	21
M043	83.44	97.74	14.30	14.30	33	33
M044	75.30	87.91	12.61	12.61	23	23
M045	74.37	90.99	16.62	16.62	41	41
M046	74.94	87.11	12.17	12.17	18	18
M047	74.00	91.72	17.72	17.72	49	49
M048	79.28	92.94	13.66	13.66	31	31
M049	77.64	94.38	16.74	16.74	43	43
M050	79.36	90.92	11.56	11.56	12	12

Step Wilcoxon & Interpretasi

Langkah 5: Menghitung Statistik Uji

Pada langkah ini, dihitung jumlah peringkat bertanda positif (W⁺) dan jumlah peringkat bertanda negatif (W⁻). Statistik uji Wilcoxon didefinisikan sebagai nilai minimum dari W⁺ dan W⁻.

W_Positif	W_Negatif	Statistik_Uji_W
1275	0	0

Langkah 6: Pengambilan Keputusan

Pada langkah ini, dilakukan uji Wilcoxon Signed-Rank menggunakan fungsi wilcox.test() di R. Keputusan diambil berdasarkan nilai p-value dengan tingkat signifikansi \(α = 0.05\). Jika p-value \(< α\), maka H₀ ditolak.

	Statistik_Uji	P_Value	Keputusan
V	1275	0	Tolak H₀

Interpretasi Statistik

Jika p-value < 0.05, maka hipotesis nol (H₀) ditolak, yang berarti terdapat perbedaan median skor kuis sebelum dan sesudah mengikuti kelas intensif statistika. Hal ini menunjukkan bahwa program kelas intensif statistika memberikan pengaruh yang signifikan terhadap perubahan skor kuis mahasiswa.

Secara praktis, hasil ini mengindikasikan bahwa pendekatan pembelajaran yang diterapkan dalam program tersebut efektif dalam meningkatkan pemahaman mahasiswa terhadap materi statistika. Oleh karena itu, program kelas intensif dapat dipertahankan dan dipertimbangkan untuk dikembangkan lebih lanjut sebagai strategi pembelajaran yang mendukung peningkatan prestasi akademik.

---
title: "UAS StatDas"
output: 
  flexdashboard::flex_dashboard:
    vertical_layout: scroll
    theme: yeti
    source_code: embed
    css: style.uas.css
---

  
```{r setup, include=FALSE}
packages <- c(
  "flexdashboard",
  "tidyverse",
  "highcharter",
  "viridis",
  "DT",
  "gapminder",
  "jsonlite"
)

installed <- packages %in% rownames(installed.packages())
if (any(!installed)) {
  install.packages(packages[!installed])
}

# Load library
library(flexdashboard)
library(tidyverse)
library(highcharter)
library(viridis)
library(DT)
library(gapminder)
library(jsonlite)
```

Anggota Kelompok {data-orientation=rows}
=======================================================================

## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

<div class="members-container">

<div class="members-left">
<img src="logo_ITSB.png" class="logo">
<div class="student-tags">
<span class="tag blue">R Programming</span>
<span class="tag navy">Statistics</span>
</div>
<div class="student-assignment"><b>Final Exam – Mr. Bakti Siregar, M.Sc., CDS</b></div>
<div class="student-info">
<div class="group-title">Foto Kelompok</div>
</div><img src="gurlspict.jpeg" class="group-photo"></div>

<div class="members-divider"></div>
<div class="members-grid">

<div class="member-card">
<img src="FotoAngel.jpeg" class="member-photo">
<div class="member-info">
<b>Angelique Kiyoshi Lakeisha Bahrul Ulum</b>
<p>NIM: 52250001</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 9 & 10</li>
<li>Interval Keyakinan</li>
<li>Bagian Dataset</li>
<li>Desain Kartu Anggota Kelompok</li>
</ul>
</div>
</div>

<div class="member-card">
<img src="fotonisa.jpg" class="member-photo">
<div class="member-info">
<b>Khafizatun Nisa</b>
<p>NIM: 52250018</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 1 & 2</li>
<li>Visualisasi Statistika Dasar (Sentral Tendensi, Dispersi Statistik, Distribusi Probabilitas)</li>
</ul>
</div>
</div>

<div class="member-card">
<img src="fotoadel.jpg" class="member-photo">
<div class="member-info">
<b>Naychilla Adelia Zahrah</b>
<p>NIM: 52250004</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 7 & 8</li>
<li>Metode Nonparametrik</li>
</ul>
</div>
</div>

<div class="member-card">
<img src="fotonara.jpg" class="member-photo">
<div class="member-info">
<b>Nakeisha Aulia Zahra</b>
<p>NIM: 52250023</p>
<div class="member-line"></div> 
<ul class="member-task">
<li>Ringkasan Bab 5 & 6</li>
<li>Visualisasi Statistika Dasar (Diagram Lingkaran, Batang, dan Garis)</li>
<li>Desain Foto Kelompok</li>
</ul>
</div>
</div>
</div>

<div class="member-tall">
<img src="fotovero.jpg">
<h3><b>Veronica Maria Lucia Ferreira Xavier</b></h3>
<p>NIM: 52250021</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 3 & 4</li>
<li>Inferensi Statistik</li>
</ul>
</div>
</div>


Ringkasan Statistika Dasar {data-orientation=rows}
=======================================================================
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Bab 1 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistik adalah ilmu yang mempelajari metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data untuk menghasilkan informasi yang bermakna serta mendukung pengambilan keputusan di bawah kondisi ketidakpastian.
Statistik digunakan untuk memahami pola dan variasi dalam data, serta untuk menarik kesimpulan dan membuat prediksi mengenai suatu populasi berdasarkan data yang tersedia.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Permasalahan Statistik Utama</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Permasalahan statistik utama berkaitan dengan bagaimana data dapat diolah dan dianalisis secara sistematis agar menghasilkan informasi yang akurat dan dapat dipercaya. Data yang tersedia sering kali mengandung variasi, ketidakpastian, serta jumlah yang besar, sehingga diperlukan metode statistik untuk merangkum data, memahami pola yang muncul, dan mengurangi kesalahan dalam penarikan kesimpulan. Statistik membantu menjembatani data mentah menjadi dasar yang rasional dalam pengambilan keputusan.
:::
</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Jenis Statistik yang Digunakan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistik secara umum terbagi menjadi dua jenis utama, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif digunakan untuk menggambarkan dan meringkas data melalui ukuran pemusatan, ukuran penyebaran, serta visualisasi data. Sementara itu, statistik inferensial digunakan untuk menarik kesimpulan atau membuat estimasi mengenai suatu populasi berdasarkan data sampel, dengan memanfaatkan konsep peluang, interval kepercayaan, dan pengujian hipotesis.
:::

</div>
</div>


### Bab 2 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Eksplorasi Data adalah tahap awal analisis statistik untuk memahami karakteristik, struktur, dan kualitas data sebelum analisis lanjutan, sehingga membantu menghindari kesalahan interpretasi dan menghasilkan keputusan yang lebih akurat.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Jenis Variabel Data</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
```{r}
library(knitr)
library(kableExtra)

data_tipe <- data.frame(
  `Jenis Data` = c("Data Numerik (Kuantitatif)", 
                   "Data Numerik (Kuantitatif)",
                   "Data Kategorikal (Kualitatif)",
                   "Data Kategorikal (Kualitatif)"),
  
  `Bentuk Data` = c("Berupa angka",
                    "Berupa angka",
                    "Berupa kategori",
                    "Berupa kategori"),
  
  `Tipe` = c("Diskrit",
              "Kontinu",
              "Nominal",
              "Ordinal"),
  
  `Deskripsi` = c("Data hasil hitungan, biasanya berupa bilangan bulat",
                  "Data hasil pengukuran, dapat berupa bilangan pecahan",
                  "Data kategori tanpa urutan tertentu",
                  "Data kategori yang memiliki urutan atau tingkatan")
)

kable(
  data_tipe,
  align = "l"
) %>%
  kable_styling(
    bootstrap_options = c("hover", "condensed"),
    full_width = TRUE
  ) %>%
  column_spec(1, background = "#e7f0ff", bold = TRUE) %>%
  column_spec(2, background = "#e7f0ff") %>%
  column_spec(3, background = "#e7f0ff") %>%
  column_spec(4, background = "#e7f0ff") %>%
  collapse_rows(columns = c(1, 2), valign = "middle")

```
:::
</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Deskripsi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada tahap eksplorasi data, variabel numerik diringkas menggunakan statistik deskriptif untuk memberikan gambaran awal terhadap data. Ringkasan statistik ini meliputi ukuran pemusatan seperti mean dan median, serta ukuran penyebaran seperti nilai minimum, maksimum, range, varians, dan standar deviasi.

Selain itu, eksplorasi data juga bertujuan untuk mengidentifikasi pola awal, yaitu kecenderungan umum yang muncul dalam data, tren, yaitu perubahan nilai data apabila diamati berdasarkan urutan tertentu, serta anomali (outlier), yaitu nilai yang menyimpang jauh dari sebagian besar data. Informasi ini menjadi dasar penting dalam memahami perilaku data dan menentukan metode analisis statistik selanjutnya.
:::

</div>
</div>


### Bab 3 {data-width=1200}

::: {.text-justify}
**Visualisasi data** adalah proses mengubah data mentah menjadi informasi yang 
jelas dan bermakna, sehingga mudah dipahami dan membantu penyampaian pesan
secara tepat.
:::

<div class="chapter3-grid">

<div class="chapter3-box">
<h4>Line Chart</h4>
Line chart adalah alat visualisasi data yang digunakan untuk menunjukkan bagaimana nilai berubah secara berurutan, biasanya dari waktu ke waktu.

**Contoh Kasus**: Menampilkan tren penjualan bulanan toko online selama tahun 2024 untuk melihat bulan mana yang memiliki performa terbaik.

```{r}
library(plotly)

# Data: Penjualan per bulan
sales_trend <- data.frame(
  Bulan = c("Jan", "Feb", "Mar", "Apr", "Mei", "Jun", 
            "Jul", "Agu", "Sep", "Oct", "Nov", "Des"),
  Total_Penjualan = c(15, 18, 22, 19, 25, 28, 26, 30, 32, 29, 35, 40)
)

plot_ly(
  data = sales_trend,
  x = ~Bulan,
  y = ~Total_Penjualan,
  type = 'scatter',
  mode = 'lines+markers',
  line = list(color = 'steelblue', width = 2.5),
  marker = list(
    color = 'darkorange', 
    size = 7,
    line = list(color = 'white', width = 1.5)
  ),
  hovertemplate = paste(
    '<b>%{x}</b><br>',
    'Penjualan: Rp %{y} juta<br>',
    '<extra></extra>'
  )
) %>%
  layout(
    title = list(
      text = "<b>Tren Penjualan Bulanan 2024</b>",
      font = list(size = 14, color = '#2c3e50')
    ),
    xaxis = list(
      title = "<b>Bulan</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10)
    ),
    yaxis = list(
      title = "<b>Penjualan (juta IDR)</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10)
    ),
    hovermode = 'x unified',
    plot_bgcolor = '#ffffff',
    paper_bgcolor = '#f8f9fa',
    width = 500,
    height = 300,
    margin = list(l = 50, r = 20, t = 50, b = 40)
  )
```

</div>

<div class="chapter3-box">
<h4>Bar Chart</h4>
Bar chart adalah grafik batang untuk menampilkan data kategorikal. Tinggi atau panjang batang menunjukkan nilai tiap kategori sehingga mudah dibandingkan.

**Contoh Kasus**: Membandingkan total penjualan antar kategori produk untuk mengetahui produk mana yang paling laris.

```{r}
library(plotly)

# Data: Penjualan per kategori
sales_kategori <- data.frame(
  Kategori = c("Fashion", "Kecantikan", "Makanan", "Elektronik", "Furniture"),
  Total_Penjualan = c(120, 110, 95, 85, 70)
)
sales_kategori <- sales_kategori %>%
  arrange(desc(Total_Penjualan))

# Buat bar chart
plot_ly(
  data = sales_kategori,
  x = ~Kategori,
  y = ~Total_Penjualan,
  type = 'bar',
  marker = list(
    color = c('#e74c3c', '#9b59b6', '#2ecc71', '#3498db', '#f39c12'),
    line = list(color = 'white', width = 1.5)
  ),
  hovertemplate = paste(
    '<b>%{x}</b><br>',
    'Penjualan: Rp %{y} juta<br>',
    '<extra></extra>'
  )
) %>%
  layout(
    title = list(
      text = "<b>Penjualan per Kategori Produk</b>",
      font = list(size = 14, color = '#2c3e50')
    ),
    xaxis = list(
      title = "<b>Kategori</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10),
      categoryorder = "array",               
      categoryarray = sales_kategori$Kategori 
    ),
    yaxis = list(
      title = "<b>Penjualan (juta IDR)</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10)
    ),
    plot_bgcolor = '#ffffff',
    paper_bgcolor = '#f8f9fa',
    width = 400,
    height = 285,
    margin = list(l = 50, r = 20, t = 50, b = 40)
  )
```  
</div>


<div class="chapter3-box">
<h4>Histogram</h4>
Histogram adalah grafik batang untuk menunjukkan sebaran data numerik dalam beberapa interval.

**Contoh Kasus** : Distribusi Nilai Ujian Mahasiswa

```{r}
library(plotly)

set.seed(123)

nilai_ujian <- data.frame(
  Nilai = round(rnorm(100, mean = 75, sd = 8))
)

plot_ly(
  data = nilai_ujian,
  x = ~Nilai,
  type = "histogram",
  nbinsx = 12,
  hovertemplate = paste(
    "Nilai: %{x}<br>",
    "Frekuensi: %{y}<extra></extra>"
  ),
  marker = list(
    color = "#3498db",
    line = list(color = "#ffffff", width = 1)
  ),
  opacity = 0.85
) %>%
  layout(
    title = list(
      text = "<b>Distribusi Nilai Ujian Mahasiswa</b>",
      x = 0.5,
      font = list(size = 14)
    ),
    xaxis = list(
      title = "Nilai",
      tickfont = list(size = 10)
    ),
    yaxis = list(
      title = "Frekuensi",
      tickfont = list(size = 10)
    ),
    width = 400,
    height = 300,
    plot_bgcolor = "#f8f9fa",
    paper_bgcolor = "#ffffff",
    margin = list(l = 50, r = 20, t = 50, b = 50)
  )
```
</div>

</div>


### Bab 4  {data-width=1200}

::: {.text-justify}
**Central Tendency** adalah ukuran statistik yang merepresentasikan nilai tipikal atau 
sentral dari dataset. Bertujuan memberikan satu nilai yang paling mewakili keseluruhan data. **Ada Tiga Ukuran Utama yaitu:**
:::

<div class="chapter3-grid">
<div class="chapter3-box">
<h4>Rata-rata</h4>
::: {.text-justify}
Rata-rata adalah nilai yang diperoleh dengan membagi jumlah seluruh data dengan banyaknya data, dan digunakan untuk data bertipe interval dan rasio.

**Rumus:**
$\bar{x} = \frac{\sum x}{n}$
:::
</div>

<div class="chapter3-box">
<h4>Nilai Tengah</h4>
::: {.text-justify}
Nilai Tengah adalah nilai tengah dari data yang telah diurutkan dan cocok digunakan
untuk data bertipe ordinal, interval, dan rasio.

**Rumus:** \(\text{Median} =
\begin{cases}
x_{\left(\frac{n+1}{2}\right)}, & \text{jika } n \text{ ganjil} \\
\frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}, & \text{jika } n \text{ genap}
\end{cases}\)
:::
</div>

<div class="chapter3-box">
<h4>Nilai Tengah</h4>
::: {.text-justify}
Nilai tengah adalah nilai yang paling sering muncul dalam suatu kumpulan data dan dapat 
digunakan untuk data bertipe nominal, ordinal, interval, maupun rasio.

**Rumus:** \(\text{Mode} = x \;\; \text{dengan frekuensi tertinggi}\)
:::
</div>
</div>

<div class="light-box">
<div class="two-column">
<div class="col section-text">

Menghitung ukuran pemusatan data dari nilai siswa pada 2 mata pelajaran:  
- **Nilai Fisika:** 85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70  
- **Nilai Bahasa:** 80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76

**Perhitungan Menggunakan Kode R**

```{r, echo=FALSE, warning=FALSE, message=FALSE, fig.align='center'}
library(dplyr)
library(knitr)
library(kableExtra)

# Data nilai
nilai_fisika <- c(85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70)
nilai_bahasa <- c(80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76)

# Fungsi modus
hitung_mode <- function(x) {
  frek <- table(x)
  paste(names(frek)[frek == max(frek)], collapse = ", ")
}

# Tabel sentral tendensi
tabel_sentral <- data.frame(
  Variabel = c("Fisika", "Bahasa Indonesia"),
  Mean     = c(mean(nilai_fisika), mean(nilai_bahasa)),
  Median   = c(median(nilai_fisika), median(nilai_bahasa)),
  Modus    = c(hitung_mode(nilai_fisika), hitung_mode(nilai_bahasa))
)

# Tampilkan tabel (FULL WIDTH & CENTER)
tabel_sentral %>%
  kable(
    digits = 2,
    align = "c"
  ) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    position = "center"
  ) %>%
  row_spec(
    0,
    bold = TRUE,
    color = "white",
    background = "#1f77b4"
  )


```

</div>

<div class="divider"></div>
<div class="col section-text">

**Interpretasi dan Perbandingan Hasil Kedua Nilai Siswa:**   
1. **Rata-rata:** Nilai rata-rata Fisika (83,60) lebih tinggi dibandingkan Bahasa Indonesia (81,67), sehingga performa siswa pada Fisika lebih baik.  
2. **Nilai Tengah:** Median Fisika sebesar 85 lebih tinggi daripada Bahasa Indonesia sebesar 80, menunjukkan nilai tengah Fisika berada pada tingkat lebih tinggi.  
3. **Modus (nilai paling sering muncul):** Modus Fisika adalah 85, sedangkan Bahasa Indonesia 80, yang berarti nilai yang paling sering muncul pada Fisika lebih tinggi.

**Kesimpulan:** Secara keseluruhan, hasil belajar siswa pada mata pelajaran Fisika lebih baik dibandingkan Bahasa Indonesia, baik dilihat dari rata-rata, nilai tengah, maupun nilai yang paling sering muncul.


</div>
</div>
</div>


### Bab 5 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistical dispersion adalah ukuran yang menunjukkan seberapa tersebar atau bervariasi data dari suatu kumpulan nilai. Semakin besar nilai dispersi, semakin tidak seragam datanya, sedangkan semakin kecil nilai dispersi, semakin homogen data tersebut.  
Pengukuran tingkat dispersi data umumnya dilakukan menggunakan beberapa ukuran utama, yaitu jangkauan (range), varians, dan simpangan baku
:::
</div>

<div class="chapter5-grid">

<div class="chapter-box">
<h4><b>Range</b></h4>
Range adalah ukuran penyebaran paling sederhana yang menunjukkan selisih antara
nilai maksimum dan minimum dalam data.

**Rumus:**
$Range = X_{max} - X_{min}$ 

**Contoh Perhitungan:**  
Data: 5, 7, 10, 12, 15  
Range = 15 − 5 = **10**  
</div>

<div class="chapter-box">
<h4><b>Varians</b></h4>
**Definisi:**
Varians menunjukkan rata-rata kuadrat selisih setiap data terhadap nilai rata-rata
(mean).

**Rumus:**  
Populasi:  
$\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}$  
Sampel:  
$s^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1}$

**Contoh Perhitungan**  
Diketahui data: 46, 50, 54, 48, 52  
$\bar{X} = \frac{250}{5} = 50$  
$\sum (X_i - \bar{X})^2 = 40$    
$s^2 = \frac{40}{4} = 10$  
</div>

<div class="chapter-box">
<h4><b>Standar Deviasi</b></h4>
<b>Definisi</b><br>
Standar deviasi adalah akar kuadrat dari varians dan menunjukkan rata-rata jarak
data terhadap mean.<br><br>

<b>Rumus</b><br>
$s = \sqrt{s^2}$<br><br>

<b>Contoh Perhitungan</b><br>
$s^2 = 10$<br>
$s = \sqrt{10} \approx 3,16$
</div>

<div class="chapter-box">
<h4><b>Interpretasi Tingkat Penyebaran Data</b></h4>
<ul>
  <li>Range kecil → data tidak terlalu menyebar</li>
  <li>Varians kecil → data mendekati rata-rata</li>
  <li>Standar deviasi kecil → data homogen</li>
  <li>Dispersi besar → data heterogen</li>
</ul>

::: {.text-justify}
Secara umum, ukuran dispersi digunakan untuk menilai tingkat keragaman data dalam suatu kumpulan pengamatan. Nilai range, varians, dan standar deviasi yang relatif kecil menunjukkan bahwa data cenderung terkonsentrasi di sekitar nilai rata-rata, sehingga variasi antar data tidak terlalu besar. Sebaliknya, nilai dispersi yang besar mengindikasikan adanya perbedaan yang cukup signifikan antar nilai pengamatan, yang mencerminkan tingkat heterogenitas data yang lebih tinggi.
:::

</div>

</div>


### Bab 6 {data-width=1200}

<div class="chapter5-grid">

<div class="chapter-box">
<h4><b>Definisi Probabilitas</b></h4>

Probabilitas adalah ukuran peluang terjadinya suatu peristiwa. Nilainya berada antara 0 sampai 1, di mana:  
0 → kejadian mustahil  
1 → kejadian pasti  

Rumus dasar:  
$P(A) = \frac{\text{Jumlah hasil yang menguntungkan}}{\text{Jumlah seluruh hasil dalam ruang sampel}}$
</div>

<div class="chapter-box">
<h4><b>Konsep Dasar & Ruang Sampel</b></h4>

Ruang sampel (S) adalah seluruh kemungkinan hasil dari suatu percobaan.  
Kejadian (event) adalah bagian dari ruang sampel yang diperhatikan.  

Contoh:  
Melempar koin 2 kali:  
$S = \{HH, HT, TH, TT\}$
</div>

<div class="chapter-box">
<h4><b>Aturan Probabilitas</b></h4>
Dua aturan utama:  
- Nilai probabilitas selalu $0 \le P(A) \le 1$  
- Total probabilitas seluruh hasil dalam ruang sampel = 1

<h4><b>Aturan Komplemen</b></h4>

Aturan ini digunakan untuk mencari peluang kejadian tidak terjadi.  
Rumus:  
$P(A^c) = 1 - P(A)$
</div>

<div class="chapter-box">
<h4><b>Kejadian Independen dan Dependen</b></h4>

Independen: satu kejadian tidak memengaruhi kejadian lain.<br>
$P(A \cap B) = P(A) \times P(B)$

Dependen: satu kejadian memengaruhi kejadian berikutnya.<br>
$P(A \cap B) = P(A) \times P(B|A)$
</div>

<div class="chapter-box">
<h4><b>Penyatuan, Saling Lepas, dan Menyeluruh</b></h4>

Gabungan (Union): kejadian A atau B.<br>
$P(A \cup B) = P(A) + P(B) - P(A \cap B)$

Saling lepas (Mutually Exclusive): tidak bisa terjadi bersamaan.<br>
Menyeluruh (Exhaustive): mencakup seluruh ruang sampel.
</div>

<div class="chapter-box">
<h4><b>Percobaan & Distribusi Binomial</b></h4>

Eksperimen binomial memiliki 4 syarat:<br>
Jumlah percobaan tetap<br>
Dua hasil (sukses/gagal)<br>
Peluang sukses tetap<br>
Percobaan saling independen<br><br>

Rumus binomial:<br>
$P(k) = \binom{n}{k} p^k (1-p)^{n-k}$
</div>

<div class="chapter-box">
<h4><b>Contoh Kejadian</b></h4>
Muncul setidaknya satu Ekor saat koin dilempar 2 kali

**Ruang Sampel**
$S = \{HH, HT, TH, TT\}$  
Jumlah total hasil = 4

**Hasil yang Mendukung Event A**  
$\{HT, TH, TT\}$ → jumlah = 3

**Perhitungan Peluang**  
$P(A) = \frac{3}{4} = 0.75$

</div>

<div class="chapter-box">
<h4><b>Interpretasi Hasil dari Contoh Kejadian</b></h4>
Probabilitas 0.75 (75%) berarti bahwa:<br>
Dari banyak percobaan melempar koin 2 kali,<br>
Sekitar 75% percobaan akan menghasilkan setidaknya satu Ekor.<br>
Artinya, kejadian ini cukup besar kemungkinannya dan lebih sering terjadi dibandingkan tidak terjadi.
</div>

</div>


### Bab 7 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Distribusi probabilitas menggambarkan bagaimana nilai suatu variabel numerik tersebar dalam data. Konsep ini digunakan untuk memahami pola sebaran data dan kecenderungan nilai yang sering muncul.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Visualisasi Distribusi Variabel Numerik</b></h4>
<div class="section-divider"></div>

```{r, fig.height=3, fig.width=5, fig.align='center'}
library(readr)
library(dplyr)
library(ggplot2)

df <- read_csv("dataset_uas.csv", show_col_types = FALSE) %>%
  dplyr::distinct(id_mahasiswa, minggu, materi_pembelajaran, .keep_all = TRUE)

ggplot(df, aes(x = jam_belajar_menit)) +
  geom_density(
    fill = "#1f77b4",
    color = "#1f77b4",
    alpha = 0.35,
    size = 1
  ) +
  labs(
    title = "Distribusi Durasi Belajar Mahasiswa",
    x = "Durasi Belajar (Menit)",
    y = "Kepadatan"
  ) +
  theme_minimal(base_size = 10)

```
</div>

<div class="divider"></div>
<div class="col section-text">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justtify}
Distribusi durasi belajar mahasiswa (dalam menit) divisualisasikan menggunakan kurva distribusi (density plot). Berdasarkan visualisasi tersebut, distribusi data cenderung miring ke kanan, yang menunjukkan bahwa sebagian besar mahasiswa memiliki durasi belajar pada rentang menengah, sementara hanya sedikit mahasiswa dengan durasi belajar yang sangat tinggi.
:::

</div>
</div>


### Bab 8 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Interval kepercayaan adalah rentang nilai yang digunakan untuk memperkirakan parameter populasi berdasarkan data sampel dengan tingkat keyakinan tertentu. Interval ini menunjukkan sejauh mana estimasi dari sampel dapat mewakili kondisi populasi yang sebenarnya.
:::
</div>

<div class="section-divider"></div>
<h4><b>Contoh Perhitungan Interval Keyakinan 95%</b></h4>
<div class="section-divider"></div>

<div class="two-column">
<div class="col section-text">

Misalkan dilakukan pengambilan sampel terhadap 25 mahasiswa untuk mengukur rata-rata waktu belajar harian. Dari sampel tersebut diperoleh:

- Rata-rata waktu belajar ($\bar{x}$) = 120 menit
- Simpangan baku sampel ($s$) = 20 menit
- Ukuran sampel ($n$) = 25

Dengan tingkat kepercayaan 95% dan menggunakan distribusi t, diperoleh nilai kritis $t_{0.025,24} \approx 2.064$.

Interval kepercayaan 95% dihitung sebagai: \(CI = \bar{x} \pm t_{\alpha/2,\,df} \left( \frac{s}{\sqrt{n}} \right)\)

</div>

<div class="divider"></div>
<div class="col section-text">

Sehingga diperoleh interval:
\[
\begin{aligned}
CI &= 120 \pm 2.064 \left( \frac{20}{\sqrt{25}} \right) = 120 \pm 2.064 \times 4  = 120 \pm 8.256 \\
CI &= (111.74, 128.26) 
\end{aligned}
\]

**Interpretasi:**  
Dengan tingkat keyakinan 95%, dapat disimpulkan bahwa rata-rata waktu belajar harian mahasiswa dalam populasi diperkirakan berada antara 111.74 hingga 128.26 menit. Interval ini memberikan gambaran tingkat ketelitian estimasi serta menunjukkan adanya ketidakpastian yang masih melekat dalam proses penarikan kesimpulan berdasarkan data sampel.

</div>
</div>

### Bab 9  {data-width=1200}

::: {.text-justify}
Inferensi statistik adalah proses penarikan kesimpulan tentang suatu populasi berdasarkan data sampel. Konsep ini digunakan untuk melakukan generalisasi, prediksi, dan pengambilan keputusan dalam kondisi ketidakpastian.
:::

<div class="chapter9-grid">
<div class="chapter9-box">
<h4>Hipotesis Statistik</h4>
<b>H₀</b>: tidak ada efek atau perbedaan.<br>
<b>H₁</b>: ada efek atau perbedaan.<br><br>
Hipotesis alternatif dapat berupa <i>uji dua arah</i> (tanpa arah khusus) atau <i>uji satu arah</i> (arah efek ditentukan sebelumnya).
</div>

<div class="chapter9-box">
<h4>Tipe Kesalahan I dan II</h4>
<b>Tipe I (α)</b>: menolak H₀ yang benar (<i>false positive</i>).<br>
<b>Tipe II (β)</b>: gagal menolak H₀ yang salah (<i>false negative</i>).<br><br>
<b>Power</b> = 1 − β, menunjukkan kemampuan uji mendeteksi efek nyata.
</div>

<div class="chapter9-box">
<h4>Metode Uji Hipotesis</h4>
<b>Uji T</b>: rata-rata, σ tidak diketahui, sampel kecil.<br>
<b>Uji Z</b>: rata-rata, σ diketahui atau n ≥ 30.<br>
<b>Chi-Square (χ²)</b>: data kategorikal.<br><br>
Perbedaan utama terletak pada jenis data dan asumsi statistik.
</div>

<div class="chapter9-box">
<h4>Pengambilan Keputusan Statistik</h4>
Keputusan dibuat berdasarkan nilai <i>p-value</i>.<br><br>
<b>p ≤ α</b> → H₀ ditolak.<br>
<b>p > α</b> → H₀ gagal ditolak.<br><br>
Pendekatan ini memastikan keputusan objektif dan terkontrol.
</div>
</div>

<div class="chapter9-test-grid">
<div class="chapter9-test-box">
**Contoh Kasus:** Sebuah produsen minuman mengklaim bahwa rata-rata volume isi botol produknya **lebih dari 500 ml**.  (Sampel diambil sebanyak 10 botol dengan $α$ = 0.05)

<b>Hipotesis:</b><br>
H₀: μ ≤ 500 ml<br>
H₁: μ > 500 ml<br>

Uji satu arah digunakan karena arah klaim telah ditentukan.
</div>

<div class="chapter9-test-box">
<b>Statistik Uji:</b><br>
Uji t satu sampel digunakan karena data numerik dan simpangan baku populasi tidak diketahui.  
Kemudian dari sampel diperoleh rata-rata 504,2 ml dengan simpangan baku 3,7 ml.

<b>Kesimpulan:</b><br>
Hasil pengujian menghasilkan p-value < 0,05 sehingga **H₀ ditolak**.
Dengan demikian, rata-rata volume isi botol secara signifikan **lebih besar dari 500 ml**.
</div>
</div>


### Bab 10  {data-width=1200}

::: {.text-justify}
Metode nonparametrik adalah teknik inferensi statistik yang tidak bergantung
pada asumsi distribusi tertentu, seperti normalitas atau parameter populasi
yang diketahui. Metode ini digunakan ketika data berskala ordinal/kategorikal,
berukuran kecil, atau mengandung nilai pencilan.
:::

<div class="chapter9-grid">

<div class="chapter9-box">
<h4>Peran Nonparametrik</h4>
Metode nonparametrik digunakan sebagai alternatif
ketika asumsi metode parametrik tidak terpenuhi.

Fokus inferensi meliputi:  
- median  
- peringkat  
- frekuensi
</div>

<div class="chapter9-box">
<h4>Kapan Digunakan?</h4>
Direkomendasikan ketika:  
- distribusi data tidak normal  
- ukuran sampel kecil  
- terdapat outlier  
- data berskala ordinal atau nominal
</div>

<div class="chapter9-box">
<h4>Perbandingan Metode</h4>
<b>Parametrik</b>: asumsi distribusi ketat, sensitif terhadap outlier.  
<b>Nonparametrik</b>: asumsi minimal, lebih robust namun power lebih rendah.
</div>

<div class="chapter9-box">
<h4>Uji Nonparametrik Umum</h4>  
- Tes Tanda   
- Wilcoxon Signed-Rank  
- Mann–Whitney U  
- Kruskal–Wallis  
- Friedman  
- Chi-Square
</div>
</div>

<div class="chapter9-test-grid">
<div class="chapter9-test-box">
<b>Contoh Kasus:</b><br>
Peneliti membandingkan tingkat kepuasan pelanggan antara dua layanan
transportasi online. Data kepuasan diperoleh menggunakan skala ordinal (1–5)
dari masing-masing 8 responden.

**Alasan Pemilihan Uji:**   
Uji nonparametrik dipilih karena data berskala ordinal dan ukuran sampel kecil.
</div>

<div class="chapter9-test-box">
**Statistik Uji:**
Uji Mann–Whitney U digunakan karena data berskala ordinal, ukuran sampel kecil, dan kedua kelompok pelanggan bersifat independen. Uji ini merupakan alternatif nonparametrik dari uji-t dua sampel untuk membandingkan kecenderungan pusat dua kelompok tanpa asumsi distribusi normal.

**Kesimpulan:**
Berdasarkan hasil uji Mann–Whitney U, diperoleh bukti adanya perbedaan tingkat kepuasan pelanggan antara kedua layanan transportasi online, sehingga hipotesis nol ditolak.
</div>
</div>





Dataset {data-orientation=rows}
=======================================================================
  
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Pendahuluan dan Deskripsi Dataset {data-height=520}

<div class="two-column">
<div class="col section-text">

Dalam beberapa tahun terakhir, proses pembelajaran mengalami perubahan seiring dengan pemanfaatan teknologi digital dalam kegiatan belajar-mengajar. Pembelajaran tidak lagi hanya dilakukan melalui pertemuan tatap muka (luring), tetapi juga mulai mengombinasikan pembelajaran daring sebagai alternatif dalam pelaksanaannya.

Namun, efektivitas suatu metode pembelajaran tidak dapat ditentukan hanya dari cara penyampaiannya. Keberhasilan program pembelajaran juga dipengaruhi oleh beberapa faktor penting, antara lain:

- Durasi belajar peserta
- Tingkat fokus selama proses pembelajaran
- Capaian hasil belajar
- Tingkat kepuasan pengguna

Oleh karena itu, diperlukan analisis berbasis data untuk mengevaluasi bagaimana karakteristik pembelajaran tersebut memengaruhi performa peserta secara kuantitatif.

Pada analisis ini, digunakan dataset kelas intensif statistik yang memuat informasi aktivitas belajar mingguan serta beberapa indikator penilaian yang relevan. Dataset ini dianalisis untuk menilai dan mengevaluasi efektivitas kelas intensif statistik secara kuantitatif dan menjadi dasar dalam penyusunan strategi pembelajaran yang lebih efektif serta sesuai dengan kebutuhan pengguna.

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Deskripsi Dataset</b></h4>
Dataset yang digunakan dalam analisis ini terdiri dari beberapa variabel yang merepresentasikan karakteristik peserta, aktivitas pembelajaran, serta capaian hasil belajar dalam kelas intensif statistik. Adapun penjelasan masing-masing variabel adalah sebagai berikut:

```{r}
library(knitr)
library(kableExtra)
library(tibble)

deskripsi_variabel <- tibble::tibble(
variabel = c(
"ID Mahasiswa",
"Minggu ke-",
"Materi Pembelajaran",
"Mode Pembelajaran",
"Durasi Belajar (Menit)",
"Skor Fokus",
"Skor Kuis 1",
"Skor Kuis 2",
"Tingkat Kepuasan"
),
jenis_variabel = c(
"Kategorikal – Nominal",
"Numerik – Jangka Waktu",
"Kategorikal – Nominal",
"Kategorikal – Nominal",
"Numerik – Kontinu",
"Numerik – Diskrit",
"Numerik – Kontinu",
"Numerik – Kontinu",
"Kategorikal – Ordinal"
),
deskripsi = c(
"Identitas unik setiap mahasiswa peserta kelas intensif statistik",
"Menunjukkan urutan minggu pelaksanaan pembelajaran",
"Topik statistik yang dipelajari",
"Metode pembelajaran yang digunakan (luring atau daring)",
"Durasi waktu belajar peserta dalam satuan menit",
"Skor tingkat fokus mahasiswa selama proses pembelajaran",
"Nilai kuis yang diperoleh sebelum mengikuti kelas intensif",
"Nilai kuis yang diperoleh setelah mengikuti kelas intensif",
"Tingkat kepuasan mahasiswa terhadap proses pembelajaran"
)
)

kable(
  deskripsi_variabel,
  col.names = c("Nama Variabel", "Jenis Variabel", "Deskripsi Singkat"),
  align = c("l", "l", "l")
) %>%
  kable_styling(
    full_width = TRUE,
    position = "center"
  ) %>%

  # ISI SELANG SELING (MANUAL, AMAN)
  row_spec(
    seq(1, nrow(deskripsi_variabel), 2),
    background = "#E6F0FA"
  ) %>%
  row_spec(
    seq(2, nrow(deskripsi_variabel), 2),
    background = "#CFE2F3"
  ) %>%

  # GARIS KIRI & KANAN TABEL
  column_spec(1, border_left = FALSE, border_right = FALSE) %>%
  column_spec(2, border_right = FALSE) %>%
  column_spec(3, border_right = FALSE)


```

</div>
</div>

### Tabel Dataset {data-height=520}

```{r}
df <- readr::read_csv(
  "dataset_uas.csv",
  show_col_types = FALSE
) %>% 
  dplyr::distinct(id_mahasiswa, minggu, materi_pembelajaran, .keep_all = TRUE)
```
  
```{r}
df1 <- df %>% 
  dplyr::filter(kepuasan >= 0) %>% 
  dplyr::arrange(desc(skor_kuis_sesudah)) %>% 
  dplyr::select(
    id_mahasiswa,
    minggu,
    materi_pembelajaran,
    mode_pembelajaran,
    jam_belajar_menit,
    skor_fokus,
    skor_kuis_sebelum,
    skor_kuis_sesudah,
    kepuasan
  )

DT::datatable(
  df1,
  colnames = c(
    "ID Mahasiswa",
    "Minggu Ke-",
    "Materi Pembelajaran",
    "Mode Pembelajaran",
    "Durasi Belajar (Menit)",
    "Skor Fokus",
    "Skor Kuis 1",
    "Skor Kuis 2",
    "Tingkat Kepuasan"
  ),
  options = list(
    pageLength = 10,
    lengthChange = TRUE,
    searching = TRUE,
    ordering = TRUE,
    paging = TRUE,
    info = TRUE,
    drawCallback = JS(
      "function(settings) {",
      "$('table thead th').css({",
      "  'background-color': '#0B3C5D',",
      "  'color': 'white',",
      "  'font-weight': 'bold',",
      "  'text-align': 'center'",
      "});",

      "$('table tbody tr:odd').css({",
      "  'background-color': '#E6F0FA'",
      "});",

      "$('table tbody tr:even').css({",
      "  'background-color': '#CFE2F3'",
      "});",
      "}"
    )
  ),

  caption = htmltools::tags$caption(
    style = 'caption-side: bottom; text-align: center;',
    'Tabel: ',
    htmltools::em('Sampel Kelas Intensif Statistik')
  )
)

```


Visualisasi Statistika Dasar {data-orientation=rows}
=======================================================================

## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
  
### Diagram Lingkaran {data-width=600 data-height=510}

<div class="two-column">
<div class="col section-text">

```{r pie-kepuasan, echo=FALSE, message=FALSE, warning=FALSE, fig.width=11, fig.height=11, out.width="100%"}

library(readr)
library(dplyr)
library(highcharter)

# Baca dataset
df <- read_csv("dataset_uas.csv", show_col_types = FALSE)

# Rekode kepuasan numerik -> kategori
kepuasan_df <- df %>%
  mutate(
    kategori = case_when(
      kepuasan == 5 ~ "Tidak Puas",
      kepuasan == 4 ~ "Cukup Puas",
      kepuasan == 3 ~ "Puas",
      kepuasan == 2 ~ "Sangat Puas",
    )
  ) %>%
  count(kategori) %>%
  mutate(
    persentase = round(n / sum(n) * 100, 1)
  )

# Pie chart interaktif
highchart() %>%
  hc_chart(
    type = "pie",
    animation = list(duration = 1000),
    height = 350
  ) %>%
  hc_title(text = "Tingkat Kepuasan Mahasiswa") %>%
  hc_add_series(
    name = "Persentase",
    data = list_parse(
      transform(kepuasan_df,
                name = kategori,
                y = persentase)
    )
  ) %>%
  hc_plotOptions(
    pie = list(
      size = "70%",
      allowPointSelect = TRUE,
      cursor = "pointer",
      dataLabels = list(
        enabled = TRUE,
        format = "<b>{point.name}</b>: {point.y}%"
      ),
      showInLegend = FALSE
    )
  )

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="section-divider"></div>
::: {.text-justify}
Pada analisis ini, visualisasi menggunakan pie chart dipilih karena bertujuan untuk menampilkan proporsi tingkat kepuasan mahasiswa pada setiap kategori secara jelas dan mudah dipahami. Pie chart efektif digunakan untuk menunjukkan perbandingan persentase antar kategori dalam satu variabel kategorikal, sehingga memudahkan pembaca dalam melihat distribusi kepuasan mahasiswa secara keseluruhan.
:::
<div class="section-divider"></div>

<div class="visualisasi-box">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Tingkat kepuasan mahasiswa menggambarkan sejauh mana mahasiswa merasa puas terhadap proses pembelajaran yang telah diterapkan. Berdasarkan pie chart di samping, **mayoritas** mahasiswa berada pada kategori **“Puas”** dan **“Sangat Puas”**, yang menunjukkan bahwa sebagian besar mahasiswa memiliki persepsi positif terhadap kualitas pembelajaran.

Namun demikian, masih terdapat mahasiswa yang berada pada kategori **“Cukup Puas”** dan **“Tidak Puas”**, yang menandakan bahwa meskipun tingkat kepuasan secara umum sudah baik, tetap diperlukan upaya peningkatan kualitas pembelajaran secara berkelanjutan.
:::
</div>

</div>
</div>


### Diagram Batang {data-width=600 data-height=510}

```{r plot-mode, message=FALSE, warning=FALSE} 
library(tidyverse)
library(grid)
library(gridExtra)

data <- read.csv("dataset_uas.csv")

mode_summary <- data %>%
  group_by(mode_pembelajaran) %>%
  summarise(
    n = n()
  )

plot_mode <- ggplot(mode_summary,
       aes(x = mode_pembelajaran,
           y = n,
           fill = mode_pembelajaran)) +
  geom_col(width = 0.5, color = "black", alpha = 0.85) +
  geom_text(aes(label = n),
            vjust = -0.6, size = 4) +
  scale_fill_brewer(palette = "Set2") +
  scale_y_continuous(
    expand = expansion(mult = c(0, 0.1))
  ) +
  labs(
    title = "Distribusi Mode Pembelajaran",
    subtitle = "Jumlah mahasiswa berdasarkan mode pembelajaran",
    x = "Mode Pembelajaran",
    y = "Jumlah Mahasiswa"
  ) +
  theme_minimal(base_size = 8) +
  theme(
    plot.title = element_text(face = "bold", size = 13),
    plot.subtitle = element_text(size = 11),
    axis.title = element_text(face = "bold"),
    panel.grid.minor = element_blank(),
    legend.position = "none"
  )


```

```{r plot-materi, message=FALSE, warning=FALSE}

materi_summary <- data %>%
  group_by(materi_pembelajaran) %>%
  summarise(
    n = n()
  )

plot_materi <- ggplot(materi_summary,
       aes(x = reorder(materi_pembelajaran, n),
           y = n,
           fill = materi_pembelajaran)) +
  geom_col(width = 0.55, color = "black", alpha = 0.85) +
  geom_text(aes(label = n),
            hjust = -0.15, size = 3.8) +
  coord_flip() +
  scale_fill_brewer(palette = "Pastel1") +
  scale_y_continuous(
    expand = expansion(mult = c(0, 0.1))
  ) +
  labs(
    title = "Distribusi Materi Pembelajaran",
    subtitle = "Jumlah mahasiswa pada masing-masing materi pembelajaran",
    x = "Materi Pembelajaran",
    y = "Jumlah Mahasiswa"
  ) +
  theme_minimal(base_size = 8) +
  theme(
    plot.title = element_text(face = "bold", size = 13),
    plot.subtitle = element_text(size = 11),
    axis.title = element_text(face = "bold"),
    legend.position = "none",
    panel.grid.minor = element_blank()
  )


```

```{r}
library(grid)

box_bg <- roundrectGrob(
  r = unit(6, "pt"),
  gp = gpar(
    fill = "#f8fbff",
    col  = "#8cb6ff",
    lwd  = 1
  )
)

Alasan <- textGrob(
  "Bar chart digunakan dalam analisis ini karena efektif untuk menampilkan dan
  membandingkan jumlah mahasiswa pada setiap kategori secara langsung. 
  Visualisasi ini bertujuan untuk memudahkan identifikasi perbedaan distribusi 
  mahasiswa berdasarkan mode dan materi pembelajaran
  
Kedua visualisasi menunjukkan bahwa mahasiswa cenderung memilih 
pembelajaran luring dan materi yang bersifat praktis. Dominasi mode
luring mengindikasikan kebutuhan akan interaksi langsung dalam proses
belajar, sementara tingginya  minat pada Pemrograman R dan SQL & Python
menegaskan bahwa mahasiswa lebih tertarik pada keterampilan yang
aplikatif dan relevan dengan kebutuhan dunia data. Insight ini
menyiratkan bahwa pembelajaran akan lebih efektif jika difokuskan pada 
tatap muka untuk materi teknis dan praktik langsung, dengan penyesuaian 
metode pada materi yang kurang diminati.",
  gp = gpar(fontsize = 9.5, lineheight = 1.25),
  just = c("left", "top"),
  x = unit(0.04, "npc"),
  y = unit(0.87, "npc")
)

judul2 <- textGrob(
  "Interpretasi Visualisasi",
  gp = gpar(fontsize = 11, fontface = "bold"),
  just = c("left", "top"),
  x = unit(0.04, "npc"),
  y = unit(0.95, "npc")
)

visualisasi <- textGrob(
  "Bar chart digunakan dalam analisis ini karena efektif untuk menampilkan dan
  membandingkan jumlah mahasiswa pada setiap kategori secara langsung. 
  Visualisasi ini bertujuan untuk memudahkan identifikasi perbedaan distribusi 
  mahasiswa berdasarkan mode dan materi pembelajaran",
  gp = gpar(fontsize = 9.5, lineheight = 1.25),
  just = c("left", "top"),
  x = unit(0.04, "npc"),
  y = unit(0.87, "npc")
)



interpretasi <- grobTree(
  box_bg,
  Alasan,
  judul2,
  visualisasi
)


```

```{r plot-gabungan, fig.width=15, fig.height=4, message=FALSE, warning=FALSE}
gridExtra::grid.arrange(
  plot_mode,
  plot_materi,
  interpretasi,
  ncol = 3,
  widths = c(1.1, 1.4, 1.2)
)

```

### Diagram Garis {data-width=600 data-height=510}

<div class="two-column">
<div class="col section-text">

```{r line-chart-sebelum-sesudah, echo=FALSE, message=FALSE, warning=FALSE, fig.width=12, fig.height=7, out.width="100%"}
library(tidyverse)

data <- read.csv("dataset_uas.csv")

data_line <- data %>%
  group_by(minggu) %>%
  summarise(
    skor_sebelum = mean(skor_kuis_sebelum),
    skor_sesudah = mean(skor_kuis_sesudah)
  )

data_long <- data_line %>%
  pivot_longer(
    cols = c(skor_sebelum, skor_sesudah),
    names_to = "waktu",
    values_to = "rata_skor"
  )

ggplot(data_long, aes(x = minggu, y = rata_skor, color = waktu)) +
  geom_line(linewidth = 1.2) +
  geom_point(size = 3) +
  labs(
    title = "Perbandingan Rata-rata Skor Kuis Sebelum dan Sesudah",
    x = "Minggu",
    y = "Rata-rata Skor Kuis",
    color = "Waktu Pengukuran"
  ) +
  scale_color_manual(
    values = c(
      "skor_sebelum" = "#E5533D",
      "skor_sesudah" = "#2C7BE5"
    ),
    labels = c("Sebelum Pembelajaran", "Sesudah Pembelajaran")
  ) +
  theme_minimal()

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="section-divider"></div>
::: {.text-justify}
Line chart digunakan pada analisis ini karena mampu menampilkan perubahan nilai rata-rata skor kuis dari waktu ke waktu secara jelas. Visualisasi ini bertujuan untuk membandingkan tren skor kuis sebelum dan sesudah pembelajaran setiap minggu, sehingga memudahkan dalam mengamati pola peningkatan atau penurunan hasil belajar mahasiswa.
:::
<div class="section-divider"></div>

<div class="visualisasi-box">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan grafik, rata-rata skor kuis sesudah pembelajaran selalu lebih tinggi dibandingkan sebelum pembelajaran pada setiap minggu pengamatan. Hal ini menunjukkan bahwa pembelajaran yang diberikan memberikan dampak positif terhadap peningkatan hasil belajar. Peningkatan skor terlihat semakin stabil setelah minggu ke-7.
:::
</div>

</div>
</div>


### Sentral Tendensi

Analisis central tendency digunakan untuk menggambarkan nilai pusat dari skor kuis sesudah pembelajaran. Ukuran seperti mean dan median membantu mengetahui skor yang paling mewakili performa mahasiswa secara keseluruhan serta menilai kecenderungan umum hasil belajar setelah proses pembelajaran.

<div class="section-divider"></div>

<div class="two-column">
<div class="col section-text">

```{r ct_visual_lr, echo=FALSE, fig.width=9, fig.height=5, out.width="100%", fig.align='center'}
library(ggplot2)
library(patchwork)

hist_plot <- ggplot(df, aes(x = skor_kuis_sesudah)) +
  geom_histogram(aes(y = after_stat(density)),
                 bins = 10,
                 fill = "#80b1d3",
                 color = "white",
                 alpha = 0.8) +
  geom_density(color = "#1f78b4", linewidth = 1) +
  geom_vline(xintercept = mean(df$skor_kuis_sesudah),
             color = "red", linewidth = 1) +
  geom_vline(xintercept = median(df$skor_kuis_sesudah),
             color = "darkgreen", linewidth = 1,
             linetype = "dashed") +
  labs(title = "Histogram Skor Kuis Sesudah",
       x = "Skor Kuis", y = "Density") +
  theme_minimal(base_size = 11)

box_plot <- ggplot(df, aes(y = skor_kuis_sesudah)) +
  geom_boxplot(fill = "#fdd0a2",
               color = "gray30",
               width = 0.4,
               outlier.color = "red") +
  labs(title = "Boxplot Skor Kuis Sesudah",
       y = "Skor Kuis", x = NULL) +
  theme_minimal(base_size = 11)

hist_plot | box_plot

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="visualisasi-box">
<b>Interpretasi Histogram</b><br>
Histogram menunjukkan bahwa skor kuis sesudah pembelajaran terkonsentrasi pada nilai tinggi (sekitar 90–98). Distribusi tampak sedikit miring ke kiri, ditandai dengan nilai mean yang lebih kecil dari median, yang mengindikasikan adanya beberapa skor rendah meskipun mayoritas mahasiswa memperoleh nilai tinggi.

<b>Interpretasi Boxplot</b><br>
Boxplot menunjukkan median skor yang tinggi dengan rentang antar kuartil yang relatif sempit, menandakan konsistensi hasil belajar. Terdapat beberapa outlier pada skor rendah, yang menunjukkan sebagian kecil mahasiswa memiliki capaian di bawah mayoritas peserta.

<div class="section-divider"></div>

Berdasarkan kedua visualisasi, skor kuis mahasiswa umumnya berada pada nilai tinggi dan relatif konsisten, menunjukkan efektivitas pembelajaran yang diterapkan. Meskipun terdapat beberapa nilai pencilan yang rendah, secara keseluruhan hasil belajar tetap terpusat pada skor tinggi, dengan kebutuhan pendampingan bagi sebagian kecil mahasiswa.
</div>
</div>
</div>


### Statistik Dispersi

<div style="display:flex; gap:20px; align-items:flex-start;">
  <div style="width:65%;">
```{r fig.width=9.5, fig.height=5, echo=FALSE}
library(ggplot2)
library(dplyr)
library(patchwork)

# Histogram + density
p_hist <- ggplot(df, aes(x = skor_kuis_sesudah, fill = mode_pembelajaran)) +
  geom_histogram(
    aes(y = after_stat(density)),
    bins = 10,
    alpha = 0.5,
    color = "black",
    position = "identity"
  ) +
  geom_density(alpha = 0.4, linewidth = 1) +
  facet_wrap(~mode_pembelajaran, ncol = 1) +
  labs(
    title = "Distribusi Skor Kuis Sesudah",
    x = "Skor Kuis Sesudah",
    y = "Kepadatan"
  ) +
  theme_minimal() +
  theme(
    legend.position = "none",
    plot.title = element_text(size = 11, face = "bold")
  )

# Violin + boxplot
p_violin <- ggplot(df, aes(
  x = materi_pembelajaran,
  y = skor_kuis_sesudah,
  fill = materi_pembelajaran
)) +
  geom_violin(alpha = 0.4, trim = FALSE) +
  geom_boxplot(width = 0.15, alpha = 0.7, outlier.color = "red") +
  stat_summary(fun = mean, geom = "point", shape = 23, size = 2.5, fill = "blue") +
  labs(
    title = "Sebaran Skor Kuis Berdasarkan Materi",
    x = "Materi",
    y = "Skor Kuis"
  ) +
  theme_minimal() +
  theme(
    legend.position = "none",
    plot.title = element_text(size = 10, face = "bold"),
    axis.text.x = element_text(angle = 20, hjust = 1)
  )

# SEJAJAR KIRI–KANAN
p_hist | p_violin
```

</div>

<div style="width:40%;">
::: {.text-justify}
Pada analisis ini, ukuran penyebaran digunakan untuk melihat seberapa beragam skor kuis sesudah pembelajaran pada setiap mode dan materi pembelajaran. Analisis ini bertujuan untuk menilai tingkat konsistensi hasil belajar mahasiswa, bukan hanya melihat nilai rata-rata.
:::

<div class="section-divider"></div>
<div style="background-color:#f8f9fa; padding:16px; border-radius:10px; border-left:6px solid #0d6efd; text-align:justify; font-size:14px;">

<b>Histogram</b><br>
Histogram menunjukkan distribusi skor kuis sesudah pada mode pembelajaran luring dan daring. Meskipun rata-rata skor relatif berdekatan, bentuk kurva density memperlihatkan perbedaan tingkat variasi penyebaran skor antar mode pembelajaran, yang menunjukkan bahwa tingkat konsistensi hasil belajar mahasiswa dapat berbeda tergantung pada mode pembelajaran yang digunakan.
<br><br>
<b>Violin & Boxplot</b><br>
Violin plot dan boxplot menunjukkan bahwa penyebaran skor kuis sesudah berbeda pada setiap materi pembelajaran. Violin yang lebih lebar menandakan variasi skor yang lebih tinggi, sedangkan boxplot dengan IQR yang lebih sempit menunjukkan hasil belajar yang lebih konsisten, meskipun masih terdapat beberapa nilai pencilan yang menandakan adanya mahasiswa dengan capaian yang jauh di bawah mayoritas.

</div>
</div>
</div>


### Distribusi Probabilitas

Pada analisis ini, distribusi probabilitas digunakan untuk melihat pola sebaran skor kuis sesudah pembelajaran pada setiap mode pembelajaran. Analisis ini bertujuan untuk memahami bagaimana peluang mahasiswa memperoleh skor tertentu tersebar dalam data, sehingga tidak hanya berfokus pada nilai rata-rata, tetapi juga pada pola dan konsistensi capaian hasil belajar.

<div class="section-divider"></div>

<div class="two-column">
<div class="col section-text">

```{r probability_distribution, echo=FALSE, fig.width=8.5, fig.height=4.8}
library(ggplot2)

ggplot(df, aes(
  x = mode_pembelajaran,
  y = skor_kuis_sesudah,
  fill = mode_pembelajaran
)) +
  geom_violin(
    trim = FALSE,
    alpha = 0.55,
    color = NA
  ) +
  geom_boxplot(
    width = 0.15,
    alpha = 0.75,
    outlier.color = "red"
  ) +
  stat_summary(
    fun = mean,
    geom = "point",
    shape = 23,
    size = 3,
    fill = "blue",
    color = "black"
  ) +
  labs(
    title = "Distribusi Skor Kuis Sesudah Berdasarkan Mode Pembelajaran",
    subtitle = "Visualisasi Probability Distribution",
    x = "Mode Pembelajaran",
    y = "Skor Kuis Sesudah"
  ) +
  scale_x_discrete(expand = expansion(add = 0.6)) +
  theme_minimal(base_size = 12) +
  theme(
    legend.position = "none",
    plot.margin = margin(5, 5, 5, 5),
    plot.title = element_text(face = "bold")
  )

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="visualisasi-box">
<h4><b>Interpretasi Visual:</b></h4>
Violin plot menunjukkan distribusi probabilitas skor kuis sesudah berdasarkan mode pembelajaran daring dan luring. Lebar violin merepresentasikan kepadatan data, sehingga bagian yang lebih lebar menunjukkan peluang mahasiswa memperoleh skor pada rentang nilai tertentu lebih besar.

Boxplot di dalam violin memperlihatkan nilai median dan rentang antar kuartil (IQR), yang menggambarkan sebaran utama skor kuis sesudah, sementara titik mean merepresentasikan nilai harapan (expected value).

Perbedaan bentuk dan lebar sebaran antara pembelajaran daring dan luring menunjukkan variasi pola distribusi peluang serta tingkat konsistensi capaian skor, meskipun secara umum kedua mode pembelajaran sama-sama menunjukkan kecenderungan hasil belajar yang relatif baik.
</div>

</div>
</div>


Interval Keyakinan {data-orientation=rows}
=======================================================================
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Studi Kasus dan Identifikasi Uji {data-height=520}

<div class="skyblue-box">
<h4><b>Studi Kasus Dataset:</b></h4>
::: {.text-justify}
Program kelas intensif statistik diikuti oleh mahasiswa untuk meningkatkan pemahaman materi statistika. Setelah menyelesaikan program, mahasiswa mengikuti kuis evaluasi.  
Berdasarkan data skor kuis sesudah mengikuti kelas, dilakukan perhitungan **interval keyakinan 95%** untuk **mengestimasi rata-rata skor kuis** mahasiswa yang mengikuti program kelas intensif statistik.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<div class="blue-box">
<h4><b>Identifikasi Metode dan Uji Statistik yang Tepat:</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Analisis ini bertujuan untuk **mengestimasi rata-rata skor kuis** mahasiswa **setelah** mengikuti kelas intensif statistik. Sehingga sampel pada analisis ini terdiri dari **50** skor kuis mahasiswa setelah mengikuti kelas, di mana setiap skor merepresentasikan hasil kuis satu mahasiswa.

Karena data yang digunakan merupakan **data sampel** dan **simpangan baku populasi tidak diketahui**, maka interval keyakinan untuk rata-rata dihitung menggunakan **distribusi t** dengan **simpangan baku sampel**. Interval keyakinan **95%** digunakan karena tingkat keyakinan ini umum dipakai dan memberikan estimasi rata-rata yang cukup akurat tanpa menghasilkan interval yang terlalu lebar.
:::
</div>

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Persiapan Perhitungan Analisis</b></h4>
Rata-rata sampel (\(\bar{x}\)): 
\[
\begin{aligned}
\bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348
\end{aligned}
\] 
Simpangan Baku Sampel: 
\[
\begin{aligned}
s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{
      \frac{1131.078}{49}} = 4.804501
\end{aligned}
\]
Derajat Kebebasan: \(df = n - 1 = 50 - 1 = 49\)
</div>
</div>

### Hitungan dan Visualisasi {data-height=520}

<div class="two-column">
<div class="col section-text">

<h4><b>Hitung Interval Keyakinan 95% Menggunakan Rumus \(t = \bar{x} \pm t_{\alpha/2,\,df}\left(\frac{s}{\sqrt{n}}\right)\)</b></h4>
<div class="section-divider"></div>

Hitung \(t_{\alpha/2,\,df}\) untuk tingkat keyakinan 95%
\[
\begin{aligned}
\alpha &= 1 - 0.95 = 0.05 \\
\alpha/2 &= 0.025 \\
df &= 49 \\
t_{0.025,49} &= 2.009575
\end{aligned}
\]
Hitung Kesalahan Margin
\[
\begin{aligned}
ME &= t_{\alpha/2,df}\left(\frac{s}{\sqrt{n}}\right) = 2.009575\left(\frac{4.804501}{\sqrt{50}}\right) = 1.3654
\end{aligned}
\]
Interval Keyakinan 95% adalah:
\[
\begin{aligned}
CI_{95\%} &= \bar{x} \pm ME \\
UCI &= 92.5348 + 1.3654 = 93.9002 \\
LCI &= 92.5348 - 1.3654 = 91.1698 \\
CI_{95\%} &= (93.8998,\; 91.1694)
\end{aligned}
\]

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Hitung Interval Keyakinan 95% Menggunakan Kode R</b></h4>
<div class="section-divider"></div>

```{r echo=FALSE, message=FALSE, warning=FALSE,}
library(readr)
library(dplyr)
library(knitr)
library(kableExtra)

df <- read_csv("dataset_uas.csv", show_col_types = FALSE)

x <- df$skor_kuis_sesudah
x <- x[!is.na(x)]

CL <- 0.95
alpha <- 1 - CL
n <- length(x)
dfree <- n - 1
xbar <- mean(x)
s <- sd(x)
SE <- s / sqrt(n)
t_crit <- qt(1 - alpha/2, df = dfree)
MoE <- t_crit * SE

LCI <- xbar - MoE
UCI <- xbar + MoE

ci_table <- data.frame(
  CL = "95%",
  Alpha = round(alpha, 2),
  Mean = round(xbar, 4),
  SD = round(s, 4),
  t = round(t_crit, 3),
  SE = round(SE, 4),
  MoE = round(MoE, 4),
  LCI = round(LCI, 4),
  UCI = round(UCI, 4)
)

ci_table %>%
  kable(
    align = "c"
  ) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    position = "center"
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#1f77b4")

```

```{r echo=FALSE, message=FALSE, warning=FALSE}
library(plotly)

# Data CI 
ci_plot <- data.frame(
  label = "CI 95%",
  mean = xbar,
  lci = LCI,
  uci = UCI
)

plot_ly() %>%
  
  # Garis CI
  add_segments(
    data = ci_plot,
    x = ~lci, xend = ~uci,
    y = 0, yend = 0,
    line = list(color = "#1f77b4", width = 6),
    name = "Confidence Interval 95%",
    hoverinfo = "text",
    text = ~paste0(
      "CI 95%<br>",
      "Lower: ", round(lci, 3), "<br>",
      "Upper: ", round(uci, 3)
    )
  ) %>%
  
  # Titik Mean
  add_markers(
    data = ci_plot,
    x = ~mean,
    y = 0,
    marker = list(
      color = "#d62728",
      size = 14
    ),
    name = "Rata-rata Sampel",
    hoverinfo = "text",
    text = ~paste0(
      "Mean: ", round(mean, 3)
    )
  ) %>%
  
  layout(
  title = list(
    text = "Visualisasi Interval Kepercayaan 95%<br>Skor Kuis Sesudah",
    x = 0.5,
    plot_bgcolor = "#b7d4ff"
  ),
  xaxis = list(
    title = "Skor Kuis Sesudah",
    range = c(91, 94),    
    tick0 = 90,
    dtick = 0.5
  ),
  yaxis = list(
    visible = FALSE
  ),
  legend = list(
    orientation = "h",     
    x = 0.5,               
    xanchor = "center",
    y = -0.25              
  ),
  showlegend = TRUE,
  height = 350
)


```

</div>
</div>

### Kesimpulan Analisis {data-height=520}

<div class="blue-box">
<h4><b>Hasil Interval Keyakinan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan perhitungan interval keyakinan **95%**, diperoleh bahwa rata-rata skor kuis mahasiswa setelah mengikuti program kelas intensif statistik berada pada **rentang 91.1698 hingga 93.9002**. Dengan tingkat keyakinan 95%, dapat diyakini bahwa rata-rata skor kuis populasi mahasiswa **berada dalam interval tersebut**.
:::
</div>

<div class="skyblue-box">
<h4><b>Interpretasi Statistik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Rentang interval yang **relatif sempit** serta posisi **rata-rata sampel** yang berada **di dalam** interval keyakinan menunjukkan bahwa skor kuis sesudah pembelajaran berada pada tingkat yang **relatif stabil**. Dengan demikian, hasil ini mengindikasikan bahwa capaian pembelajaran pada kelas intensif statistik menunjukkan konsistensi performa antar mahasiswa setelah mengikuti program pembelajaran.
:::
</div>

<div class="blue-box">
<h4><b>Insight</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Hasil interval keyakinan yang diperoleh menunjukkan bahwa sistem pembelajaran pada program kelas intensif statistik memberikan hasil yang **relatif konsisten**. Dengan demikian, sistem pembelajaran ini perlu dipertahankan serta ditingkatkan agar kualitas dan konsistensi hasil belajar mahasiswa dapat terus terjaga pada periode pembelajaran berikutnya.
:::
</div>

Statistik Inferensi {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Studi Kasus dan Identifikasi Uji {data-height=520}

<div class="skyblue-box">
::: {.text-justify}
<h4><b>Studi Kasus Dataset:</b></h4>
Program kelas intensif statistik menerapkan evaluasi berupa kuis sesudah pembelajaran untuk mengukur perubahan hasil belajar mahasiswa.Berdasarkan data skor kuis mahasiswa setelah mengikuti kelas intensif statistika, dilakukan pengujian hipotesis untuk mengetahui apakah rata-rata skor kuis mahasiswa secara signifikan lebih tinggi dari nilai 80.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<div class="blue-box">
<h4><b>Identifikasi Uji</b></h4>
Uji statistik yang digunakan adalah **uji t satu sampel satu sisi**.  
Uji ini dipilih karena tujuan analisis adalah untuk menguji apakah rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan **lebih tinggi dari nilai acuan 80** berdasarkan satu sampel data mahasiswa. Data yang digunakan merupakan data sampel, dan **simpangan baku populasi tidak diketahui**, sehingga simpangan baku diestimasi menggunakan simpangan baku sampel.

Taraf signifikansi yang digunakan adalah $α = 0,05$, karena merupakan tingkat signifikansi yang umum digunakan dalam penelitian statistik.
Pengujian dilakukan **satu sisi** karena fokus analisis adalah untuk menguji apakah rata-rata skor **lebih besar dari 80**, bukan sekadar berbeda.
</div>

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Menentukan Hipotesis</b></h4>
Dalam studi kasus ini, nilai 80 digunakan sebagai nilai pembanding (baseline) yang merepresentasikan standar pencapaian skor kuis yang diharapkan.

- **Hipotesis Nol (H₀):**  
  Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika sama dengan     atau tidak lebih tinggi dari 80.
  \[
  H_0 : \mu \le 80
  \]

- **Hipotesis Alternatif (H₁):**  
  Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika lebih tinggi    dari 80.
  \[
  H_1 : \mu > 80
  \]

</div>
</div>

### Perhitungan Uji T & Kesimpulan {data-height=520}

<div class="two-column">
<div class="col section-text">

Rata-rata sampel (\(\bar{x}\)): 
\[
\begin{aligned}
\bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348
\end{aligned}
\] 
Simpangan Baku Sampel: 
\[
\begin{aligned}
s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{
      \frac{1131.078}{49}} = 4.804501
\end{aligned}
\]
Standar Kesalahan:
\[
\begin{aligned}
SE &= \frac{s}{\sqrt{n}} = \frac{4.804501}{\sqrt{50}} = 0.679
\end{aligned}
\]

**Statistik Uji t**:  
\[
\begin{aligned}
t &= \frac{\bar{x} - \mu_0}{SE} = \frac{92.5348 - 80}{0.679} = \frac{12.5348}{0.679}  \approx 18.45
\end{aligned}
\]


```{r echo=FALSE, message=FALSE, warning=FALSE}
library(readr)
library(dplyr)
library(knitr)
library(kableExtra)

# Load data
df <- read_csv("dataset_uas.csv", show_col_types = FALSE)

# Variabel
x <- df$skor_kuis_sesudah
x <- x[!is.na(x)]

# Parameter uji
mu0 <- 80          # nilai yang diklaim (GANTI SESUAI SOAL)
alpha <- 0.05
n <- length(x)
dfree <- n - 1
xbar <- mean(x)
s <- sd(x)
SE <- s / sqrt(n)

# Statistik uji t
t_hit <- (xbar - mu0) / SE

# p-value dua arah
p_value <- 2 * pt(-abs(t_hit), df = dfree)

# Tabel hasil uji
test_table <- data.frame(
  n = n,
  Mean = round(xbar, 4),
  SD = round(s, 4),
  SE = round(SE, 4),
  t_statistic = round(t_hit, 4),
  df = dfree,
  p_value = round(p_value, 4),
  Alpha = alpha,
  Keputusan = ifelse(p_value > alpha, 
                     "Gagal menolak H0", 
                     "Tolak H0")
)

# Tabel biru
test_table %>%
  kable(align = "c") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    position = "center"
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#1f77b4")

```

</div>

<div class="divider"></div>
<div class="col section-text">

**Hitung p-value**:  
Rumus p-value uji t satu arah adalah: \(\begin{aligned} p\text{-value} &= P(t \ge t_{\text{hitung}}) \end{aligned}\) dengan derajat kebebasan $df = 49$, maka 

\[
\begin{aligned}
p\text{-value} 
&= P\left(t_{49} \ge 18.45\right)
\end{aligned}
\]

Hasil perhitungan menggunakan kode R memberikan nilai:
\(
\begin{aligned}
p\text{-value} 
&= 5.206043 \times 10^{-24}
\end{aligned}
\)

Nilai tersebut sangat kecil dan secara praktis dapat dinyatakan sebagai:
\(
\begin{aligned}
p\text{-value} &< 0.0001
\end{aligned}
\)

<div class="blue-box">
<h4><b>Kesimpulan</b></h4>
<div class="section-divider"></div>
Karena nilai $p$-value jauh lebih kecil dari tingkat signifikansi yang digunakan, yaitu $\alpha = 0.05$, maka keputusan yang diambil adalah **menolak hipotesis nol ($H_0$)**.

Dengan demikian, terdapat bukti statistik yang sangat kuat untuk menyimpulkan bahwa rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik **secara signifikan lebih tinggi dari 80**.

Hasil ini menunjukkan bahwa program kelas intensif statistik memberikan dampak positif yang signifikan terhadap peningkatan skor kuis mahasiswa. Oleh karena itu, hasil ini mengindikasikan bahwa pendekatan kelas intensif statistik layak untuk dipertahankan sebagai metode pembelajaran dalam meningkatkan performa akademik mahasiswa.
</div>

</div>
</div>


Metode Nonparametrik {data-orientation=rows}
=======================================================================
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Studi Kasus dan Identifikasi Uji {data-height=520}

<div class="skyblue-box">
<div class="two-column">
<div class="col section-text">

<h4><b>Studi Kasus</b></h4>
<div class="section-divider"></div>
Sebuah program kelas intensif statistika berlangsung selama 12 minggu dengan evaluasi berupa kuis mingguan. Untuk menilai efektivitas program, dilakukan pengukuran skor kuis sebelum dan sesudah mengikuti kelas pada kelompok mahasiswa yang sama.

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Hipotesis</b></h4>
<div class="section-divider"></div>
\[\begin{aligned}
H_0 &: \text{Median perbedaan skor kuis sebelum dan sesudah} = 0 \\
H_1 &: \text{Median perbedaan skor kuis sebelum dan sesudah} \neq 0
\end{aligned}\]

</div>
</div>
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<div class="blue-box">
<h4><b>Alasan Menggunakan Analisis Nonparametrik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan hasil uji asumsi, data skor kuis tidak berdistribusi normal, sehingga metode parametrik seperti uji-t berpasangan tidak memenuhi syarat. Oleh karena itu, digunakan pendekatan nonparametrik yang lebih sesuai dengan karakteristik data.
:::

<h4><b>Tujuan Analisis</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Tujuan analisis ini adalah untuk mengetahui apakah terdapat perbedaan median skor kuis mahasiswa sebelum dan sesudah mengikuti kelas intensif statistika.
:::

</div>
</div>

<div class="divider"></div>
<div class="col section-text">

<div class="blue-box">
<h4><b>Alasan menggunakan Uji Wilcoxon</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Uji Wilcoxon Signed-Rank dipilih karena sesuai untuk membandingkan dua pengukuran berpasangan pada kelompok yang sama ketika asumsi normalitas tidak terpenuhi. Metode ini mempertimbangkan arah dan besar perbedaan, sehingga memberikan hasil yang lebih kuat dibandingkan uji tanda.
:::

</div>
</div>


### Step Wilcoxon {data-height=520}

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Langkah 1: Menghitung Perbedaan Berpasangan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung perbedaan skor kuis sebelum dan sesudah pembelajaran untuk setiap mahasiswa. Perbedaan berpasangan didefinisikan sebagai selisih antara skor kuis sesudah dan skor kuis sebelum pembelajaran.
:::

```{r wilcoxon-step1, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step1 <- df %>%
  select(id_mahasiswa, skor_kuis_sebelum, skor_kuis_sesudah) %>%
  mutate(
    perbedaan = skor_kuis_sesudah - skor_kuis_sebelum
  )

kable(
  step1
) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px", )

```

<div class="section-divider"></div>
<h4><b>Langkah 2: Hapus Perbedaan Nol</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, observasi dengan nilai perbedaan sama dengan nol dihapus dari analisis, karena pasangan dengan perbedaan nol tidak memberikan informasi mengenai arah perubahan.
:::

```{r wilcoxon-step2, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step2 <- step1 %>%
  filter(perbedaan != 0)

kable(
  step2
) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px")

```


</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Langkah 3: Peringkat Perbedaan Absolut</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung nilai absolut dari perbedaan berpasangan. Selanjutnya, nilai absolut tersebut diberi peringkat dari yang terkecil hingga terbesar. Jika terdapat nilai yang sama (ties), maka diberikan peringkat rata-rata.
:::

```{r wilcoxon-step3, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step3 <- step2 %>%
  mutate(
    abs_perbedaan = abs(perbedaan),
    peringkat = rank(abs_perbedaan, ties.method = "average")
  )

kable(step3) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px")
```

<div class="section-divider"></div>
<h4><b>Langkah 4: Menentukan Tanda Peringkat</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, tanda peringkat ditentukan berdasarkan arah perbedaan. Jika perbedaan bernilai positif, maka peringkat diberi tanda positif. Jika perbedaan bernilai negatif, maka peringkat diberi tanda negatif.
:::

```{r wilcoxon-step4, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step4 <- step3 %>%
  mutate(
    peringkat_bertanda = ifelse(perbedaan > 0, peringkat, -peringkat)
  )

kable(step4) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px")
```


</div>
</div>


### Step Wilcoxon & Interpretasi {data-height=520}

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Langkah 5: Menghitung Statistik Uji</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung jumlah peringkat bertanda positif (W⁺) dan jumlah peringkat bertanda negatif (W⁻).
Statistik uji Wilcoxon didefinisikan sebagai nilai minimum dari W⁺ dan W⁻.
:::

```{r wilcoxon-step5, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

W_pos <- sum(step4$peringkat[step4$perbedaan > 0])
W_neg <- sum(step4$peringkat[step4$perbedaan < 0])
W_stat <- min(W_pos, W_neg)

hasil_W <- data.frame(
  W_Positif = W_pos,
  W_Negatif = W_neg,
  Statistik_Uji_W = W_stat
)

kable(hasil_W) %>%
  kable_styling(full_width = TRUE)

```

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Langkah 6: Pengambilan Keputusan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dilakukan uji Wilcoxon Signed-Rank menggunakan fungsi `wilcox.test()` di R. Keputusan diambil berdasarkan nilai p-value dengan tingkat signifikansi $α = 0.05$.
Jika p-value $< α$, maka H₀ ditolak.
:::

```{r wilcoxon-step6, echo=FALSE, message=FALSE, warning=FALSE}
library(knitr)
library(kableExtra)

uji_wilcoxon <- wilcox.test(
  df$skor_kuis_sesudah,
  df$skor_kuis_sebelum,
  paired = TRUE,
  alternative = "two.sided",
  exact = TRUE
)

hasil_uji <- data.frame(
  Statistik_Uji = uji_wilcoxon$statistic,
  P_Value = uji_wilcoxon$p.value,
  Keputusan = ifelse(uji_wilcoxon$p.value < 0.05, "Tolak H₀", "Gagal Menolak H₀")
)

kable(hasil_uji) %>%
  kable_styling(full_width = TRUE)

```


</div>
</div>

<div class="blue-box">
<h4><b>Interpretasi Statistik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Jika **p-value < 0.05**, maka hipotesis nol **(H₀) ditolak**, yang berarti **terdapat perbedaan median** skor kuis sebelum dan sesudah mengikuti kelas intensif statistika. Hal ini menunjukkan bahwa program kelas intensif statistika memberikan pengaruh yang signifikan terhadap perubahan skor kuis mahasiswa.

Secara praktis, hasil ini mengindikasikan bahwa pendekatan pembelajaran yang diterapkan dalam program tersebut efektif dalam meningkatkan pemahaman mahasiswa terhadap materi statistika. Oleh karena itu, program kelas intensif dapat dipertahankan dan dipertimbangkan untuk dikembangkan lebih lanjut sebagai strategi pembelajaran yang mendukung peningkatan prestasi akademik.
:::
</div>