Anggota Kelompok

## Column

R Programming Statistics

Final Exam – Mr. Bakti Siregar, M.Sc., CDS
Foto Kelompok
Angelique Kiyoshi Lakeisha Bahrul Ulum

NIM: 52250001

  • Ringkasan Bab 9 & 10
  • Interval Keyakinan
  • Bagian Dataset
  • Desain Kartu Anggota Kelompok
Khafizatun Nisa

NIM: 52250018

  • Ringkasan Bab 1 & 2
  • Visualisasi Statistika Dasar (Sentral Tendensi, Dispersi Statistik, Distribusi Probabilitas)
Naychilla Adelia Zahrah

NIM: 52250004

  • Ringkasan Bab 7 & 8
  • Metode Nonparametrik
Nakeisha Aulia Zahra

NIM: 52250023

  • Ringkasan Bab 5 & 6
  • Visualisasi Statistika Dasar (Diagram Lingkaran, Batang, dan Garis)
  • Desain Foto Kelompok

Veronica Maria Lucia Ferreira Xavier

NIM: 52250021

  • Ringkasan Bab 3 & 4
  • Inferensi Statistik

Ringkasan Statistika Dasar

## Column

Bab 1

Definisi

Statistik adalah ilmu yang mempelajari metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data untuk menghasilkan informasi yang bermakna serta mendukung pengambilan keputusan di bawah kondisi ketidakpastian. Statistik digunakan untuk memahami pola dan variasi dalam data, serta untuk menarik kesimpulan dan membuat prediksi mengenai suatu populasi berdasarkan data yang tersedia.

Permasalahan Statistik Utama

Permasalahan statistik utama berkaitan dengan bagaimana data dapat diolah dan dianalisis secara sistematis agar menghasilkan informasi yang akurat dan dapat dipercaya. Data yang tersedia sering kali mengandung variasi, ketidakpastian, serta jumlah yang besar, sehingga diperlukan metode statistik untuk merangkum data, memahami pola yang muncul, dan mengurangi kesalahan dalam penarikan kesimpulan. Statistik membantu menjembatani data mentah menjadi dasar yang rasional dalam pengambilan keputusan.

Jenis Statistik yang Digunakan

Statistik secara umum terbagi menjadi dua jenis utama, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif digunakan untuk menggambarkan dan meringkas data melalui ukuran pemusatan, ukuran penyebaran, serta visualisasi data. Sementara itu, statistik inferensial digunakan untuk menarik kesimpulan atau membuat estimasi mengenai suatu populasi berdasarkan data sampel, dengan memanfaatkan konsep peluang, interval kepercayaan, dan pengujian hipotesis.

Bab 2

Definisi

Eksplorasi Data adalah tahap awal analisis statistik untuk memahami karakteristik, struktur, dan kualitas data sebelum analisis lanjutan, sehingga membantu menghindari kesalahan interpretasi dan menghasilkan keputusan yang lebih akurat.

Jenis Variabel Data

Jenis.Data Bentuk.Data Tipe Deskripsi
Data Numerik (Kuantitatif) Berupa angka Diskrit Data hasil hitungan, biasanya berupa bilangan bulat
Kontinu Data hasil pengukuran, dapat berupa bilangan pecahan
Data Kategorikal (Kualitatif) Berupa kategori Nominal Data kategori tanpa urutan tertentu
Ordinal Data kategori yang memiliki urutan atau tingkatan

Deskripsi

Pada tahap eksplorasi data, variabel numerik diringkas menggunakan statistik deskriptif untuk memberikan gambaran awal terhadap data. Ringkasan statistik ini meliputi ukuran pemusatan seperti mean dan median, serta ukuran penyebaran seperti nilai minimum, maksimum, range, varians, dan standar deviasi.

Selain itu, eksplorasi data juga bertujuan untuk mengidentifikasi pola awal, yaitu kecenderungan umum yang muncul dalam data, tren, yaitu perubahan nilai data apabila diamati berdasarkan urutan tertentu, serta anomali (outlier), yaitu nilai yang menyimpang jauh dari sebagian besar data. Informasi ini menjadi dasar penting dalam memahami perilaku data dan menentukan metode analisis statistik selanjutnya.

Bab 3

Visualisasi data adalah proses mengubah data mentah menjadi informasi yang jelas dan bermakna, sehingga mudah dipahami dan membantu penyampaian pesan secara tepat.

Line Chart

Line chart adalah alat visualisasi data yang digunakan untuk menunjukkan bagaimana nilai berubah secara berurutan, biasanya dari waktu ke waktu.

Contoh Kasus: Menampilkan tren penjualan bulanan toko online selama tahun 2024 untuk melihat bulan mana yang memiliki performa terbaik.

Bar Chart

Bar chart adalah grafik batang untuk menampilkan data kategorikal. Tinggi atau panjang batang menunjukkan nilai tiap kategori sehingga mudah dibandingkan.

Contoh Kasus: Membandingkan total penjualan antar kategori produk untuk mengetahui produk mana yang paling laris.

Histogram

Histogram adalah grafik batang untuk menunjukkan sebaran data numerik dalam beberapa interval.

Contoh Kasus : Distribusi Nilai Ujian Mahasiswa

Bab 4

Central Tendency adalah ukuran statistik yang merepresentasikan nilai tipikal atau sentral dari dataset. Bertujuan memberikan satu nilai yang paling mewakili keseluruhan data. Ada Tiga Ukuran Utama yaitu:

Rata-rata

Rata-rata adalah nilai yang diperoleh dengan membagi jumlah seluruh data dengan banyaknya data, dan digunakan untuk data bertipe interval dan rasio.

Rumus: \(\bar{x} = \frac{\sum x}{n}\)

Nilai Tengah

Nilai Tengah adalah nilai tengah dari data yang telah diurutkan dan cocok digunakan untuk data bertipe ordinal, interval, dan rasio.

Rumus: \(\text{Median} = \begin{cases} x_{\left(\frac{n+1}{2}\right)}, & \text{jika } n \text{ ganjil} \\ \frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}, & \text{jika } n \text{ genap} \end{cases}\)

Nilai Tengah

Nilai tengah adalah nilai yang paling sering muncul dalam suatu kumpulan data dan dapat digunakan untuk data bertipe nominal, ordinal, interval, maupun rasio.

Rumus: \(\text{Mode} = x \;\; \text{dengan frekuensi tertinggi}\)

Menghitung ukuran pemusatan data dari nilai siswa pada 2 mata pelajaran:
- Nilai Fisika: 85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70
- Nilai Bahasa: 80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76

Perhitungan Menggunakan Kode R

Variabel Mean Median Modus
Fisika 83.60 85 85
Bahasa Indonesia 81.67 80 80

Interpretasi dan Perbandingan Hasil Kedua Nilai Siswa:
1. Rata-rata: Nilai rata-rata Fisika (83,60) lebih tinggi dibandingkan Bahasa Indonesia (81,67), sehingga performa siswa pada Fisika lebih baik.
2. Nilai Tengah: Median Fisika sebesar 85 lebih tinggi daripada Bahasa Indonesia sebesar 80, menunjukkan nilai tengah Fisika berada pada tingkat lebih tinggi.
3. Modus (nilai paling sering muncul): Modus Fisika adalah 85, sedangkan Bahasa Indonesia 80, yang berarti nilai yang paling sering muncul pada Fisika lebih tinggi.

Kesimpulan: Secara keseluruhan, hasil belajar siswa pada mata pelajaran Fisika lebih baik dibandingkan Bahasa Indonesia, baik dilihat dari rata-rata, nilai tengah, maupun nilai yang paling sering muncul.

Bab 5

Definisi

Statistical dispersion adalah ukuran yang menunjukkan seberapa tersebar atau bervariasi data dari suatu kumpulan nilai. Semakin besar nilai dispersi, semakin tidak seragam datanya, sedangkan semakin kecil nilai dispersi, semakin homogen data tersebut.
Pengukuran tingkat dispersi data umumnya dilakukan menggunakan beberapa ukuran utama, yaitu jangkauan (range), varians, dan simpangan baku

Range

Range adalah ukuran penyebaran paling sederhana yang menunjukkan selisih antara nilai maksimum dan minimum dalam data.

Rumus: \(Range = X_{max} - X_{min}\)

Contoh Perhitungan:
Data: 5, 7, 10, 12, 15
Range = 15 − 5 = 10

Varians

Definisi: Varians menunjukkan rata-rata kuadrat selisih setiap data terhadap nilai rata-rata (mean).

Rumus:
Populasi:
\(\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}\)
Sampel:
\(s^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1}\)

Contoh Perhitungan
Diketahui data: 46, 50, 54, 48, 52
\(\bar{X} = \frac{250}{5} = 50\)
\(\sum (X_i - \bar{X})^2 = 40\)
\(s^2 = \frac{40}{4} = 10\)

Standar Deviasi

Definisi
Standar deviasi adalah akar kuadrat dari varians dan menunjukkan rata-rata jarak data terhadap mean.

Rumus
\(s = \sqrt{s^2}\)

Contoh Perhitungan
\(s^2 = 10\)
\(s = \sqrt{10} \approx 3,16\)

Interpretasi Tingkat Penyebaran Data

  • Range kecil → data tidak terlalu menyebar
  • Varians kecil → data mendekati rata-rata
  • Standar deviasi kecil → data homogen
  • Dispersi besar → data heterogen

Secara umum, ukuran dispersi digunakan untuk menilai tingkat keragaman data dalam suatu kumpulan pengamatan. Nilai range, varians, dan standar deviasi yang relatif kecil menunjukkan bahwa data cenderung terkonsentrasi di sekitar nilai rata-rata, sehingga variasi antar data tidak terlalu besar. Sebaliknya, nilai dispersi yang besar mengindikasikan adanya perbedaan yang cukup signifikan antar nilai pengamatan, yang mencerminkan tingkat heterogenitas data yang lebih tinggi.

Bab 6

Definisi Probabilitas

Probabilitas adalah ukuran peluang terjadinya suatu peristiwa. Nilainya berada antara 0 sampai 1, di mana:
0 → kejadian mustahil
1 → kejadian pasti

Rumus dasar:
\(P(A) = \frac{\text{Jumlah hasil yang menguntungkan}}{\text{Jumlah seluruh hasil dalam ruang sampel}}\)

Konsep Dasar & Ruang Sampel

Ruang sampel (S) adalah seluruh kemungkinan hasil dari suatu percobaan.
Kejadian (event) adalah bagian dari ruang sampel yang diperhatikan.

Contoh:
Melempar koin 2 kali:
\(S = \{HH, HT, TH, TT\}\)

Aturan Probabilitas

Dua aturan utama:
- Nilai probabilitas selalu \(0 \le P(A) \le 1\)
- Total probabilitas seluruh hasil dalam ruang sampel = 1

Aturan Komplemen

Aturan ini digunakan untuk mencari peluang kejadian tidak terjadi.
Rumus:
\(P(A^c) = 1 - P(A)\)

Kejadian Independen dan Dependen

Independen: satu kejadian tidak memengaruhi kejadian lain.
\(P(A \cap B) = P(A) \times P(B)\)

Dependen: satu kejadian memengaruhi kejadian berikutnya.
\(P(A \cap B) = P(A) \times P(B|A)\)

Penyatuan, Saling Lepas, dan Menyeluruh

Gabungan (Union): kejadian A atau B.
\(P(A \cup B) = P(A) + P(B) - P(A \cap B)\)

Saling lepas (Mutually Exclusive): tidak bisa terjadi bersamaan.
Menyeluruh (Exhaustive): mencakup seluruh ruang sampel.

Percobaan & Distribusi Binomial

Eksperimen binomial memiliki 4 syarat:
Jumlah percobaan tetap
Dua hasil (sukses/gagal)
Peluang sukses tetap
Percobaan saling independen

Rumus binomial:
\(P(k) = \binom{n}{k} p^k (1-p)^{n-k}\)

Contoh Kejadian

Muncul setidaknya satu Ekor saat koin dilempar 2 kali

Ruang Sampel \(S = \{HH, HT, TH, TT\}\)
Jumlah total hasil = 4

Hasil yang Mendukung Event A
\(\{HT, TH, TT\}\) → jumlah = 3

Perhitungan Peluang
\(P(A) = \frac{3}{4} = 0.75\)

Interpretasi Hasil dari Contoh Kejadian

Probabilitas 0.75 (75%) berarti bahwa:
Dari banyak percobaan melempar koin 2 kali,
Sekitar 75% percobaan akan menghasilkan setidaknya satu Ekor.
Artinya, kejadian ini cukup besar kemungkinannya dan lebih sering terjadi dibandingkan tidak terjadi.

Bab 7

Definisi

Distribusi probabilitas menggambarkan bagaimana nilai suatu variabel numerik tersebar dalam data. Konsep ini digunakan untuk memahami pola sebaran data dan kecenderungan nilai yang sering muncul.

Visualisasi Distribusi Variabel Numerik

Interpretasi Visualisasi

Distribusi durasi belajar mahasiswa (dalam menit) divisualisasikan menggunakan kurva distribusi (density plot). Berdasarkan visualisasi tersebut, distribusi data cenderung miring ke kanan, yang menunjukkan bahwa sebagian besar mahasiswa memiliki durasi belajar pada rentang menengah, sementara hanya sedikit mahasiswa dengan durasi belajar yang sangat tinggi.

Bab 8

Definisi

Interval kepercayaan adalah rentang nilai yang digunakan untuk memperkirakan parameter populasi berdasarkan data sampel dengan tingkat keyakinan tertentu. Interval ini menunjukkan sejauh mana estimasi dari sampel dapat mewakili kondisi populasi yang sebenarnya.

Contoh Perhitungan Interval Keyakinan 95%

Misalkan dilakukan pengambilan sampel terhadap 25 mahasiswa untuk mengukur rata-rata waktu belajar harian. Dari sampel tersebut diperoleh:

  • Rata-rata waktu belajar (\(\bar{x}\)) = 120 menit
  • Simpangan baku sampel (\(s\)) = 20 menit
  • Ukuran sampel (\(n\)) = 25

Dengan tingkat kepercayaan 95% dan menggunakan distribusi t, diperoleh nilai kritis \(t_{0.025,24} \approx 2.064\).

Interval kepercayaan 95% dihitung sebagai: \(CI = \bar{x} \pm t_{\alpha/2,\,df} \left( \frac{s}{\sqrt{n}} \right)\)

Sehingga diperoleh interval: \[ \begin{aligned} CI &= 120 \pm 2.064 \left( \frac{20}{\sqrt{25}} \right) = 120 \pm 2.064 \times 4 = 120 \pm 8.256 \\ CI &= (111.74, 128.26) \end{aligned} \]

Interpretasi:
Dengan tingkat keyakinan 95%, dapat disimpulkan bahwa rata-rata waktu belajar harian mahasiswa dalam populasi diperkirakan berada antara 111.74 hingga 128.26 menit. Interval ini memberikan gambaran tingkat ketelitian estimasi serta menunjukkan adanya ketidakpastian yang masih melekat dalam proses penarikan kesimpulan berdasarkan data sampel.

Bab 9

Inferensi statistik adalah proses penarikan kesimpulan tentang suatu populasi berdasarkan data sampel. Konsep ini digunakan untuk melakukan generalisasi, prediksi, dan pengambilan keputusan dalam kondisi ketidakpastian.

Hipotesis Statistik

H₀: tidak ada efek atau perbedaan.
H₁: ada efek atau perbedaan.

Hipotesis alternatif dapat berupa uji dua arah (tanpa arah khusus) atau uji satu arah (arah efek ditentukan sebelumnya).

Tipe Kesalahan I dan II

Tipe I (α): menolak H₀ yang benar (false positive).
Tipe II (β): gagal menolak H₀ yang salah (false negative).

Power = 1 − β, menunjukkan kemampuan uji mendeteksi efek nyata.

Metode Uji Hipotesis

Uji T: rata-rata, σ tidak diketahui, sampel kecil.
Uji Z: rata-rata, σ diketahui atau n ≥ 30.
Chi-Square (χ²): data kategorikal.

Perbedaan utama terletak pada jenis data dan asumsi statistik.

Pengambilan Keputusan Statistik

Keputusan dibuat berdasarkan nilai p-value.

p ≤ α → H₀ ditolak.
p > α → H₀ gagal ditolak.

Pendekatan ini memastikan keputusan objektif dan terkontrol.

Contoh Kasus: Sebuah produsen minuman mengklaim bahwa rata-rata volume isi botol produknya lebih dari 500 ml. (Sampel diambil sebanyak 10 botol dengan \(α\) = 0.05)

Hipotesis:
H₀: μ ≤ 500 ml
H₁: μ > 500 ml

Uji satu arah digunakan karena arah klaim telah ditentukan.

Statistik Uji:
Uji t satu sampel digunakan karena data numerik dan simpangan baku populasi tidak diketahui.
Kemudian dari sampel diperoleh rata-rata 504,2 ml dengan simpangan baku 3,7 ml.

Kesimpulan:
Hasil pengujian menghasilkan p-value < 0,05 sehingga H₀ ditolak. Dengan demikian, rata-rata volume isi botol secara signifikan lebih besar dari 500 ml.

Bab 10

Metode nonparametrik adalah teknik inferensi statistik yang tidak bergantung pada asumsi distribusi tertentu, seperti normalitas atau parameter populasi yang diketahui. Metode ini digunakan ketika data berskala ordinal/kategorikal, berukuran kecil, atau mengandung nilai pencilan.

Peran Nonparametrik

Metode nonparametrik digunakan sebagai alternatif ketika asumsi metode parametrik tidak terpenuhi.

Fokus inferensi meliputi:
- median
- peringkat
- frekuensi

Kapan Digunakan?

Direkomendasikan ketika:
- distribusi data tidak normal
- ukuran sampel kecil
- terdapat outlier
- data berskala ordinal atau nominal

Perbandingan Metode

Parametrik: asumsi distribusi ketat, sensitif terhadap outlier.
Nonparametrik: asumsi minimal, lebih robust namun power lebih rendah.

Uji Nonparametrik Umum

  • Tes Tanda
  • Wilcoxon Signed-Rank
  • Mann–Whitney U
  • Kruskal–Wallis
  • Friedman
  • Chi-Square

Contoh Kasus:
Peneliti membandingkan tingkat kepuasan pelanggan antara dua layanan transportasi online. Data kepuasan diperoleh menggunakan skala ordinal (1–5) dari masing-masing 8 responden.

Alasan Pemilihan Uji:
Uji nonparametrik dipilih karena data berskala ordinal dan ukuran sampel kecil.

Statistik Uji: Uji Mann–Whitney U digunakan karena data berskala ordinal, ukuran sampel kecil, dan kedua kelompok pelanggan bersifat independen. Uji ini merupakan alternatif nonparametrik dari uji-t dua sampel untuk membandingkan kecenderungan pusat dua kelompok tanpa asumsi distribusi normal.

Kesimpulan: Berdasarkan hasil uji Mann–Whitney U, diperoleh bukti adanya perbedaan tingkat kepuasan pelanggan antara kedua layanan transportasi online, sehingga hipotesis nol ditolak.

Dataset

## Column

Pendahuluan dan Deskripsi Dataset

Dalam beberapa tahun terakhir, proses pembelajaran mengalami perubahan seiring dengan pemanfaatan teknologi digital dalam kegiatan belajar-mengajar. Pembelajaran tidak lagi hanya dilakukan melalui pertemuan tatap muka (luring), tetapi juga mulai mengombinasikan pembelajaran daring sebagai alternatif dalam pelaksanaannya.

Namun, efektivitas suatu metode pembelajaran tidak dapat ditentukan hanya dari cara penyampaiannya. Keberhasilan program pembelajaran juga dipengaruhi oleh beberapa faktor penting, antara lain:

  • Durasi belajar peserta
  • Tingkat fokus selama proses pembelajaran
  • Capaian hasil belajar
  • Tingkat kepuasan pengguna

Oleh karena itu, diperlukan analisis berbasis data untuk mengevaluasi bagaimana karakteristik pembelajaran tersebut memengaruhi performa peserta secara kuantitatif.

Pada analisis ini, digunakan dataset kelas intensif statistik yang memuat informasi aktivitas belajar mingguan serta beberapa indikator penilaian yang relevan. Dataset ini dianalisis untuk menilai dan mengevaluasi efektivitas kelas intensif statistik secara kuantitatif dan menjadi dasar dalam penyusunan strategi pembelajaran yang lebih efektif serta sesuai dengan kebutuhan pengguna.

Deskripsi Dataset

Dataset yang digunakan dalam analisis ini terdiri dari beberapa variabel yang merepresentasikan karakteristik peserta, aktivitas pembelajaran, serta capaian hasil belajar dalam kelas intensif statistik. Adapun penjelasan masing-masing variabel adalah sebagai berikut:

Nama Variabel Jenis Variabel Deskripsi Singkat
ID Mahasiswa Kategorikal – Nominal Identitas unik setiap mahasiswa peserta kelas intensif statistik
Minggu ke- Numerik – Jangka Waktu Menunjukkan urutan minggu pelaksanaan pembelajaran
Materi Pembelajaran Kategorikal – Nominal Topik statistik yang dipelajari
Mode Pembelajaran Kategorikal – Nominal Metode pembelajaran yang digunakan (luring atau daring)
Durasi Belajar (Menit) Numerik – Kontinu Durasi waktu belajar peserta dalam satuan menit
Skor Fokus Numerik – Diskrit Skor tingkat fokus mahasiswa selama proses pembelajaran
Skor Kuis 1 Numerik – Kontinu Nilai kuis yang diperoleh sebelum mengikuti kelas intensif
Skor Kuis 2 Numerik – Kontinu Nilai kuis yang diperoleh setelah mengikuti kelas intensif
Tingkat Kepuasan Kategorikal – Ordinal Tingkat kepuasan mahasiswa terhadap proses pembelajaran

Tabel Dataset

Visualisasi Statistika Dasar

## Column

Diagram Lingkaran

Pada analisis ini, visualisasi menggunakan pie chart dipilih karena bertujuan untuk menampilkan proporsi tingkat kepuasan mahasiswa pada setiap kategori secara jelas dan mudah dipahami. Pie chart efektif digunakan untuk menunjukkan perbandingan persentase antar kategori dalam satu variabel kategorikal, sehingga memudahkan pembaca dalam melihat distribusi kepuasan mahasiswa secara keseluruhan.

Interpretasi Visualisasi

Tingkat kepuasan mahasiswa menggambarkan sejauh mana mahasiswa merasa puas terhadap proses pembelajaran yang telah diterapkan. Berdasarkan pie chart di samping, mayoritas mahasiswa berada pada kategori “Puas” dan “Sangat Puas”, yang menunjukkan bahwa sebagian besar mahasiswa memiliki persepsi positif terhadap kualitas pembelajaran.

Namun demikian, masih terdapat mahasiswa yang berada pada kategori “Cukup Puas” dan “Tidak Puas”, yang menandakan bahwa meskipun tingkat kepuasan secara umum sudah baik, tetap diperlukan upaya peningkatan kualitas pembelajaran secara berkelanjutan.

Diagram Batang

Diagram Garis

Line chart digunakan pada analisis ini karena mampu menampilkan perubahan nilai rata-rata skor kuis dari waktu ke waktu secara jelas. Visualisasi ini bertujuan untuk membandingkan tren skor kuis sebelum dan sesudah pembelajaran setiap minggu, sehingga memudahkan dalam mengamati pola peningkatan atau penurunan hasil belajar mahasiswa.

Interpretasi Visualisasi

Berdasarkan grafik, rata-rata skor kuis sesudah pembelajaran selalu lebih tinggi dibandingkan sebelum pembelajaran pada setiap minggu pengamatan. Hal ini menunjukkan bahwa pembelajaran yang diberikan memberikan dampak positif terhadap peningkatan hasil belajar. Peningkatan skor terlihat semakin stabil setelah minggu ke-7.

Sentral Tendensi

Analisis central tendency digunakan untuk menggambarkan nilai pusat dari skor kuis sesudah pembelajaran. Ukuran seperti mean dan median membantu mengetahui skor yang paling mewakili performa mahasiswa secara keseluruhan serta menilai kecenderungan umum hasil belajar setelah proses pembelajaran.

Interpretasi Histogram
Histogram menunjukkan bahwa skor kuis sesudah pembelajaran terkonsentrasi pada nilai tinggi (sekitar 90–98). Distribusi tampak sedikit miring ke kiri, ditandai dengan nilai mean yang lebih kecil dari median, yang mengindikasikan adanya beberapa skor rendah meskipun mayoritas mahasiswa memperoleh nilai tinggi.

Interpretasi Boxplot
Boxplot menunjukkan median skor yang tinggi dengan rentang antar kuartil yang relatif sempit, menandakan konsistensi hasil belajar. Terdapat beberapa outlier pada skor rendah, yang menunjukkan sebagian kecil mahasiswa memiliki capaian di bawah mayoritas peserta.

Berdasarkan kedua visualisasi, skor kuis mahasiswa umumnya berada pada nilai tinggi dan relatif konsisten, menunjukkan efektivitas pembelajaran yang diterapkan. Meskipun terdapat beberapa nilai pencilan yang rendah, secara keseluruhan hasil belajar tetap terpusat pada skor tinggi, dengan kebutuhan pendampingan bagi sebagian kecil mahasiswa.

Statistik Dispersi

Pada analisis ini, ukuran penyebaran digunakan untuk melihat seberapa beragam skor kuis sesudah pembelajaran pada setiap mode dan materi pembelajaran. Analisis ini bertujuan untuk menilai tingkat konsistensi hasil belajar mahasiswa, bukan hanya melihat nilai rata-rata.

Histogram
Histogram menunjukkan distribusi skor kuis sesudah pada mode pembelajaran luring dan daring. Meskipun rata-rata skor relatif berdekatan, bentuk kurva density memperlihatkan perbedaan tingkat variasi penyebaran skor antar mode pembelajaran, yang menunjukkan bahwa tingkat konsistensi hasil belajar mahasiswa dapat berbeda tergantung pada mode pembelajaran yang digunakan.

Violin & Boxplot
Violin plot dan boxplot menunjukkan bahwa penyebaran skor kuis sesudah berbeda pada setiap materi pembelajaran. Violin yang lebih lebar menandakan variasi skor yang lebih tinggi, sedangkan boxplot dengan IQR yang lebih sempit menunjukkan hasil belajar yang lebih konsisten, meskipun masih terdapat beberapa nilai pencilan yang menandakan adanya mahasiswa dengan capaian yang jauh di bawah mayoritas.

Distribusi Probabilitas

Pada analisis ini, distribusi probabilitas digunakan untuk melihat pola sebaran skor kuis sesudah pembelajaran pada setiap mode pembelajaran. Analisis ini bertujuan untuk memahami bagaimana peluang mahasiswa memperoleh skor tertentu tersebar dalam data, sehingga tidak hanya berfokus pada nilai rata-rata, tetapi juga pada pola dan konsistensi capaian hasil belajar.

Interpretasi Visual:

Violin plot menunjukkan distribusi probabilitas skor kuis sesudah berdasarkan mode pembelajaran daring dan luring. Lebar violin merepresentasikan kepadatan data, sehingga bagian yang lebih lebar menunjukkan peluang mahasiswa memperoleh skor pada rentang nilai tertentu lebih besar.

Boxplot di dalam violin memperlihatkan nilai median dan rentang antar kuartil (IQR), yang menggambarkan sebaran utama skor kuis sesudah, sementara titik mean merepresentasikan nilai harapan (expected value).

Perbedaan bentuk dan lebar sebaran antara pembelajaran daring dan luring menunjukkan variasi pola distribusi peluang serta tingkat konsistensi capaian skor, meskipun secara umum kedua mode pembelajaran sama-sama menunjukkan kecenderungan hasil belajar yang relatif baik.

Interval Keyakinan

## Column

Studi Kasus dan Identifikasi Uji

Studi Kasus Dataset:

Program kelas intensif statistik diikuti oleh mahasiswa untuk meningkatkan pemahaman materi statistika. Setelah menyelesaikan program, mahasiswa mengikuti kuis evaluasi.
Berdasarkan data skor kuis sesudah mengikuti kelas, dilakukan perhitungan interval keyakinan 95% untuk mengestimasi rata-rata skor kuis mahasiswa yang mengikuti program kelas intensif statistik.

Identifikasi Metode dan Uji Statistik yang Tepat:

Analisis ini bertujuan untuk mengestimasi rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik. Sehingga sampel pada analisis ini terdiri dari 50 skor kuis mahasiswa setelah mengikuti kelas, di mana setiap skor merepresentasikan hasil kuis satu mahasiswa.

Karena data yang digunakan merupakan data sampel dan simpangan baku populasi tidak diketahui, maka interval keyakinan untuk rata-rata dihitung menggunakan distribusi t dengan simpangan baku sampel. Interval keyakinan 95% digunakan karena tingkat keyakinan ini umum dipakai dan memberikan estimasi rata-rata yang cukup akurat tanpa menghasilkan interval yang terlalu lebar.

Persiapan Perhitungan Analisis

Rata-rata sampel (\(\bar{x}\)): \[ \begin{aligned} \bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348 \end{aligned} \] Simpangan Baku Sampel: \[ \begin{aligned} s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{ \frac{1131.078}{49}} = 4.804501 \end{aligned} \] Derajat Kebebasan: \(df = n - 1 = 50 - 1 = 49\)

Hitungan dan Visualisasi

Hitung Interval Keyakinan 95% Menggunakan Rumus \(t = \bar{x} \pm t_{\alpha/2,\,df}\left(\frac{s}{\sqrt{n}}\right)\)

Hitung \(t_{\alpha/2,\,df}\) untuk tingkat keyakinan 95% \[ \begin{aligned} \alpha &= 1 - 0.95 = 0.05 \\ \alpha/2 &= 0.025 \\ df &= 49 \\ t_{0.025,49} &= 2.009575 \end{aligned} \] Hitung Kesalahan Margin \[ \begin{aligned} ME &= t_{\alpha/2,df}\left(\frac{s}{\sqrt{n}}\right) = 2.009575\left(\frac{4.804501}{\sqrt{50}}\right) = 1.3654 \end{aligned} \] Interval Keyakinan 95% adalah: \[ \begin{aligned} CI_{95\%} &= \bar{x} \pm ME \\ UCI &= 92.5348 + 1.3654 = 93.9002 \\ LCI &= 92.5348 - 1.3654 = 91.1698 \\ CI_{95\%} &= (93.8998,\; 91.1694) \end{aligned} \]

Hitung Interval Keyakinan 95% Menggunakan Kode R

CL Alpha Mean SD t SE MoE LCI UCI
95% 0.05 92.5348 4.8045 2.01 0.6795 1.3654 91.1694 93.9002

Kesimpulan Analisis

Hasil Interval Keyakinan

Berdasarkan perhitungan interval keyakinan 95%, diperoleh bahwa rata-rata skor kuis mahasiswa setelah mengikuti program kelas intensif statistik berada pada rentang 91.1698 hingga 93.9002. Dengan tingkat keyakinan 95%, dapat diyakini bahwa rata-rata skor kuis populasi mahasiswa berada dalam interval tersebut.

Interpretasi Statistik

Rentang interval yang relatif sempit serta posisi rata-rata sampel yang berada di dalam interval keyakinan menunjukkan bahwa skor kuis sesudah pembelajaran berada pada tingkat yang relatif stabil. Dengan demikian, hasil ini mengindikasikan bahwa capaian pembelajaran pada kelas intensif statistik menunjukkan konsistensi performa antar mahasiswa setelah mengikuti program pembelajaran.

Insight

Hasil interval keyakinan yang diperoleh menunjukkan bahwa sistem pembelajaran pada program kelas intensif statistik memberikan hasil yang relatif konsisten. Dengan demikian, sistem pembelajaran ini perlu dipertahankan serta ditingkatkan agar kualitas dan konsistensi hasil belajar mahasiswa dapat terus terjaga pada periode pembelajaran berikutnya.

Statistik Inferensi

## Column

Studi Kasus dan Identifikasi Uji

Studi Kasus Dataset:

Program kelas intensif statistik menerapkan evaluasi berupa kuis sesudah pembelajaran untuk mengukur perubahan hasil belajar mahasiswa.Berdasarkan data skor kuis mahasiswa setelah mengikuti kelas intensif statistika, dilakukan pengujian hipotesis untuk mengetahui apakah rata-rata skor kuis mahasiswa secara signifikan lebih tinggi dari nilai 80.

Identifikasi Uji

Uji statistik yang digunakan adalah uji t satu sampel satu sisi.
Uji ini dipilih karena tujuan analisis adalah untuk menguji apakah rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan lebih tinggi dari nilai acuan 80 berdasarkan satu sampel data mahasiswa. Data yang digunakan merupakan data sampel, dan simpangan baku populasi tidak diketahui, sehingga simpangan baku diestimasi menggunakan simpangan baku sampel.

Taraf signifikansi yang digunakan adalah \(α = 0,05\), karena merupakan tingkat signifikansi yang umum digunakan dalam penelitian statistik. Pengujian dilakukan satu sisi karena fokus analisis adalah untuk menguji apakah rata-rata skor lebih besar dari 80, bukan sekadar berbeda.

Menentukan Hipotesis

Dalam studi kasus ini, nilai 80 digunakan sebagai nilai pembanding (baseline) yang merepresentasikan standar pencapaian skor kuis yang diharapkan.

  • Hipotesis Nol (H₀):
    Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika sama dengan atau tidak lebih tinggi dari 80. \[ H_0 : \mu \le 80 \]

  • Hipotesis Alternatif (H₁):
    Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika lebih tinggi dari 80. \[ H_1 : \mu > 80 \]

Perhitungan Uji T & Kesimpulan

Rata-rata sampel (\(\bar{x}\)): \[ \begin{aligned} \bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348 \end{aligned} \] Simpangan Baku Sampel: \[ \begin{aligned} s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{ \frac{1131.078}{49}} = 4.804501 \end{aligned} \] Standar Kesalahan: \[ \begin{aligned} SE &= \frac{s}{\sqrt{n}} = \frac{4.804501}{\sqrt{50}} = 0.679 \end{aligned} \]

Statistik Uji t:
\[ \begin{aligned} t &= \frac{\bar{x} - \mu_0}{SE} = \frac{92.5348 - 80}{0.679} = \frac{12.5348}{0.679} \approx 18.45 \end{aligned} \]

n Mean SD SE t_statistic df p_value Alpha Keputusan
50 92.5348 4.8045 0.6795 18.4482 49 0 0.05 Tolak H0

Hitung p-value:
Rumus p-value uji t satu arah adalah: \(\begin{aligned} p\text{-value} &= P(t \ge t_{\text{hitung}}) \end{aligned}\) dengan derajat kebebasan \(df = 49\), maka

\[ \begin{aligned} p\text{-value} &= P\left(t_{49} \ge 18.45\right) \end{aligned} \]

Hasil perhitungan menggunakan kode R memberikan nilai: \(\begin{aligned} p\text{-value} &= 5.206043 \times 10^{-24} \end{aligned}\)

Nilai tersebut sangat kecil dan secara praktis dapat dinyatakan sebagai: \(\begin{aligned} p\text{-value} &< 0.0001 \end{aligned}\)

Kesimpulan

Karena nilai \(p\)-value jauh lebih kecil dari tingkat signifikansi yang digunakan, yaitu \(\alpha = 0.05\), maka keputusan yang diambil adalah menolak hipotesis nol (\(H_0\)).

Dengan demikian, terdapat bukti statistik yang sangat kuat untuk menyimpulkan bahwa rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan lebih tinggi dari 80.

Hasil ini menunjukkan bahwa program kelas intensif statistik memberikan dampak positif yang signifikan terhadap peningkatan skor kuis mahasiswa. Oleh karena itu, hasil ini mengindikasikan bahwa pendekatan kelas intensif statistik layak untuk dipertahankan sebagai metode pembelajaran dalam meningkatkan performa akademik mahasiswa.

Metode Nonparametrik

## Column

Studi Kasus dan Identifikasi Uji

Studi Kasus

Sebuah program kelas intensif statistika berlangsung selama 12 minggu dengan evaluasi berupa kuis mingguan. Untuk menilai efektivitas program, dilakukan pengukuran skor kuis sebelum dan sesudah mengikuti kelas pada kelompok mahasiswa yang sama.

Hipotesis

\[\begin{aligned} H_0 &: \text{Median perbedaan skor kuis sebelum dan sesudah} = 0 \\ H_1 &: \text{Median perbedaan skor kuis sebelum dan sesudah} \neq 0 \end{aligned}\]

Alasan Menggunakan Analisis Nonparametrik

Berdasarkan hasil uji asumsi, data skor kuis tidak berdistribusi normal, sehingga metode parametrik seperti uji-t berpasangan tidak memenuhi syarat. Oleh karena itu, digunakan pendekatan nonparametrik yang lebih sesuai dengan karakteristik data.

Tujuan Analisis

Tujuan analisis ini adalah untuk mengetahui apakah terdapat perbedaan median skor kuis mahasiswa sebelum dan sesudah mengikuti kelas intensif statistika.

Alasan menggunakan Uji Wilcoxon

Uji Wilcoxon Signed-Rank dipilih karena sesuai untuk membandingkan dua pengukuran berpasangan pada kelompok yang sama ketika asumsi normalitas tidak terpenuhi. Metode ini mempertimbangkan arah dan besar perbedaan, sehingga memberikan hasil yang lebih kuat dibandingkan uji tanda.

Step Wilcoxon

Langkah 1: Menghitung Perbedaan Berpasangan

Pada langkah ini, dihitung perbedaan skor kuis sebelum dan sesudah pembelajaran untuk setiap mahasiswa. Perbedaan berpasangan didefinisikan sebagai selisih antara skor kuis sesudah dan skor kuis sebelum pembelajaran.

id_mahasiswa skor_kuis_sebelum skor_kuis_sesudah perbedaan
M001 81.28 92.81 11.53
M002 75.42 87.57 12.15
M003 83.46 97.34 13.88
M004 83.92 96.90 12.98
M005 77.96 91.12 13.16
M006 76.07 92.82 16.75
M007 81.43 98.87 17.44
M008 76.01 86.57 10.56
M009 79.25 90.92 11.67
M010 81.06 96.43 15.37
M011 83.37 96.24 12.87
M012 86.94 98.97 12.03
M013 78.17 90.53 12.36
M014 73.46 86.04 12.58
M015 79.68 96.47 16.79
M016 83.80 94.89 11.09
M017 71.06 86.73 15.67
M018 77.81 92.23 14.42
M019 79.79 92.16 12.37
M020 70.26 83.62 13.36
M021 84.66 96.71 12.05
M022 81.65 96.54 14.89
M023 81.26 91.91 10.65
M024 73.46 83.50 10.04
M025 81.93 96.95 15.02
M026 81.39 92.94 11.55
M027 69.38 79.95 10.57
M028 85.36 98.53 13.17
M029 85.76 96.17 10.41
M030 73.96 91.05 17.09
M031 87.01 97.23 10.22
M032 82.71 97.34 14.63
M033 67.95 81.46 13.51
M034 79.77 95.15 15.38
M035 83.87 96.50 12.63
M036 85.62 96.86 11.24
M037 79.99 97.84 17.85
M038 77.51 94.22 16.71
M039 71.11 87.99 16.88
M040 84.35 96.35 12.00
M041 80.53 90.84 10.31
M042 75.34 87.77 12.43
M043 83.44 97.74 14.30
M044 75.30 87.91 12.61
M045 74.37 90.99 16.62
M046 74.94 87.11 12.17
M047 74.00 91.72 17.72
M048 79.28 92.94 13.66
M049 77.64 94.38 16.74
M050 79.36 90.92 11.56

Langkah 2: Hapus Perbedaan Nol

Pada langkah ini, observasi dengan nilai perbedaan sama dengan nol dihapus dari analisis, karena pasangan dengan perbedaan nol tidak memberikan informasi mengenai arah perubahan.

id_mahasiswa skor_kuis_sebelum skor_kuis_sesudah perbedaan
M001 81.28 92.81 11.53
M002 75.42 87.57 12.15
M003 83.46 97.34 13.88
M004 83.92 96.90 12.98
M005 77.96 91.12 13.16
M006 76.07 92.82 16.75
M007 81.43 98.87 17.44
M008 76.01 86.57 10.56
M009 79.25 90.92 11.67
M010 81.06 96.43 15.37
M011 83.37 96.24 12.87
M012 86.94 98.97 12.03
M013 78.17 90.53 12.36
M014 73.46 86.04 12.58
M015 79.68 96.47 16.79
M016 83.80 94.89 11.09
M017 71.06 86.73 15.67
M018 77.81 92.23 14.42
M019 79.79 92.16 12.37
M020 70.26 83.62 13.36
M021 84.66 96.71 12.05
M022 81.65 96.54 14.89
M023 81.26 91.91 10.65
M024 73.46 83.50 10.04
M025 81.93 96.95 15.02
M026 81.39 92.94 11.55
M027 69.38 79.95 10.57
M028 85.36 98.53 13.17
M029 85.76 96.17 10.41
M030 73.96 91.05 17.09
M031 87.01 97.23 10.22
M032 82.71 97.34 14.63
M033 67.95 81.46 13.51
M034 79.77 95.15 15.38
M035 83.87 96.50 12.63
M036 85.62 96.86 11.24
M037 79.99 97.84 17.85
M038 77.51 94.22 16.71
M039 71.11 87.99 16.88
M040 84.35 96.35 12.00
M041 80.53 90.84 10.31
M042 75.34 87.77 12.43
M043 83.44 97.74 14.30
M044 75.30 87.91 12.61
M045 74.37 90.99 16.62
M046 74.94 87.11 12.17
M047 74.00 91.72 17.72
M048 79.28 92.94 13.66
M049 77.64 94.38 16.74
M050 79.36 90.92 11.56

Langkah 3: Peringkat Perbedaan Absolut

Pada langkah ini, dihitung nilai absolut dari perbedaan berpasangan. Selanjutnya, nilai absolut tersebut diberi peringkat dari yang terkecil hingga terbesar. Jika terdapat nilai yang sama (ties), maka diberikan peringkat rata-rata.

id_mahasiswa skor_kuis_sebelum skor_kuis_sesudah perbedaan abs_perbedaan peringkat
M001 81.28 92.81 11.53 11.53 10
M002 75.42 87.57 12.15 12.15 17
M003 83.46 97.34 13.88 13.88 32
M004 83.92 96.90 12.98 12.98 26
M005 77.96 91.12 13.16 13.16 27
M006 76.07 92.82 16.75 16.75 44
M007 81.43 98.87 17.44 17.44 48
M008 76.01 86.57 10.56 10.56 5
M009 79.25 90.92 11.67 11.67 13
M010 81.06 96.43 15.37 15.37 38
M011 83.37 96.24 12.87 12.87 25
M012 86.94 98.97 12.03 12.03 15
M013 78.17 90.53 12.36 12.36 19
M014 73.46 86.04 12.58 12.58 22
M015 79.68 96.47 16.79 16.79 45
M016 83.80 94.89 11.09 11.09 8
M017 71.06 86.73 15.67 15.67 40
M018 77.81 92.23 14.42 14.42 34
M019 79.79 92.16 12.37 12.37 20
M020 70.26 83.62 13.36 13.36 29
M021 84.66 96.71 12.05 12.05 16
M022 81.65 96.54 14.89 14.89 36
M023 81.26 91.91 10.65 10.65 7
M024 73.46 83.50 10.04 10.04 1
M025 81.93 96.95 15.02 15.02 37
M026 81.39 92.94 11.55 11.55 11
M027 69.38 79.95 10.57 10.57 6
M028 85.36 98.53 13.17 13.17 28
M029 85.76 96.17 10.41 10.41 4
M030 73.96 91.05 17.09 17.09 47
M031 87.01 97.23 10.22 10.22 2
M032 82.71 97.34 14.63 14.63 35
M033 67.95 81.46 13.51 13.51 30
M034 79.77 95.15 15.38 15.38 39
M035 83.87 96.50 12.63 12.63 24
M036 85.62 96.86 11.24 11.24 9
M037 79.99 97.84 17.85 17.85 50
M038 77.51 94.22 16.71 16.71 42
M039 71.11 87.99 16.88 16.88 46
M040 84.35 96.35 12.00 12.00 14
M041 80.53 90.84 10.31 10.31 3
M042 75.34 87.77 12.43 12.43 21
M043 83.44 97.74 14.30 14.30 33
M044 75.30 87.91 12.61 12.61 23
M045 74.37 90.99 16.62 16.62 41
M046 74.94 87.11 12.17 12.17 18
M047 74.00 91.72 17.72 17.72 49
M048 79.28 92.94 13.66 13.66 31
M049 77.64 94.38 16.74 16.74 43
M050 79.36 90.92 11.56 11.56 12

Langkah 4: Menentukan Tanda Peringkat

Pada langkah ini, tanda peringkat ditentukan berdasarkan arah perbedaan. Jika perbedaan bernilai positif, maka peringkat diberi tanda positif. Jika perbedaan bernilai negatif, maka peringkat diberi tanda negatif.

id_mahasiswa skor_kuis_sebelum skor_kuis_sesudah perbedaan abs_perbedaan peringkat peringkat_bertanda
M001 81.28 92.81 11.53 11.53 10 10
M002 75.42 87.57 12.15 12.15 17 17
M003 83.46 97.34 13.88 13.88 32 32
M004 83.92 96.90 12.98 12.98 26 26
M005 77.96 91.12 13.16 13.16 27 27
M006 76.07 92.82 16.75 16.75 44 44
M007 81.43 98.87 17.44 17.44 48 48
M008 76.01 86.57 10.56 10.56 5 5
M009 79.25 90.92 11.67 11.67 13 13
M010 81.06 96.43 15.37 15.37 38 38
M011 83.37 96.24 12.87 12.87 25 25
M012 86.94 98.97 12.03 12.03 15 15
M013 78.17 90.53 12.36 12.36 19 19
M014 73.46 86.04 12.58 12.58 22 22
M015 79.68 96.47 16.79 16.79 45 45
M016 83.80 94.89 11.09 11.09 8 8
M017 71.06 86.73 15.67 15.67 40 40
M018 77.81 92.23 14.42 14.42 34 34
M019 79.79 92.16 12.37 12.37 20 20
M020 70.26 83.62 13.36 13.36 29 29
M021 84.66 96.71 12.05 12.05 16 16
M022 81.65 96.54 14.89 14.89 36 36
M023 81.26 91.91 10.65 10.65 7 7
M024 73.46 83.50 10.04 10.04 1 1
M025 81.93 96.95 15.02 15.02 37 37
M026 81.39 92.94 11.55 11.55 11 11
M027 69.38 79.95 10.57 10.57 6 6
M028 85.36 98.53 13.17 13.17 28 28
M029 85.76 96.17 10.41 10.41 4 4
M030 73.96 91.05 17.09 17.09 47 47
M031 87.01 97.23 10.22 10.22 2 2
M032 82.71 97.34 14.63 14.63 35 35
M033 67.95 81.46 13.51 13.51 30 30
M034 79.77 95.15 15.38 15.38 39 39
M035 83.87 96.50 12.63 12.63 24 24
M036 85.62 96.86 11.24 11.24 9 9
M037 79.99 97.84 17.85 17.85 50 50
M038 77.51 94.22 16.71 16.71 42 42
M039 71.11 87.99 16.88 16.88 46 46
M040 84.35 96.35 12.00 12.00 14 14
M041 80.53 90.84 10.31 10.31 3 3
M042 75.34 87.77 12.43 12.43 21 21
M043 83.44 97.74 14.30 14.30 33 33
M044 75.30 87.91 12.61 12.61 23 23
M045 74.37 90.99 16.62 16.62 41 41
M046 74.94 87.11 12.17 12.17 18 18
M047 74.00 91.72 17.72 17.72 49 49
M048 79.28 92.94 13.66 13.66 31 31
M049 77.64 94.38 16.74 16.74 43 43
M050 79.36 90.92 11.56 11.56 12 12

Step Wilcoxon & Interpretasi

Langkah 5: Menghitung Statistik Uji

Pada langkah ini, dihitung jumlah peringkat bertanda positif (W⁺) dan jumlah peringkat bertanda negatif (W⁻). Statistik uji Wilcoxon didefinisikan sebagai nilai minimum dari W⁺ dan W⁻.

W_Positif W_Negatif Statistik_Uji_W
1275 0 0

Langkah 6: Pengambilan Keputusan

Pada langkah ini, dilakukan uji Wilcoxon Signed-Rank menggunakan fungsi wilcox.test() di R. Keputusan diambil berdasarkan nilai p-value dengan tingkat signifikansi \(α = 0.05\). Jika p-value \(< α\), maka H₀ ditolak.

Statistik_Uji P_Value Keputusan
V 1275 0 Tolak H₀

Interpretasi Statistik

Jika p-value < 0.05, maka hipotesis nol (H₀) ditolak, yang berarti terdapat perbedaan median skor kuis sebelum dan sesudah mengikuti kelas intensif statistika. Hal ini menunjukkan bahwa program kelas intensif statistika memberikan pengaruh yang signifikan terhadap perubahan skor kuis mahasiswa.

Secara praktis, hasil ini mengindikasikan bahwa pendekatan pembelajaran yang diterapkan dalam program tersebut efektif dalam meningkatkan pemahaman mahasiswa terhadap materi statistika. Oleh karena itu, program kelas intensif dapat dipertahankan dan dipertimbangkan untuk dikembangkan lebih lanjut sebagai strategi pembelajaran yang mendukung peningkatan prestasi akademik.

---
title: "UAS StatDas"
output: 
  flexdashboard::flex_dashboard:
    vertical_layout: scroll
    theme: yeti
    source_code: embed
    css: style.uas.css
---

  
```{r setup, include=FALSE}
packages <- c(
  "flexdashboard",
  "tidyverse",
  "highcharter",
  "viridis",
  "DT",
  "gapminder",
  "jsonlite"
)

installed <- packages %in% rownames(installed.packages())
if (any(!installed)) {
  install.packages(packages[!installed])
}

# Load library
library(flexdashboard)
library(tidyverse)
library(highcharter)
library(viridis)
library(DT)
library(gapminder)
library(jsonlite)
```

Anggota Kelompok {data-orientation=rows}
=======================================================================

## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

<div class="members-container">

<div class="members-left">
<img src="logo_ITSB.png" class="logo">
<div class="student-tags">
<span class="tag blue">R Programming</span>
<span class="tag navy">Statistics</span>
</div>
<div class="student-assignment"><b>Final Exam – Mr. Bakti Siregar, M.Sc., CDS</b></div>
<div class="student-info">
<div class="group-title">Foto Kelompok</div>
</div><img src="gurlspict.jpeg" class="group-photo"></div>

<div class="members-divider"></div>
<div class="members-grid">

<div class="member-card">
<img src="FotoAngel.jpeg" class="member-photo">
<div class="member-info">
<b>Angelique Kiyoshi Lakeisha Bahrul Ulum</b>
<p>NIM: 52250001</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 9 & 10</li>
<li>Interval Keyakinan</li>
<li>Bagian Dataset</li>
<li>Desain Kartu Anggota Kelompok</li>
</ul>
</div>
</div>

<div class="member-card">
<img src="fotonisa.jpg" class="member-photo">
<div class="member-info">
<b>Khafizatun Nisa</b>
<p>NIM: 52250018</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 1 & 2</li>
<li>Visualisasi Statistika Dasar (Sentral Tendensi, Dispersi Statistik, Distribusi Probabilitas)</li>
</ul>
</div>
</div>

<div class="member-card">
<img src="fotoadel.jpg" class="member-photo">
<div class="member-info">
<b>Naychilla Adelia Zahrah</b>
<p>NIM: 52250004</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 7 & 8</li>
<li>Metode Nonparametrik</li>
</ul>
</div>
</div>

<div class="member-card">
<img src="fotonara.jpg" class="member-photo">
<div class="member-info">
<b>Nakeisha Aulia Zahra</b>
<p>NIM: 52250023</p>
<div class="member-line"></div> 
<ul class="member-task">
<li>Ringkasan Bab 5 & 6</li>
<li>Visualisasi Statistika Dasar (Diagram Lingkaran, Batang, dan Garis)</li>
<li>Desain Foto Kelompok</li>
</ul>
</div>
</div>
</div>

<div class="member-tall">
<img src="fotovero.jpg">
<h3><b>Veronica Maria Lucia Ferreira Xavier</b></h3>
<p>NIM: 52250021</p>
<div class="member-line"></div>
<ul class="member-task">
<li>Ringkasan Bab 3 & 4</li>
<li>Inferensi Statistik</li>
</ul>
</div>
</div>


Ringkasan Statistika Dasar {data-orientation=rows}
=======================================================================
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Bab 1 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistik adalah ilmu yang mempelajari metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data untuk menghasilkan informasi yang bermakna serta mendukung pengambilan keputusan di bawah kondisi ketidakpastian.
Statistik digunakan untuk memahami pola dan variasi dalam data, serta untuk menarik kesimpulan dan membuat prediksi mengenai suatu populasi berdasarkan data yang tersedia.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Permasalahan Statistik Utama</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Permasalahan statistik utama berkaitan dengan bagaimana data dapat diolah dan dianalisis secara sistematis agar menghasilkan informasi yang akurat dan dapat dipercaya. Data yang tersedia sering kali mengandung variasi, ketidakpastian, serta jumlah yang besar, sehingga diperlukan metode statistik untuk merangkum data, memahami pola yang muncul, dan mengurangi kesalahan dalam penarikan kesimpulan. Statistik membantu menjembatani data mentah menjadi dasar yang rasional dalam pengambilan keputusan.
:::
</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Jenis Statistik yang Digunakan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistik secara umum terbagi menjadi dua jenis utama, yaitu statistik deskriptif dan statistik inferensial. Statistik deskriptif digunakan untuk menggambarkan dan meringkas data melalui ukuran pemusatan, ukuran penyebaran, serta visualisasi data. Sementara itu, statistik inferensial digunakan untuk menarik kesimpulan atau membuat estimasi mengenai suatu populasi berdasarkan data sampel, dengan memanfaatkan konsep peluang, interval kepercayaan, dan pengujian hipotesis.
:::

</div>
</div>


### Bab 2 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Eksplorasi Data adalah tahap awal analisis statistik untuk memahami karakteristik, struktur, dan kualitas data sebelum analisis lanjutan, sehingga membantu menghindari kesalahan interpretasi dan menghasilkan keputusan yang lebih akurat.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Jenis Variabel Data</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
```{r}
library(knitr)
library(kableExtra)

data_tipe <- data.frame(
  `Jenis Data` = c("Data Numerik (Kuantitatif)", 
                   "Data Numerik (Kuantitatif)",
                   "Data Kategorikal (Kualitatif)",
                   "Data Kategorikal (Kualitatif)"),
  
  `Bentuk Data` = c("Berupa angka",
                    "Berupa angka",
                    "Berupa kategori",
                    "Berupa kategori"),
  
  `Tipe` = c("Diskrit",
              "Kontinu",
              "Nominal",
              "Ordinal"),
  
  `Deskripsi` = c("Data hasil hitungan, biasanya berupa bilangan bulat",
                  "Data hasil pengukuran, dapat berupa bilangan pecahan",
                  "Data kategori tanpa urutan tertentu",
                  "Data kategori yang memiliki urutan atau tingkatan")
)

kable(
  data_tipe,
  align = "l"
) %>%
  kable_styling(
    bootstrap_options = c("hover", "condensed"),
    full_width = TRUE
  ) %>%
  column_spec(1, background = "#e7f0ff", bold = TRUE) %>%
  column_spec(2, background = "#e7f0ff") %>%
  column_spec(3, background = "#e7f0ff") %>%
  column_spec(4, background = "#e7f0ff") %>%
  collapse_rows(columns = c(1, 2), valign = "middle")

```
:::
</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Deskripsi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada tahap eksplorasi data, variabel numerik diringkas menggunakan statistik deskriptif untuk memberikan gambaran awal terhadap data. Ringkasan statistik ini meliputi ukuran pemusatan seperti mean dan median, serta ukuran penyebaran seperti nilai minimum, maksimum, range, varians, dan standar deviasi.

Selain itu, eksplorasi data juga bertujuan untuk mengidentifikasi pola awal, yaitu kecenderungan umum yang muncul dalam data, tren, yaitu perubahan nilai data apabila diamati berdasarkan urutan tertentu, serta anomali (outlier), yaitu nilai yang menyimpang jauh dari sebagian besar data. Informasi ini menjadi dasar penting dalam memahami perilaku data dan menentukan metode analisis statistik selanjutnya.
:::

</div>
</div>


### Bab 3 {data-width=1200}

::: {.text-justify}
**Visualisasi data** adalah proses mengubah data mentah menjadi informasi yang 
jelas dan bermakna, sehingga mudah dipahami dan membantu penyampaian pesan
secara tepat.
:::

<div class="chapter3-grid">

<div class="chapter3-box">
<h4>Line Chart</h4>
Line chart adalah alat visualisasi data yang digunakan untuk menunjukkan bagaimana nilai berubah secara berurutan, biasanya dari waktu ke waktu.

**Contoh Kasus**: Menampilkan tren penjualan bulanan toko online selama tahun 2024 untuk melihat bulan mana yang memiliki performa terbaik.

```{r}
library(plotly)

# Data: Penjualan per bulan
sales_trend <- data.frame(
  Bulan = c("Jan", "Feb", "Mar", "Apr", "Mei", "Jun", 
            "Jul", "Agu", "Sep", "Oct", "Nov", "Des"),
  Total_Penjualan = c(15, 18, 22, 19, 25, 28, 26, 30, 32, 29, 35, 40)
)

plot_ly(
  data = sales_trend,
  x = ~Bulan,
  y = ~Total_Penjualan,
  type = 'scatter',
  mode = 'lines+markers',
  line = list(color = 'steelblue', width = 2.5),
  marker = list(
    color = 'darkorange', 
    size = 7,
    line = list(color = 'white', width = 1.5)
  ),
  hovertemplate = paste(
    '<b>%{x}</b><br>',
    'Penjualan: Rp %{y} juta<br>',
    '<extra></extra>'
  )
) %>%
  layout(
    title = list(
      text = "<b>Tren Penjualan Bulanan 2024</b>",
      font = list(size = 14, color = '#2c3e50')
    ),
    xaxis = list(
      title = "<b>Bulan</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10)
    ),
    yaxis = list(
      title = "<b>Penjualan (juta IDR)</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10)
    ),
    hovermode = 'x unified',
    plot_bgcolor = '#ffffff',
    paper_bgcolor = '#f8f9fa',
    width = 500,
    height = 300,
    margin = list(l = 50, r = 20, t = 50, b = 40)
  )
```

</div>

<div class="chapter3-box">
<h4>Bar Chart</h4>
Bar chart adalah grafik batang untuk menampilkan data kategorikal. Tinggi atau panjang batang menunjukkan nilai tiap kategori sehingga mudah dibandingkan.

**Contoh Kasus**: Membandingkan total penjualan antar kategori produk untuk mengetahui produk mana yang paling laris.

```{r}
library(plotly)

# Data: Penjualan per kategori
sales_kategori <- data.frame(
  Kategori = c("Fashion", "Kecantikan", "Makanan", "Elektronik", "Furniture"),
  Total_Penjualan = c(120, 110, 95, 85, 70)
)
sales_kategori <- sales_kategori %>%
  arrange(desc(Total_Penjualan))

# Buat bar chart
plot_ly(
  data = sales_kategori,
  x = ~Kategori,
  y = ~Total_Penjualan,
  type = 'bar',
  marker = list(
    color = c('#e74c3c', '#9b59b6', '#2ecc71', '#3498db', '#f39c12'),
    line = list(color = 'white', width = 1.5)
  ),
  hovertemplate = paste(
    '<b>%{x}</b><br>',
    'Penjualan: Rp %{y} juta<br>',
    '<extra></extra>'
  )
) %>%
  layout(
    title = list(
      text = "<b>Penjualan per Kategori Produk</b>",
      font = list(size = 14, color = '#2c3e50')
    ),
    xaxis = list(
      title = "<b>Kategori</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10),
      categoryorder = "array",               
      categoryarray = sales_kategori$Kategori 
    ),
    yaxis = list(
      title = "<b>Penjualan (juta IDR)</b>",
      titlefont = list(size = 11),
      tickfont = list(size = 10)
    ),
    plot_bgcolor = '#ffffff',
    paper_bgcolor = '#f8f9fa',
    width = 400,
    height = 285,
    margin = list(l = 50, r = 20, t = 50, b = 40)
  )
```  
</div>


<div class="chapter3-box">
<h4>Histogram</h4>
Histogram adalah grafik batang untuk menunjukkan sebaran data numerik dalam beberapa interval.

**Contoh Kasus** : Distribusi Nilai Ujian Mahasiswa

```{r}
library(plotly)

set.seed(123)

nilai_ujian <- data.frame(
  Nilai = round(rnorm(100, mean = 75, sd = 8))
)

plot_ly(
  data = nilai_ujian,
  x = ~Nilai,
  type = "histogram",
  nbinsx = 12,
  hovertemplate = paste(
    "Nilai: %{x}<br>",
    "Frekuensi: %{y}<extra></extra>"
  ),
  marker = list(
    color = "#3498db",
    line = list(color = "#ffffff", width = 1)
  ),
  opacity = 0.85
) %>%
  layout(
    title = list(
      text = "<b>Distribusi Nilai Ujian Mahasiswa</b>",
      x = 0.5,
      font = list(size = 14)
    ),
    xaxis = list(
      title = "Nilai",
      tickfont = list(size = 10)
    ),
    yaxis = list(
      title = "Frekuensi",
      tickfont = list(size = 10)
    ),
    width = 400,
    height = 300,
    plot_bgcolor = "#f8f9fa",
    paper_bgcolor = "#ffffff",
    margin = list(l = 50, r = 20, t = 50, b = 50)
  )
```
</div>

</div>


### Bab 4  {data-width=1200}

::: {.text-justify}
**Central Tendency** adalah ukuran statistik yang merepresentasikan nilai tipikal atau 
sentral dari dataset. Bertujuan memberikan satu nilai yang paling mewakili keseluruhan data. **Ada Tiga Ukuran Utama yaitu:**
:::

<div class="chapter3-grid">
<div class="chapter3-box">
<h4>Rata-rata</h4>
::: {.text-justify}
Rata-rata adalah nilai yang diperoleh dengan membagi jumlah seluruh data dengan banyaknya data, dan digunakan untuk data bertipe interval dan rasio.

**Rumus:**
$\bar{x} = \frac{\sum x}{n}$
:::
</div>

<div class="chapter3-box">
<h4>Nilai Tengah</h4>
::: {.text-justify}
Nilai Tengah adalah nilai tengah dari data yang telah diurutkan dan cocok digunakan
untuk data bertipe ordinal, interval, dan rasio.

**Rumus:** \(\text{Median} =
\begin{cases}
x_{\left(\frac{n+1}{2}\right)}, & \text{jika } n \text{ ganjil} \\
\frac{x_{\left(\frac{n}{2}\right)} + x_{\left(\frac{n}{2}+1\right)}}{2}, & \text{jika } n \text{ genap}
\end{cases}\)
:::
</div>

<div class="chapter3-box">
<h4>Nilai Tengah</h4>
::: {.text-justify}
Nilai tengah adalah nilai yang paling sering muncul dalam suatu kumpulan data dan dapat 
digunakan untuk data bertipe nominal, ordinal, interval, maupun rasio.

**Rumus:** \(\text{Mode} = x \;\; \text{dengan frekuensi tertinggi}\)
:::
</div>
</div>

<div class="light-box">
<div class="two-column">
<div class="col section-text">

Menghitung ukuran pemusatan data dari nilai siswa pada 2 mata pelajaran:  
- **Nilai Fisika:** 85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70  
- **Nilai Bahasa:** 80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76

**Perhitungan Menggunakan Kode R**

```{r, echo=FALSE, warning=FALSE, message=FALSE, fig.align='center'}
library(dplyr)
library(knitr)
library(kableExtra)

# Data nilai
nilai_fisika <- c(85, 78, 92, 85, 76, 88, 85, 90, 72, 85, 95, 80, 85, 88, 70)
nilai_bahasa <- c(80, 75, 88, 82, 78, 85, 80, 90, 74, 82, 92, 78, 80, 85, 76)

# Fungsi modus
hitung_mode <- function(x) {
  frek <- table(x)
  paste(names(frek)[frek == max(frek)], collapse = ", ")
}

# Tabel sentral tendensi
tabel_sentral <- data.frame(
  Variabel = c("Fisika", "Bahasa Indonesia"),
  Mean     = c(mean(nilai_fisika), mean(nilai_bahasa)),
  Median   = c(median(nilai_fisika), median(nilai_bahasa)),
  Modus    = c(hitung_mode(nilai_fisika), hitung_mode(nilai_bahasa))
)

# Tampilkan tabel (FULL WIDTH & CENTER)
tabel_sentral %>%
  kable(
    digits = 2,
    align = "c"
  ) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    position = "center"
  ) %>%
  row_spec(
    0,
    bold = TRUE,
    color = "white",
    background = "#1f77b4"
  )


```

</div>

<div class="divider"></div>
<div class="col section-text">

**Interpretasi dan Perbandingan Hasil Kedua Nilai Siswa:**   
1. **Rata-rata:** Nilai rata-rata Fisika (83,60) lebih tinggi dibandingkan Bahasa Indonesia (81,67), sehingga performa siswa pada Fisika lebih baik.  
2. **Nilai Tengah:** Median Fisika sebesar 85 lebih tinggi daripada Bahasa Indonesia sebesar 80, menunjukkan nilai tengah Fisika berada pada tingkat lebih tinggi.  
3. **Modus (nilai paling sering muncul):** Modus Fisika adalah 85, sedangkan Bahasa Indonesia 80, yang berarti nilai yang paling sering muncul pada Fisika lebih tinggi.

**Kesimpulan:** Secara keseluruhan, hasil belajar siswa pada mata pelajaran Fisika lebih baik dibandingkan Bahasa Indonesia, baik dilihat dari rata-rata, nilai tengah, maupun nilai yang paling sering muncul.


</div>
</div>
</div>


### Bab 5 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Statistical dispersion adalah ukuran yang menunjukkan seberapa tersebar atau bervariasi data dari suatu kumpulan nilai. Semakin besar nilai dispersi, semakin tidak seragam datanya, sedangkan semakin kecil nilai dispersi, semakin homogen data tersebut.  
Pengukuran tingkat dispersi data umumnya dilakukan menggunakan beberapa ukuran utama, yaitu jangkauan (range), varians, dan simpangan baku
:::
</div>

<div class="chapter5-grid">

<div class="chapter-box">
<h4><b>Range</b></h4>
Range adalah ukuran penyebaran paling sederhana yang menunjukkan selisih antara
nilai maksimum dan minimum dalam data.

**Rumus:**
$Range = X_{max} - X_{min}$ 

**Contoh Perhitungan:**  
Data: 5, 7, 10, 12, 15  
Range = 15 − 5 = **10**  
</div>

<div class="chapter-box">
<h4><b>Varians</b></h4>
**Definisi:**
Varians menunjukkan rata-rata kuadrat selisih setiap data terhadap nilai rata-rata
(mean).

**Rumus:**  
Populasi:  
$\sigma^2 = \frac{\sum (x_i - \mu)^2}{n}$  
Sampel:  
$s^2 = \frac{\sum (x_i - \bar{x})^2}{n - 1}$

**Contoh Perhitungan**  
Diketahui data: 46, 50, 54, 48, 52  
$\bar{X} = \frac{250}{5} = 50$  
$\sum (X_i - \bar{X})^2 = 40$    
$s^2 = \frac{40}{4} = 10$  
</div>

<div class="chapter-box">
<h4><b>Standar Deviasi</b></h4>
<b>Definisi</b><br>
Standar deviasi adalah akar kuadrat dari varians dan menunjukkan rata-rata jarak
data terhadap mean.<br><br>

<b>Rumus</b><br>
$s = \sqrt{s^2}$<br><br>

<b>Contoh Perhitungan</b><br>
$s^2 = 10$<br>
$s = \sqrt{10} \approx 3,16$
</div>

<div class="chapter-box">
<h4><b>Interpretasi Tingkat Penyebaran Data</b></h4>
<ul>
  <li>Range kecil → data tidak terlalu menyebar</li>
  <li>Varians kecil → data mendekati rata-rata</li>
  <li>Standar deviasi kecil → data homogen</li>
  <li>Dispersi besar → data heterogen</li>
</ul>

::: {.text-justify}
Secara umum, ukuran dispersi digunakan untuk menilai tingkat keragaman data dalam suatu kumpulan pengamatan. Nilai range, varians, dan standar deviasi yang relatif kecil menunjukkan bahwa data cenderung terkonsentrasi di sekitar nilai rata-rata, sehingga variasi antar data tidak terlalu besar. Sebaliknya, nilai dispersi yang besar mengindikasikan adanya perbedaan yang cukup signifikan antar nilai pengamatan, yang mencerminkan tingkat heterogenitas data yang lebih tinggi.
:::

</div>

</div>


### Bab 6 {data-width=1200}

<div class="chapter5-grid">

<div class="chapter-box">
<h4><b>Definisi Probabilitas</b></h4>

Probabilitas adalah ukuran peluang terjadinya suatu peristiwa. Nilainya berada antara 0 sampai 1, di mana:  
0 → kejadian mustahil  
1 → kejadian pasti  

Rumus dasar:  
$P(A) = \frac{\text{Jumlah hasil yang menguntungkan}}{\text{Jumlah seluruh hasil dalam ruang sampel}}$
</div>

<div class="chapter-box">
<h4><b>Konsep Dasar & Ruang Sampel</b></h4>

Ruang sampel (S) adalah seluruh kemungkinan hasil dari suatu percobaan.  
Kejadian (event) adalah bagian dari ruang sampel yang diperhatikan.  

Contoh:  
Melempar koin 2 kali:  
$S = \{HH, HT, TH, TT\}$
</div>

<div class="chapter-box">
<h4><b>Aturan Probabilitas</b></h4>
Dua aturan utama:  
- Nilai probabilitas selalu $0 \le P(A) \le 1$  
- Total probabilitas seluruh hasil dalam ruang sampel = 1

<h4><b>Aturan Komplemen</b></h4>

Aturan ini digunakan untuk mencari peluang kejadian tidak terjadi.  
Rumus:  
$P(A^c) = 1 - P(A)$
</div>

<div class="chapter-box">
<h4><b>Kejadian Independen dan Dependen</b></h4>

Independen: satu kejadian tidak memengaruhi kejadian lain.<br>
$P(A \cap B) = P(A) \times P(B)$

Dependen: satu kejadian memengaruhi kejadian berikutnya.<br>
$P(A \cap B) = P(A) \times P(B|A)$
</div>

<div class="chapter-box">
<h4><b>Penyatuan, Saling Lepas, dan Menyeluruh</b></h4>

Gabungan (Union): kejadian A atau B.<br>
$P(A \cup B) = P(A) + P(B) - P(A \cap B)$

Saling lepas (Mutually Exclusive): tidak bisa terjadi bersamaan.<br>
Menyeluruh (Exhaustive): mencakup seluruh ruang sampel.
</div>

<div class="chapter-box">
<h4><b>Percobaan & Distribusi Binomial</b></h4>

Eksperimen binomial memiliki 4 syarat:<br>
Jumlah percobaan tetap<br>
Dua hasil (sukses/gagal)<br>
Peluang sukses tetap<br>
Percobaan saling independen<br><br>

Rumus binomial:<br>
$P(k) = \binom{n}{k} p^k (1-p)^{n-k}$
</div>

<div class="chapter-box">
<h4><b>Contoh Kejadian</b></h4>
Muncul setidaknya satu Ekor saat koin dilempar 2 kali

**Ruang Sampel**
$S = \{HH, HT, TH, TT\}$  
Jumlah total hasil = 4

**Hasil yang Mendukung Event A**  
$\{HT, TH, TT\}$ → jumlah = 3

**Perhitungan Peluang**  
$P(A) = \frac{3}{4} = 0.75$

</div>

<div class="chapter-box">
<h4><b>Interpretasi Hasil dari Contoh Kejadian</b></h4>
Probabilitas 0.75 (75%) berarti bahwa:<br>
Dari banyak percobaan melempar koin 2 kali,<br>
Sekitar 75% percobaan akan menghasilkan setidaknya satu Ekor.<br>
Artinya, kejadian ini cukup besar kemungkinannya dan lebih sering terjadi dibandingkan tidak terjadi.
</div>

</div>


### Bab 7 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Distribusi probabilitas menggambarkan bagaimana nilai suatu variabel numerik tersebar dalam data. Konsep ini digunakan untuk memahami pola sebaran data dan kecenderungan nilai yang sering muncul.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Visualisasi Distribusi Variabel Numerik</b></h4>
<div class="section-divider"></div>

```{r, fig.height=3, fig.width=5, fig.align='center'}
library(readr)
library(dplyr)
library(ggplot2)

df <- read_csv("dataset_uas.csv", show_col_types = FALSE) %>%
  dplyr::distinct(id_mahasiswa, minggu, materi_pembelajaran, .keep_all = TRUE)

ggplot(df, aes(x = jam_belajar_menit)) +
  geom_density(
    fill = "#1f77b4",
    color = "#1f77b4",
    alpha = 0.35,
    size = 1
  ) +
  labs(
    title = "Distribusi Durasi Belajar Mahasiswa",
    x = "Durasi Belajar (Menit)",
    y = "Kepadatan"
  ) +
  theme_minimal(base_size = 10)

```
</div>

<div class="divider"></div>
<div class="col section-text">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justtify}
Distribusi durasi belajar mahasiswa (dalam menit) divisualisasikan menggunakan kurva distribusi (density plot). Berdasarkan visualisasi tersebut, distribusi data cenderung miring ke kanan, yang menunjukkan bahwa sebagian besar mahasiswa memiliki durasi belajar pada rentang menengah, sementara hanya sedikit mahasiswa dengan durasi belajar yang sangat tinggi.
:::

</div>
</div>


### Bab 8 {data-width=1200}

<div class="light-box">
<h4><b>Definisi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Interval kepercayaan adalah rentang nilai yang digunakan untuk memperkirakan parameter populasi berdasarkan data sampel dengan tingkat keyakinan tertentu. Interval ini menunjukkan sejauh mana estimasi dari sampel dapat mewakili kondisi populasi yang sebenarnya.
:::
</div>

<div class="section-divider"></div>
<h4><b>Contoh Perhitungan Interval Keyakinan 95%</b></h4>
<div class="section-divider"></div>

<div class="two-column">
<div class="col section-text">

Misalkan dilakukan pengambilan sampel terhadap 25 mahasiswa untuk mengukur rata-rata waktu belajar harian. Dari sampel tersebut diperoleh:

- Rata-rata waktu belajar ($\bar{x}$) = 120 menit
- Simpangan baku sampel ($s$) = 20 menit
- Ukuran sampel ($n$) = 25

Dengan tingkat kepercayaan 95% dan menggunakan distribusi t, diperoleh nilai kritis $t_{0.025,24} \approx 2.064$.

Interval kepercayaan 95% dihitung sebagai: \(CI = \bar{x} \pm t_{\alpha/2,\,df} \left( \frac{s}{\sqrt{n}} \right)\)

</div>

<div class="divider"></div>
<div class="col section-text">

Sehingga diperoleh interval:
\[
\begin{aligned}
CI &= 120 \pm 2.064 \left( \frac{20}{\sqrt{25}} \right) = 120 \pm 2.064 \times 4  = 120 \pm 8.256 \\
CI &= (111.74, 128.26) 
\end{aligned}
\]

**Interpretasi:**  
Dengan tingkat keyakinan 95%, dapat disimpulkan bahwa rata-rata waktu belajar harian mahasiswa dalam populasi diperkirakan berada antara 111.74 hingga 128.26 menit. Interval ini memberikan gambaran tingkat ketelitian estimasi serta menunjukkan adanya ketidakpastian yang masih melekat dalam proses penarikan kesimpulan berdasarkan data sampel.

</div>
</div>

### Bab 9  {data-width=1200}

::: {.text-justify}
Inferensi statistik adalah proses penarikan kesimpulan tentang suatu populasi berdasarkan data sampel. Konsep ini digunakan untuk melakukan generalisasi, prediksi, dan pengambilan keputusan dalam kondisi ketidakpastian.
:::

<div class="chapter9-grid">
<div class="chapter9-box">
<h4>Hipotesis Statistik</h4>
<b>H₀</b>: tidak ada efek atau perbedaan.<br>
<b>H₁</b>: ada efek atau perbedaan.<br><br>
Hipotesis alternatif dapat berupa <i>uji dua arah</i> (tanpa arah khusus) atau <i>uji satu arah</i> (arah efek ditentukan sebelumnya).
</div>

<div class="chapter9-box">
<h4>Tipe Kesalahan I dan II</h4>
<b>Tipe I (α)</b>: menolak H₀ yang benar (<i>false positive</i>).<br>
<b>Tipe II (β)</b>: gagal menolak H₀ yang salah (<i>false negative</i>).<br><br>
<b>Power</b> = 1 − β, menunjukkan kemampuan uji mendeteksi efek nyata.
</div>

<div class="chapter9-box">
<h4>Metode Uji Hipotesis</h4>
<b>Uji T</b>: rata-rata, σ tidak diketahui, sampel kecil.<br>
<b>Uji Z</b>: rata-rata, σ diketahui atau n ≥ 30.<br>
<b>Chi-Square (χ²)</b>: data kategorikal.<br><br>
Perbedaan utama terletak pada jenis data dan asumsi statistik.
</div>

<div class="chapter9-box">
<h4>Pengambilan Keputusan Statistik</h4>
Keputusan dibuat berdasarkan nilai <i>p-value</i>.<br><br>
<b>p ≤ α</b> → H₀ ditolak.<br>
<b>p > α</b> → H₀ gagal ditolak.<br><br>
Pendekatan ini memastikan keputusan objektif dan terkontrol.
</div>
</div>

<div class="chapter9-test-grid">
<div class="chapter9-test-box">
**Contoh Kasus:** Sebuah produsen minuman mengklaim bahwa rata-rata volume isi botol produknya **lebih dari 500 ml**.  (Sampel diambil sebanyak 10 botol dengan $α$ = 0.05)

<b>Hipotesis:</b><br>
H₀: μ ≤ 500 ml<br>
H₁: μ > 500 ml<br>

Uji satu arah digunakan karena arah klaim telah ditentukan.
</div>

<div class="chapter9-test-box">
<b>Statistik Uji:</b><br>
Uji t satu sampel digunakan karena data numerik dan simpangan baku populasi tidak diketahui.  
Kemudian dari sampel diperoleh rata-rata 504,2 ml dengan simpangan baku 3,7 ml.

<b>Kesimpulan:</b><br>
Hasil pengujian menghasilkan p-value < 0,05 sehingga **H₀ ditolak**.
Dengan demikian, rata-rata volume isi botol secara signifikan **lebih besar dari 500 ml**.
</div>
</div>


### Bab 10  {data-width=1200}

::: {.text-justify}
Metode nonparametrik adalah teknik inferensi statistik yang tidak bergantung
pada asumsi distribusi tertentu, seperti normalitas atau parameter populasi
yang diketahui. Metode ini digunakan ketika data berskala ordinal/kategorikal,
berukuran kecil, atau mengandung nilai pencilan.
:::

<div class="chapter9-grid">

<div class="chapter9-box">
<h4>Peran Nonparametrik</h4>
Metode nonparametrik digunakan sebagai alternatif
ketika asumsi metode parametrik tidak terpenuhi.

Fokus inferensi meliputi:  
- median  
- peringkat  
- frekuensi
</div>

<div class="chapter9-box">
<h4>Kapan Digunakan?</h4>
Direkomendasikan ketika:  
- distribusi data tidak normal  
- ukuran sampel kecil  
- terdapat outlier  
- data berskala ordinal atau nominal
</div>

<div class="chapter9-box">
<h4>Perbandingan Metode</h4>
<b>Parametrik</b>: asumsi distribusi ketat, sensitif terhadap outlier.  
<b>Nonparametrik</b>: asumsi minimal, lebih robust namun power lebih rendah.
</div>

<div class="chapter9-box">
<h4>Uji Nonparametrik Umum</h4>  
- Tes Tanda   
- Wilcoxon Signed-Rank  
- Mann–Whitney U  
- Kruskal–Wallis  
- Friedman  
- Chi-Square
</div>
</div>

<div class="chapter9-test-grid">
<div class="chapter9-test-box">
<b>Contoh Kasus:</b><br>
Peneliti membandingkan tingkat kepuasan pelanggan antara dua layanan
transportasi online. Data kepuasan diperoleh menggunakan skala ordinal (1–5)
dari masing-masing 8 responden.

**Alasan Pemilihan Uji:**   
Uji nonparametrik dipilih karena data berskala ordinal dan ukuran sampel kecil.
</div>

<div class="chapter9-test-box">
**Statistik Uji:**
Uji Mann–Whitney U digunakan karena data berskala ordinal, ukuran sampel kecil, dan kedua kelompok pelanggan bersifat independen. Uji ini merupakan alternatif nonparametrik dari uji-t dua sampel untuk membandingkan kecenderungan pusat dua kelompok tanpa asumsi distribusi normal.

**Kesimpulan:**
Berdasarkan hasil uji Mann–Whitney U, diperoleh bukti adanya perbedaan tingkat kepuasan pelanggan antara kedua layanan transportasi online, sehingga hipotesis nol ditolak.
</div>
</div>





Dataset {data-orientation=rows}
=======================================================================
  
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Pendahuluan dan Deskripsi Dataset {data-height=520}

<div class="two-column">
<div class="col section-text">

Dalam beberapa tahun terakhir, proses pembelajaran mengalami perubahan seiring dengan pemanfaatan teknologi digital dalam kegiatan belajar-mengajar. Pembelajaran tidak lagi hanya dilakukan melalui pertemuan tatap muka (luring), tetapi juga mulai mengombinasikan pembelajaran daring sebagai alternatif dalam pelaksanaannya.

Namun, efektivitas suatu metode pembelajaran tidak dapat ditentukan hanya dari cara penyampaiannya. Keberhasilan program pembelajaran juga dipengaruhi oleh beberapa faktor penting, antara lain:

- Durasi belajar peserta
- Tingkat fokus selama proses pembelajaran
- Capaian hasil belajar
- Tingkat kepuasan pengguna

Oleh karena itu, diperlukan analisis berbasis data untuk mengevaluasi bagaimana karakteristik pembelajaran tersebut memengaruhi performa peserta secara kuantitatif.

Pada analisis ini, digunakan dataset kelas intensif statistik yang memuat informasi aktivitas belajar mingguan serta beberapa indikator penilaian yang relevan. Dataset ini dianalisis untuk menilai dan mengevaluasi efektivitas kelas intensif statistik secara kuantitatif dan menjadi dasar dalam penyusunan strategi pembelajaran yang lebih efektif serta sesuai dengan kebutuhan pengguna.

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Deskripsi Dataset</b></h4>
Dataset yang digunakan dalam analisis ini terdiri dari beberapa variabel yang merepresentasikan karakteristik peserta, aktivitas pembelajaran, serta capaian hasil belajar dalam kelas intensif statistik. Adapun penjelasan masing-masing variabel adalah sebagai berikut:

```{r}
library(knitr)
library(kableExtra)
library(tibble)

deskripsi_variabel <- tibble::tibble(
variabel = c(
"ID Mahasiswa",
"Minggu ke-",
"Materi Pembelajaran",
"Mode Pembelajaran",
"Durasi Belajar (Menit)",
"Skor Fokus",
"Skor Kuis 1",
"Skor Kuis 2",
"Tingkat Kepuasan"
),
jenis_variabel = c(
"Kategorikal – Nominal",
"Numerik – Jangka Waktu",
"Kategorikal – Nominal",
"Kategorikal – Nominal",
"Numerik – Kontinu",
"Numerik – Diskrit",
"Numerik – Kontinu",
"Numerik – Kontinu",
"Kategorikal – Ordinal"
),
deskripsi = c(
"Identitas unik setiap mahasiswa peserta kelas intensif statistik",
"Menunjukkan urutan minggu pelaksanaan pembelajaran",
"Topik statistik yang dipelajari",
"Metode pembelajaran yang digunakan (luring atau daring)",
"Durasi waktu belajar peserta dalam satuan menit",
"Skor tingkat fokus mahasiswa selama proses pembelajaran",
"Nilai kuis yang diperoleh sebelum mengikuti kelas intensif",
"Nilai kuis yang diperoleh setelah mengikuti kelas intensif",
"Tingkat kepuasan mahasiswa terhadap proses pembelajaran"
)
)

kable(
  deskripsi_variabel,
  col.names = c("Nama Variabel", "Jenis Variabel", "Deskripsi Singkat"),
  align = c("l", "l", "l")
) %>%
  kable_styling(
    full_width = TRUE,
    position = "center"
  ) %>%

  # ISI SELANG SELING (MANUAL, AMAN)
  row_spec(
    seq(1, nrow(deskripsi_variabel), 2),
    background = "#E6F0FA"
  ) %>%
  row_spec(
    seq(2, nrow(deskripsi_variabel), 2),
    background = "#CFE2F3"
  ) %>%

  # GARIS KIRI & KANAN TABEL
  column_spec(1, border_left = FALSE, border_right = FALSE) %>%
  column_spec(2, border_right = FALSE) %>%
  column_spec(3, border_right = FALSE)


```

</div>
</div>

### Tabel Dataset {data-height=520}

```{r}
df <- readr::read_csv(
  "dataset_uas.csv",
  show_col_types = FALSE
) %>% 
  dplyr::distinct(id_mahasiswa, minggu, materi_pembelajaran, .keep_all = TRUE)
```
  
```{r}
df1 <- df %>% 
  dplyr::filter(kepuasan >= 0) %>% 
  dplyr::arrange(desc(skor_kuis_sesudah)) %>% 
  dplyr::select(
    id_mahasiswa,
    minggu,
    materi_pembelajaran,
    mode_pembelajaran,
    jam_belajar_menit,
    skor_fokus,
    skor_kuis_sebelum,
    skor_kuis_sesudah,
    kepuasan
  )

DT::datatable(
  df1,
  colnames = c(
    "ID Mahasiswa",
    "Minggu Ke-",
    "Materi Pembelajaran",
    "Mode Pembelajaran",
    "Durasi Belajar (Menit)",
    "Skor Fokus",
    "Skor Kuis 1",
    "Skor Kuis 2",
    "Tingkat Kepuasan"
  ),
  options = list(
    pageLength = 10,
    lengthChange = TRUE,
    searching = TRUE,
    ordering = TRUE,
    paging = TRUE,
    info = TRUE,
    drawCallback = JS(
      "function(settings) {",
      "$('table thead th').css({",
      "  'background-color': '#0B3C5D',",
      "  'color': 'white',",
      "  'font-weight': 'bold',",
      "  'text-align': 'center'",
      "});",

      "$('table tbody tr:odd').css({",
      "  'background-color': '#E6F0FA'",
      "});",

      "$('table tbody tr:even').css({",
      "  'background-color': '#CFE2F3'",
      "});",
      "}"
    )
  ),

  caption = htmltools::tags$caption(
    style = 'caption-side: bottom; text-align: center;',
    'Tabel: ',
    htmltools::em('Sampel Kelas Intensif Statistik')
  )
)

```


Visualisasi Statistika Dasar {data-orientation=rows}
=======================================================================

## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------
  
### Diagram Lingkaran {data-width=600 data-height=510}

<div class="two-column">
<div class="col section-text">

```{r pie-kepuasan, echo=FALSE, message=FALSE, warning=FALSE, fig.width=11, fig.height=11, out.width="100%"}

library(readr)
library(dplyr)
library(highcharter)

# Baca dataset
df <- read_csv("dataset_uas.csv", show_col_types = FALSE)

# Rekode kepuasan numerik -> kategori
kepuasan_df <- df %>%
  mutate(
    kategori = case_when(
      kepuasan == 5 ~ "Tidak Puas",
      kepuasan == 4 ~ "Cukup Puas",
      kepuasan == 3 ~ "Puas",
      kepuasan == 2 ~ "Sangat Puas",
    )
  ) %>%
  count(kategori) %>%
  mutate(
    persentase = round(n / sum(n) * 100, 1)
  )

# Pie chart interaktif
highchart() %>%
  hc_chart(
    type = "pie",
    animation = list(duration = 1000),
    height = 350
  ) %>%
  hc_title(text = "Tingkat Kepuasan Mahasiswa") %>%
  hc_add_series(
    name = "Persentase",
    data = list_parse(
      transform(kepuasan_df,
                name = kategori,
                y = persentase)
    )
  ) %>%
  hc_plotOptions(
    pie = list(
      size = "70%",
      allowPointSelect = TRUE,
      cursor = "pointer",
      dataLabels = list(
        enabled = TRUE,
        format = "<b>{point.name}</b>: {point.y}%"
      ),
      showInLegend = FALSE
    )
  )

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="section-divider"></div>
::: {.text-justify}
Pada analisis ini, visualisasi menggunakan pie chart dipilih karena bertujuan untuk menampilkan proporsi tingkat kepuasan mahasiswa pada setiap kategori secara jelas dan mudah dipahami. Pie chart efektif digunakan untuk menunjukkan perbandingan persentase antar kategori dalam satu variabel kategorikal, sehingga memudahkan pembaca dalam melihat distribusi kepuasan mahasiswa secara keseluruhan.
:::
<div class="section-divider"></div>

<div class="visualisasi-box">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Tingkat kepuasan mahasiswa menggambarkan sejauh mana mahasiswa merasa puas terhadap proses pembelajaran yang telah diterapkan. Berdasarkan pie chart di samping, **mayoritas** mahasiswa berada pada kategori **“Puas”** dan **“Sangat Puas”**, yang menunjukkan bahwa sebagian besar mahasiswa memiliki persepsi positif terhadap kualitas pembelajaran.

Namun demikian, masih terdapat mahasiswa yang berada pada kategori **“Cukup Puas”** dan **“Tidak Puas”**, yang menandakan bahwa meskipun tingkat kepuasan secara umum sudah baik, tetap diperlukan upaya peningkatan kualitas pembelajaran secara berkelanjutan.
:::
</div>

</div>
</div>


### Diagram Batang {data-width=600 data-height=510}

```{r plot-mode, message=FALSE, warning=FALSE} 
library(tidyverse)
library(grid)
library(gridExtra)

data <- read.csv("dataset_uas.csv")

mode_summary <- data %>%
  group_by(mode_pembelajaran) %>%
  summarise(
    n = n()
  )

plot_mode <- ggplot(mode_summary,
       aes(x = mode_pembelajaran,
           y = n,
           fill = mode_pembelajaran)) +
  geom_col(width = 0.5, color = "black", alpha = 0.85) +
  geom_text(aes(label = n),
            vjust = -0.6, size = 4) +
  scale_fill_brewer(palette = "Set2") +
  scale_y_continuous(
    expand = expansion(mult = c(0, 0.1))
  ) +
  labs(
    title = "Distribusi Mode Pembelajaran",
    subtitle = "Jumlah mahasiswa berdasarkan mode pembelajaran",
    x = "Mode Pembelajaran",
    y = "Jumlah Mahasiswa"
  ) +
  theme_minimal(base_size = 8) +
  theme(
    plot.title = element_text(face = "bold", size = 13),
    plot.subtitle = element_text(size = 11),
    axis.title = element_text(face = "bold"),
    panel.grid.minor = element_blank(),
    legend.position = "none"
  )


```

```{r plot-materi, message=FALSE, warning=FALSE}

materi_summary <- data %>%
  group_by(materi_pembelajaran) %>%
  summarise(
    n = n()
  )

plot_materi <- ggplot(materi_summary,
       aes(x = reorder(materi_pembelajaran, n),
           y = n,
           fill = materi_pembelajaran)) +
  geom_col(width = 0.55, color = "black", alpha = 0.85) +
  geom_text(aes(label = n),
            hjust = -0.15, size = 3.8) +
  coord_flip() +
  scale_fill_brewer(palette = "Pastel1") +
  scale_y_continuous(
    expand = expansion(mult = c(0, 0.1))
  ) +
  labs(
    title = "Distribusi Materi Pembelajaran",
    subtitle = "Jumlah mahasiswa pada masing-masing materi pembelajaran",
    x = "Materi Pembelajaran",
    y = "Jumlah Mahasiswa"
  ) +
  theme_minimal(base_size = 8) +
  theme(
    plot.title = element_text(face = "bold", size = 13),
    plot.subtitle = element_text(size = 11),
    axis.title = element_text(face = "bold"),
    legend.position = "none",
    panel.grid.minor = element_blank()
  )


```

```{r}
library(grid)

box_bg <- roundrectGrob(
  r = unit(6, "pt"),
  gp = gpar(
    fill = "#f8fbff",
    col  = "#8cb6ff",
    lwd  = 1
  )
)

Alasan <- textGrob(
  "Bar chart digunakan dalam analisis ini karena efektif untuk menampilkan dan
  membandingkan jumlah mahasiswa pada setiap kategori secara langsung. 
  Visualisasi ini bertujuan untuk memudahkan identifikasi perbedaan distribusi 
  mahasiswa berdasarkan mode dan materi pembelajaran
  
Kedua visualisasi menunjukkan bahwa mahasiswa cenderung memilih 
pembelajaran luring dan materi yang bersifat praktis. Dominasi mode
luring mengindikasikan kebutuhan akan interaksi langsung dalam proses
belajar, sementara tingginya  minat pada Pemrograman R dan SQL & Python
menegaskan bahwa mahasiswa lebih tertarik pada keterampilan yang
aplikatif dan relevan dengan kebutuhan dunia data. Insight ini
menyiratkan bahwa pembelajaran akan lebih efektif jika difokuskan pada 
tatap muka untuk materi teknis dan praktik langsung, dengan penyesuaian 
metode pada materi yang kurang diminati.",
  gp = gpar(fontsize = 9.5, lineheight = 1.25),
  just = c("left", "top"),
  x = unit(0.04, "npc"),
  y = unit(0.87, "npc")
)

judul2 <- textGrob(
  "Interpretasi Visualisasi",
  gp = gpar(fontsize = 11, fontface = "bold"),
  just = c("left", "top"),
  x = unit(0.04, "npc"),
  y = unit(0.95, "npc")
)

visualisasi <- textGrob(
  "Bar chart digunakan dalam analisis ini karena efektif untuk menampilkan dan
  membandingkan jumlah mahasiswa pada setiap kategori secara langsung. 
  Visualisasi ini bertujuan untuk memudahkan identifikasi perbedaan distribusi 
  mahasiswa berdasarkan mode dan materi pembelajaran",
  gp = gpar(fontsize = 9.5, lineheight = 1.25),
  just = c("left", "top"),
  x = unit(0.04, "npc"),
  y = unit(0.87, "npc")
)



interpretasi <- grobTree(
  box_bg,
  Alasan,
  judul2,
  visualisasi
)


```

```{r plot-gabungan, fig.width=15, fig.height=4, message=FALSE, warning=FALSE}
gridExtra::grid.arrange(
  plot_mode,
  plot_materi,
  interpretasi,
  ncol = 3,
  widths = c(1.1, 1.4, 1.2)
)

```

### Diagram Garis {data-width=600 data-height=510}

<div class="two-column">
<div class="col section-text">

```{r line-chart-sebelum-sesudah, echo=FALSE, message=FALSE, warning=FALSE, fig.width=12, fig.height=7, out.width="100%"}
library(tidyverse)

data <- read.csv("dataset_uas.csv")

data_line <- data %>%
  group_by(minggu) %>%
  summarise(
    skor_sebelum = mean(skor_kuis_sebelum),
    skor_sesudah = mean(skor_kuis_sesudah)
  )

data_long <- data_line %>%
  pivot_longer(
    cols = c(skor_sebelum, skor_sesudah),
    names_to = "waktu",
    values_to = "rata_skor"
  )

ggplot(data_long, aes(x = minggu, y = rata_skor, color = waktu)) +
  geom_line(linewidth = 1.2) +
  geom_point(size = 3) +
  labs(
    title = "Perbandingan Rata-rata Skor Kuis Sebelum dan Sesudah",
    x = "Minggu",
    y = "Rata-rata Skor Kuis",
    color = "Waktu Pengukuran"
  ) +
  scale_color_manual(
    values = c(
      "skor_sebelum" = "#E5533D",
      "skor_sesudah" = "#2C7BE5"
    ),
    labels = c("Sebelum Pembelajaran", "Sesudah Pembelajaran")
  ) +
  theme_minimal()

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="section-divider"></div>
::: {.text-justify}
Line chart digunakan pada analisis ini karena mampu menampilkan perubahan nilai rata-rata skor kuis dari waktu ke waktu secara jelas. Visualisasi ini bertujuan untuk membandingkan tren skor kuis sebelum dan sesudah pembelajaran setiap minggu, sehingga memudahkan dalam mengamati pola peningkatan atau penurunan hasil belajar mahasiswa.
:::
<div class="section-divider"></div>

<div class="visualisasi-box">
<h4><b>Interpretasi Visualisasi</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan grafik, rata-rata skor kuis sesudah pembelajaran selalu lebih tinggi dibandingkan sebelum pembelajaran pada setiap minggu pengamatan. Hal ini menunjukkan bahwa pembelajaran yang diberikan memberikan dampak positif terhadap peningkatan hasil belajar. Peningkatan skor terlihat semakin stabil setelah minggu ke-7.
:::
</div>

</div>
</div>


### Sentral Tendensi

Analisis central tendency digunakan untuk menggambarkan nilai pusat dari skor kuis sesudah pembelajaran. Ukuran seperti mean dan median membantu mengetahui skor yang paling mewakili performa mahasiswa secara keseluruhan serta menilai kecenderungan umum hasil belajar setelah proses pembelajaran.

<div class="section-divider"></div>

<div class="two-column">
<div class="col section-text">

```{r ct_visual_lr, echo=FALSE, fig.width=9, fig.height=5, out.width="100%", fig.align='center'}
library(ggplot2)
library(patchwork)

hist_plot <- ggplot(df, aes(x = skor_kuis_sesudah)) +
  geom_histogram(aes(y = after_stat(density)),
                 bins = 10,
                 fill = "#80b1d3",
                 color = "white",
                 alpha = 0.8) +
  geom_density(color = "#1f78b4", linewidth = 1) +
  geom_vline(xintercept = mean(df$skor_kuis_sesudah),
             color = "red", linewidth = 1) +
  geom_vline(xintercept = median(df$skor_kuis_sesudah),
             color = "darkgreen", linewidth = 1,
             linetype = "dashed") +
  labs(title = "Histogram Skor Kuis Sesudah",
       x = "Skor Kuis", y = "Density") +
  theme_minimal(base_size = 11)

box_plot <- ggplot(df, aes(y = skor_kuis_sesudah)) +
  geom_boxplot(fill = "#fdd0a2",
               color = "gray30",
               width = 0.4,
               outlier.color = "red") +
  labs(title = "Boxplot Skor Kuis Sesudah",
       y = "Skor Kuis", x = NULL) +
  theme_minimal(base_size = 11)

hist_plot | box_plot

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="visualisasi-box">
<b>Interpretasi Histogram</b><br>
Histogram menunjukkan bahwa skor kuis sesudah pembelajaran terkonsentrasi pada nilai tinggi (sekitar 90–98). Distribusi tampak sedikit miring ke kiri, ditandai dengan nilai mean yang lebih kecil dari median, yang mengindikasikan adanya beberapa skor rendah meskipun mayoritas mahasiswa memperoleh nilai tinggi.

<b>Interpretasi Boxplot</b><br>
Boxplot menunjukkan median skor yang tinggi dengan rentang antar kuartil yang relatif sempit, menandakan konsistensi hasil belajar. Terdapat beberapa outlier pada skor rendah, yang menunjukkan sebagian kecil mahasiswa memiliki capaian di bawah mayoritas peserta.

<div class="section-divider"></div>

Berdasarkan kedua visualisasi, skor kuis mahasiswa umumnya berada pada nilai tinggi dan relatif konsisten, menunjukkan efektivitas pembelajaran yang diterapkan. Meskipun terdapat beberapa nilai pencilan yang rendah, secara keseluruhan hasil belajar tetap terpusat pada skor tinggi, dengan kebutuhan pendampingan bagi sebagian kecil mahasiswa.
</div>
</div>
</div>


### Statistik Dispersi

<div style="display:flex; gap:20px; align-items:flex-start;">
  <div style="width:65%;">
```{r fig.width=9.5, fig.height=5, echo=FALSE}
library(ggplot2)
library(dplyr)
library(patchwork)

# Histogram + density
p_hist <- ggplot(df, aes(x = skor_kuis_sesudah, fill = mode_pembelajaran)) +
  geom_histogram(
    aes(y = after_stat(density)),
    bins = 10,
    alpha = 0.5,
    color = "black",
    position = "identity"
  ) +
  geom_density(alpha = 0.4, linewidth = 1) +
  facet_wrap(~mode_pembelajaran, ncol = 1) +
  labs(
    title = "Distribusi Skor Kuis Sesudah",
    x = "Skor Kuis Sesudah",
    y = "Kepadatan"
  ) +
  theme_minimal() +
  theme(
    legend.position = "none",
    plot.title = element_text(size = 11, face = "bold")
  )

# Violin + boxplot
p_violin <- ggplot(df, aes(
  x = materi_pembelajaran,
  y = skor_kuis_sesudah,
  fill = materi_pembelajaran
)) +
  geom_violin(alpha = 0.4, trim = FALSE) +
  geom_boxplot(width = 0.15, alpha = 0.7, outlier.color = "red") +
  stat_summary(fun = mean, geom = "point", shape = 23, size = 2.5, fill = "blue") +
  labs(
    title = "Sebaran Skor Kuis Berdasarkan Materi",
    x = "Materi",
    y = "Skor Kuis"
  ) +
  theme_minimal() +
  theme(
    legend.position = "none",
    plot.title = element_text(size = 10, face = "bold"),
    axis.text.x = element_text(angle = 20, hjust = 1)
  )

# SEJAJAR KIRI–KANAN
p_hist | p_violin
```

</div>

<div style="width:40%;">
::: {.text-justify}
Pada analisis ini, ukuran penyebaran digunakan untuk melihat seberapa beragam skor kuis sesudah pembelajaran pada setiap mode dan materi pembelajaran. Analisis ini bertujuan untuk menilai tingkat konsistensi hasil belajar mahasiswa, bukan hanya melihat nilai rata-rata.
:::

<div class="section-divider"></div>
<div style="background-color:#f8f9fa; padding:16px; border-radius:10px; border-left:6px solid #0d6efd; text-align:justify; font-size:14px;">

<b>Histogram</b><br>
Histogram menunjukkan distribusi skor kuis sesudah pada mode pembelajaran luring dan daring. Meskipun rata-rata skor relatif berdekatan, bentuk kurva density memperlihatkan perbedaan tingkat variasi penyebaran skor antar mode pembelajaran, yang menunjukkan bahwa tingkat konsistensi hasil belajar mahasiswa dapat berbeda tergantung pada mode pembelajaran yang digunakan.
<br><br>
<b>Violin & Boxplot</b><br>
Violin plot dan boxplot menunjukkan bahwa penyebaran skor kuis sesudah berbeda pada setiap materi pembelajaran. Violin yang lebih lebar menandakan variasi skor yang lebih tinggi, sedangkan boxplot dengan IQR yang lebih sempit menunjukkan hasil belajar yang lebih konsisten, meskipun masih terdapat beberapa nilai pencilan yang menandakan adanya mahasiswa dengan capaian yang jauh di bawah mayoritas.

</div>
</div>
</div>


### Distribusi Probabilitas

Pada analisis ini, distribusi probabilitas digunakan untuk melihat pola sebaran skor kuis sesudah pembelajaran pada setiap mode pembelajaran. Analisis ini bertujuan untuk memahami bagaimana peluang mahasiswa memperoleh skor tertentu tersebar dalam data, sehingga tidak hanya berfokus pada nilai rata-rata, tetapi juga pada pola dan konsistensi capaian hasil belajar.

<div class="section-divider"></div>

<div class="two-column">
<div class="col section-text">

```{r probability_distribution, echo=FALSE, fig.width=8.5, fig.height=4.8}
library(ggplot2)

ggplot(df, aes(
  x = mode_pembelajaran,
  y = skor_kuis_sesudah,
  fill = mode_pembelajaran
)) +
  geom_violin(
    trim = FALSE,
    alpha = 0.55,
    color = NA
  ) +
  geom_boxplot(
    width = 0.15,
    alpha = 0.75,
    outlier.color = "red"
  ) +
  stat_summary(
    fun = mean,
    geom = "point",
    shape = 23,
    size = 3,
    fill = "blue",
    color = "black"
  ) +
  labs(
    title = "Distribusi Skor Kuis Sesudah Berdasarkan Mode Pembelajaran",
    subtitle = "Visualisasi Probability Distribution",
    x = "Mode Pembelajaran",
    y = "Skor Kuis Sesudah"
  ) +
  scale_x_discrete(expand = expansion(add = 0.6)) +
  theme_minimal(base_size = 12) +
  theme(
    legend.position = "none",
    plot.margin = margin(5, 5, 5, 5),
    plot.title = element_text(face = "bold")
  )

```

</div>

<div class="divider"></div>
<div class="col section-text">

<div class="visualisasi-box">
<h4><b>Interpretasi Visual:</b></h4>
Violin plot menunjukkan distribusi probabilitas skor kuis sesudah berdasarkan mode pembelajaran daring dan luring. Lebar violin merepresentasikan kepadatan data, sehingga bagian yang lebih lebar menunjukkan peluang mahasiswa memperoleh skor pada rentang nilai tertentu lebih besar.

Boxplot di dalam violin memperlihatkan nilai median dan rentang antar kuartil (IQR), yang menggambarkan sebaran utama skor kuis sesudah, sementara titik mean merepresentasikan nilai harapan (expected value).

Perbedaan bentuk dan lebar sebaran antara pembelajaran daring dan luring menunjukkan variasi pola distribusi peluang serta tingkat konsistensi capaian skor, meskipun secara umum kedua mode pembelajaran sama-sama menunjukkan kecenderungan hasil belajar yang relatif baik.
</div>

</div>
</div>


Interval Keyakinan {data-orientation=rows}
=======================================================================
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Studi Kasus dan Identifikasi Uji {data-height=520}

<div class="skyblue-box">
<h4><b>Studi Kasus Dataset:</b></h4>
::: {.text-justify}
Program kelas intensif statistik diikuti oleh mahasiswa untuk meningkatkan pemahaman materi statistika. Setelah menyelesaikan program, mahasiswa mengikuti kuis evaluasi.  
Berdasarkan data skor kuis sesudah mengikuti kelas, dilakukan perhitungan **interval keyakinan 95%** untuk **mengestimasi rata-rata skor kuis** mahasiswa yang mengikuti program kelas intensif statistik.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<div class="blue-box">
<h4><b>Identifikasi Metode dan Uji Statistik yang Tepat:</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Analisis ini bertujuan untuk **mengestimasi rata-rata skor kuis** mahasiswa **setelah** mengikuti kelas intensif statistik. Sehingga sampel pada analisis ini terdiri dari **50** skor kuis mahasiswa setelah mengikuti kelas, di mana setiap skor merepresentasikan hasil kuis satu mahasiswa.

Karena data yang digunakan merupakan **data sampel** dan **simpangan baku populasi tidak diketahui**, maka interval keyakinan untuk rata-rata dihitung menggunakan **distribusi t** dengan **simpangan baku sampel**. Interval keyakinan **95%** digunakan karena tingkat keyakinan ini umum dipakai dan memberikan estimasi rata-rata yang cukup akurat tanpa menghasilkan interval yang terlalu lebar.
:::
</div>

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Persiapan Perhitungan Analisis</b></h4>
Rata-rata sampel (\(\bar{x}\)): 
\[
\begin{aligned}
\bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348
\end{aligned}
\] 
Simpangan Baku Sampel: 
\[
\begin{aligned}
s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{
      \frac{1131.078}{49}} = 4.804501
\end{aligned}
\]
Derajat Kebebasan: \(df = n - 1 = 50 - 1 = 49\)
</div>
</div>

### Hitungan dan Visualisasi {data-height=520}

<div class="two-column">
<div class="col section-text">

<h4><b>Hitung Interval Keyakinan 95% Menggunakan Rumus \(t = \bar{x} \pm t_{\alpha/2,\,df}\left(\frac{s}{\sqrt{n}}\right)\)</b></h4>
<div class="section-divider"></div>

Hitung \(t_{\alpha/2,\,df}\) untuk tingkat keyakinan 95%
\[
\begin{aligned}
\alpha &= 1 - 0.95 = 0.05 \\
\alpha/2 &= 0.025 \\
df &= 49 \\
t_{0.025,49} &= 2.009575
\end{aligned}
\]
Hitung Kesalahan Margin
\[
\begin{aligned}
ME &= t_{\alpha/2,df}\left(\frac{s}{\sqrt{n}}\right) = 2.009575\left(\frac{4.804501}{\sqrt{50}}\right) = 1.3654
\end{aligned}
\]
Interval Keyakinan 95% adalah:
\[
\begin{aligned}
CI_{95\%} &= \bar{x} \pm ME \\
UCI &= 92.5348 + 1.3654 = 93.9002 \\
LCI &= 92.5348 - 1.3654 = 91.1698 \\
CI_{95\%} &= (93.8998,\; 91.1694)
\end{aligned}
\]

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Hitung Interval Keyakinan 95% Menggunakan Kode R</b></h4>
<div class="section-divider"></div>

```{r echo=FALSE, message=FALSE, warning=FALSE,}
library(readr)
library(dplyr)
library(knitr)
library(kableExtra)

df <- read_csv("dataset_uas.csv", show_col_types = FALSE)

x <- df$skor_kuis_sesudah
x <- x[!is.na(x)]

CL <- 0.95
alpha <- 1 - CL
n <- length(x)
dfree <- n - 1
xbar <- mean(x)
s <- sd(x)
SE <- s / sqrt(n)
t_crit <- qt(1 - alpha/2, df = dfree)
MoE <- t_crit * SE

LCI <- xbar - MoE
UCI <- xbar + MoE

ci_table <- data.frame(
  CL = "95%",
  Alpha = round(alpha, 2),
  Mean = round(xbar, 4),
  SD = round(s, 4),
  t = round(t_crit, 3),
  SE = round(SE, 4),
  MoE = round(MoE, 4),
  LCI = round(LCI, 4),
  UCI = round(UCI, 4)
)

ci_table %>%
  kable(
    align = "c"
  ) %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    position = "center"
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#1f77b4")

```

```{r echo=FALSE, message=FALSE, warning=FALSE}
library(plotly)

# Data CI 
ci_plot <- data.frame(
  label = "CI 95%",
  mean = xbar,
  lci = LCI,
  uci = UCI
)

plot_ly() %>%
  
  # Garis CI
  add_segments(
    data = ci_plot,
    x = ~lci, xend = ~uci,
    y = 0, yend = 0,
    line = list(color = "#1f77b4", width = 6),
    name = "Confidence Interval 95%",
    hoverinfo = "text",
    text = ~paste0(
      "CI 95%<br>",
      "Lower: ", round(lci, 3), "<br>",
      "Upper: ", round(uci, 3)
    )
  ) %>%
  
  # Titik Mean
  add_markers(
    data = ci_plot,
    x = ~mean,
    y = 0,
    marker = list(
      color = "#d62728",
      size = 14
    ),
    name = "Rata-rata Sampel",
    hoverinfo = "text",
    text = ~paste0(
      "Mean: ", round(mean, 3)
    )
  ) %>%
  
  layout(
  title = list(
    text = "Visualisasi Interval Kepercayaan 95%<br>Skor Kuis Sesudah",
    x = 0.5,
    plot_bgcolor = "#b7d4ff"
  ),
  xaxis = list(
    title = "Skor Kuis Sesudah",
    range = c(91, 94),    
    tick0 = 90,
    dtick = 0.5
  ),
  yaxis = list(
    visible = FALSE
  ),
  legend = list(
    orientation = "h",     
    x = 0.5,               
    xanchor = "center",
    y = -0.25              
  ),
  showlegend = TRUE,
  height = 350
)


```

</div>
</div>

### Kesimpulan Analisis {data-height=520}

<div class="blue-box">
<h4><b>Hasil Interval Keyakinan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan perhitungan interval keyakinan **95%**, diperoleh bahwa rata-rata skor kuis mahasiswa setelah mengikuti program kelas intensif statistik berada pada **rentang 91.1698 hingga 93.9002**. Dengan tingkat keyakinan 95%, dapat diyakini bahwa rata-rata skor kuis populasi mahasiswa **berada dalam interval tersebut**.
:::
</div>

<div class="skyblue-box">
<h4><b>Interpretasi Statistik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Rentang interval yang **relatif sempit** serta posisi **rata-rata sampel** yang berada **di dalam** interval keyakinan menunjukkan bahwa skor kuis sesudah pembelajaran berada pada tingkat yang **relatif stabil**. Dengan demikian, hasil ini mengindikasikan bahwa capaian pembelajaran pada kelas intensif statistik menunjukkan konsistensi performa antar mahasiswa setelah mengikuti program pembelajaran.
:::
</div>

<div class="blue-box">
<h4><b>Insight</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Hasil interval keyakinan yang diperoleh menunjukkan bahwa sistem pembelajaran pada program kelas intensif statistik memberikan hasil yang **relatif konsisten**. Dengan demikian, sistem pembelajaran ini perlu dipertahankan serta ditingkatkan agar kualitas dan konsistensi hasil belajar mahasiswa dapat terus terjaga pada periode pembelajaran berikutnya.
:::
</div>

Statistik Inferensi {data-orientation=rows}
=======================================================================
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Studi Kasus dan Identifikasi Uji {data-height=520}

<div class="skyblue-box">
::: {.text-justify}
<h4><b>Studi Kasus Dataset:</b></h4>
Program kelas intensif statistik menerapkan evaluasi berupa kuis sesudah pembelajaran untuk mengukur perubahan hasil belajar mahasiswa.Berdasarkan data skor kuis mahasiswa setelah mengikuti kelas intensif statistika, dilakukan pengujian hipotesis untuk mengetahui apakah rata-rata skor kuis mahasiswa secara signifikan lebih tinggi dari nilai 80.
:::
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<div class="blue-box">
<h4><b>Identifikasi Uji</b></h4>
Uji statistik yang digunakan adalah **uji t satu sampel satu sisi**.  
Uji ini dipilih karena tujuan analisis adalah untuk menguji apakah rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik secara signifikan **lebih tinggi dari nilai acuan 80** berdasarkan satu sampel data mahasiswa. Data yang digunakan merupakan data sampel, dan **simpangan baku populasi tidak diketahui**, sehingga simpangan baku diestimasi menggunakan simpangan baku sampel.

Taraf signifikansi yang digunakan adalah $α = 0,05$, karena merupakan tingkat signifikansi yang umum digunakan dalam penelitian statistik.
Pengujian dilakukan **satu sisi** karena fokus analisis adalah untuk menguji apakah rata-rata skor **lebih besar dari 80**, bukan sekadar berbeda.
</div>

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Menentukan Hipotesis</b></h4>
Dalam studi kasus ini, nilai 80 digunakan sebagai nilai pembanding (baseline) yang merepresentasikan standar pencapaian skor kuis yang diharapkan.

- **Hipotesis Nol (H₀):**  
  Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika sama dengan     atau tidak lebih tinggi dari 80.
  \[
  H_0 : \mu \le 80
  \]

- **Hipotesis Alternatif (H₁):**  
  Rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistika lebih tinggi    dari 80.
  \[
  H_1 : \mu > 80
  \]

</div>
</div>

### Perhitungan Uji T & Kesimpulan {data-height=520}

<div class="two-column">
<div class="col section-text">

Rata-rata sampel (\(\bar{x}\)): 
\[
\begin{aligned}
\bar{x} &= \frac{1}{n}\sum_{i=1}^{n} x_i = \frac{4626.74}{50} = 92.5348
\end{aligned}
\] 
Simpangan Baku Sampel: 
\[
\begin{aligned}
s &= \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} = \sqrt{
      \frac{1131.078}{49}} = 4.804501
\end{aligned}
\]
Standar Kesalahan:
\[
\begin{aligned}
SE &= \frac{s}{\sqrt{n}} = \frac{4.804501}{\sqrt{50}} = 0.679
\end{aligned}
\]

**Statistik Uji t**:  
\[
\begin{aligned}
t &= \frac{\bar{x} - \mu_0}{SE} = \frac{92.5348 - 80}{0.679} = \frac{12.5348}{0.679}  \approx 18.45
\end{aligned}
\]


```{r echo=FALSE, message=FALSE, warning=FALSE}
library(readr)
library(dplyr)
library(knitr)
library(kableExtra)

# Load data
df <- read_csv("dataset_uas.csv", show_col_types = FALSE)

# Variabel
x <- df$skor_kuis_sesudah
x <- x[!is.na(x)]

# Parameter uji
mu0 <- 80          # nilai yang diklaim (GANTI SESUAI SOAL)
alpha <- 0.05
n <- length(x)
dfree <- n - 1
xbar <- mean(x)
s <- sd(x)
SE <- s / sqrt(n)

# Statistik uji t
t_hit <- (xbar - mu0) / SE

# p-value dua arah
p_value <- 2 * pt(-abs(t_hit), df = dfree)

# Tabel hasil uji
test_table <- data.frame(
  n = n,
  Mean = round(xbar, 4),
  SD = round(s, 4),
  SE = round(SE, 4),
  t_statistic = round(t_hit, 4),
  df = dfree,
  p_value = round(p_value, 4),
  Alpha = alpha,
  Keputusan = ifelse(p_value > alpha, 
                     "Gagal menolak H0", 
                     "Tolak H0")
)

# Tabel biru
test_table %>%
  kable(align = "c") %>%
  kable_styling(
    bootstrap_options = c("striped", "hover", "condensed"),
    full_width = TRUE,
    position = "center"
  ) %>%
  row_spec(0, bold = TRUE, color = "white", background = "#1f77b4")

```

</div>

<div class="divider"></div>
<div class="col section-text">

**Hitung p-value**:  
Rumus p-value uji t satu arah adalah: \(\begin{aligned} p\text{-value} &= P(t \ge t_{\text{hitung}}) \end{aligned}\) dengan derajat kebebasan $df = 49$, maka 

\[
\begin{aligned}
p\text{-value} 
&= P\left(t_{49} \ge 18.45\right)
\end{aligned}
\]

Hasil perhitungan menggunakan kode R memberikan nilai:
\(
\begin{aligned}
p\text{-value} 
&= 5.206043 \times 10^{-24}
\end{aligned}
\)

Nilai tersebut sangat kecil dan secara praktis dapat dinyatakan sebagai:
\(
\begin{aligned}
p\text{-value} &< 0.0001
\end{aligned}
\)

<div class="blue-box">
<h4><b>Kesimpulan</b></h4>
<div class="section-divider"></div>
Karena nilai $p$-value jauh lebih kecil dari tingkat signifikansi yang digunakan, yaitu $\alpha = 0.05$, maka keputusan yang diambil adalah **menolak hipotesis nol ($H_0$)**.

Dengan demikian, terdapat bukti statistik yang sangat kuat untuk menyimpulkan bahwa rata-rata skor kuis mahasiswa setelah mengikuti kelas intensif statistik **secara signifikan lebih tinggi dari 80**.

Hasil ini menunjukkan bahwa program kelas intensif statistik memberikan dampak positif yang signifikan terhadap peningkatan skor kuis mahasiswa. Oleh karena itu, hasil ini mengindikasikan bahwa pendekatan kelas intensif statistik layak untuk dipertahankan sebagai metode pembelajaran dalam meningkatkan performa akademik mahasiswa.
</div>

</div>
</div>


Metode Nonparametrik {data-orientation=rows}
=======================================================================
  
## Column {.tabset .tabset-fade data-height=520}
-----------------------------------------------------------------------

### Studi Kasus dan Identifikasi Uji {data-height=520}

<div class="skyblue-box">
<div class="two-column">
<div class="col section-text">

<h4><b>Studi Kasus</b></h4>
<div class="section-divider"></div>
Sebuah program kelas intensif statistika berlangsung selama 12 minggu dengan evaluasi berupa kuis mingguan. Untuk menilai efektivitas program, dilakukan pengukuran skor kuis sebelum dan sesudah mengikuti kelas pada kelompok mahasiswa yang sama.

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Hipotesis</b></h4>
<div class="section-divider"></div>
\[\begin{aligned}
H_0 &: \text{Median perbedaan skor kuis sebelum dan sesudah} = 0 \\
H_1 &: \text{Median perbedaan skor kuis sebelum dan sesudah} \neq 0
\end{aligned}\]

</div>
</div>
</div>

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<div class="blue-box">
<h4><b>Alasan Menggunakan Analisis Nonparametrik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Berdasarkan hasil uji asumsi, data skor kuis tidak berdistribusi normal, sehingga metode parametrik seperti uji-t berpasangan tidak memenuhi syarat. Oleh karena itu, digunakan pendekatan nonparametrik yang lebih sesuai dengan karakteristik data.
:::

<h4><b>Tujuan Analisis</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Tujuan analisis ini adalah untuk mengetahui apakah terdapat perbedaan median skor kuis mahasiswa sebelum dan sesudah mengikuti kelas intensif statistika.
:::

</div>
</div>

<div class="divider"></div>
<div class="col section-text">

<div class="blue-box">
<h4><b>Alasan menggunakan Uji Wilcoxon</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Uji Wilcoxon Signed-Rank dipilih karena sesuai untuk membandingkan dua pengukuran berpasangan pada kelompok yang sama ketika asumsi normalitas tidak terpenuhi. Metode ini mempertimbangkan arah dan besar perbedaan, sehingga memberikan hasil yang lebih kuat dibandingkan uji tanda.
:::

</div>
</div>


### Step Wilcoxon {data-height=520}

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Langkah 1: Menghitung Perbedaan Berpasangan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung perbedaan skor kuis sebelum dan sesudah pembelajaran untuk setiap mahasiswa. Perbedaan berpasangan didefinisikan sebagai selisih antara skor kuis sesudah dan skor kuis sebelum pembelajaran.
:::

```{r wilcoxon-step1, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step1 <- df %>%
  select(id_mahasiswa, skor_kuis_sebelum, skor_kuis_sesudah) %>%
  mutate(
    perbedaan = skor_kuis_sesudah - skor_kuis_sebelum
  )

kable(
  step1
) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px", )

```

<div class="section-divider"></div>
<h4><b>Langkah 2: Hapus Perbedaan Nol</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, observasi dengan nilai perbedaan sama dengan nol dihapus dari analisis, karena pasangan dengan perbedaan nol tidak memberikan informasi mengenai arah perubahan.
:::

```{r wilcoxon-step2, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step2 <- step1 %>%
  filter(perbedaan != 0)

kable(
  step2
) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px")

```


</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Langkah 3: Peringkat Perbedaan Absolut</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung nilai absolut dari perbedaan berpasangan. Selanjutnya, nilai absolut tersebut diberi peringkat dari yang terkecil hingga terbesar. Jika terdapat nilai yang sama (ties), maka diberikan peringkat rata-rata.
:::

```{r wilcoxon-step3, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step3 <- step2 %>%
  mutate(
    abs_perbedaan = abs(perbedaan),
    peringkat = rank(abs_perbedaan, ties.method = "average")
  )

kable(step3) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px")
```

<div class="section-divider"></div>
<h4><b>Langkah 4: Menentukan Tanda Peringkat</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, tanda peringkat ditentukan berdasarkan arah perbedaan. Jika perbedaan bernilai positif, maka peringkat diberi tanda positif. Jika perbedaan bernilai negatif, maka peringkat diberi tanda negatif.
:::

```{r wilcoxon-step4, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

step4 <- step3 %>%
  mutate(
    peringkat_bertanda = ifelse(perbedaan > 0, peringkat, -peringkat)
  )

kable(step4) %>%
  kable_styling(full_width = TRUE) %>%
  scroll_box(height = "95px", width = "700px")
```


</div>
</div>


### Step Wilcoxon & Interpretasi {data-height=520}

<div class="section-divider"></div>
<div class="two-column">
<div class="col section-text">

<h4><b>Langkah 5: Menghitung Statistik Uji</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dihitung jumlah peringkat bertanda positif (W⁺) dan jumlah peringkat bertanda negatif (W⁻).
Statistik uji Wilcoxon didefinisikan sebagai nilai minimum dari W⁺ dan W⁻.
:::

```{r wilcoxon-step5, echo=FALSE, message=FALSE, warning=FALSE}
library(dplyr)
library(knitr)
library(kableExtra)

W_pos <- sum(step4$peringkat[step4$perbedaan > 0])
W_neg <- sum(step4$peringkat[step4$perbedaan < 0])
W_stat <- min(W_pos, W_neg)

hasil_W <- data.frame(
  W_Positif = W_pos,
  W_Negatif = W_neg,
  Statistik_Uji_W = W_stat
)

kable(hasil_W) %>%
  kable_styling(full_width = TRUE)

```

</div>

<div class="divider"></div>
<div class="col section-text">

<h4><b>Langkah 6: Pengambilan Keputusan</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Pada langkah ini, dilakukan uji Wilcoxon Signed-Rank menggunakan fungsi `wilcox.test()` di R. Keputusan diambil berdasarkan nilai p-value dengan tingkat signifikansi $α = 0.05$.
Jika p-value $< α$, maka H₀ ditolak.
:::

```{r wilcoxon-step6, echo=FALSE, message=FALSE, warning=FALSE}
library(knitr)
library(kableExtra)

uji_wilcoxon <- wilcox.test(
  df$skor_kuis_sesudah,
  df$skor_kuis_sebelum,
  paired = TRUE,
  alternative = "two.sided",
  exact = TRUE
)

hasil_uji <- data.frame(
  Statistik_Uji = uji_wilcoxon$statistic,
  P_Value = uji_wilcoxon$p.value,
  Keputusan = ifelse(uji_wilcoxon$p.value < 0.05, "Tolak H₀", "Gagal Menolak H₀")
)

kable(hasil_uji) %>%
  kable_styling(full_width = TRUE)

```


</div>
</div>

<div class="blue-box">
<h4><b>Interpretasi Statistik</b></h4>
<div class="section-divider"></div>
::: {.text-justify}
Jika **p-value < 0.05**, maka hipotesis nol **(H₀) ditolak**, yang berarti **terdapat perbedaan median** skor kuis sebelum dan sesudah mengikuti kelas intensif statistika. Hal ini menunjukkan bahwa program kelas intensif statistika memberikan pengaruh yang signifikan terhadap perubahan skor kuis mahasiswa.

Secara praktis, hasil ini mengindikasikan bahwa pendekatan pembelajaran yang diterapkan dalam program tersebut efektif dalam meningkatkan pemahaman mahasiswa terhadap materi statistika. Oleh karena itu, program kelas intensif dapat dipertahankan dan dipertimbangkan untuk dikembangkan lebih lanjut sebagai strategi pembelajaran yang mendukung peningkatan prestasi akademik.
:::
</div>