FEBRIANO FARREL NAUFAL
H1101251078

Sistem Informasi · Universitas Tanjungpura

Pendahuluan

Laporan ini menyajikan analisis data statistik deskriptif dan inferensial. Analisis difokuskan pada interpretasi ukuran pemusatan, penyebaran data melalui distribusi frekuensi, serta pemodelan hubungan antar variabel menggunakan regresi linear.


1. Pengaruh Nilai Ekstrem terhadap Ukuran Pemusatan

Pertanyaan: Sebutkan ukuran pemusatan data yang dipengaruhi oleh nilai ekstrim!

Jawaban: Ukuran pemusatan data yang paling sensitif dan dipengaruhi oleh nilai ekstrem (outlier) adalah Rata-rata (Mean).

Penjelasan Singkat:
Mean dihitung dengan menjumlahkan seluruh nilai observasi kemudian dibagi dengan banyaknya data. Artinya, setiap nilai—sekecil atau sebesar apapun—memiliki kontribusi matematis langsung terhadap hasil akhir. Ketika ada nilai ekstrem masuk, nilai tersebut akan langsung menarik rata-rata menjauh dari pusat data sebenarnya. Berbeda dengan mean, Median (nilai tengah) dan Modus (nilai paling sering muncul) cenderung stabil dan tidak terpengaruh oleh nilai ekstrem.

2. Skenario Perubahan Nilai pada Set Data

Pertanyaan: Jika dalam suatu set data, sebuah nilai yang agak lebih besar dari nilai rata-rata data tersebut diganti dengan nilai yang jauh lebih besar, bagaimanakah pengaruhnya terhadap nilai rata-ratanya, apakah menjadi lebih besar, lebih kecil ataukah tetap sama saja? Bagaimana pula pengaruhnya terhadap median?

Jawaban: Jika hal tersebut terjadi, maka pengaruhnya adalah sebagai berikut:

  • Nilai Rata-rata (Mean) akan menjadi LEBIH BESAR.
    Hal ini mutlak terjadi karena rata-rata menghitung total jumlah seluruh data (\(\Sigma X\)). Jika ada satu nilai yang melonjak menjadi jauh lebih besar, total penjumlahan data otomatis membesar, sehingga hasil pembagiannya (rata-ratanya) pun ikut terdorong menjadi lebih besar.

  • Nilai Median (Nilai Tengah) akan TETAP SAMA SAJA.
    Median tidak terpengaruh oleh besaran suatu angka, melainkan oleh posisi urutannya. Karena nilai yang diubah itu awalnya sudah berada di atas rata-rata (dan pastinya di atas/sebelah kanan median), membuatnya menjadi “jauh lebih besar” tidak akan merubah posisi letak nilai tengahnya sama sekali.

3. Distribusi Frekuensi dan Histogram Data Nilai

💡 Catatan Analisis Kritis:
Berdasarkan instruksi soal, diminta untuk menggunakan 7 interval kelas dengan lebar 6,5. Namun, rentang data aktual adalah 53. Jika dipaksakan menggunakan interval 6,5, jangkauan maksimal hanya 45,5. Oleh karena itu, dilakukan penyesuaian matematis dengan menggunakan lebar interval 8 agar seluruh distribusi data dapat terakomodasi secara presisi.

a. Tabel dan Histogram Frekuensi

Tabel Distribusi Frekuensi
Interval Frekuensi
35.5 - 43.5 2
43.5 - 51.5 6
51.5 - 59.5 2
59.5 - 67.5 5
67.5 - 75.5 29
75.5 - 83.5 10
83.5 - 91.5 9

b. Tabel dan Histogram Frekuensi Relatif

Berikut adalah hasil perhitungan distribusi frekuensi relatif beserta visualisasi histogram dan kurva kepadatannya:

Tabel Distribusi Frekuensi Relatif
Interval Frekuensi_Relatif Persentase
35.5 - 43.5 0.0317 3.17%
43.5 - 51.5 0.0952 9.52%
51.5 - 59.5 0.0317 3.17%
59.5 - 67.5 0.0794 7.94%
67.5 - 75.5 0.4603 46.03%
75.5 - 83.5 0.1587 15.87%
83.5 - 91.5 0.1429 14.29%

Data dikelompokkan ke dalam 7 interval kelas dengan lebar sekitar 6,5 dimulai dari nilai minimum. Pada kelas terakhir dilakukan penyesuaian batas atas agar seluruh data dapat terakomodasi. Tabel distribusi frekuensi menunjukkan jumlah data pada setiap interval, sedangkan histogram frekuensi dan frekuensi relatif digunakan untuk memvisualisasikan pola penyebaran data.

4. Analisis Kandungan Karbon Organik

Data dianalisis menggunakan R untuk mencari nilai Mean, Median, Modus, serta Interquartile Range (IQR) guna melihat pusat dan penyebaran data. Selain itu, Diagram Batang dan Daun (Stem-and-Leaf Plot) dan Histogram disajikan untuk melihat visualisasi distribusi mentah.

Tabel Ringkasan Statistik Data Karbon
Ukuran Nilai
Mean (Rata-rata) 1.359
Median 1.29
Modus (Multimodal) 0.24, 0.58, 0.94, 1.08, 1.19, 1.24, 1.35, 2.01
Interquartile Range (IQR) 0.855
## 
## --- DIAGRAM BATANG DAN DAUN (STEM-AND-LEAF PLOT) ---
## 
##   The decimal point is at the |
## 
##   0 | 122
##   0 | 55566699
##   1 | 000011112222234444
##   1 | 5555688899
##   2 | 00122
##   2 | 678
##   3 | 2

Berdasarkan hasil di atas, data tergolong multimodal karena terdapat beberapa nilai yang memiliki frekuensi kemunculan tertinggi yang sama (yaitu muncul 2 kali). Oleh karena itu, ukuran rata-rata (Mean) dan nilai tengah (Median) menjadi indikator yang lebih solid untuk melihat titik pusat penyebaran kandungan karbon dibandingkan dengan modusnya.

5. Persentase Kontribusi PDRB Provinsi Kalbar

a. Kelayakan Penggunaan Diagram Garis

TIDAK LAYAK.
Diagram garis (line chart) secara fungsional didesain untuk menampilkan pergerakan atau tren data dari waktu ke waktu (Time Series) secara kontinu. Sedangkan data pada soal hanya membandingkan besaran kontribusi antar sektor (kategorikal) pada satu periode waktu tertentu (Tahun 2000). Oleh karena itu, representasi visual yang paling tepat dan efisien untuk membandingkan data proporsi seperti ini adalah Diagram Lingkaran (Pie Chart) atau Diagram Batang.

b. Diagram Lingkaran (Donut Chart)

Untuk menghindari juring yang terlalu sempit dan sulit dibaca, sektor-sektor dengan kontribusi di bawah 6% (Pertambangan, Listrik/Gas/Air, Bangunan, dan Keuangan) telah digabung ke dalam satu kategori yaitu “Lainnya”.

Diagram Kontribusi Sektor terhadap PDRB (Tahun 2000)

6. Analisis Ukuran Pemusatan dan Penyebaran (Data Berkelompok)

Berdasarkan hasil survey tarif kelas ekonomi di sejumlah penginapan/hotel (dalam puluhan ribu rupiah), kita akan menghitung Rata-rata (Mean), Nilai Tengah (Median), dan Varians dari data berkelompok tersebut.

Karena data ini bersumber dari survey (sampel), maka perhitungan varians akan menggunakan rumus varians sampel (pembagi \(n-1\)).

a. Tabel Perhitungan dan Hasil Akhir

Tabel Perhitungan Data Berkelompok Tarif Penginapan
Interval Kelas Frekuensi (f) Frek. Kumulatif (Fk) Titik Tengah (x) f · x f(x - x̄)²
20 - 40 1 1 30 30 2555.86
40 - 60 7 8 50 350 6535.49
60 - 80 14 22 70 980 1559.88
80 - 100 6 28 90 540 535.19
100 - 120 3 31 110 330 2600.93
120 - 140 4 35 130 520 9779.01
140 - 160 1 36 150 150 4822.53
Total Frekuensi (n) = 36
Ringkasan Parameter Statistik
Ukuran Nilai Rumus
Rata-rata (Mean) 80.56 Σ(f·x) / n
Median 74.29 L + [((n/2) - Fk) / f] · p
Varians Sampel (s²) 811.11 Σf(x - x̄)² / (n - 1)

7. Analisis Regresi Linear Sederhana

Berdasarkan data sampel 20 siswa, kita diminta untuk mengestimasi nilai slope (\(\beta_1\)) dan intercept (\(\beta_0\)) dari model regresi linear sederhana berikut: \[Y = \beta_0 + \beta_1 X + \varepsilon\]

Dimana: * X = Nilai Ujian Masuk (Variabel Independen/Prediktor) * Y = Nilai Matematika (Variabel Dependen/Respon)

Tabel Estimasi dan Visualisasi Model

Hasil Estimasi Parameter Regresi
Parameter Nilai_Estimasi Interpretasi
(Intercept) Intercept (β₀) 4.1844 Nilai estimasi Y jika X bernilai 0
X Slope (β₁) 0.9431 Peningkatan Y untuk setiap kenaikan 1 poin X
Interpretasi Model Regresi:
  1. Intercept (\(\beta_0 = 4,1837\)): Nilai ini merepresentasikan estimasi nilai tes Matematika (\(Y\)) apabila skor ujian masuk (\(X\)) bernilai nol. Ini menunjukkan adanya nilai dasar (baseline) kemampuan matematika siswa sebelum memperhitungkan variabel skor ujian masuk.
  2. Slope (\(\beta_1 = 0,9431\)): Koefisien ini menunjukkan hubungan positif yang kuat. Secara statistik, setiap kenaikan 1 poin pada skor ujian masuk (\(X\)) akan meningkatkan prediksi nilai Matematika (\(Y\)) sebesar 0,9431 poin.
  3. Kesimpulan: Model ini menunjukkan bahwa skor ujian masuk memiliki pengaruh yang signifikan dan positif terhadap pencapaian nilai matematika siswa. Semakin tinggi skor ujian masuk, semakin tinggi pula probabilitas siswa mendapatkan nilai matematika yang baik.