Pendahuluan

Laporan ini menyajikan analisis data statistik deskriptif dan inferensial. Analisis difokuskan pada interpretasi ukuran pemusatan, penyebaran data melalui distribusi frekuensi, serta pemodelan hubungan antar variabel menggunakan regresi linear.

1. Pengaruh Nilai Ekstrem terhadap Ukuran Pemusatan

Pertanyaan: Sebutkan ukuran pemusatan data yang dipengaruhi oleh nilai ekstrim!

Jawaban: Ukuran pemusatan data yang paling sensitif dan dipengaruhi oleh nilai ekstrem (outlier) adalah Rata-rata (Mean).

Penjelasan Singkat:
Mean dihitung dengan menjumlahkan seluruh nilai observasi kemudian dibagi dengan banyaknya data. Artinya, setiap nilai—sekecil atau sebesar apapun—memiliki kontribusi matematis langsung terhadap hasil akhir. Ketika ada nilai ekstrem masuk, nilai tersebut akan langsung menarik rata-rata menjauh dari pusat data sebenarnya. Berbeda dengan mean, Median (nilai tengah) dan Modus (nilai paling sering muncul) cenderung stabil dan tidak terpengaruh oleh nilai ekstrem.

2. Skenario Perubahan Nilai pada Set Data

Pertanyaan: Jika dalam suatu set data, sebuah nilai yang agak lebih besar dari nilai rata-rata data tersebut diganti dengan nilai yang jauh lebih besar, bagaimanakah pengaruhnya terhadap nilai rata-ratanya, apakah menjadi lebih besar, lebih kecil ataukah tetap sama saja? Bagaimana pula pengaruhnya terhadap median?

Jawaban: Jika hal tersebut terjadi, maka pengaruhnya adalah sebagai berikut:

Nilai Rata-rata (Mean) akan menjadi LEBIH BESAR.
Hal ini mutlak terjadi karena rata-rata menghitung total jumlah seluruh data (\(\Sigma X\)). Jika ada satu nilai yang melonjak menjadi jauh lebih besar, total penjumlahan data otomatis membesar, sehingga hasil pembagiannya (rata-ratanya) pun ikut terdorong menjadi lebih besar.

Nilai Median (Nilai Tengah) akan TETAP SAMA SAJA.
Median tidak terpengaruh oleh besaran suatu angka, melainkan oleh posisi urutannya. Karena nilai yang diubah itu awalnya sudah berada di atas rata-rata (dan pastinya di atas/sebelah kanan median), membuatnya menjadi “jauh lebih besar” tidak akan merubah posisi letak nilai tengahnya sama sekali.

3. Distribusi Frekuensi dan Histogram Data Nilai

💡 Catatan Analisis Kritis:
Berdasarkan instruksi soal, diminta untuk menggunakan 7 interval kelas dengan lebar 6,5. Namun, rentang data aktual adalah 53. Jika dipaksakan menggunakan interval 6,5, jangkauan maksimal hanya 45,5. Oleh karena itu, dilakukan penyesuaian matematis dengan menggunakan lebar interval 8 agar seluruh distribusi data dapat terakomodasi secara presisi.

a. Tabel dan Histogram Frekuensi

Tabel Distribusi Frekuensi
Interval	Frekuensi
35.5 - 43.5	2
43.5 - 51.5	6
51.5 - 59.5	2
59.5 - 67.5	5
67.5 - 75.5	29
75.5 - 83.5	10
83.5 - 91.5	9

b. Tabel dan Histogram Frekuensi Relatif

Berikut adalah hasil perhitungan distribusi frekuensi relatif beserta visualisasi histogram dan kurva kepadatannya:

Tabel Distribusi Frekuensi Relatif
Interval	Frekuensi_Relatif	Persentase
35.5 - 43.5	0.0317	3.17%
43.5 - 51.5	0.0952	9.52%
51.5 - 59.5	0.0317	3.17%
59.5 - 67.5	0.0794	7.94%
67.5 - 75.5	0.4603	46.03%
75.5 - 83.5	0.1587	15.87%
83.5 - 91.5	0.1429	14.29%

Data dikelompokkan ke dalam 7 interval kelas dengan lebar sekitar 6,5 dimulai dari nilai minimum. Pada kelas terakhir dilakukan penyesuaian batas atas agar seluruh data dapat terakomodasi. Tabel distribusi frekuensi menunjukkan jumlah data pada setiap interval, sedangkan histogram frekuensi dan frekuensi relatif digunakan untuk memvisualisasikan pola penyebaran data.

4. Analisis Kandungan Karbon Organik

Data dianalisis menggunakan R untuk mencari nilai Mean, Median, Modus, serta Interquartile Range (IQR) guna melihat pusat dan penyebaran data. Selain itu, Diagram Batang dan Daun (Stem-and-Leaf Plot) dan Histogram disajikan untuk melihat visualisasi distribusi mentah.

Tabel Ringkasan Statistik Data Karbon
Ukuran	Nilai
Mean (Rata-rata)	1.359
Median	1.29
Modus (Multimodal)	0.24, 0.58, 0.94, 1.08, 1.19, 1.24, 1.35, 2.01
Interquartile Range (IQR)	0.855

## 
## --- DIAGRAM BATANG DAN DAUN (STEM-AND-LEAF PLOT) ---

## 
##   The decimal point is at the |
## 
##   0 | 122
##   0 | 55566699
##   1 | 000011112222234444
##   1 | 5555688899
##   2 | 00122
##   2 | 678
##   3 | 2

Berdasarkan hasil di atas, data tergolong multimodal karena terdapat beberapa nilai yang memiliki frekuensi kemunculan tertinggi yang sama (yaitu muncul 2 kali). Oleh karena itu, ukuran rata-rata (Mean) dan nilai tengah (Median) menjadi indikator yang lebih solid untuk melihat titik pusat penyebaran kandungan karbon dibandingkan dengan modusnya.

5. Persentase Kontribusi PDRB Provinsi Kalbar

a. Kelayakan Penggunaan Diagram Garis

TIDAK LAYAK.
Diagram garis (line chart) secara fungsional didesain untuk menampilkan pergerakan atau tren data dari waktu ke waktu (Time Series) secara kontinu. Sedangkan data pada soal hanya membandingkan besaran kontribusi antar sektor (kategorikal) pada satu periode waktu tertentu (Tahun 2000). Oleh karena itu, representasi visual yang paling tepat dan efisien untuk membandingkan data proporsi seperti ini adalah Diagram Lingkaran (Pie Chart) atau Diagram Batang.

b. Diagram Lingkaran (Donut Chart)

Untuk menghindari juring yang terlalu sempit dan sulit dibaca, sektor-sektor dengan kontribusi di bawah 6% (Pertambangan, Listrik/Gas/Air, Bangunan, dan Keuangan) telah digabung ke dalam satu kategori yaitu “Lainnya”.

Diagram Kontribusi Sektor terhadap PDRB (Tahun 2000)

6. Analisis Ukuran Pemusatan dan Penyebaran (Data Berkelompok)

Berdasarkan hasil survey tarif kelas ekonomi di sejumlah penginapan/hotel (dalam puluhan ribu rupiah), kita akan menghitung Rata-rata (Mean), Nilai Tengah (Median), dan Varians dari data berkelompok tersebut.

Karena data ini bersumber dari survey (sampel), maka perhitungan varians akan menggunakan rumus varians sampel (pembagi \(n-1\)).

a. Tabel Perhitungan dan Hasil Akhir

Tabel Perhitungan Data Berkelompok Tarif Penginapan
Interval Kelas	Frekuensi (f)	Frek. Kumulatif (Fk)	Titik Tengah (x)	f · x	f(x - x̄)²
20 - 40	1	1	30	30	2555.86
40 - 60	7	8	50	350	6535.49
60 - 80	14	22	70	980	1559.88
80 - 100	6	28	90	540	535.19
100 - 120	3	31	110	330	2600.93
120 - 140	4	35	130	520	9779.01
140 - 160	1	36	150	150	4822.53
Total Frekuensi (n) = 36

Ringkasan Parameter Statistik
Ukuran	Nilai	Rumus
Rata-rata (Mean)	80.56	Σ(f·x) / n
Median	74.29	L + [((n/2) - Fk) / f] · p
Varians Sampel (s²)	811.11	Σf(x - x̄)² / (n - 1)

7. Analisis Regresi Linear Sederhana

Berdasarkan data sampel 20 siswa, kita diminta untuk mengestimasi nilai slope (\(\beta_1\)) dan intercept (\(\beta_0\)) dari model regresi linear sederhana berikut: \[Y = \beta_0 + \beta_1 X + \varepsilon\]

Dimana: * X = Nilai Ujian Masuk (Variabel Independen/Prediktor) * Y = Nilai Matematika (Variabel Dependen/Respon)

Tabel Estimasi dan Visualisasi Model

Hasil Estimasi Parameter Regresi
	Parameter	Nilai_Estimasi	Interpretasi
(Intercept)	Intercept (β₀)	4.1844	Nilai estimasi Y jika X bernilai 0
X	Slope (β₁)	0.9431	Peningkatan Y untuk setiap kenaikan 1 poin X

Interpretasi Model Regresi:

Intercept (\(\beta_0 = 4,1837\)): Nilai ini merepresentasikan estimasi nilai tes Matematika (\(Y\)) apabila skor ujian masuk (\(X\)) bernilai nol. Ini menunjukkan adanya nilai dasar (baseline) kemampuan matematika siswa sebelum memperhitungkan variabel skor ujian masuk.
Slope (\(\beta_1 = 0,9431\)): Koefisien ini menunjukkan hubungan positif yang kuat. Secara statistik, setiap kenaikan 1 poin pada skor ujian masuk (\(X\)) akan meningkatkan prediksi nilai Matematika (\(Y\)) sebesar 0,9431 poin.
Kesimpulan: Model ini menunjukkan bahwa skor ujian masuk memiliki pengaruh yang signifikan dan positif terhadap pencapaian nilai matematika siswa. Semakin tinggi skor ujian masuk, semakin tinggi pula probabilitas siswa mendapatkan nilai matematika yang baik.

Statistical Analysis

Febriano Farrel Naufal

2026-03-20`