Tugas Praktikum 1 dan 2


1.1 Praktikum 1

1.1.1 Mean untuk Data Kelompok

Mean (rata-rata) adalah ukuran pemusatan yang paling umum digunakan dalam statistik. Data kelompok adalah data yang sudah dikelompokkan dalam bentuk data kelompok. Menghitung mean pada datra kelompok tidak berbeda dengan perhitungan distribusi frekuensi tunggal. Hanya nilai X tidak mewakili nilai variable individu,melainkan mewakili titik tengah interval.

Langkah langkah untuk menghitung mean sebagai berikut :

  • Hitung nilai tengah (\(X_i\)) dari setiap kelas interval:

    \(X_i = \frac{\text{Tepi bawah kelas} + \text{Tepi atas kelas}}{2}\)

  • Kalikan Frekuensi (\(f\)) dengan Nilai Tengah (\(X_i\))} :

    Hitung \(f \cdot X_i\) untuk setiap kelas

  • Hitung Total \(\sum fX\)} :

    Jumlahkan semua hasil dari perkalian frekuensi dengan nilai tengah .

  • Hitung Total Frekuensi (\(n\))} :

    Jumlahkan seluruh frekuensi (𝑓).

  • Substitusi ke Rumus Mean :

\[ \bar{X} = \frac{\sum fX}{n} \]

dimana :

\[\begin{aligned} \bar{X} & = \text{rata-rata hitung data berkelompok} \\ \sum fX & = \text{jumlah dari seluruh hasil perkalian antara frekuensi dan nilai tengah masing-masing kelas} \\ n & = \text{jumlah total data} \end{aligned}\]

contoh :

Dibawah ini adalah data yang sudah dikelompokan dari 20 perusahaan yang sahamnya menjadi pilihan pada bulan maret 2003.

Tabel Data Kelompok untuk mean
Interval Nilai_Tengah Frekuensi
160 - 303 231,5 2
304 - 447 375,5 5
448 - 591 519,5 9
592 - 735 663,5 3
736 - 878 807 1

Penyelesaian dengan outliers:

\[ \bar{X} = \frac{\sum fX}{n} = \frac {2(231,5)+ 5(375,5)+ 9(519,5)+ 3(663,5)+ 1(807)}{20} = \frac {9.813,5}{20} = 490,68 \]

Penyelesaian tanpa outliers:

\[ \bar{X} = \frac{\sum fX}{n} = \frac {2(231,5)+ 5(375,5)+ 9(519,5)+ 3(663,5)}{20} = \frac {9006.5}{19} = 474,03 \]

Kesimpulan :

  • Rata-rata dengan outliers menghasilkan nilai 490,68, yang lebih tinggi dibandingkan rata-rata tanpa outliers. Hal ini menunjukkan bahwa keberadaan data ekstrem (outliers) memengaruhi hasil perhitungan, sehingga menyebabkan nilai rata-rata menjadi tidak sepenuhnya mewakili distribusi data mayoritas.

  • Rata-rata tanpa outliers menghasilkan nilai 474,03, yang lebih mencerminkan karakteristik utama data. Penghapusan outliers membantu mengurangi bias dalam perhitungan rata-rata dan memberikan hasil yang lebih representatif terhadap distribusi data utama.

  • Dengan itu juga penghapusan outliers penting untuk kedua metode ini agar mendapatkan gambaran yang lebih akurat tentang tren atau karakteristik data secara keseluruhan.

Mean dalam bentuk boxplot :

Mean dalam bentuk histogram :

1.1.2 Median untuk Data Kelompok

Median adalah nilai tengah dalam suatu kumpulan data yang telah diurutkan dari data terkecil hingga terbesar atau sebaliknya. Perhitungan median dengan data kelompok dapat dilakukan dengan bantuan frekuensi ku,mulatif kurang dari.

Langkah langkah untuk menghitung median sebagai beikut :

  • Hitung Total Frekuensi (𝑛)

  • Hitung nilai \(\frac{n}{2}\)

  • Kurangkan \(\sum f_{i_0}\) dari \(\frac{n}{2}\)

  • Bagikan hasil tersebut dengan \(f_m\)

  • Kalikan hasilnya dengan \(C\)

  • Tambahkan hasil ke \(tb\) untuk mendapatkan median

  • Substitusi ke Rumus Median:

\[ \text{Med} = tb + \left( \frac{\frac{n}{2} - \sum f_{i_0}}{f_m} \right). C \]

dimana :

\[ \begin{align*} tb & = \text{batas bawah untuk kelas dimana median berada} \\ C & = \text{interval kelas} \\ \sum f_{i_0} & = \text{jumlah frekuensi dari semua kelas dibawah kelas yang mengandung median} \\ f_m & = \text{frekuensi dari kelas yang mengandung median} \end{align*} \] contoh :

Terdapat data kelompok dibawah ini, hitung berapa mediannya !

Tabel Data Kelompok untuk median
Nilai Frekuensi
31 - 40 3
41 - 50 5
51 - 60 10
61 - 70 11
71 - 80 8
81 - 90 3
jumlah 40

penyelesaian :

Jumlah data sebesar 40, maka mediannya terletak pada :

\[ Q_2 = \frac {1}{2} \cdot 40 = 20 \] Maka median terletak didata ke-20.

Sebelum itu, kita harus menentukan frekuensi kumulatif :

Tabel Data Kelompok untuk median frekuensi kumulatif dengan outliers
Nilai Frekuensi Fkk
31 - 40 3 3
41 - 50 5 8
51 - 60 10 18
61 - 70 11 29
71 - 80 8 37
81 - 90 3 40

Pada tabel di atas, didapatkan data berupa:

\[ \begin{aligned} tb &= 61 - 0,5 = 60,5 \\ p &= 10 \\ F_m &= 11 \\ F &= 18 \\ \end{aligned} \]

Cara menghitung median dengan Outliers :

\[ \text{Median} = tb + \left( \frac{\frac{n}{2} - F}{F_m} \right).c \]

\[ \begin{aligned} \text{Median} &= 60,5 + \left( \frac{\frac{40}{2} - 18}{11} \right) 10 \\ &= 60,5 + \left( \frac{20 - 18}{11} \right) 10 \\ &= 60,5 + 1,82 \\ &= 62,32 \end{aligned} \]

Maka median dalam Outliers dari data tersebut adalah \(62,32\).

Cara menghitung median tanpa Outliers :

Tabel Data Kelompok untuk median frekuensi kumulatif tanpa outliers
Nilai Frekuensi Fkk
41 - 50 5 5
51 - 60 10 15
61 - 70 11 26
71 - 80 8 34

pada tabel data diatas, bisa didapatkan sebagai berikut :

  • Total 𝑛=34, sehingga \(\frac {n}{2} = 17\)

  • Kelas median: 61 − 70, dengan parameter :

\[ \begin{aligned} tb &= 61 - 0,5 = 60,5 \\ C &= 10 \\ F_m &= 11 \\ F &= 15 \\ \end{aligned} \]

  • subsitusikan ke rumus :

\[ \begin{aligned} \text{Median} &= 60,5 + \left( \frac{\frac{34}{2} - 15}{11} \right) 10 \\ &= 60,5 + \left( \frac{17 - 15}{11} \right) 10 \\ &= 60,5 + 1.818 \\ &= 62.32 \end{aligned} \]

Kesimpulan :

Hasil perhitungan median dari kedua metode yakni menggunakan outlier dan tanpa menggunakan outliers menunjukkan bahwa nilai median tidak berubah (tetap 62,32). Hal ini membuktikan bahwa median adalah ukuran pemusatan data yang robust atau kuat terhadap outliers, karena posisinya ditentukan oleh urutan data, bukan nilai-nilai ekstrem dalam distribusi. Median tetap menggambarkan nilai tengah data dengan konsisten meskipun distribusi data dimodifikasi.

Median dalam bentuk boxplot :

Median dalam bentuk histogram :

1.1.3 Modus untuk Data Kelompok

Modus adalah nilai yang sering muncul dalam sebuah dataset. Modus digunakan untuk mengetahui nilai yang paling dominan atau paling sering terjadi dalam suatu kumpulan data.

Langkah langkah menghitung modus sebagai berikut :

  • Kurangi frekuensi sebelum kelas modus (\(f_0\)) dari frekuensi kelas modus (\(f_1\))

  • Kurangi frekuensi setelah kelas modus (\(f_2\)) dari frekuensi kelas modus (\(f_1\))

  • Hitung pembilang = \((f_1 - f_0)\) dan penyebut = \((f_1 - f_0) + (f_1 - f_2)\)

  • Bagi pembilang dengan penyebut = \(\frac{f_1 - f_0}{(f_1 - f_0) + (f_1 - f_2)}\)

  • Kalikan hasilnya dengan lebar kelas (\(C\))

  • Tambahkan hasil tersebut ke batas bawah kelas modus (\(tb\))

  • Substitusi ke Rumus Modus :

    \(\text{Modus} = tb + \left( \frac{(f_1 - f_0) }{f_1 - f_0 + (f_1 - f_2)} \right). C\)

  • Bisa Juga ditulis dengan :

    \(\text{Mod} = tb + \left( \frac{(f_1)_0}{(f_1)_0 + (f_2)_0} \right). C\)

    di mana:

\[ \begin{aligned} tb &= \text{batas bawah untuk kelas di mana modus berada} \\ C &= \text{interval kelas} \\ (f_1)_0 &= \text{selisih frekuensi yang memuat modus dengan frekuensi kelas sebelumnya} \\ (f_2)_0 &= \text{selisih frekuensi yang memuat modus dengan frekuensi kelas sesudahnya} \end{aligned} \]

contoh :

Sebuah sampel nilai penjualan mingguan (dalam juta rupiah) dari 60 penyalur barang antik di kota mojokerto disajikan seperti berikut :

Tabel Data Kelompok untuk modus frekuensi kumulatif dengan outliers dan tanpa outliers
Nilai_penjualan Banyak_penyalur Frekuensi
10 - 14 4 14,5
15 - 19 5 19,5
20 - 24 8 24,5
25 - 29 13 29,5
30 - 34 20 34,5
35 - 39 10 39,5

Dari tabel diatas, frekuensi modusnya adalah 20 dengan letak kelas ke-5 dan kelas nyatanya adalah 29,5 - 34,5. jadi :

\[ (f_1)_0= 20 - 13 = 7 \\ (f_2)_0 = 20 - 10 = 10 \\ tb = 29, 5 \\ C = 5 \]

Cara menghitung modus dengan Outliers ::

\[ \begin{aligned} \text{Mod} = tb + \left( \frac{(f_1)_0}{(f_1)_0 + (f_2)_0}. C \right) \end{aligned} \]

\[ \begin{aligned} \text{Mod} &= 29,5 \left( \frac{7}{7 + 10} \right). 5 \\ &= 29,5 + (0,41)(5) \\ &= 29,5 + 2,05 \\ &= 31,55 \end{aligned} \]

Jadi, modus dari nilai penjualan mingguan 60 penyalur barang antik dikota mojokerto adalah sebanyak Rp. 31,55 Juta.

Cara menghitung modus tanpa Outliers :

\[ \begin{aligned} \text{Mod} = tb + \left( \frac{(f_1)_0}{(f_1)_0 + (f_2)_0}. C \right) \end{aligned} \]

dengan parameter :

\[ 𝑓_𝑚 = 20 \\ (f_1)_0= 20 - 13 = 7 \\ (f_2)_0 = 20 - 10 = 10 \\ tb = 29, 5 \\ C = 5 \]

\[ \begin{aligned} \text{Mod} &= 29,5 \left( \frac{7}{7 + 10} \right). 5 \\ &= 29,5 + (0,41)(5) \\ &= 29,5 + 2,05 \\ &= 31,55 \end{aligned} \]

Kesimpulan :

  • Modus dengan dan tanpa outliers menghasilkan nilai yang sama, yaitu 31.56. Hal ini menunjukkan bahwa data dalam kelompok ini cukup stabil, sehingga keberadaan atau ketiadaan outliers tidak memengaruhi nilai modus. dan pada tabel Menggunakan semua data asli tanpa menghilangkan nilai ekstrem.

  • Modus 31.56 merepresentasikan nilai yang paling sering muncul dalam dataset ini, baik dengan maupun tanpa mempertimbangkan adanya outliers, sehingga mencerminkan karakteristik utama distribusi data. pada tabel dia Sama dengan data asli karena tidak ada nilai ekstrem (outliers) yang terdeteksi.

Modus dalam bentuk boxplot :

Modus dalam bentuk histogram :

1.2 Praktikum 2

1.2.1 Bisnis

Topik: Analisis data pendapatan bulanan karyawan

Sebuah perusahaan ingin menganalisis data pendapatan bulanan karyawan dari 40 orang. Berikut adalah data yang telah dikelompokkan dalam tabel frekuensi:

Tabel Data Kelompok untuk data kelompok gaji karyawan
Rentan_gaji Frekuensi
1.000.000 - 1.999.999 5
2.000.000 - 2.999.999 10
3.000.000 - 3.999.999 15
4.000.000 - 4.999.999 8
5.000.000 - 5.999.999 2

Penyelesaian :

Diketahui bahwa titik tengah, Frekuensi Kumulatif adalah sebagai berikut :

Tabel Data Kelompok untuk frekuensi kumulatif dan titik tengah dengan outliers
Rentan_gaji Frekuensi Fkk Titik_tengah hasil_kali_frekuensi_dan_titik_tengah
1.000.000 - 1.999.999 5 5 1.500.000 7.500.000
2.000.000 - 2.999.999 10 15 2.500.000 25.000.000
3.000.000 - 3.999.999 15 30 3.500.000 52.500.000
4.000.000 - 4.999.999 8 38 4.500.000 36.000.000
5.000.000 - 5.999.999 2 40 5.500.000 11.000.000

Mean :

Jumlah total frekuensi \(𝑁= 5 + 10 + 15 + 8 + 2 = 40\)

hitung rata-rata gaji karyawan dengan perkalian frekuensi dengan titik tengah, lalu dibagi dengan jumlah total frekuensi:

Menggunakan Outliers:

\[ \begin{aligned} \bar{X} = \frac{\sum fX}{n} = \frac {5(1.500.000)+ 10(2.500.000)+ 15(3.500.000)+ 8(4.500.000)+ 2(5.500.000)}{40} \end{aligned} \] \[ \begin{aligned} = \frac {132.000.000}{40} = 3.300.000 \end{aligned} \]

Tanpa menggunakan Outliers :

Tabel Data Kelompok untuk frekuensi kumulatif dan titik tengah tanpa outliers
Rentan_gaji Frekuensi Titik_tengah hasil_kali_frekuensi_dan_titik_tengah
1.000.000 - 1.999.999 5 1.500.000 7.500.000
2.000.000 - 2.999.999 10 2.500.000 25.000.000
3.000.000 - 3.999.999 15 3.500.000 52.500.000
4.000.000 - 4.999.999 8 4.500.000 36.000.000

Total \({fX}{n}\) tanpa outliers :

\[ 7.500.000+25.000.000+52.500.000+36.000.000=121.000.000 \]

Total Frekuensi tanpa outliers :

\[ 5+10+15+8=38 \]

Lalu Masukan dalam rumus ( tanpa outliers) :

\[ \bar{X} = \frac {121.000.000}{38} = 3.184.211 \]

Kesimpulan :

  • Mean dengan outliers menghasilkan nilai sebesar 3.300.000. Hal ini menunjukkan bahwa keberadaan data ekstrem pada rentang gaji 5.000.000 - 5.999.999 memengaruhi hasil rata-rata, sehingga menghasilkan nilai yang lebih tinggi dibandingkan dengan mayoritas data. Mean ini cocok digunakan jika analisis memerlukan inklusi data ekstrem, misalnya untuk memahami distribusi gaji tinggi.

  • Mean tanpa outliers menghasilkan nilai sebesar 3.184.211, yang lebih mencerminkan kondisi mayoritas data setelah menghilangkan pengaruh rentang gaji ekstrem. Mean ini lebih stabil dan relevan untuk analisis yang fokus pada tren utama dalam distribusi gaji.

Median :

Menggunakan Outliers:

\[ \begin{aligned} \text{Median} = tb + \left( \frac{\frac{n}{2} - F}{F_m} \right). C \end{aligned} \]

\[ \begin{aligned} = 2.999.999,5 + \left( \frac{\frac{40}{2} - 15}{15} \right) 1.000.000 \\ = 2.999.999,5 + \left( \frac{20 - 15}{15} \right) 1.000.000 \\ = 2.999.999,5 + 333.333,3 \\ = 3.333.332,8 Rp \end{aligned} \]

Tanpa menggunakan outliers

Posisi median untuk 𝑛 = 38 adalah:

\[ \frac {n}{2} = \frac {38}{2} = 19 \] Dimana:

𝐿 = batas bawah kelas median = 2.999.999 𝐹 = frekuensi kumulatif sebelum kelas median = 15 𝑓_𝑚 = frekuensi kelas median = 15 𝑐= panjang kelas = 1.000.000

\[ \begin{aligned} = 2.999.999,5 + \left( \frac{\frac{38}{2} - 15}{15} \right) 1.000.000 \\ = 2.999.999,5 + \left( \frac{19 - 15}{15} \right) 1.000.000 \\ = 2.999.999,5 + 266.666,67 \\ = 3.266.666 Rp \end{aligned} \]

Kesimpulan :

  • Dengan outliers, median yang lebih tinggi (3.333.333) mencerminkan keberadaan data yang sangat tinggi, yaitu rentang gaji 5.000.000 - 5.999.999, yang dapat menggeser nilai tengah ke atas.

  • Tanpa outliers, median yang lebih rendah (3.266.666) memberikan gambaran yang lebih akurat dan representatif tentang nilai tengah distribusi gaji penyalur jika mengabaikan data yang tidak biasa atau ekstrim.

  • Oleh karena itu, pemilihan antara menggunakan median dengan atau tanpa outliers sangat bergantung pada tujuan analisis. Jika tujuan analisis adalah menggambarkan distribusi keseluruhan data, termasuk ekstrem, maka median dengan outliers adalah pilihan yang tepat. Namun, jika ingin fokus pada distribusi mayoritas tanpa dipengaruhi oleh data ekstrim, maka median tanpa outliers lebih sesuai.

Modus :

Menggunakan Outliers dan tidak menggunakan Outliers:

\[ \begin{aligned} \text{Modus} = tb + \left( \frac{(f_1 - f_0) }{f_1 - f_0 + (f_1 - f_2)} \right).C \end{aligned} \]

\[ \begin{aligned} \text{Mod} = tb + \left( \frac{(f_1)_0}{(f_1)_0 + (f_2)_0} \right) .c \end{aligned} \]

\[ \begin{aligned} \text{Modus} = 2.999.999,5 + \left( \frac{15−10 }{ (15−10) + (15 - 8)} \right) \times 1.000.000 \end{aligned} \]

\[ \begin{aligned} \text{Mod} &= 2.999.999,5 \left( \frac{5}{5 + 7} \right) 1.000.000\\ &= 2.999.999,5+ (416.667) \\ &= 3.416.666,5 \end{aligned} \]

kelas pendapatan 4.000.000 - 4.999.999 adalah yang paling banyak muncul, sehingga modus memberikan kita indikasi bahwa pendapatan yang paling sering ditemukan di antara karyawan adalah sekitar Rp 3.416.666,5.

Kesimpulan :

  • Modus dengan outliers menghasilkan nilai sebesar 3.416.667, mencakup seluruh data termasuk rentang gaji ekstrem (outliers). Nilai ini mencerminkan kelas dengan frekuensi tertinggi, yaitu kelas 3.000.000 - 3.999.999, yang tetap dominan meskipun ada pengaruh data ekstrem.

  • Modus tanpa outliers juga menghasilkan nilai sebesar 3.416.667. Hal ini menunjukkan bahwa penghapusan outliers tidak memengaruhi hasil, karena kelas dengan frekuensi tertinggi tetap berada di rentang yang sama, yaitu kelas 3.000.000 - 3.999.999.

  • Kesimpulan: Modus dengan dan tanpa outliers memberikan hasil yang sama dalam kasus ini. Hal ini menunjukkan bahwa data cukup terkonsentrasi pada kelas dengan frekuensi tertinggi, sehingga data ekstrem tidak memengaruhi nilai modus secara signifikan.

1.2.2 Kesehatan

Topik: Analisis Distribusi Jumlah Dosis Vaksinasi COVID-19 di Kota Mojokerto

Sebuah dinas kesehatan di kota Mojokerto menganalisis jumlah dosis vaksinasi COVID-19 yang telah diberikan kepada penduduk dalam kelompok usia tertentu. Data jumlah dosis vaksin yang diterima penduduk di kota mojokerto dikelompokkan berdasarkan kelompok usia sebagai berikut:

Tabel Data Kelompok untuk analisis ditribusi jumlah vaksin
Kelompok_usia_.Tahun. Frekuensi_penerima_dosis_vaksin
18 - 29 1000
30 - 39 1500
40 - 49 1200
50 - 59 800
60 - 69 500

Penyelesaian :

Diketahui bahwa titik tengah, Frekuensi Kumulatif adalah sebagai berikut :

Tabel Data Kelompok untuk frekuensi kumulatif dan nilai tengah analisis menggunakan outliers
Kelompok_usia_.Tahun. Frekuensi_penerima_dosis_vaksin Fkk Nilai_tengah hasil_kali_frekuensi_dan_nilai_tengah
18 - 29 1000 1000 23.5 23,500
30 - 39 1500 2500 34.5 51,750
40 - 49 1200 3700 44.5 53,400
50 - 59 800 4500 54.5 43,600
60 - 69 500 5000 64.5 32,250

Mean :

Jumlah total frekuensi 𝑁= 1000 + 1500 + 1200 + 800 + 500 = 5000

hitung rata-rata dosis vaksinasi:

Menggunakan Outliers

\[ \begin{aligned} \bar{X} = \frac{\sum fX}{n} = \frac {1000(23.5)+ 1500(34.5)+ 1200(44.5)+ 800(54.5)+ 500(64.5)}{5000} \end{aligned} \] \[ \begin{aligned} = \frac {204,500}{5000} = 40.9tahun \end{aligned} \]

Tanpa menggunakan Outliers

Tabel Data Kelompok untuk frekuensi kumulatif dan nilai tengah analisis tanpa outliers
Kelompok_usia_.Tahun. Frekuensi_penerima_dosis_vaksin Nilai_tengah hasil_kali_frekuensi_dan_nilai_tengah
18 - 29 1000 23.5 23,500
30 - 39 1500 34.5 51,750
40 - 49 1200 44.5 53,400
50 - 59 800 54.5 43,600

Total frekuensi tanpa outliers:

\[ n=1000+1500+1200+800=4500 \]

Menghitung Mean Tanpa Outliers:

\[ \begin{aligned} \bar{X} = {\sum fX} = {23,500+ 51,750 + 53,400 + 43,600} = 172,250 \end{aligned} \] \[ \begin{aligned} = \frac {172,250}{4500} = 38.22 tahun \end{aligned} \]

Kesimpulan :

  • Mean dengan Outliers adalah 40.9, yang mencakup seluruh data, termasuk kelompok usia 60 - 69 yang dianggap sebagai outlier.

  • Mean tanpa Outliers adalah 38.22, yang diperoleh setelah mengabaikan kelompok usia 60 - 69 yang dianggap sebagai outlier.

  • Pengaruh Outliers: Mean dengan outliers lebih tinggi, menunjukkan pengaruh kelompok usia yang lebih tua yang memiliki nilai lebih tinggi (64.5), yang mempengaruhi rata-rata keseluruhan. Setelah menghapus data outlier, rata-rata menjadi lebih rendah, mencerminkan distribusi data mayoritas penerima vaksin.

Median :

Menggunakan Outliers

\[ \begin{aligned} \text{Median} = tb + \left( \frac{\frac{n}{2} - F}{F_m} \right). C \end{aligned} \]

\[ \begin{aligned} \text{Median} &= 29.5 + \left( \frac{\frac{5000}{2} - 1000}{1500} \right) 10 \\ &= 29.5 + \left( \frac{2500 - 1000}{1500} \right) 10 \\ &= 29.5 + 10 \\ &=39.5 tahun \end{aligned} \]

Tanpa menggunakan Outliers

Jumlah total frekuensi tanpa outliers 𝑛=4500

\[ \frac {n}{2} = \frac {4500}{2} = 2250 \] menghitung median tanpa outliers :

\[ \begin{aligned} \text{Median} &= 29.5 + \left( \frac{\frac{4500}{2} - 1000}{1500} \right) 10 \\ &= 29.5 + \left( \frac{2250 - 1000}{1500} \right) 10 \\ &= 29.5 + 8.33 \\ &=37.83 tahun \end{aligned} \]

Kesimpulan :

  • Median dengan Outliers (menghitung dengan seluruh data) adalah 39.5.

  • Median tanpa Outliers (mengabaikan kelompok usia 60 - 69 sebagai outlier) adalah 37.83.

  • Pengaruh Outliers: Perbedaan nilai median menunjukkan bahwa kelompok usia yang lebih tua (60 - 69) yang dianggap sebagai outlier memiliki dampak pada nilai median. Setelah mengabaikan outlier, nilai median sedikit lebih rendah, mencerminkan distribusi data mayoritas penerima vaksin yang lebih terpusat.

Modus :

Menggunnakan Outliers dan tanpa menggunakan Outliers

\[ \begin{aligned} \text{Modus} = tb + \left( \frac{(f_1 - f_0) }{f_1 - f_0 + (f_1 - f_2)} \right).C \end{aligned} \]

\[ \begin{aligned} \text{Mod} = tb + \left( \frac{(f_1)_0}{(f_1)_0 + (f_2)_0} \right).C \end{aligned} \]

\[ \begin{aligned} \text{Mod} &= 29.5 \left( \frac{500}{500 + 300} \right) 10\\ &= 29.5 + (0.625) \\ &= 35.75tahun \end{aligned} \]

Jadi modus diatas terdapat pada usia sekitar 36.25 tahun adalah usia yang paling sering mendapatkan vaksin, yang termasuk dalam kelompok usia 30 - 39 tahun.

Kesimpulan :

  • Nilai modus tidak terpengaruh oleh outliers dalam data ini.

  • Hal ini disebabkan oleh posisi kelas modus ( 30 − 39 ) yang tidak berubah meskipun outlier (kelas 60−69) dikeluarkan.

  • Modus memberikan informasi tentang kelompok usia yang paling umum dalam data penerima vaksin, yaitu 30 - 39 tahun, terlepas dari keberadaan outliers.

  • Penggunaan batas bawah 𝐿= 29.5 menghasilkan nilai modus yang sama untuk kedua metode. Ini terjadi karena frekuensi tertinggi tetap berada di kelas yang sama ( 30 − 39), sehingga outlier tidak memengaruhi hasil perhitungan modus.

Validasi Data

untuk memvalidasi data maka menggunakan presentase efektivitas vaksinasi tiap kelompok usia ( dalam bentuk % ) :

Tabel Data Kelompok untuk mevalidasi data menggunakan presentase efektivitas vaksinasi
Kelompok_Usia.Tahun. Frekuensi_penerima_vaksin Efektivitas_Vaksinasi…
18 - 29 1000 98%
30 - 39 1500 97%
40 - 49 1200 95%
50 - 59 800 90%
60 - 69 500 85%

Langkah-langkah validasi:

  1. Menghitung Total Efektivitas Vaksinasi dengan rumus :

\[ \text{Rata-rata Efektivitas} = \frac{\Sigma (\text{Frekuensi} \times \text{Efektivitas})}{\Sigma (\text{Frekuensi})} \]

Perhitungan:

\[ \begin{aligned} \text{Rata-rata Efektivitas} = \frac{(1000 \times 98) + (1500 \times 97) + (1200 \times 95) + (800 \times 90) + (500 \times 85)}{5000} \end{aligned} \]

\[ \begin{aligned} = \frac{98000 + 145500 + 114000 + 72000 + 42500}{5000} \end{aligned} \]

\[ \begin{aligned} = \frac{472000}{5000} = 94.4\% \end{aligned} \]

Jadi, rata-rata efektivitas vaksinasi adalah \({94.4\%}\).

  1. Membandingkan dengan Ambang Keberhasilan 99% :

Jika standar keberhasilan adalah 99%, rata-rata efektivitas sebesar 94.4% belum mencapai angka ini. Dengan demikian, vaksinasi pada kelompok ini belum memenuhi kriteria keberhasilan 99%.

  1. Analisis Per Kelompok Usia yang mendekati atau melebihi 99%:
  • Kelompok usia 18 - 29 tahun memiliki efektivitas tertinggi, yaitu 98%, tetapi masih di bawah 99%.

  • Kelompok lainnya memiliki efektivitas yang semakin menurun dengan bertambahnya usia.

  1. Kesimpulan Validasi:
  • Secara keseluruhan, rata-rata efektivitas vaksinasi adalah 94.4%, yang belum mencapai target keberhasilan 99%.

  • Per kelompok, tidak ada kelompok yang mencapai atau melebihi ambang 99%.

  • Untuk mencapai keberhasilan 99%, diperlukan strategi tambahan, seperti meningkatkan cakupan vaksinasi, optimasi dosis untuk kelompok usia tertentu, atau evaluasi terhadap jenis vaksin yang digunakan.

1.2.3 Pendidikan

Topik: Menganalisis bagaimana penggunaan media sosial memengaruhi produktivitas belajar siswa.

data tentang waktu penggunaan media sosial siswa setiap hari (dalam jam) dan rata-rata nilai ujian yang mereka peroleh. Data dibagi dalam kelompok waktu penggunaan media sosial sebagai berikut :

Tabel Data Kelompok untuk median frekuensi kumulatif
waktu_Penggunaan_Media_Sosial_.jam.hari. Frekuensi_siswa Rata_rata_nilai_ujian_.1.100.
0 - 1 8 85
2 - 3 12 75
4 - 5 10 65
6 - 7 5 60

Penyelesaian :

Diketahui bahwa titik tengah, Frekuensi Kumulatif adalah sebagai berikut :

Tabel Data Kelompok untuk frekuensi kumulatif dan nilai tengah analisis menggunakan outliers
waktu_Penggunaan_Media_Sosial_.jam.hari. Frekuensi_siswa Fkk Titik_tengah hasil_kali_frekuensi_dan_titik_tengah
0 - 1 8 8 0.5 4
2 - 3 12 20 2.5 30
4 - 5 10 30 4.5 45
6 - 7 5 35 6.5 32.5

Mean :

Total frekuensi \((𝑁) = 35\)

Total \(𝑓.𝑥 = 4 + 30 + 45 + 32.5 = 111.5\)

hitung rata-rata penggunaan media sosial:

Menggunakan Outliers

\[ \begin{aligned} \bar{X} = \frac{\sum fX}{n} = \frac {8(0.5)+ 12(2.5)+ 10(4.5)+ 5(6.5)}{35} = \frac {111.5}{35} = 3.18 jam/hari. \end{aligned} \]

Tanpa menggunakan outliers

  • Hitung total hasil kali 𝑓⋅𝑥 tanpa outliers:

\[ Total f⋅x = 4 + 30 + 45 = 79 \] - Jumlah frekuensi (𝑛) tanpa outliers:

\[ n = 8 + 12 + 10 = 30 \]

  • hitung mean :

\[ \begin{aligned} \bar{X} = \frac{\sum fX}{n} = \frac {8(0.5)+ 12(2.5)+ 10(4.5)}{30} = \frac {79}{30} = 2.63 jam/hari. \end{aligned} \]

Kesimpulan :

  • Pengaruh outliers pada mean sangat signifikan. Nilai mean dengan outliers lebih tinggi dibandingkan tanpa outliers.

  • Mean tanpa outliers memberikan representasi yang lebih akurat terhadap waktu penggunaan media sosial mayoritas siswa.

  • Keputusan untuk menggunakan mean dengan atau tanpa outliers tergantung pada tujuan analisis:

    • Dengan outliers: Menggambarkan seluruh distribusi data, termasuk ekstrem.

    • Tanpa outliers: Memberikan gambaran yang lebih stabil dan realistis terhadap data umum.

Median :

Menggunakan Outliers

\[ \begin{aligned} \text{Median} = L_0 + \left( \frac{\frac{n}{2} - F}{F_m} \right). C \end{aligned} \]

\[ \begin{aligned} \text{Median} &= 2 + \left( \frac{\frac{35}{2} - 8}{12} \right) 2 \\ &= 2 + \left( \frac{17.5−8}{12} \right) 2 \\ &= 2+ 1,58 \\ &=3.58 jam/hari. \end{aligned} \]

tanpa menggunakan ourliers

Tabel Data Kelompok untuk frekuensi kumulatif dan nilai tengah analisis tanpa outliers
waktu_Penggunaan_Media_Sosial_.jam.hari. Frekuensi_siswa Fkk
0 - 1 8 8
2 - 3 12 20
4 - 5 10 30
  • mencari :

\[ \frac{n}{2} = \frac{30}{2} = 15 \] - hitung median :

\[ \begin{aligned} \text{Median} &= 2 + \left( \frac{\frac{30}{2} - 8}{12} \right) 2 \\ &= 2 + \left( \frac{15−8}{12} \right) 2 \\ &= 2+ 1,17 \\ &=3.17 jam/hari. \end{aligned} \]

Kesimpulan :

  • Pengaruh outliers pada median tidak terlalu besar, tetapi tetap memberikan perbedaan. Median dengan outliers sedikit lebih tinggi, mencerminkan pengaruh data ekstrem pada nilai tengah.

  • Median tanpa outliers memberikan gambaran yang lebih stabil dan representatif untuk mayoritas data, dengan waktu penggunaan media sosial yang lebih realistis bagi sebagian besar siswa.

Modus :

Menggunakan Outliers dan tanpa outliers

\[ \begin{aligned} \text{Modus} = L_0 + \left( \frac{(f_1 - f_0) }{f_1 - f_0 + (f_1 - f_2)} \right) C \end{aligned} \]

\[ \begin{aligned} \text{Mod} = L_0 \left( \frac{(f_1)_0}{(f_1)_0 + (f_2)_0} \right).C \end{aligned} \] \[ \begin{aligned} \text{Modus} = 2 + \left( \frac{(12−8) }{12 - 8 + (12 - 10)} \right). 2 \end{aligned} \] \[ \begin{aligned} \text{Mod} &= 2 \left( \frac{4}{4 + 2} \right). 2\\ &= 2+1.33 \\ &= 3.33 jam/hari. \end{aligned} \]

Berdasarkan perhitungan menggunakan metode modus, ditemukan bahwa kelas interval 2 - 3 jam/hari adalah kelas dengan frekuensi tertinggi, yaitu sebanyak 12 siswa. Dengan didapatkan nilai modus sebesar 2.67 jam/hari.

Kesimpulan :

  • Modus dengan dan tanpa outliers menghasilkan nilai yang sama dalam kasus ini. Ini menunjukkan bahwa data dalam kelompok ini cukup terkonsentrasi pada kelas dengan frekuensi tinggi (2 - 3 jam/hari), sehingga pengaruh data ekstrem pada kelas 6 - 7 jam/hari tidak terlalu mempengaruhi nilai modus.

  • Modus yang ditemukan adalah 3.33 jam/hari, yang menunjukkan waktu penggunaan media sosial yang paling umum digunakan oleh siswa dalam dataset ini, baik dengan maupun tanpa memperhitungkan outliers.

