Praktikum Ukuran Pemusatan Data

Statistika Dasar

1 Praktikum 1

1.1 Mean untuk Data Kelompok

Mean untuk data kelompok merupakan representasi nilai yang terdapat pada suatu data yang disajikan dalam bentuk kelompok. Dalam bentuk ini, nilai mean diperoleh dari hasil bagi antara perkalian frekuensi setiap kelas dan nilai tengah pada setiap kelas dengan jumlah frekuensi.

Mean untuk data kelompok memiliki rumus sebagai berikut: \[ \bar{X} = \frac {∑f \cdot x_i}{∑f} \] Keterangan: \[ \bar{X} = Nilai~mean~(rata-rata)~untuk~data~kelompok\\ ∑f = Jumlah~total~frekuensi\\ x_i = Nilai~tengah~(x_i)~dari~kelas~interval,~dihitung~dengan~rumus: \]

\[ x_i = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2} \] Langkah-langkah untuk menghitung mean untuk data kelompok, yaitu:

  1. Menentukan tepi bawah dan tepi atas kelas lalu menghitung nilai tengah dengan menjumlahkan tepi bawah dan tepi atas kelas setelah itu dibagi dengan 2.

  2. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))

  3. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\))

  4. Menghitung jumlah total frekuensi (∑f): dengan cara menjumlahkan semua frekuensi yang ada.

  5. Memasukkan ke dalam rumus lalu menghitung secara matematical.

1.1.1 Contoh

Berikut adalah data nilai ujian Statistika Dasar dari 30 mahasiswa Sains Data.

Nilai Frekuensi (f)
30 - 39 1
40 - 49 4
50 - 59 5
60 - 69 7
70 - 79 6
80 - 89 3
90 - 99 4

1.1.1.1 Mean dengan Outlier

1.Menentukan nilai tengah (\(x\))

  • Interval 30 - 39 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {29,5+39,5}{2}=34,5\)

  • Interval 40 - 49 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {39,5+49,5}{2}=44,5\)

  • Interval 50 - 59 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {49,5+59,5}{2}=54,5\)

  • Interval 60 - 69 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {59,5+69,5}{2}=64,5\)

  • Interval 70 - 79 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {69,5+79,5}{2}=74,5\)

  • Interval 80 - 89 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {79,5+89,5}{2}=84,5\)

  • Interval 90 - 99 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {89,5+99,5}{2}=94,5\)

Nilai Frekuensi (\(f\)) Nilai Tengah (\(x_i\))
30 - 39 1 34.5
40 - 49 4 44.5
50 - 59 5 54.5
60 - 69 7 64.5
70 - 79 6 74.5
80 - 89 3 84.5
90 - 99 4 94.5
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval 30 - 39 : \(f \cdot x_i= 1 \cdot 34,5= 34,5\)

  • Interval 40 - 49 : \(f \cdot x_i= 4 \cdot 44,5= 178\)

  • Interval 50 - 59 : \(f \cdot x_i= 5 \cdot 54,5= 272,5\)

  • Interval 60 - 69 : \(f \cdot x_i= 7 \cdot 64,5= 451,5\)

  • Interval 70 - 79 : \(f \cdot x_i= 6 \cdot 74,5= 447\)

  • Interval 80 - 89 : \(f \cdot x_i= 3 \cdot 84,5= 253,5\)

  • Interval 90 - 99 : \(f \cdot x_i= 4 \cdot 94,5= 378\)

Nilai Frekuensi (\(f\)) Nilai Tengah (\(x_i\)) \(f \cdot x_i\)
30 - 39 1 34.5 34.5
40 - 49 4 44.5 178
50 - 59 5 54.5 272.5
60 - 69 7 64.5 451.5
70 - 79 6 74.5 447
80 - 89 3 84.5 253.5
90 - 99 4 94.5 378
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=34,5+178+272,5+451,5+447+253,5+378=2015\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=1+4+5+7+6+3+4=30\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {2015}{30}=67,17\]

1.1.1.2 Mean tanpa Outlier

Menganggap interval kelas 30 - 39 sebagai outlier dalam analisis data kelompok dapat dipertimbangkan karena frekuensinya yang sangat rendah (hanya 1 mahasiswa) dibandingkan dengan kelas lainnya, serta distribusi data yang lebih terkonsentrasi pada nilai yang lebih tinggi seperti 60 - 69 dan 70 - 79. Selain itu, rentang nilai kelas 30 - 39 yang jauh lebih rendah juga dapat dianggap sebagai anomali dalam konteks data yang lebih luas. Dalam visualisasi data, kelas ini terlihat terpisah dari pola distribusi umum, sehingga dapat dipandang sebagai data yang tidak sesuai dengan pola mayoritas. Penghapusan kelas ini juga dapat membantu untuk fokus pada kelompok data yang lebih relevan dan memberikan gambaran distribusi yang lebih representatif.

Nilai Frekuensi (\(f\))
40 - 49 4
50 - 59 5
60 - 69 7
70 - 79 6
80 - 89 3
90 - 99 4

1.Menentukan nilai tengah (\(x\))

  • Interval 40 - 49 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {39,5+49,5}{2}=44,5\)

  • Interval 50 - 59 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {49,5+59,5}{2}=54,5\)

  • Interval 60 - 69 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {59,5+69,5}{2}=64,5\)

  • Interval 70 - 79 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {69,5+79,5}{2}=74,5\)

  • Interval 80 - 89 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {79,5+89,5}{2}=84,5\)

  • Interval 90 - 99 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {89,5+99,5}{2}=94,5\)

Nilai Frekuensi (\(f\)) Nilai Tengah (\(x_i\))
40 - 49 4 44.5
50 - 59 5 54.5
60 - 69 7 64.5
70 - 79 6 74.5
80 - 89 3 84.5
90 - 99 4 94.5
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval 40 - 49 : \(f \cdot x_i= 4 \cdot 44,5= 178\)

  • Interval 50 - 59 : \(f \cdot x_i= 5 \cdot 54,5= 272,5\)

  • Interval 60 - 69 : \(f \cdot x_i= 7 \cdot 64,5= 451,5\)

  • Interval 70 - 79 : \(f \cdot x_i= 6 \cdot 74,5= 447\)

  • Interval 80 - 89 : \(f \cdot x_i= 3 \cdot 84,5= 253,5\)

  • Interval 90 - 99 : \(f \cdot x_i= 4 \cdot 94,5= 378\)

Interval Nilai Frekuensi (\(f\)) Nilai Tengah (\(x_i\)) \(f \cdot x_i\)
40 - 49 4 44.5 178
50 - 59 5 54.5 272.5
60 - 69 7 64.5 451.5
70 - 79 6 74.5 447
80 - 89 3 84.5 253.5
90 - 99 4 94.5 378
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=178+272,5+451,5+447+253,5+378=1980,5\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=4+5+7+6+3+4=29\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {1980,5}{29}=68,29\]

1.1.1.3 Mean dengan Boxplot

1.1.1.4 Mean dengan Histogram

1.1.1.5 Analisis Mean

Mean dengan Outlier: 67,17

Mean tanpa Outlier: 68,29

Interpretasi:

Nilai mean memberikan gambaran tentang nilai rata-rata ujian Statistika Dasar pada populasi mahasiswa yang diteliti. Perbedaan antara mean dengan outlier (67,17) dan mean tanpa outlier (68,29) menunjukkan bahwa kehadiran interval 30 - 39 yang memiliki frekuensi sangat rendah (hanya 1 mahasiswa) memengaruhi sedikit nilai rata-rata keseluruhan, tetapi cukup untuk menurunkan rata-rata tersebut. Meskipun sebagian besar mahasiswa memiliki nilai yang lebih tinggi, satu mahasiswa dengan nilai yang jauh lebih rendah menarik rata-rata menjadi lebih rendah.

Pengaruh terhadap Kasus:

Jika kita hanya melihat mean tanpa outlier (68,29), rata-rata nilai ujian lebih realistis dan menunjukkan bahwa mayoritas mahasiswa memiliki nilai yang cukup baik, dengan konsentrasi nilai di rentang 60 ke atas. Ini berarti bahwa meskipun ada satu mahasiswa yang memiliki nilai sangat rendah, sebagian besar mahasiswa menunjukkan kinerja yang baik di ujian ini.

1.2 Median untuk Data Kelompok

Median adalah nilai tengah dari data yang telah diurutkan. Untuk data kelompok, median dihitung dengan menggunakan rumus khusus yang memperhitungkan kelas interval. Median membagi data menjadi dua bagian yang sama besar: separuh data berada di bawah median, dan separuh berada di atasnya.

Median untuk data kelompok memiliki rumus sebagai berikut:

\[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p \] Keterangan: \[ M_e = Nilai~median~untuk~data~kelompok\\ T_b = Tepi~bawah~kelas~median~data~kelompok\\ ∑f = Jumlah~total~frekuensi\\ f_k = Frekuensi~kumulatif~sebelum~kelas~median\\ f_m = Frekuensi~kelas~median\\ p = Panjang~interval~kelas \] Langkah-langkah dalam menghitung median untuk data kelompok:

  1. Menghitung jumlah total frekuensi (∑f): dengan cara menjumlahkan semua frekuensi yang ada.

  2. Membagi jumlah total frekuensi dengan 2.

  3. Menentukan frekuensi kumulatif: frekuensi kumulatif adalah jumlah frekuensi yang dihitung secara bertahap dari awal hingga akhir, dengan menambahkan frekuensi pada setiap langkah. Langkah-langkah menentukan frekuensi kumulatif, yaitu: Mulai dari frekuensi kelas pertama, Tambahkan frekuensi setiap kelas ke jumlah frekuensi sebelumnya secara berurutan.

  4. Menentukan kelas median: kelas median merupakan interval kelas yang mengandung jumlah total frekuensi dibagi dengan 2 dari distribusi frkuensi kumulatif.

  5. Menentukan frekuensi kumulatif sebelum kelas median.

  6. Menentukan frekuensi kelas median.

  7. Menentukan panjang interval kelas.

  8. Menentukan tepi bawah kelas median.

  9. Memasukkan ke dalam rumus lalu menghitung secara matematical.

1.2.1 Contoh

Berikut adalah data nilai ujian Statistika Dasar dari 30 mahasiswa Sains Data.

Nilai Frekuensi (f)
30 - 39 1
40 - 49 4
50 - 59 5
60 - 69 7
70 - 79 6
80 - 89 3
90 - 99 4

1.2.1.1 Median Dengan Outlier

  1. Menghitung jumlah total frekuensi (∑f) \[∑f=1+4+5+7+6+3+4=30\]
  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {30}{2} = 15\]
  3. Menentukan frekuensi kumulatif
Interval Nilai Frekuensi (\(f\)) Frekuensi Kumulatif
30 - 39 1 1
40 - 49 4 5
50 - 59 5 10
60 - 69 7 17
70 - 79 6 23
80 - 89 3 26
90 - 99 4 30
  1. Menentukan kelas median

Kelas median adalah 60 - 69 (frekuensi kumulatif sebelum kelas ini adalah 10, dan kumulatif kelas ini mencapai 17).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 10\]

  2. Menentukan frekuensi kelas median. \[f_m= 7\]

  3. Menentukan panjang interval kelas. \[p= 10\]

  4. Menentukan tepi bawah kelas median. \[T_b = 59,5\]

  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 59,5 + \frac {15-10}{7} \cdot 10 = 66,64 \]

1.2.1.2 Median Tanpa Outlier

Menganggap interval kelas 30 - 39 sebagai outlier dalam analisis data kelompok dapat dipertimbangkan karena frekuensinya yang sangat rendah (hanya 1 mahasiswa) dibandingkan dengan kelas lainnya, serta distribusi data yang lebih terkonsentrasi pada nilai yang lebih tinggi seperti 60 - 69 dan 70 - 79. Selain itu, rentang nilai kelas 30 - 39 yang jauh lebih rendah juga dapat dianggap sebagai anomali dalam konteks data yang lebih luas. Dalam visualisasi data, kelas ini terlihat terpisah dari pola distribusi umum, sehingga dapat dipandang sebagai data yang tidak sesuai dengan pola mayoritas. Penghapusan kelas ini juga dapat membantu untuk fokus pada kelompok data yang lebih relevan dan memberikan gambaran distribusi yang lebih representatif.

Nilai Frekuensi (\(f\))
40 - 49 4
50 - 59 5
60 - 69 7
70 - 79 6
80 - 89 3
90 - 99 4
  1. Menghitung jumlah total frekuensi (∑f) \[∑f=4+5+7+6+3+4=29\]
  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {29}{2} = 14,5\]
  3. Menentukan frekuensi kumulatif
Nilai Frekuensi (\(f\)) Frekuensi Kumulatif
40 - 49 4 4
50 - 59 5 9
60 - 69 7 16
70 - 79 6 22
80 - 89 3 25
90 - 99 4 29
  1. Menentukan kelas median

Kelas median adalah 60 - 69 (frekuensi kumulatif sebelum kelas ini adalah 9, dan kumulatif kelas ini mencapai 16).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 9\]
  2. Menentukan frekuensi kelas median. \[f_m= 7\]
  3. Menentukan panjang interval kelas. \[p= 10\]
  4. Menentukan tepi bawah kelas median. \[T_b = 59,5\]
  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 59,5 + \frac {14,5-9}{7} \cdot 10 = 67,36 \]

1.2.1.3 Median dengan Boxplot

1.2.1.4 Median dengan Histogram

1.2.1.5 Analisis Median

Median dengan Outlier: 66,64

Median tanpa Outlier: 67,36

Interpretasi:

Nilai median menunjukkan posisi tengah dari data yang telah diurutkan. Median dengan outlier (66,64) sedikit lebih rendah daripada median tanpa outlier (67,36), yang mengindikasikan bahwa penghapusan interval kelas 30 - 39, yang memiliki frekuensi sangat rendah, sedikit menggeser posisi tengah data ke atas. Meskipun nilai median dengan outlier menunjukkan posisi tengah data secara keseluruhan, penghapusan kelas 30 - 39 yang terisolasi memberikan gambaran yang lebih akurat tentang distribusi data mayoritas, yaitu nilai-nilai ujian yang lebih tinggi.

Pengaruh terhadap Kasus:

Jika kita hanya melihat median tanpa outlier (67,36), posisi tengah data menjadi sedikit lebih tinggi, yang mencerminkan kenyataan bahwa mayoritas mahasiswa memiliki nilai di atas 60, dengan konsentrasi nilai yang cukup besar di rentang 60 - 69 dan 70 - 79. Hal ini menunjukkan bahwa, meskipun ada satu nilai yang sangat rendah, mayoritas mahasiswa berada di atas nilai tengah, yang menunjukkan kinerja yang lebih baik di ujian Statistika Dasar.

1.3 Modus untuk Data Kelompok

Modus untuk data kelompok adalah nilai yang paling sering muncul atau memiliki frekuensi tertinggi dalam distribusi data kelompok.

Modus untuk data kelompok memiliki rumus sebagai berikut:

\[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p \]

Keterangan:

\[ M_O = Nilai~modus~untuk~data~kelompok\\ T_b = Tepi~bawah~kelas~modus~data~kelompok\\ d_1 = Selisih~frekuensi~kelas~modus~dengan~frekuensi~sebelum~kelas~modus\\ d_2 = Selisih~frekuensi~kelas~modus~dengan~frekuensi~setelah~kelas~modus\\ p = Panjang~interval~kelas \]

Langkah-langkah dalam menghitung modus untuk data kelompok, yaitu:

  1. Mengidentifikasi kelas modus : Dengan cara mencari kelas yang memiliki frekuensi tertinggi.

  2. Menentukan tepi bawah kelas modus : Dengan cara mengurangi batas bawah kelas modus tersebut dengan 0,5.

  3. Menentukan \(d_1\):selisih frekuensi kelas modus dengan frekuensi sebelum kelas modus.

  4. Menentukan \(d_2\):selisih frekuensi kelas modus dengan frekuensi setelah kelas modus.

  5. Mentukan panjang interval kelas.

  6. Memasukkan ke dalam rumus lalu menghitung secara matematical.

1.3.1 Contoh

Berikut adalah data nilai ujian Statistika Dasar dari 30 mahasiswa Sains Data.

Nilai Frekuensi (f)
30 - 39 1
40 - 49 4
50 - 59 5
60 - 69 7
70 - 79 6
80 - 89 3
90 - 99 4

1.3.1.1 Modus Dengan Outlier

  1. Mengidentifikasi kelas modus

Kelas modus adalah 60-69 karena memiliki frekuensi tertinggi yaitu 7

  1. Menentukan tepi bawah kelas modus \[ T_b = 59,5 \]
  2. Menentukan \(d_1\) \[ d_1 = 7-5 = 2\]
  3. Menentukan \(d_2\) \[ d_2 = 7-6 = 1\]
  4. Mentukan panjang interval kelas \[p= 10\]
  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 59,5 + \frac {2}{2+1} \cdot 10 = 66,17 \]

1.3.1.2 Modus Tanpa Outlier

Menganggap interval kelas 30 - 39 sebagai outlier dalam analisis data kelompok dapat dipertimbangkan karena frekuensinya yang sangat rendah (hanya 1 mahasiswa) dibandingkan dengan kelas lainnya, serta distribusi data yang lebih terkonsentrasi pada nilai yang lebih tinggi seperti 60 - 69 dan 70 - 79. Selain itu, rentang nilai kelas 30 - 39 yang jauh lebih rendah juga dapat dianggap sebagai anomali dalam konteks data yang lebih luas. Dalam visualisasi data, kelas ini terlihat terpisah dari pola distribusi umum, sehingga dapat dipandang sebagai data yang tidak sesuai dengan pola mayoritas. Penghapusan kelas ini juga dapat membantu untuk fokus pada kelompok data yang lebih relevan dan memberikan gambaran distribusi yang lebih representatif.

Nilai Frekuensi (\(f\))
40 - 49 4
50 - 59 5
60 - 69 7
70 - 79 6
80 - 89 3
90 - 99 4
  1. Mengidentifikasi kelas modus

Kelas modus adalah 60-69 karena memiliki frekuensi tertinggi yaitu 7 Menentukan \(d_1\)

  1. Menentukan tepi bawah kelas modus \[ T_b = 59,5 \]

  2. Menentukan \(d_1\) \[ d_1 = 7-5 = 2\]

  3. Menentukan \(d_2\) \[ d_2 = 7-6 = 1\]

  4. Mentukan panjang interval kelas \[p= 10\]

  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 59,5 + \frac {2}{2+1} \cdot 10 = 66,17 \]

1.3.1.3 Modus dengan Boxplot

1.3.1.4 Modus dengan Histogram

1.3.1.5 Analisis Modus

Modus dengan Outlier: 66,17

Modus tanpa Outlier: 66,17

Interpretasi:

Nilai modus menunjukkan nilai yang paling sering muncul dalam distribusi data. Dalam kasus ini, baik dengan atau tanpa outlier, modus tetap berada pada nilai 66,17. Ini karena kelas dengan frekuensi tertinggi (60-69) tetap menjadi kelas modus baik sebelum maupun setelah penghapusan interval kelas 30 - 39. Meskipun kelas 30 - 39 memiliki frekuensi yang sangat rendah dan dapat dianggap sebagai outlier, penghapusan kelas ini tidak mempengaruhi hasil perhitungan modus secara signifikan.

Pengaruh terhadap Kasus:

Modus ini menunjukkan bahwa nilai ujian yang paling sering ditemui di kalangan mahasiswa adalah di rentang 60 - 69. Artinya, sebagian besar mahasiswa memperoleh nilai yang berada di kisaran tersebut, yang mencerminkan konsentrasi tinggi di kelompok nilai sedang. Penghapusan kelas dengan frekuensi rendah (30 - 39) tidak mengubah distribusi mayoritas data, yang tetap menunjukkan bahwa mayoritas mahasiswa berada dalam kategori nilai menengah.

2 Praktikum 2

Contoh sederhana yang menggunakan ukuran pemusatan data dalam studi kasus

2.1 Bisnis

Sebuah perusahaan ingin menganalisis distribusi gaji bulanan karyawan mereka untuk memahami rentang gaji yang paling umum diterima di perusahaan tersebut. Data ini akan membantu perusahaan dalam melakukan perencanaan kebijakan gaji dan menentukan apakah struktur gaji yang ada perlu disesuaikan untuk menarik dan mempertahankan talenta terbaik. Perusahaan mengelompokkan data gaji bulanan karyawan dalam beberapa rentang gaji, seperti berikut:

Rentang Gaji Jumlah Karyawan (f)
$0 - $999 8
$1000 - $1999 15
$2000 - $2999 25
$3000 - $3999 20
$4000 - $4999 10
$5000 - $5999 5

Gaji $5000 - $5999 dianggap sebagai outlier karena frekuensinya jauh lebih rendah dibandingkan dengan rentang gaji lainnya, dan angkanya jauh lebih tinggi dibandingkan dengan sebagian besar data, yang menciptakan ketidakseimbangan dalam distribusi gaji secara keseluruhan. Maka data tanpa outlier, seperti berikut:

Rentang Gaji Jumlah Karyawan (f)
$0 - $999 8
$1000 - $1999 15
$2000 - $2999 25
$3000 - $3999 20
$4000 - $4999 10

2.1.1 Mean dengan Outlier

1.Menentukan nilai tengah (\(x_i\))

  • Interval $0 - $999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {-0,5+999,5}{2}=499,5\)

  • Interval $1000 - $1999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {999,5+1999,5}{2}=1499,5\)

  • Interval $2000 - $2999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {1999,5+2999,5}{2}=2499,5\)

  • Interval $3000 - $3999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {2999,5+3999,5}{2}=3499,5\)

  • Interval $4000 - $4999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {3999,5+4999,5}{2}=4499,5\)

  • Interval $5000 - $5999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {4999,5+5999,5}{2}=5499,5\)

Rentang Gaji Frekuensi (f) Nilai Tengah (x_i)
$0 - $999 8 499.5
$1000 - $1999 15 1499.5
$2000 - $2999 25 2499.5
$3000 - $3999 20 3499.5
$4000 - $4999 10 4499.5
$5000 - $5999 5 4499.5
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval $0 - $999 : \(f \cdot x_i= 8 \cdot 499.5= 3996\)

  • Interval $1000 - $1999 : \(f \cdot x_i= 15 \cdot 1499.5= 22492.5\)

  • Interval $2000 - $2999 : \(f \cdot x_i= 25 \cdot 2499.5= 62487.5\)

  • Interval $3000 - $3999 : \(f \cdot x_i= 20 \cdot 3499.5= 69990\)

  • Interval $4000 - $4999 : \(f \cdot x_i= 10 \cdot 4499.5= 44995\)

  • Interval $5000 - $5999 : \(f \cdot x_i= 5 \cdot 4499.5= 27497.5\)

Rentang Gaji Frekuensi (f) Nilai Tengah (x_i) \(f_i \cdot x_i\)
$0 - $999 8 499.5 3996
$1000 - $1999 15 1499.5 22492.5
$2000 - $2999 25 2499.5 62487.5
$3000 - $3999 20 3499.5 69990
$4000 - $4999 10 4499.5 44995
$5000 - $5999 5 5499.5 27497.5
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=3996+22492.5+62487.5+69990+44995+27497.5=231458,5\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=8+15+25+20+10+5=83\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {231458,5}{83}=2788,65\]

2.1.2 Mean tanpa Outlier

1.Menentukan nilai tengah (\(x_i\))

  • Interval $0 - $999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {-0,5+999,5}{2}=499,5\)

  • Interval $1000 - $1999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {999,5+1999,5}{2}=1499,5\)

  • Interval $2000 - $2999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {1999,5+2999,5}{2}=2499,5\)

  • Interval $3000 - $3999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {2999,5+3999,5}{2}=3499,5\)

  • Interval $4000 - $4999 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {3999,5+4999,5}{2}=4499,5\)

Rentang Gaji Frekuensi (f) Nilai Tengah (x_i)
$0 - $999 8 499.5
$1000 - $1999 15 1499.5
$2000 - $2999 25 2499.5
$3000 - $3999 20 3499.5
$4000 - $4999 10 4499.5
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval $0 - $999 : \(f \cdot x_i= 8 \cdot 499.5= 3996\)

  • Interval $1000 - $1999 : \(f \cdot x_i= 15 \cdot 1499.5= 22492.5\)

  • Interval $2000 - $2999 : \(f \cdot x_i= 25 \cdot 2499.5= 62487.5\)

  • Interval $3000 - $3999 : \(f \cdot x_i= 20 \cdot 3499.5= 69990\)

  • Interval $4000 - $4999 : \(f \cdot x_i= 10 \cdot 4499.5= 44995\)

Rentang Gaji Frekuensi (f) Nilai Tengah (x_i) \(f_i \cdot x_i\)
$0 - $999 8 499.5 3996
$1000 - $1999 15 1499.5 22492.5
$2000 - $2999 25 2499.5 62487.5
$3000 - $3999 20 3499.5 69990
$4000 - $4999 10 4499.5 44995
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=3996+22492.5+62487.5+69990+44995 = 203961\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=8+15+25+20+10=78\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {203961}{78}=2641,88\]

2.1.3 Median dengan Outlier

  1. Menghitung jumlah total frekuensi (∑f) \[∑f=8+15+25+20+10+5=83\]

  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {83}{2} = 41,5\]

  3. Menentukan frekuensi kumulatif

Rentang Gaji Jumlah Karyawan (f) Frekuensi Kumulatif
$0 - $999 8 8
$1000 - $1999 15 23
$2000 - $2999 25 48
$3000 - $3999 20 68
$4000 - $4999 10 78
$5000 - $5999 5 83
  1. Menentukan kelas median

Kelas median adalah $2000 - $2999 (frekuensi kumulatif sebelum kelas ini adalah 23, dan kumulatif kelas ini mencapai 48).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 23\]

  2. Menentukan frekuensi kelas median. \[f_m= 25\]

  3. Menentukan panjang interval kelas. \[p= 1000\]

  4. Menentukan tepi bawah kelas median. \[T_b = 1999,5\]

  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 1999,5 + \frac {41,5-23}{25} \cdot 1000 = 2739,5 \]

2.1.4 Median tanpa Outlier

  1. Menghitung jumlah total frekuensi (∑f) \[∑f=8+15+25+20+10=78\]

  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {78}{2} = 39\]

  3. Menentukan frekuensi kumulatif

Rentang Gaji Jumlah Karyawan (f) Frekuensi Kumulatif
$0 - $999 8 8
$1000 - $1999 15 23
$2000 - $2999 25 48
$3000 - $3999 20 68
$4000 - $4999 10 78
  1. Menentukan kelas median

Kelas median adalah $2000 - $2999 (frekuensi kumulatif sebelum kelas ini adalah 23, dan kumulatif kelas ini mencapai 48).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 23\]

  2. Menentukan frekuensi kelas median. \[f_m= 25\]

  3. Menentukan panjang interval kelas. \[p= 1000\]

  4. Menentukan tepi bawah kelas median. \[T_b = 1999,5\]

  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 1999,5 + \frac {39-23}{25} \cdot 1000 = 2639,5 \]

2.1.5 Modus dengan Outlier

  1. Mengidentifikasi kelas modus

Kelas modus adalah $2000 - $2999 karena memiliki frekuensi tertinggi yaitu 25

  1. Menentukan tepi bawah kelas modus \[ T_b = 1999,5 \]

  2. Menentukan \(d_1\) \[ d_1 = 25-15 = 10\]

  3. Menentukan \(d_2\) \[ d_2 = 25-20 = 5\]

  4. Mentukan panjang interval kelas \[p= 1000\]

  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 1999,5 + \frac {10}{10+5} \cdot 1000 = 2666,17 \]

2.1.6 Modus tanpa Outlier

  1. Mengidentifikasi kelas modus

Kelas modus adalah $2000 - $2999 karena memiliki frekuensi tertinggi yaitu 25

  1. Menentukan tepi bawah kelas modus \[ T_b = 1999,5 \]

  2. Menentukan \(d_1\) \[ d_1 = 25-15 = 10\]

  3. Menentukan \(d_2\) \[ d_2 = 25-20 = 5\]

  4. Mentukan panjang interval kelas \[p= 1000\]

  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 1999,5 + \frac {10}{10+5} \cdot 1000 = 2666,17 \]

2.1.7 Visualisasi dengan Boxplot

2.1.8 Visualisasi dengan Histogram

2.1.9 Analisis

Mean (Rata-rata)

Mean dengan Outlier: $2788,65

Mean tanpa Outlier: $2641,88

Interpretasi:
Nilai mean memberikan gambaran tentang rata-rata gaji bulanan karyawan perusahaan. Perbedaan antara mean dengan outlier (2788,65) dan mean tanpa outlier (2641,88) menunjukkan bahwa kehadiran rentang gaji yang sangat tinggi ($5000 - $5999) yang diwakili oleh sedikit karyawan (5 orang) sedikit mempengaruhi rata-rata gaji keseluruhan. Meskipun mayoritas karyawan memiliki gaji yang lebih rendah, keberadaan gaji yang sangat tinggi ini mendorong rata-rata gaji lebih tinggi.

Pengaruh terhadap Kasus:
Jika hanya melihat mean tanpa outlier (2641,88), rata-rata gaji karyawan lebih mencerminkan distribusi gaji mayoritas, yang berada di bawah $3000. Artinya, sebagian besar karyawan menerima gaji yang relatif lebih rendah dibandingkan dengan nilai rata-rata yang tercatat saat mempertimbangkan outlier. Hal ini dapat menjadi bahan pertimbangan bagi perusahaan dalam merancang kebijakan gaji agar lebih adil dan merata.

Median

Median dengan Outlier: $2739,5

Median tanpa Outlier: $2639,5

Interpretasi:
Median menunjukkan nilai tengah dari distribusi gaji. Dalam hal ini, perbedaan antara median dengan outlier (2739,5) dan median tanpa outlier (2639,5) relatif kecil, menunjukkan bahwa kehadiran gaji tinggi tidak terlalu mempengaruhi nilai tengah distribusi. Ini menunjukkan bahwa sebagian besar karyawan memiliki gaji di bawah $3000, meskipun ada sejumlah kecil karyawan yang menerima gaji jauh lebih tinggi.

Pengaruh terhadap Kasus:
Nilai median yang dekat dengan $2700 menunjukkan bahwa separuh besar karyawan memiliki gaji yang tidak jauh dari angka tersebut, yang menunjukkan struktur gaji yang cukup konsisten di bawah $3000. Oleh karena itu, perusahaan mungkin perlu mengevaluasi kembali rentang gaji untuk memastikan keberagaman kompensasi yang lebih baik dan lebih menarik bagi talenta terbaik.

Modus

Modus dengan Outlier: $2666,17

Modus tanpa Outlier: $2666,17

Interpretasi:
Modus adalah nilai yang paling sering muncul dalam distribusi gaji. Dalam hal ini, kelas gaji yang memiliki frekuensi tertinggi adalah $2000 - $2999, dengan 25 karyawan. Baik dengan maupun tanpa outlier, modus tetap berada pada rentang gaji ini, yang menegaskan bahwa sebagian besar karyawan berada dalam kisaran gaji tersebut.

Pengaruh terhadap Kasus:
Karena modus menunjukkan nilai paling umum atau sering muncul, maka distribusi gaji yang paling sering adalah di kisaran $2000 - $2999. Ini menunjukkan bahwa mayoritas karyawan memiliki gaji yang lebih rendah, dan perusahaan mungkin perlu mempertimbangkan untuk menyesuaikan struktur gaji agar lebih kompetitif, terutama di luar rentang ini.

2.2 Kesehatan

Seorang peneliti ingin menganalisis distribusi Indeks Massa Tubuh (IMT) pada populasi dewasa di sebuah wilayah. Penelitian ini bertujuan untuk memahami pola distribusi IMT serta mengidentifikasi kelompok yang mungkin berisiko mengalami obesitas. Data IMT dikumpulkan dari 195 individu dan dikelompokkan dalam interval IMT memiliki kategori kategori sendiri terhadap interval IMT nya yaitu :

Interval IMT (kg/m²) Kategori
15.0 - 18.4 Berat badan kurang
18.5 - 24.9 Normal
25.0 - 29.9 Berat badan lebih
30.0 - 34.9 Obesitas I
35.0 - 39.9 Obesitas II
40.0 - 44.9 Obesitas III

Data IMT dari 195 individu yaitu sebagai berikut:

Interval IMT (kg/m²) Frekuensi (\(f\))
15.0 - 18.4 10
18.5 - 24.9 60
25.0 - 29.9 50
30.0 - 34.9 40
35.0 - 39.9 30
40.0 - 44.9 5

Interval 40.0 - 44.9 dianggap sebagai outlier karena frekuensinya yang sangat rendah (5), yang menunjukkan bahwa sangat sedikit individu yang memiliki IMT dalam rentang tersebut, serta posisinya yang jauh lebih tinggi dibandingkan interval lainnya.

Interval IMT (kg/m²) Frekuensi (\(f\))
15.0 - 18.4 10
18.5 - 24.9 60
25.0 - 29.9 50
30.0 - 34.9 40
35.0 - 39.9 30

2.2.1 Mean dengan Outlier

1.Menentukan nilai tengah (\(x_i\))

  • Interval 15.0 - 18.4 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {14,5+18,9}{2}=16,7\)

  • Interval 18.5 - 24.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {18+25,4}{2}=21,7\)

  • Interval 25.0 - 29.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {24,5+30,4}{2}=27,45\)

  • Interval 30.0 - 34.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {29,5+35,4}{2}=32,45\)

  • Interval 35.0 - 39.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {34,5+40,4}{2}=37,45\)

  • Interval 40.0 - 44.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {39,5+45,4}{2}=42,45\)

Interval IMT (kg/m²) Frekuensi (f) Nilai Tengah (xᵢ)
15.0 - 18.4 10 16.7
18.5 - 24.9 60 21.7
25.0 - 29.9 50 27.45
30.0 - 34.9 40 32.45
35.0 - 39.9 30 37.45
40.0 - 44.9 5 42.45
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval 15.0 - 18.4 : \(f \cdot x_i= 10 \cdot 16,7= 167\)

  • Interval 18.5 - 24.9 : \(f \cdot x_i= 60 \cdot 21,7= 1302\)

  • Interval 25.0 - 29.9 : \(f \cdot x_i= 50 \cdot 27,45= 1372,5\)

  • Interval 30.0 - 34.9 : \(f \cdot x_i= 40 \cdot 32,45= 1298\)

  • Interval 35.0 - 39.9 : \(f \cdot x_i= 30 \cdot 37,45= 1123,5\)

  • Interval 40.0 - 44.9 : \(f \cdot x_i= 5 \cdot 42,45= 212,25\)

Interval IMT (kg/m²) Frekuensi (f) Nilai Tengah (xᵢ) \(f \cdot x_i\)
15.0 - 18.4 10 16.7 167
18.5 - 24.9 60 21.7 1302
25.0 - 29.9 50 27.45 1372.5
30.0 - 34.9 40 32.45 1298
35.0 - 39.9 30 37.45 1123.5
40.0 - 44.9 5 42.45 212.25
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=167+1302+1372,5+1298+1123,5+212,25=5475,25\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=10+60+50+40+30+5=195\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {5475,25}{195}=28,08\]

2.2.2 Mean tanpa Outlier

1.Menentukan nilai tengah (\(x_i\))

  • Interval 15.0 - 18.4 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {14,5+18,9}{2}=16,7\)

  • Interval 18.5 - 24.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {18+25,4}{2}=21,7\)

  • Interval 25.0 - 29.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {24,5+30,4}{2}=27,45\)

  • Interval 30.0 - 34.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {29,5+35,4}{2}=32,45\)

  • Interval 35.0 - 39.9 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {34,5+40,4}{2}=37,45\)

Interval IMT (kg/m²) Frekuensi (f) Nilai Tengah (xᵢ)
15.0 - 18.4 10 16.7
18.5 - 24.9 60 21.7
25.0 - 29.9 50 27.45
30.0 - 34.9 40 32.45
35.0 - 39.9 30 37.45
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval 15.0 - 18.4 : \(f \cdot x_i= 10 \cdot 16,7= 167\)

  • Interval 18.5 - 24.9 : \(f \cdot x_i= 60 \cdot 21,7= 1302\)

  • Interval 25.0 - 29.9 : \(f \cdot x_i= 50 \cdot 27,45= 1372,5\)

  • Interval 30.0 - 34.9 : \(f \cdot x_i= 40 \cdot 32,45= 1298\)

  • Interval 35.0 - 39.9 : \(f \cdot x_i= 30 \cdot 37,45= 1123,5\)

Interval IMT (kg/m²) Frekuensi (f) Nilai Tengah (xᵢ) \(f \cdot x_i\)
15.0 - 18.4 10 16.7 167
18.5 - 24.9 60 21.7 1302
25.0 - 29.9 50 27.45 1372.5
30.0 - 34.9 40 32.45 1298
35.0 - 39.9 30 37.45 1123.5
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=167+1302+1372,5+1298+1123,5=5263\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=10+60+50+40+30=190\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {5263}{190}=27,7\]

2.2.3 Median dengan Outlier

  1. Menghitung jumlah total frekuensi (∑f) \[∑f=10+60+50+40+30+5=195\]

  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {195}{2} = 97,5\]

  3. Menentukan frekuensi kumulatif

Interval IMT (kg/m²) Frekuensi (\(f\)) Frekuensi Kumulatif
15.0 - 18.4 10 10
18.5 - 24.9 60 70
25.0 - 29.9 50 120
30.0 - 34.9 40 160
35.0 - 39.9 30 190
40.0 - 44.9 5 195
  1. Menentukan kelas median

Kelas median adalah 25.0 - 29.9 (frekuensi kumulatif sebelum kelas ini adalah 70, dan kumulatif kelas ini mencapai 120).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 70\]

  2. Menentukan frekuensi kelas median. \[f_m= 50\]

  3. Menentukan panjang interval kelas. \[p= 5\]

  4. Menentukan tepi bawah kelas median. \[T_b = 24,5\]

  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 24,5 + \frac {97,5-70}{50} \cdot 5 = 27,25 \]

2.2.4 Median tanpa Outlier

  1. Menghitung jumlah total frekuensi (∑f) \[∑f=10+60+50+40+30=190\]

  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {190}{2} = 95\]

  3. Menentukan frekuensi kumulatif

Interval IMT (kg/m²) Frekuensi (\(f\)) Frekuensi Kumulatif
15.0 - 18.4 10 10
18.5 - 24.9 60 70
25.0 - 29.9 50 120
30.0 - 34.9 40 160
35.0 - 39.9 30 190
  1. Menentukan kelas median

Kelas median adalah 25.0 - 29.9 (frekuensi kumulatif sebelum kelas ini adalah 70, dan kumulatif kelas ini mencapai 120).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 70\]

  2. Menentukan frekuensi kelas median. \[f_m= 50\]

  3. Menentukan panjang interval kelas. \[p= 5\]

  4. Menentukan tepi bawah kelas median. \[T_b = 24,5\]

  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 24,5 + \frac {95-70}{50} \cdot 5 = 27 \]

2.2.5 Modus dengan Outlier

  1. Mengidentifikasi kelas modus

Kelas modus adalah 18.5 - 24.9 karena memiliki frekuensi tertinggi yaitu 60

  1. Menentukan tepi bawah kelas modus \[ T_b = 18 \]

  2. Menentukan \(d_1\) \[ d_1 = 60-10 = 50\]

  3. Menentukan \(d_2\) \[ d_2 = 60-50 = 10\]

  4. Mentukan panjang interval kelas \[p= 5\]

  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 18 + \frac {50}{50+10} \cdot 5 = 22,17 \]

2.2.6 Modus tanpa Outlier

  1. Mengidentifikasi kelas modus

Kelas modus adalah 18.5 - 24.9 karena memiliki frekuensi tertinggi yaitu 60

  1. Menentukan tepi bawah kelas modus \[ T_b = 18 \]

  2. Menentukan \(d_1\) \[ d_1 = 60-10 = 50\]

  3. Menentukan \(d_2\) \[ d_2 = 60-50 = 10\]

  4. Mentukan panjang interval kelas \[p= 5\]

  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 18 + \frac {50}{50+10} \cdot 5 = 22,17 \]

2.2.7 Visualisasi dengan Boxplot

2.2.8 Visualisasi dengan Histogram

2.2.9 Analisis

Mean (Rata-rata)

Mean dengan Outlier: 28,08

Mean tanpa Outlier: 27,7

Interpretasi:

Nilai mean memberikan gambaran tentang nilai rata-rata IMT pada populasi yang diteliti. Perbedaan antara mean dengan outlier (28,08) dan mean tanpa outlier (27,7) menunjukkan bahwa kehadiran interval IMT yang sangat tinggi (40.0 - 44.9 dengan frekuensi 5) berpengaruh sedikit terhadap rata-rata keseluruhan, tetapi cukup untuk menaikkan nilai rata-rata tersebut. Ini berarti bahwa meskipun sebagian besar individu memiliki IMT yang lebih rendah, beberapa individu yang memiliki IMT sangat tinggi (obesitas morbid) menarik rata-rata IMT lebih tinggi.

Pengaruh terhadap Kasus:

Jika kita hanya melihat mean tanpa outlier (27,7), rata-rata IMT populasi lebih realistis dan menunjukkan bahwa secara umum, populasi ini cenderung berada pada kategori overweight (kelebihan berat badan). Artinya, meskipun banyak individu dalam kategori normal (IMT 18.5 - 24.9), ada juga kelompok yang cukup besar yang berada pada overweight, yang menandakan adanya risiko terhadap masalah kesehatan terkait obesitas.

Median

Median dengan Outlier: 27,25

Median tanpa Outlier: 27

Interpretasi:

Median memberikan nilai tengah yang membagi data menjadi dua bagian yang sama. Median dengan outlier (27,25) dan median tanpa outlier (27) sangat mirip, yang menunjukkan bahwa posisi nilai tengah data tidak banyak terpengaruh oleh data ekstrem pada interval IMT yang sangat tinggi (40.0 - 44.9). Artinya, median memberikan gambaran yang lebih stabil dan tidak terpengaruh oleh nilai ekstrem, serta mencerminkan bahwa sebagian besar individu dalam populasi memiliki IMT di sekitar 27, yang berada pada kategori overweight (kelebihan berat badan).

Pengaruh terhadap Kasus:

Nilai median yang dekat dengan 27 menunjukkan bahwa sebagian besar individu dalam populasi memiliki IMT yang lebih tinggi daripada kategori normal (18.5 - 24.9) tetapi tidak mencapai level obesitas berat. Ini mengindikasikan bahwa ada kecenderungan populasi untuk memiliki berat badan lebih dari yang disarankan untuk kesehatan, dengan lebih banyak individu di kategori overweight.

Modus

Modus dengan Outlier: 22,17

Modus tanpa Outlier: 22,17

Interpretasi:

Modus adalah nilai yang paling sering muncul dalam data, yaitu interval dengan frekuensi tertinggi. Dalam kasus ini, interval 18.5 - 24.9 (Normal) memiliki frekuensi tertinggi yaitu 60 individu, yang menunjukkan bahwa sebagian besar individu dalam populasi ini memiliki IMT dalam rentang yang dianggap sehat (normal). Baik dengan atau tanpa outlier, moda tetap berada pada interval ini, yang memperkuat kesimpulan bahwa mayoritas individu berada dalam kategori IMT yang sehat.

Pengaruh terhadap Kasus:

Modus yang berada pada nilai 22,17 menegaskan bahwa meskipun ada kelompok individu yang mengalami kelebihan berat badan atau obesitas, kelompok normal (IMT 18.5 - 24.9) adalah kelompok yang paling dominan. Ini menunjukkan bahwa meskipun ada permasalahan obesitas dalam populasi, sebagian besar individu memiliki IMT yang sehat.

2.3 Pendidikan

Sebuah sekolah melakukan survei untuk mengetahui berapa lama waktu yang dihabiskan siswa untuk belajar sebelum ujian akhir. Waktu belajar ini dikelompokkan dalam interval waktu tertentu. Data rentang waktu belajar siswa dalam satuan jam dengan jumlah siswa sebagai frekuensi adalah seperti berikut:

Rentang Waktu Belajar (Jam) Jumlah Siswa (f)
0 - 1 3
1 - 2 8
2 - 3 12
3 - 4 20
4 - 5 10
5 - 6 2
6 - 7 1

Rentang waktu 5-6 jam dan 6-7 jam dianggap outlier. Hal ini terjadi karena jumlah siswa pada rentang waktu ini sangat kecil dibandingkan dengan rentang waktu lainnya yang memiliki lebih banyak siswa serta distribusi waktu belajar siswa cenderung lebih terkonsentrasi di sekitar waktu yang lebih rendah, dan rentang waktu yang lebih panjang memiliki sedikit siswa, menunjukkan penyimpangan yang signifikan.

Rentang Waktu Belajar (Jam) Jumlah Siswa (f)
0 - 1 3
1 - 2 8
2 - 3 12
3 - 4 20
4 - 5 10

2.3.1 Mean dengan Outlier

1.Menentukan nilai tengah (\(x_i\))

  • Interval 0 - 1 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {-0,5+1,5}{2}=0,5\)

  • Interval 1 - 2 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {0,5+2,5}{2}=1,5\)

  • Interval 2 - 3 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {1,5+3,5}{2}=2,5\)

  • Interval 3 - 4 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {2,5+4,5}{2}=3,5\)

  • Interval 4 - 5 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {3,5+5,5}{2}=4,5\)

  • Interval 5 - 6 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {4,5+6,5}{2}=5,5\)

  • Interval 6 - 7 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {5,5+7,5}{2}=6,5\)

Rentang Waktu Belajar (Jam) Jumlah Siswa (\(f\)) Nilai Tengah (\(x_i\))
0 - 1 3 0.5
1 - 2 8 1.5
2 - 3 12 2.5
3 - 4 20 3.5
4 - 5 10 4.5
5 - 6 2 5.5
6 - 7 1 6.5
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval 0 - 1 : \(f \cdot x_i= 3 \cdot 0,5= 1,5\)

  • Interval 1 - 2 : \(f \cdot x_i= 8 \cdot 1,5= 12\)

  • Interval 2 - 3 : \(f \cdot x_i= 12 \cdot 2,5= 30\)

  • Interval 3 - 4 : \(f \cdot x_i= 20 \cdot 3,5= 70\)

  • Interval 4 - 5 : \(f \cdot x_i= 10 \cdot 4,5= 45\)

  • Interval 5 - 6 : \(f \cdot x_i= 2 \cdot 5,5= 11\)

  • Interval 6 - 7 : \(f \cdot x_i= 1 \cdot 6,5= 6,5\)

Rentang Waktu Belajar (Jam) Jumlah Siswa (\(f\)) Nilai Tengah (\(x_i\)) \(f \cdot x_i\)
0 - 1 3 0.5 1.5
1 - 2 8 1.5 12
2 - 3 12 2.5 30
3 - 4 20 3.5 70
4 - 5 10 4.5 45
5 - 6 2 5.5 11
6 - 7 1 6.5 6.5
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=1,5+12+30+70+45+11+6,5=176\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=3+8+12+20+10+2+1=56\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {176}{56}=3,14\]

2.3.2 Mean tanpa Outlier

1.Menentukan nilai tengah (\(x_i\))

  • Interval 0 - 1 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {-0,5+1,5}{2}=0,5\)

  • Interval 1 - 2 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {0,5+2,5}{2}=1,5\)

  • Interval 2 - 3 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {1,5+3,5}{2}=2,5\)

  • Interval 3 - 4 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {2,5+4,5}{2}=3,5\)

  • Interval 4 - 5 : \(x = \frac {tepi~bawah~kelas~+~tepi~atas~kelas}{2}= \frac {3,5+5,5}{2}=4,5\)

Rentang Waktu Belajar (Jam) Jumlah Siswa (\(f\)) Nilai Tengah (\(x_i\))
0 - 1 3 0.5
1 - 2 8 1.5
2 - 3 12 2.5
3 - 4 20 3.5
4 - 5 10 4.5
  1. Mengkalikan frekuensi dengan nilai tengah (\(f \cdot x_i\))
  • Interval 0 - 1 : \(f \cdot x_i= 3 \cdot 0,5= 1,5\)

  • Interval 1 - 2 : \(f \cdot x_i= 8 \cdot 1,5= 12\)

  • Interval 2 - 3 : \(f \cdot x_i= 12 \cdot 2,5= 30\)

  • Interval 3 - 4 : \(f \cdot x_i= 20 \cdot 3,5= 70\)

  • Interval 4 - 5 : \(f \cdot x_i= 10 \cdot 4,5= 45\)

Rentang Waktu Belajar (Jam) Jumlah Siswa (\(f\)) Nilai Tengah (\(x_i\)) \(f \cdot x_i\)
0 - 1 3 0.5 1.5
1 - 2 8 1.5 12
2 - 3 12 2.5 30
3 - 4 20 3.5 70
4 - 5 10 4.5 45
  1. Menghitung jumlah total dari perkalian frekuensi dengan nilai tengah (\(∑f \cdot x_i\)) \[∑f \cdot x_i=1,5+12+30+70+45=158,5\]

  2. Menghitung jumlah total frekuensi (∑f) \[∑f=3+8+12+20+10=53\]

  3. Memasukkan ke dalam rumus \[\bar{X} = \frac {∑f \cdot x_i}{∑f}= \frac {158,5}{53}=2,99\]

2.3.3 Median dengan Outlier

  1. Menghitung jumlah total frekuensi (∑f) \[∑f=3+8+12+20+10+2+1=56\]

  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {56}{2} = 28\]

  3. Menentukan frekuensi kumulatif

Rentang Waktu Belajar (Jam) Jumlah Siswa (\(f\)) Frekuensi Kumulatif
0 - 1 3 3
1 - 2 8 11
2 - 3 12 23
3 - 4 20 43
4 - 5 10 53
5 - 6 2 55
6 - 7 1 56
  1. Menentukan kelas median

Kelas median adalah 3 - 4 (frekuensi kumulatif sebelum kelas ini adalah 23, dan kumulatif kelas ini mencapai 43).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 23\]

  2. Menentukan frekuensi kelas median. \[f_m= 20\]

  3. Menentukan panjang interval kelas. \[p= 1\]

  4. Menentukan tepi bawah kelas median. \[T_b = 2,5\]

  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 2,5 + \frac {28-23}{20} \cdot 1 = 2,75 \]

2.3.4 Median tanpa Outlier

  1. Menghitung jumlah total frekuensi (∑f) \[∑f=3+8+12+20+10=53\]

  2. Membagi jumlah total frekuensi dengan 2. \[ \frac {∑f}{2} = \frac {53}{2} = 26,5\]

  3. Menentukan frekuensi kumulatif

Rentang Waktu Belajar (Jam) Jumlah Siswa (\(f\)) Frekuensi Kumulatif
0 - 1 3 3
1 - 2 8 11
2 - 3 12 23
3 - 4 20 43
4 - 5 10 53
  1. Menentukan kelas median

Kelas median adalah 3 - 4 (frekuensi kumulatif sebelum kelas ini adalah 23, dan kumulatif kelas ini mencapai 43).

  1. Menentukan frekuensi kumulatif sebelum kelas median. \[f_k= 23\]

  2. Menentukan frekuensi kelas median. \[f_m= 20\]

  3. Menentukan panjang interval kelas. \[p= 1\]

  4. Menentukan tepi bawah kelas median. \[T_b = 2,5\]

  5. Memasukkan ke dalam rumus. \[ M_e = T_b + \frac {\frac{∑f}{2}-f_k}{f_m} \cdot p = 2,5 + \frac {26,5-23}{20} \cdot 1 = 2,675 \]

2.3.5 Modus dengan Outlier

  1. Mengidentifikasi kelas modus

Kelas modus adalah 3 - 4 karena memiliki frekuensi tertinggi yaitu 20

  1. Menentukan tepi bawah kelas modus \[ T_b = 2,5 \]

  2. Menentukan \(d_1\) \[ d_1 = 20-12 = 8\]

  3. Menentukan \(d_2\) \[ d_2 = 20-10 = 10\]

  4. Mentukan panjang interval kelas \[p= 1\]

  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 2,5 + \frac {8}{8+10} \cdot 1 = 2,95 \]

2.3.6 Modus tanpa Outlier

  1. Mengidentifikasi kelas modus

Kelas modus adalah 3 - 4 karena memiliki frekuensi tertinggi yaitu 20

  1. Menentukan tepi bawah kelas modus \[ T_b = 2,5 \]

  2. Menentukan \(d_1\) \[ d_1 = 20-12 = 8\]

  3. Menentukan \(d_2\) \[ d_2 = 20-10 = 10\]

  4. Mentukan panjang interval kelas \[p= 1\]

  5. Memasukkan ke dalam rumus \[ M_o = T_b + \frac {d_1} {d_1+d_2} \cdot p= 2,5 + \frac {8}{8+10} \cdot 1 = 2,95 \]

2.3.7 Visualisasi dengan Boxplot

2.3.8 Visualisasi dengan Histogram

2.3.9 Analisis

Mean (Rata-rata)

Mean dengan Outlier: 3,14

Mean tanpa Outlier: 2,99

Interpretasi:

Nilai mean memberikan gambaran tentang waktu belajar rata-rata yang dihabiskan oleh siswa. Perbedaan antara mean dengan outlier (3,14 jam) dan mean tanpa outlier (2,99 jam) menunjukkan bahwa adanya beberapa siswa yang menghabiskan waktu belajar sangat lama (misalnya 5-7 jam) menyebabkan rata-rata keseluruhan menjadi lebih tinggi. Meskipun sebagian besar siswa belajar dalam rentang waktu yang lebih pendek, kehadiran siswa yang belajar dalam waktu lama menarik rata-rata waktu belajar ke angka yang lebih tinggi.

Pengaruh terhadap Kasus:

Jika hanya melihat mean tanpa outlier (2,99 jam), rata-rata waktu belajar siswa lebih realistis dan mencerminkan kebiasaan belajar mayoritas siswa, yang menghabiskan waktu kurang dari 3 jam. Artinya, meskipun ada beberapa siswa yang belajar dalam waktu lama, mayoritas siswa lebih memilih untuk belajar dalam waktu yang lebih singkat.

Median

Median dengan Outlier: 2,75

Median tanpa Outlier: 2,675

Interpretasi:

Median memberikan nilai tengah dari data yang terurut, membagi data menjadi dua bagian yang sama. Median dengan outlier (2,75 jam) dan median tanpa outlier (2,675 jam) menunjukkan nilai yang hampir sama, yang menunjukkan bahwa posisi nilai tengah tidak banyak dipengaruhi oleh data ekstrim (outlier). Median tetap memberikan gambaran yang stabil tentang kebiasaan waktu belajar siswa, tanpa terpengaruh oleh siswa yang menghabiskan waktu belajar jauh lebih lama.

Pengaruh terhadap Kasus:

Nilai median yang mendekati 2,7 menunjukkan bahwa sebagian besar siswa menghabiskan waktu belajar dalam rentang 0-3 jam. Ini menegaskan bahwa mayoritas siswa belajar dengan durasi yang cukup moderat, tanpa terpengaruh oleh siswa yang menghabiskan waktu belajar secara ekstrem.

Modus

Modus dengan Outlier: 2,95

Modus tanpa Outlier: 2,95

Interpretasi:

Modus adalah nilai yang paling sering muncul dalam data. Dalam kasus ini, rentang waktu belajar 3-4 jam memiliki frekuensi tertinggi, yaitu lebih banyak siswa yang menghabiskan waktu belajar pada rentang ini. Baik dengan atau tanpa outlier, modus tetap berada pada rentang 3-4 jam, yang menunjukkan bahwa sebagian besar siswa cenderung belajar dalam waktu tersebut.

Pengaruh terhadap Kasus:

Modus yang berada pada nilai 2,95 jam menunjukkan bahwa mayoritas siswa menghabiskan waktu belajar antara 3-4 jam. Ini mengindikasikan bahwa rentang waktu ini adalah pilihan yang paling umum di antara siswa, meskipun ada variasi waktu belajar yang lebih lama atau lebih singkat pada beberapa siswa.

