Praktikum Pemusatan Data

Statistika Dasar

UKURAN PEMUSATAN UNTUK DATA KELOMPOK

Pemusatan data adalah salah satu konsep penting dalam statistik yang mengacu pada upaya untuk menentukan titik atau nilai tertentu yang dapat mewakili seluruh data yang diamati dalam suatu kumpulan data. Dengan kata lain, pemusatan data berfokus pada nilai yang dianggap sebagai “pusat” atau “wakil” dari data tersebut. Nilai pusat ini bertujuan untuk memberikan gambaran umum yang dapat menyederhanakan kumpulan data sehingga lebih mudah dipahami dan dianalisis.

Konsep pemusatan data sangat berguna karena memungkinkan kita untuk meringkas informasi yang kompleks menjadi satu nilai yang mewakili seluruh dataset. Hal ini penting dalam banyak situasi, seperti pengambilan keputusan, analisis tren, atau perbandingan antar kelompok data. Pemusatan data membantu mengungkap pola umum dalam data, memungkinkan kita untuk mengenali apakah data memiliki kecenderungan tertentu atau apakah distribusi data tersebut menyimpang dari norma.

Beberapa ukuran pemusatan data yang umum digunakan meliputi mean (rata-rata), median, dan modus. Mean menghitung rata-rata dari semua nilai dalam dataset dengan membagi jumlah total nilai dengan banyaknya data. Median adalah nilai tengah dalam dataset ketika data disusun secara berurutan, sehingga lebih tahan terhadap pengaruh nilai ekstrem (outlier). Modus, di sisi lain, adalah nilai yang paling sering muncul dalam dataset.

Secara keseluruhan, pemusatan data merupakan alat statistik yang sangat penting karena memberikan dasar untuk memahami dan menginterpretasikan data dengan lebih efisien. Tanpa ukuran pemusatan, analisis data sering kali menjadi lebih sulit dan memakan waktu karena sifat data yang kompleks dan bervariasi.

Tujuan Pemusatan Data

  1. Meringkas Data: Mempermudah penyajian dan interpretasi kumpulan data yang besar dengan memberikan satu nilai yang mewakili.

  2. Membandingkan Data: Membantu membandingkan dua atau lebih kumpulan data melalui nilai pusatnya. Menentukan Karakteristik Data: Memberikan gambaran umum tentang bagaimana data terdistribusi di sekitar nilai pusat.

  3. Membantu Prediksi: Dalam beberapa kasus, pemusatan data bisa menjadi dasar untuk membuat prediksi atau keputusan berdasarkan data masa lalu.

Jenis Jenis Ukuran Pemusatan Data

Tiga ukuran utama pemusatan data adalah mean, median, dan modus. Setiap ukuran memiliki karakteristik dan kegunaan khusus, tergantung pada jenis data dan tujuan analisis.

1. MEAN

Mean atau rata-rata adalah salah satu ukuran pemusatan data yang paling umum digunakan dalam statistik. Mean menggambarkan nilai rata-rata yang diperoleh dengan menjumlahkan semua nilai dalam suatu kelompok data, kemudian membaginya dengan jumlah data tersebut. Mean sering digunakan untuk mewakili data secara keseluruhan dan memberikan gambaran umum tentang kecenderungan nilai dalam kumpulan data. Untuk menghitung mean dari kelompok data, digunakan rumus berikut:

a. Rumus Mean

\[ \begin{equation} \begin{split} \text{Mean} \, (\bar{x}) &= \frac{\sum_{i=1}^n x_i}{n} \end{split} \end{equation} \]

• ∑ 𝑋 adalah jumlah dari semua nilai data.

• 𝑛 adalah jumlah data.

1.2 Langkah-langkah untuk menghitung mean:

• Jumlahkan semua nilai dalam data.

• Bagi hasil jumlah dengan banyaknya data.

Misalkan kita memiliki data sebagai berikut: 11, 12, 13, 14, 15.

• Jumlahkan semua nilai:
11 + 12 + 13 + 14 + 15 = 65


• Bagi dengan jumlah data (𝑛 = 5):

\[ \text{Mean} = \frac{11 + 12 + 13 + 14 + 15}{5} = \frac{65}{5} = 13 \]

Jadi, mean dari data tersebut adalah 13.

1.3 Kelemahan

Salah satu kelemahan utama dari mean (rata-rata) adalah sensitivitasnya terhadap nilai ekstrem atau outlier dalam dataset. Outlier adalah nilai yang secara signifikan lebih tinggi atau lebih rendah dibandingkan dengan nilai-nilai lainnya dalam data. Kehadiran outlier dapat memengaruhi perhitungan mean secara substansial, sehingga nilai mean menjadi tidak lagi representatif terhadap distribusi data yang sebenarnya.

1.4 Pengoprasian dan Visualisasi Mean Menggunakan Boxplot dan Histogram

1.4.1 Data
a. Import data csv
Nama Nilai
Budi 90
Siti 85
Andi 88
Randi 90
Satya 86
Sokeh 83
Bayu 92
Fahim 88
Darman 83
Seno 90
Jamal 81
Romo 84

Table data

Nama Nilai
Budi 90
Siti 85
Andi 88
Randi 90
Satya 86
Sokeh 83
Bayu 92
Fahim 88
Darman 83
Seno 90
Jamal 81
Romo 84
b. Pengoprasian dan Visualisasi Mean Menggunakan Boxplot
## Loading required package: ggplot2
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
c. Pengoprasian dan Visualisasi Mean Menggunakan Histogram

2. MEDIAN

Median adalah salah satu ukuran pemusatan data yang menunjukkan nilai tengah dari suatu kumpulan data setelah data tersebut diurutkan dari nilai terkecil hingga nilai terbesar. Median memberikan informasi tentang titik tengah dari distribusi data, membagi data menjadi dua bagian yang sama besar, di mana separuh data memiliki nilai yang lebih kecil dari median, dan separuh lainnya memiliki nilai yang lebih besar.

2.1 Langkah Langkah Menghitung Median

  1. Urutkan data dari yang terkecil hingga terbesar.

  2. Jika jumlah data ganjil, ambil nilai yang berada di tengah.

  3. Jika jumlah data genap, ambil rata-rata dua nilai tengah.

rumus median adalah:

\[ \begin{equation} \begin{split} \text{Median} &= L + \left( \frac{\frac{n}{2} - F}{f_m} \right) \times h \end{split} \end{equation} \]

Keterangan Variabel

\[ \begin{aligned} L & : \text{Tepi bawah kelas median} \\ n & : \text{Jumlah total frekuensi} \ (\Sigma f) \\ \frac{n}{2} & : \text{Setengah jumlah total frekuensi (posisi median)} \\ F & : \text{Frekuensi kumulatif sebelum kelas median} \\ f_m & : \text{Frekuensi pada kelas median} \\ h & : \text{Panjang interval kelas} \end{aligned} \]

Contoh:

  • Misalnya, kita memiliki data berikut:

70, 80, 90, 85, 95

  • Langkah pertama, urutkan data: 70, 80, 85, 90, 95.

Karena jumlah data ganjil (5 data), nilai tengah adalah 85. Jadi, median adalah 85.

Jika jumlah datanya genap, misalnya data nilai ujian:

70, 80, 90, 100

  • Langkah pertama, urutkan data: 70, 80, 90, 100. Karena jumlah data genap (4 data), dua nilai tengah adalah 80 dan 90. Maka median adalah rata-rata dari keduanya:

\[ \text{Median} = \frac{80 + 90}{2} = 85 \]

Jadi, median adalah 85.

Kelebihan

Median memiliki beberapa kelebihan yang membuatnya sangat berguna dalam analisis data, terutama ketika kita bekerja dengan data yang tidak terdistribusi secara simetris atau mengandung outlier (nilai ekstrem).

2.2 Pengoprasian dan Visualisasi Median Menggunakan Boxplot dan Histogram

Table data

Nama Nilai
Budi 90
Siti 85
Andi 88
Randi 90
Satya 86
Sokeh 83
Bayu 92
Fahim 88
Darman 83
Seno 90
Jamal 81
Romo 84
Pengoprasian dan Visualisasi Median Menggunakan Boxplot
Pengoprasian dan Visualisasi Median Menggunakan Histogram

3. MODUS

Modus adalah salah satu ukuran pemusatan data yang digunakan untuk menunjukkan nilai atau angka yang paling sering muncul dalam sebuah kumpulan data. Dalam banyak kasus, modus dapat memberikan informasi yang sangat berguna tentang kecenderungan umum atau kebiasaan yang ada dalam data tersebut. Modus seringkali digunakan dalam berbagai bidang, seperti statistik, pemasaran, dan sosiologi, untuk menggambarkan elemen yang dominan atau sering muncul dalam suatu kelompok.

a. Rumus Modus

\[ \begin{equation} \begin{split} \text{Modus} &= L + \left( \frac{f_1 - f_0}{2f_1 - f_0 - f_2} \right) \times h \end{split} \end{equation} \]

$$ \[\begin{equation} \begin{aligned} L & : \text{Tepi bawah kelas modal (kelas dengan frekuensi tertinggi)} \\ f_1 & : \text{Frekuensi kelas modal} \\ f_0 & : \text{Frekuensi kelas sebelum kelas modal} \\ f_2 & : \text{Frekuensi kelas setelah kelas modal} \\ h & : \text{Panjang interval kelas} \end{aligned} \end{equation}\]

$$ ###### b. Contoh

Misalnya, kita memiliki data nilai ujian berikut:

  • 80, 85, 80, 90, 95

Di sini, ada dua nilai yang sering muncul, yaitu 80 dan 90, sehingga data ini bimodal.

Jika data adalah:

  • 70, 80, 90, 100, 110

Karena tidak ada nilai yang berulang, maka data ini tidak memiliki modus.

c. Kelebihan Modus

Modus memiliki berbagai kelebihan yang menjadikannya ukuran pemusatan data yang sangat berguna dalam berbagai jenis analisis, terutama yang berhubungan dengan frekuensi kemunculan nilai tertentu dalam dataset. Salah satu kegunaannya yang paling utama adalah untuk mengetahui nilai yang paling sering terjadi, yang dapat memberikan wawasan penting tentang pola atau kecenderungan dalam data.

3.1 Pengoprasian dan Visualisasi Modus Menggunakan Boxplot dan Histogram

Table data

Nama Nilai
Budi 90
Siti 85
Andi 88
Randi 90
Satya 86
Sokeh 83
Bayu 92
Fahim 88
Darman 83
Seno 90
Jamal 81
Romo 84
3.1.1 Pengoprasian dan Visualisasi Modus Menggunakan Boxplot
3.1.2 Pengoprasian dan Visualisasi Modus Menggunakan Histogram

Kesimpulan MEAN, MEDIAN, MODUS

Kesimpulan Umum:

  • Mean sangat berguna untuk data yang terdistribusi normal dan tidak memiliki outlier, karena memberikan gambaran keseluruhan dari seluruh data. Namun, kehadiran nilai ekstrim bisa membuatnya tidak representatif.

  • Median lebih baik digunakan ketika data memiliki distribusi yang miring atau terdapat nilai ekstrim, karena tidak dipengaruhi oleh outlier.

  • Modus sangat berguna untuk mengetahui nilai yang paling sering muncul dalam data, terutama pada data kategorikal atau nominal. Namun, jika data tidak memiliki nilai yang sering muncul, modus bisa jadi tidak ada atau kurang informatif.

Pemilihan antara mean, median, dan modus tergantung pada jenis data yang dimiliki dan tujuan analisis. Ketiganya saling melengkapi dan memberikan pandangan yang berbeda tentang kumpulan data yang dianalisis.

PEMUSATAN DATA DALAM BERBAGAI BIDANG

Ukuran pemusatan data, seperti mean, median, dan modus, sering digunakan dalam berbagai bidang untuk menganalisis data dan mengambil keputusan. Berikut adalah bagaimana ukuran pemusatan data diterapkan dalam Bisnis, Kesehatan, dan Pendidikan.

1. Bisnis

Dalam dunia bisnis, ukuran pemusatan data digunakan untuk menganalisis berbagai aspek operasi dan kinerja perusahaan. Berikut adalah contoh penerapan pemusatan data dalam bisnis:

1.1 Mengukur Rata-Rata Penjualan Perusahaan

sering menggunakan rata-rata (mean) untuk menghitung rata-rata penjualan dalam periode tertentu, seperti per bulan atau per tahun. Hal ini membantu perusahaan memahami tren penjualan dan merencanakan strategi masa depan.

- Contoh:Jika sebuah perusahaan ingin mengetahui rata-rata penjualan bulanan, mereka dapat menjumlahkan penjualan bulanan                    selama setahun dan membaginya dengan 12. Ini memberikan gambaran umum tentang kinerja perusahaan dalam                              periode tersebut. 

Ekseskusi Kasus

Sebuah perusahaan e-commerce ingin mengetahui rata-rata penjualan bulanan selama setengah tahun. Misalnya, penjualan bulanannya adalah:

BULAN JUMAL UNIT
Januari 10.000
Februari 12.000
Maret 11.000
April 15.000
Mei 13.000
Juni 10.000
  • Menghitung Rata-Rata: \[ \text{Rata-rata Penjualan} = \frac{10.000 + 12.000 + 11.000 + 15.000 + 13.000 + 10.000}{6} = 11.833 \, \text{unit} \]

Kesimpulan

Rata-rata ini memberi perusahaan gambaran tentang volume penjualan bulanan yang stabil dan dapat digunakan untuk merencanakan strategi bisnis berikutnya.

1.2 Analisis Harga Saham Di pasar saham

investor sering menggunakan nilai tengah (median) untuk memahami pergerakan harga saham yang lebih stabil, karena median tidak terpengaruh oleh fluktuasi ekstrem yang dapat menyebabkan nilai rata-rata menjadi bias.

 - Contoh: Jika sebuah saham mengalami lonjakan harga yang sangat tinggi atau rendah dalam periode tertentu, median dapat                      memberikan    gambaran yang lebih akurat tentang harga tengah saham tersebut.

Eksekusi Kasus

Hari Harga.Saham
Senin Rp50.000,00
Selasa Rp48.000,00
Rabu Rp51.000,00
Kamis Rp53.000,00
Jumat Rp50.500,00
Sabtu Rp70.000,00
Minggu Rp55.000,00

Urutkan harga saham: 48.000, 50.000, 50.500, 51.000, 53.000, 55.000, 70.000.

## [1] "Median Harga Saham (Dengan Outlier): 51000"
## [1] "Median Harga Saham (Tanpa Outlier): 50750"

Kesimpulan

Nilai tengah (median) adalah 51.000, yang menunjukkan harga saham yang paling representatif, mengurangi pengaruh fluktuasi ekstrem.

1.3 Identifikasi Tren dalam Preferensi Konsumen Bisnis dengan Modus

sering menggunakan modus untuk mengetahui produk atau layanan yang paling sering dipilih oleh konsumen. Ini membantu dalam pengembangan produk atau kampanye pemasaran yang lebih sesuai dengan preferensi pelanggan.

- Contoh:Jika sebuah toko ingin mengetahui produk mana yang paling sering dibeli, mereka dapat menghitung modus berdasarkan                  data penjualan.

Ekseskusi Kasus

Toko ritel ingin mengetahui produk mana yang paling sering dibeli oleh pelanggan. Berikut adalah jumlah pembelian produk A, B, dan C dalam satu minggu:

PRODUK TOTAL PEMBELIAN
A 40
B 60
C 60
D 30
E 20
## [1] "Modus Total Pembelian: 60"

Kesimpulan

Modus: Modus dari data ini adalah produk B dan C, karena keduanya memiliki jumlah pembelian terbanyak (60), yang membantu toko fokus pada pemasaran kedua produk tersebut.

2. Kesehatan

Di bidang kesehatan, ukuran pemusatan data sangat penting untuk menganalisis pola penyakit, efisiensi perawatan kesehatan, dan distribusi variabel kesehatan lainnya. Berikut adalah contoh penerapan ukuran pemusatan data dalam kesehatan:

2.1 Pengukuran Rata-Rata Usia Pasien

Dalam analisis demografis rumah sakit atau klinik, rata-rata usia pasien digunakan untuk memahami profil usia populasi yang dilayani, yang penting untuk perencanaan layanan kesehatan.

- Contoh: Rumah sakit dapat menghitung rata-rata usia pasien untuk merencanakan fasilitas atau perawatan yang lebih sesuai dengan kelompok usia tertentu.

Ekseskusi Kasus

Sebuah rumah sakit ingin mengetahui rata-rata usia pasien yang datang selama seminggu. Data usia pasien adalah:

  • 25 tahun

  • 30 tahun

  • 35 tahun

  • 40 tahun

  • 45 tahun

\[ \text{Rata-rata Usia} = \frac{25 + 30 + 35 + 40 + 45}{5} = 35 \, \text{tahun} \]

Penjelasan

Dengan rata-rata usia 35 tahun, rumah sakit dapat merencanakan layanan yang lebih tepat, seperti fasilitas medis atau pengobatan yang sesuai dengan kelompok usia ini.

2.2 Statistik Penyakit Median

Sering digunakan dalam epidemiologi untuk menggambarkan distribusi data penyakit, seperti waktu bertahan hidup pasien atau usia diagnosis penyakit tertentu. Median lebih disukai karena tidak terpengaruh oleh data ekstrem.

- Contoh: Dalam penelitian kanker, median umur pasien saat didiagnosis dapat digunakan untuk menginformasikan kebijakan kesehatan atau penelitian lebih lanjut.

####Eksekusi Kasus

Dalam sebuah penelitian mengenai waktu bertahan hidup pasien kanker, data waktu bertahan hidup (dalam bulan) adalah:

  • 3 bulan

  • 6 bulan

  • 9 bulan

  • 12 bulan

  • 20 bulan

\[ \text{Data: } 3, 6, 9, 12, 20 \\ \text{Median} = 9 \, \text{bulan} \]

#### Menghitung Median:

Urutkan data: 3, 6, 9, 12, 20. Nilai tengah (median) adalah 9 bulan, yang memberikan gambaran yang lebih stabil dan tidak terpengaruh oleh data ekstrem (misalnya, pasien yang bertahan hidup sangat lama).

2.3 Frekuensi Penyakit atau Gejala Modus

digunakan untuk mengetahui gejala atau penyakit yang paling sering terjadi dalam populasi tertentu. Ini sangat penting dalam epidemiologi untuk menentukan pola penyebaran penyakit.

- Contoh: Jika banyak pasien yang datang dengan gejala demam dan batuk, modus akan menunjukkan bahwa ini adalah gejala yang paling sering dilaporkan dalam periode tertentu.

Eksekusi Kasus

Di rumah sakit, dokter ingin mengetahui gejala yang paling umum dari pasien flu. Data gejala yang tercatat adalah:

Demam = 30 pasien Batuk = 50 pasien Sakit kepala = 40 pasien

\[ \text{Demam: 30 pasien, Batuk: 50 pasien, Sakit kepala: 40 pasien} \\ \text{Modus: Batuk (paling sering dilaporkan)} \]

## [1] "Modus (Dengan Outlier): Batuk"
## [1] "Modus (Tanpa Outlier): Sakit Kepala"

#### Menghitung Modus:

Modus dalam data ini adalah Batuk, karena batuk dilaporkan oleh 50 pasien, lebih banyak dibandingkan gejala lainnya.

Kesimpulan

Dengan mengetahui gejala yang paling sering dilaporkan (batuk), rumah sakit dapat lebih fokus dalam memberikan penanganan yang tepat, seperti persediaan obat atau vaksinasi yang lebih banyak.

3. Pendidikan

Dalam bidang pendidikan, ukuran pemusatan data digunakan untuk mengevaluasi kinerja siswa, menganalisis hasil ujian, dan merancang kebijakan pendidikan. Berikut adalah contoh penerapan ukuran pemusatan data dalam pendidikan:

3.1 Rata-Rata Nilai Ujian Rata-rata nilai ujian

sering digunakan untuk mengevaluasi kinerja siswa dalam suatu ujian atau tugas besar. Ini memberikan gambaran umum tentang sejauh mana siswa memahami materi yang diuji.

- Contoh: Jika sekolah ingin mengetahui rata-rata nilai ujian matematika untuk seluruh kelas, mereka dapat menjumlahkan nilai ujian dan membaginya dengan jumlah siswa.

Eksekusi Kasus

Dalam ujian matematika kelas 12, berikut adalah nilai yang diperoleh oleh siswa:

  • 80

  • 85

  • 90

  • 70

  • 95

\[ \text{Rata-rata Nilai} = \frac{80 + 85 + 90 + 70 + 95}{5} = 84 \, \text{poin} \]

## [1] "Mean Nilai (Dengan Outlier): 84"
## [1] "Mean Nilai (Tanpa Outlier): 87.5"

Penjelasan

Dengan rata-rata nilai 84 poin, guru dapat mengetahui kinerja rata-rata siswa dan menentukan apakah materi perlu penyesuaian atau ada area yang perlu diperbaiki.

3.2 Penilaian Kinerja Siswa Median

Digunakan untuk mengetahui nilai tengah dalam hasil ujian atau tes, yang tidak terpengaruh oleh nilai ekstrem. Ini memberikan pemahaman yang lebih adil tentang kinerja mayoritas siswa.

- Contoh: Jika ada beberapa siswa yang mendapatkan nilai sangat tinggi atau rendah, median dapat memberikan gambaran lebih akurat tentang kinerja siswa secara keseluruhan.

Eksekusi Kasus

Seorang guru ingin mengetahui nilai tengah dari ujian akhir yang diikuti oleh 10 siswa. Nilai yang diperoleh adalah:

  • 50, 55, 60, 70, 80, 80, 85, 90, 90, 95

Menghitung Median:

Urutkan data: 50, 55, 60, 70, 80, 80, 85, 90, 90, 95. Karena ada 10 data, median adalah rata-rata dari data ke-5 dan ke-6, yaitu:

\[ \text{Data: } 50, 55, 60, 70, 80, 80, 85, 90, 90, 95 \\ \text{Median} = \frac{80 + 80}{2} = 80 \]

## [1] "Median Nilai Ujian (Dengan Outlier): 80"
## [1] "Median Nilai Ujian (Tanpa Outlier): 80"

Kesimpulan

Median nilai adalah 80. Ini menunjukkan bahwa sebagian besar siswa mendapatkan nilai sekitar 80, memberi gambaran yang lebih representatif tentang distribusi nilai di kelas.

3.3 Frekuensi Tingkat Keterampilan Modus

Digunakan untuk mengetahui tingkat keterampilan atau pengetahuan yang paling sering dimiliki oleh siswa dalam suatu kelompok. Ini dapat membantu pendidik dalam merancang kurikulum yang lebih efektif.

- Contoh: Jika sebagian besar siswa memiliki pemahaman yang baik dalam topik tertentu, maka modus akan menunjukkan tingkat penguasaan yang paling umum di kelas tersebut.

Eksekusi Kasus

Seorang guru ingin mengetahui nilai tengah dari ujian akhir siswa. Nilai yang diperoleh adalah:

  • A = 10 Siswa

  • B = 20 Siswa

  • C = 5 Siswa

\[ \text{Nilai A: 10 siswa, Nilai B: 20 siswa, Nilai C: 5 siswa} \\ \text{Modus: Nilai B (paling sering muncul)} \]

## [1] "Modus: B"
## [1] "Modus (Tanpa Outlier): A"

Menghitung Modus:

Modus adalah Nilai B, karena 20 siswa mendapatkan nilai ini, yang merupakan jumlah terbanyak.

Kesimpulan

Dengan mengetahui bahwa nilai B adalah yang paling sering muncul, guru dapat mengevaluasi lebih lanjut kemampuan menulis siswa dan menyesuaikan cara pengajaran untuk meningkatkan keterampilan siswa.

