Komputasi Statistika: Simple Random Sampling

SIMPLE RANDOM SAMPLING

Simple random sampling adalah suatu prosedur pengambilan sampel, dimana jika sebuah sampel berukuran n diambil dari sebuah populasi berukuran N sedemikian rupa sehingga setiap kemungkinan sampel berukuran n memiliki peluang yang sama untuk dipilih. Pengambilan sampel dari anggota populasi dengan menggunakan pengacakan (random) tanpa memperhatikan strata (fingkatan) dalam anggota populasi. Sampel yang diperoleh disebut simple random sample (sampel acak sederhana)

DATA MPG PADA R

Data mpg di R adalah dataset yang berasal dari paket ggplot2. Dataset ini berisi informasi tentang efisiensi bahan bakar berbagai jenis mobil yang dijual di Amerika Serikat. Setiap baris di dataset mewakili sebuah model mobil, dengan berbagai variabel yang menjelaskan karakteristik kendaraan tersebut, seperti efisiensi bahan bakar, ukuran mesin, dan jenis penggerak.

DATA MPG

##  [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
## [16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
## [31] 15.0 21.4

DATA SAMPEL MPG

##  [1] 16.4 22.8 21.4 15.5 15.2 19.2 19.2 18.1 13.3 15.0 10.4 30.4

Pada projek komputasi statistika dengan menggunakan metode simple random sampling, kami menggunakan data mpg yang tersedia pada R dengan mengambil 12 sampel dari 31 data mpg.

ESTIMASI RATA-RATA

\[\bar{y} = \frac{\sum_{i=1}^{n} y_i}{n}\]

estimasi_rata_rata<-mean(sampel_mpg)

## Dari 10 sampel yang diambil, hasil estimasi rata-rata konsumsi bahan bakar yang diperoleh sebesar 18.075 memberikan informasi awal tentang nilai tengah dari data yang dianalisis

VARIANS SAMPLE

library(dplyr)

# Menghitung varians sample menggunakan operasi pipe
n <- length(sampel_mpg)  

varians_sample <- tibble(nilai = sampel_mpg) %>%
  mutate(rata_rata = mean(nilai)) %>%          
  mutate(varians = (nilai - rata_rata)^2) %>%  
  summarise(varians = sum(varians) / (n - 1))

## Kami menghitung varians penduga dari rata-rata dengan menggunakan rumus yang memperhitungkan ukuran sampel dan ukuran populasi sehinggan mendapatkan hasil sebesar 26.97114

VARIANS PENDUGA RATAAN POPULASI

\[\hat{V}(\bar{y}) = \left( 1 - \frac{n}{N} \right) \frac{s^2}{n}\]

n <- length(sampel_mpg)  
N <- nrow(mtcars)  

varians_penduga_rataan <- (1 - n / N) * varians_sample / n
varians_penduga_rataan

##    varians
## 1 1.404747

ESTIMASI TOTAL

\[ \hat{T} = N\hat{y} = \frac{N\sum_{i=1}^{n} y_{i}}{n} \]

n <- length(sampel_mpg) 
N <- nrow(mtcars)        

estimasi_total_populasi <- estimasi_rata_rata * N

##  Berdasarkan estimasi rata-rata yang dihitung, kami melakukan estimasi total populasi dengan mengalikan estimasi rata-rata dengan ukuran populasi sehingga mendapatkan estimasi total populasi sebesar 578.4

VARIANS PENDUGA TOTAL POPULASI

\[\hat{V}(\hat{r})=\hat{V}(N\hat{y})=N^{2}\left(1-\frac{n}{N}\right)\left(\frac{s^{2}}{n}\right)\]

# Menghitung varians penduga dari rata-rata populasi menggunakan rumus
n <- length(sampel_mpg) 
N <- nrow(mtcars)        

# Menghitung varians penduga dengan koreksi
varians_penduga_total <- N*N*(1 - n / N) * varians_sample / n
varians_penduga_total

##    varians
## 1 1438.461

ESTIMASI PROPORSI

\[\hat{p} = \bar{y} = \frac{\sum_{i=1}^{n} y_{i}}{n}\]

estimasi_proporsi<-mean(sampel_mpg)

## Dari sampel, kami menghitung proporsi yang hasilnya sebesar 18.075

VARIANS PENDUGA PROPORSI POPULASI

\[\hat {V}(\hat {p})=(1-\frac {n}{N})\frac {\hat {p}\hat {q}}{n-1}\]

\[\hat {q}=1-\hat {p}\]

n <- length(sampel_mpg)  
N <- nrow(mtcars)        
varians_penduga_proporsi <- (1 - n / N) * (estimasi_proporsi * (1 - estimasi_proporsi) / (n - 1))

## Varians penduga proporsi: -17.53583

BAR PLOT

Tujuan dibuatnya bar plot adalah untuk membandingkan estimasi rata-rata, total, dan nilai populasi secara berdampingan. Secara keseluruhan, Bar Plot memberikan visualisasi yang jelas tentang bagaimana estimasi yang diperoleh dari sampel dibandingkan dengan nilai populasi aktual, memperlihatkan bahwa estimasi rata-rata dan total dapat mendekati nilai populasi dengan cukup baik.

HISTOGRAM

Histogram yang dibuat untuk sampel MPG (Miles per Gallon) akan menunjukkan distribusi konsumsi bahan bakar kendaraan.

KESIMPULAN

Dalam proyek ini, kami menerapkan metode Simple Random Sampling untuk menganalisis konsumsi bahan bakar (mpg) dari dataset mtcars di R dengan mengambil 10 sampel acak dari total 31 data. Hasil estimasi rata-rata menunjukkan nilai tengah konsumsi bahan bakar, sedangkan varians penduga dihitung untuk menilai variasi dalam sampel. Kami juga menghitung estimasi total populasi dengan mengalikan rata-rata sampel dengan ukuran populasi, serta varians penduga proporsi meskipun lebih relevan dalam konteks kategori. Histogram yang dihasilkan memberikan visualisasi distribusi konsumsi bahan bakar, membantu memahami pola dan tren dalam data. Keseluruhan analisis ini menunjukkan bagaimana teknik statistik dapat memberikan wawasan penting untuk memahami efisiensi bahan bakar kendaraan, yang berdampak pada keputusan konsumen dan kebijakan transportasi.