1.Data masa putar film(menit) yang diproduksi dua perusahaan film. Uji hipotesis bahwa data masa putar rata-rata film yang diproduksi berdistribusi noemal?
Perusahaan1 <- c(102,86,98,109,92,NA,NA)
Perusahaan2 <- c(81,165,97,134,92,87,114)
#Data frame
perusahaan <- data.frame(Perusahaan1, Perusahaan2)
perusahaan
## Perusahaan1 Perusahaan2
## 1 102 81
## 2 86 165
## 3 98 97
## 4 109 134
## 5 92 92
## 6 NA 87
## 7 NA 114
#Pengujian kenormalan data menggunakan Shapiro.Test
perusahaan.1 <- shapiro.test(Perusahaan1)
perusahaan.1
##
## Shapiro-Wilk normality test
##
## data: Perusahaan1
## W = 0.99397, p-value = 0.9916
perusahaan.2 <- shapiro.test(Perusahaan2)
perusahaan.2
##
## Shapiro-Wilk normality test
##
## data: Perusahaan2
## W = 0.8862, p-value = 0.2554
#Boxplot untuk 2 variabel
boxplot(perusahaan,
main = "Boxplot Perusahan",
xlab = "Perusahaan",
ylab = "Jumlah",
col = c("orange","chartreuse4"))
#Histogram perusahaan 1
hist(Perusahaan1,
main = "Histogram Perusahaan 1",
xlab = "Perusahaan 1",
ylab = "Jumlah",
ylim = c(0,5),
col = c("pink3"))
#Histogram perusahaan 2
hist(Perusahaan2,
main = "Histogram Perusahaan 2",
xlab = "Perusahaan 2",
ylab = "Jumlah",
ylim = c(0,5),
col = c('skyblue3'))
Hipotesis H0: Data pengamatan berasal dari populasi yang berdistribusi normal. H1: Data pengamatan tidak berasal dari populasi yang berdistribusi normal.
Taraf Signifikan : 0,05
Kriteria uji: Tolak H0, jika p-values < 0,05
Kesimpulan perusahaan 1: karena p-value perusahaan 1 > 0,05 yaitu 0,9916 > 0,05, maka terima H0. Artinya data pengamatan berasal dari populasi yang berdistribusi normal.
Kesimpulan perusahaan 2: karena p-value perusahaan 2 > 0,05 yaitu 0,2554 > 0,05, maka terima H0. Artinya data pengamatan berasal dari populasi yang berdistribusi normal.
2.Gunakan data faithful yang terdapat pada R. Lakukan pengecekan dengan grafik dan pengujian kenormalan data eruptions dan waiting pada data faithful tersebut!
erupsi <- faithful$eruptions
erupsi
## [1] 3.600 1.800 3.333 2.283 4.533 2.883 4.700 3.600 1.950 4.350 1.833 3.917
## [13] 4.200 1.750 4.700 2.167 1.750 4.800 1.600 4.250 1.800 1.750 3.450 3.067
## [25] 4.533 3.600 1.967 4.083 3.850 4.433 4.300 4.467 3.367 4.033 3.833 2.017
## [37] 1.867 4.833 1.833 4.783 4.350 1.883 4.567 1.750 4.533 3.317 3.833 2.100
## [49] 4.633 2.000 4.800 4.716 1.833 4.833 1.733 4.883 3.717 1.667 4.567 4.317
## [61] 2.233 4.500 1.750 4.800 1.817 4.400 4.167 4.700 2.067 4.700 4.033 1.967
## [73] 4.500 4.000 1.983 5.067 2.017 4.567 3.883 3.600 4.133 4.333 4.100 2.633
## [85] 4.067 4.933 3.950 4.517 2.167 4.000 2.200 4.333 1.867 4.817 1.833 4.300
## [97] 4.667 3.750 1.867 4.900 2.483 4.367 2.100 4.500 4.050 1.867 4.700 1.783
## [109] 4.850 3.683 4.733 2.300 4.900 4.417 1.700 4.633 2.317 4.600 1.817 4.417
## [121] 2.617 4.067 4.250 1.967 4.600 3.767 1.917 4.500 2.267 4.650 1.867 4.167
## [133] 2.800 4.333 1.833 4.383 1.883 4.933 2.033 3.733 4.233 2.233 4.533 4.817
## [145] 4.333 1.983 4.633 2.017 5.100 1.800 5.033 4.000 2.400 4.600 3.567 4.000
## [157] 4.500 4.083 1.800 3.967 2.200 4.150 2.000 3.833 3.500 4.583 2.367 5.000
## [169] 1.933 4.617 1.917 2.083 4.583 3.333 4.167 4.333 4.500 2.417 4.000 4.167
## [181] 1.883 4.583 4.250 3.767 2.033 4.433 4.083 1.833 4.417 2.183 4.800 1.833
## [193] 4.800 4.100 3.966 4.233 3.500 4.366 2.250 4.667 2.100 4.350 4.133 1.867
## [205] 4.600 1.783 4.367 3.850 1.933 4.500 2.383 4.700 1.867 3.833 3.417 4.233
## [217] 2.400 4.800 2.000 4.150 1.867 4.267 1.750 4.483 4.000 4.117 4.083 4.267
## [229] 3.917 4.550 4.083 2.417 4.183 2.217 4.450 1.883 1.850 4.283 3.950 2.333
## [241] 4.150 2.350 4.933 2.900 4.583 3.833 2.083 4.367 2.133 4.350 2.200 4.450
## [253] 3.567 4.500 4.150 3.817 3.917 4.450 2.000 4.283 4.767 4.533 1.850 4.250
## [265] 1.983 2.250 4.750 4.117 2.150 4.417 1.817 4.467
waiting <- faithful$waiting
waiting
## [1] 79 54 74 62 85 55 88 85 51 85 54 84 78 47 83 52 62 84 52 79 51 47 78 69 74
## [26] 83 55 76 78 79 73 77 66 80 74 52 48 80 59 90 80 58 84 58 73 83 64 53 82 59
## [51] 75 90 54 80 54 83 71 64 77 81 59 84 48 82 60 92 78 78 65 73 82 56 79 71 62
## [76] 76 60 78 76 83 75 82 70 65 73 88 76 80 48 86 60 90 50 78 63 72 84 75 51 82
## [101] 62 88 49 83 81 47 84 52 86 81 75 59 89 79 59 81 50 85 59 87 53 69 77 56 88
## [126] 81 45 82 55 90 45 83 56 89 46 82 51 86 53 79 81 60 82 77 76 59 80 49 96 53
## [151] 77 77 65 81 71 70 81 93 53 89 45 86 58 78 66 76 63 88 52 93 49 57 77 68 81
## [176] 81 73 50 85 74 55 77 83 83 51 78 84 46 83 55 81 57 76 84 77 81 87 77 51 78
## [201] 60 82 91 53 78 46 77 84 49 83 71 80 49 75 64 76 53 94 55 76 50 82 54 75 78
## [226] 79 78 78 70 79 70 54 86 50 90 54 54 77 79 64 75 47 86 63 85 82 57 82 67 74
## [251] 54 83 73 73 88 80 71 83 56 79 78 84 58 83 43 60 75 81 46 90 46 74
#Boxplot eruptions
boxplot(erupsi,
main = "BoxPlot Eruptions",
xlab = "Eruptions",
ylab = "Jumlah",
col = c("palevioletred3"))
#Boxplot waiting
boxplot(waiting,
main = "BoxPlot Waiting",
xlab = "Waiting",
ylab = "Jumlah",
col = c("peachpuff3"))
#Boxplot untuk 2 variabel
data_list <- list(Eruptions = erupsi, Waiting = waiting)
boxplot(data_list,
main = "BoxpPlot Faithful",
xlab = "Data",
ylab = "Jumlah",
col = c("palevioletred3","peachpuff3"))
#Histogram eruptions
hist(erupsi,
main = "Histogram Eruptions",
xlab = "Erupsi",
ylab = "Jumlah",
ylim = c(0,80),
col = c('cadetblue'))
#Histogram waiting
hist(waiting,
main = "Histogram Waiting",
xlab = "Waiting",
ylab = "Jumlah",
ylim = c(0,70),
col = c('dodgerblue3'))
#QQ Plot untuk eruptions
qqnorm(faithful$eruptions)
qqline(faithful$eruptions)
#QQ Plot untuk waiting
qqnorm(faithful$waiting)
qqline(faithful$waiting)
#Pengujian kenormalan data menggunakan Shapiro.Test
shapiro.test(faithful$eruptions)
##
## Shapiro-Wilk normality test
##
## data: faithful$eruptions
## W = 0.84592, p-value = 9.036e-16
shapiro.test(faithful$waiting)
##
## Shapiro-Wilk normality test
##
## data: faithful$waiting
## W = 0.92215, p-value = 1.015e-10
Hipotesis H0: Data pengamatan berasal dari populasi yang berdistribusi normal. H1: Data pengamatan tidak berasal dari populasi yang berdistribusi normal.
Taraf Signifikan : 0,05
Kriteria uji: Tolak H0, jika p-values < 0,05
Kesimpulan eruptions: karena p-value eruptions < 0,05 yaitu 9,036e-16 < 0,05, maka tolak H0. Artinya data pengamatan tidak berasal dari populasi yang berdistribusi normal.
Kesimpulan waiting: karena p-value waiting < 0,05 yaitu 1,015e-10 < 0,05, maka tolak H0. Artinya data pengamatan tidak berasal dari populasi yang berdistribusi normal.
3.Jelaskan kelebihan dan kekurangan pengecekan kenormalan data antara histogram, boxplot, dan qq plot!
a.Histogram Kelebihan: mudah diinterpretasikan karena menunjukkan distribusi frekuensi data, mampu mengidentifikasi pola distribusi secara visual seperti apakah data simetris atau condong, dan cocok untuk memberikan gambaran umum tentang distribusi data.
Kekurangan: tidak sepenuhnya akurat untuk memastikan kenormalan terutama untuk ukuran sampel kecil, bentuk histogram bisa berbeda tergantung pada jumlah bin yang dipilih sehingga hasilnya bisa menyesatkan jika jumlah bin tidak tepat.
b.Boxplot Kelebihan: Menyediakan ringkasan statistik seperti median, kuartil, dan outlier. Memudahkan identifikasi outlier dan asimetri data (skewness), yang bisa menjadi indikasi bahwa data mungkin tidak normal.
Kekurangan: tidak menunjukkan distribusi detail sehingga sulit untuk mengidentifikasi pola kenormalan yang lebih halus, kurang akurat dalam mengevaluasi kenormalan karena hanya menampilkan ringkasan dan tidak mencakup seluruh bentuk distribusi.
c.QQ Plot Kelebihan: metode yang paling akurat untuk mengecek kenormalan secara visual, jika data normal titik-titik qq plot akan membentuk garis lurus. Mampu mengidentifikasi penyimpangan kecil dari kenormalan seperti kurtosis dan skewness.
Kekurangan: memerlukan interpretasi yang lebih mendalam, dan tidak memberikan informasi ringkasan seperti median atau outlier.
4.Jelaskan perbedaan penggunaan antara Uji Shapiro-Wilk, Uji Jarque-Bera, dan Uji Kolomorov-Smirnov
a.Uji Shapiro Wilk Lebih sensitif dan lebih cocok untuk sampel kecil hingga sedang.
b.Uji Jarque-Bera Terfokus pada skewness dan kurtosis, cocok untuk sampel besar.
c.Kolomogorov-Smirnov Membandingkan distribusi kumulatif data dengan distribusi normal, cocok untuk berbagai ukuran sampel, tetapi kurang sensitif dibanding Shapiro-Wilk.