#Data perusahaan
perusahaan1 <- c(102, 86, 98, 109, 92)
perusahaan2 <- c(81, 165, 97, 134, 92, 87, 114)
# Uji normalitas menggunakan Kolmogorov-Smirnov test
shapiro.test(perusahaan1)
##
## Shapiro-Wilk normality test
##
## data: perusahaan1
## W = 0.99397, p-value = 0.9916
shapiro.test(perusahaan2)
##
## Shapiro-Wilk normality test
##
## data: perusahaan2
## W = 0.8862, p-value = 0.2554
#plot histogram
hist(perusahaan1)
hist(perusahaan2)
jawaban: Hasil Uji Shapiro-Wilk menunjukkan bahwa
p-value untuk data perusahaan1 adalah 0.9916. Dengan menggunakan tingkat
signifikansi α = 0.05 atau 5%, dapat disimpulkan bahwa pengujian
menunjukkan terima H0, yang berarti data perusahaan1 berdistribusi
normal.
Sementara itu, untuk data perusahaan2, p-value yang diperoleh adalah 0.2554. Karena p-value ini lebih besar dari α = 0.05, maka hasil pengujian menunjukkan terima H0, yang berarti data perusahaan2 juga berdistribusi normal.
Meskipun hasil histogram untuk data perusahaan2 mungkin tidak menunjukkan distribusi normal, hasil dari pengujian kenormalan Shapiro-Wilk dapat diandalkan, dan memberikan kesimpulan bahwa kedua data, yaitu dari perusahaan1 dan perusahaan2, dapat dianggap berdistribusi normal pada tingkat signifikansi 5%.
#Data faithful
data("faithful")
#Data untuk kolom eruptions
hist(faithful$eruptions)
#Data untuk kolom waiting
hist(faithful$waiting)
# Uji Kenormalan Shapiro-Wilk
library(nortest)
lillie.test(faithful$eruptions)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: faithful$eruptions
## D = 0.18135, p-value < 2.2e-16
lillie.test(faithful$waiting)
##
## Lilliefors (Kolmogorov-Smirnov) normality test
##
## data: faithful$waiting
## D = 0.15536, p-value < 2.2e-16
jawaban: a.1 Grafik histogram data eruptions pada dataset faithful memberikan pola distribusi yang tidak normal, terlihat sebaran data tidak menyerupai kurva normal.
a.2 Grafik histogram data waiting pada dataset faithful memberikan pola distribusi yang tidak normal, terlihat sebaran data tidak menyerupai kurva normal.
Hasil Uji Normalitas Lilliefors (Kolmogorov-Smirnov) menunjukkan bahwa p-value untuk data faithful\(eruptions adalah kurang dari 2.2e-16. Dengan tingkat signifikansi α = 0.05 atau 5%, dapat disimpulkan bahwa pengujian menunjukkan tolak H0 dan H1 diterima. Ini berarti data waktu letusan dari faithful\)eruptions tidak dapat dianggap berasal dari populasi yang berdistribusi normal pada tingkat signifikansi 5%.
Selain itu, p-value untuk data faithful\(waiting juga kurang dari 2.2e-16. Karena p-value ini jauh lebih kecil dari α = 0.05, hasil pengujian menunjukkan tolak H0 dan H1 diterima untuk faithful\)waiting. Dengan demikian, data waktu tunggu dari faithful$waiting juga tidak dapat dianggap berasal dari populasi yang berdistribusi normal pada tingkat signifikansi 5%.
Kesimpulannya, berdasarkan hasil uji Lilliefors (Kolmogorov-Smirnov), kedua data waktu letusan (faithful\(eruptions) dan waktu tunggu (faithful\)waiting) tidak dapat diterima sebagai data yang berdistribusi normal pada tingkat signifikansi 5%.
jawaban: 1. Histogram a. Kelebihan: - Memberikan gambaran yang mudah dipahami tentang distribusi data. - Mudah untuk melihat bentuk distribusi, seperti simetri, kecondongan (skewness), dan adanya outlier. - Memungkinkan untuk melihat frekuensi data dalam interval tertentu, sehingga membantu dalam memahami kepadatan data. b. Kekurangan: - Tidak dirancang khusus untuk memeriksan kenormalan, sehingga sulit memastikan apakah data berdistribusi normal. - Interpretasinya bisa subjektif dan tergantung pada jumlah interval dalam histogram, yang dapat memengaruhi tampilan distribusi data.
jawaban: 1. Uji Shapiro-Wilk, menguji apakah sampel data berasal dari distribusi normal. Cocok untuk dampel kecil hingga menengah dan lebih spesifik untuk normalitas. Sedangkan, 2. Uji Jarque-Bera, menguji apakah data memiliki skewness dan kurtosis yang sesuai dengan distribusi normal. Cocok untuk dampel dengan ukuran besar. Lebih sensitif terhadap outlier. Sedangkan, 3. Uji Kolmogorov-Smirnov, menguji apakah sampel data berasal dari distribusi tertentu, termasuk distribusi normal. Cocok untuk beragam ukuran sampel dan digunakan untuk menguji berbagai distribusi.