Regresi Linier, Chi-Square Test, t Test

Regresi Linier

Diketahui data feed efficiency ratio (FER) dari 60 ekor ayam sebagai berikut:

Ditanya:

  1. Buatlah plot rata-rata FER terhadap Additive (A)

  2. Gunakan ilmu statistika yang telah anda pelajari, analisis statistika untuk menentukan jenis analisis yang dapat digunakan berdasarkan data tersebut.

  3. Berdasarkan hasil analisis yang telah anda lakukan, kesimpulan apa yang Anda dapatkan?

Pembahasan:

  1. Buatlah plot rata-rata FER terhadap Additive (A)

Jawab

#Input Data dan menghitung rata-rata
Additive<-c(0,20,40,60,80,100) 

Additive0<-c(1.30,1.35,1.44,1.52,1.56,1.61,1.48,1.56,1.45,1.14)
meanA0=sum(Additive0)/length(Additive0)

Additive20<-c(2.17,2.11,2.08,2.13,2.22,2.29,2.33,2.24,2.16,2.21)
meanA20=sum(Additive20)/length(Additive20)

Additive40<-c(2.30,2.34,2.20,2.38,2.48,2.44,2.37,2.43,2.37,2.41)
meanA40=sum(Additive40)/length(Additive40)

Additive60<-c(2.47,2.51,2.79,2.40,2.55,2.67,2.50,2.55,2.60,2.49)
meanA60=sum(Additive60)/length(Additive60)

Additive80<-c(3.31,3.17,3.24,3.21,3.35,3.38,3.42,3.36,3.25,3.51)
meanA80=sum(Additive80)/length(Additive80)

Additive100<-c(4.92,3.87,4.81,4.88,5.06,5.09,4.97,4.95,4.59,4.76)
meanA100=sum(Additive100)/length(Additive100)

MeanFER <-c(meanA0,meanA20,meanA40,meanA60,meanA80,meanA100)

DataFER<- data.frame(Additive,MeanFER)
DataFER
##   Additive MeanFER
## 1        0   1.441
## 2       20   2.194
## 3       40   2.372
## 4       60   2.553
## 5       80   3.320
## 6      100   4.790
# Membuat Plot

plot(Additive,MeanFER,ylab = "Rata-Rata FER",xlab="Additive(A)",main = "Plot Rata-Rata FER terhadap Additive(A)", col="red")

Berdasarkan plot gambar di atas terlihat bahwa Additive(A) dan Rata-rata FER memiliki pola hubungan linier. Secara eksploratif terlihat bahwa semakin besar additive(A) maka rata-rata FER akan semakin besar. Dari koefisien korelasi di bawah terlihat bahwa terdapat hubungan linier positif yang sangat erat antara Additive(A) dan Rata-rata FER (r =0.9385 mendekati nilai 1). Selain itu, hasil uji korelasi juga menunjukkan bahwa kedua perubah tersebut signifikan pada taraf alpha 5%.

#Koefisien Korelasi 
cat("Koefisien Korelasi(r)", cor(DataFER$Additive,DataFER$MeanFER, method="pearson"))
## Koefisien Korelasi(r) 0.9385331
#Uji Korelasi
cor.test(DataFER$Additive,DataFER$MeanFER)
## 
##  Pearson's product-moment correlation
## 
## data:  DataFER$Additive and DataFER$MeanFER
## t = 5.4378, df = 4, p-value = 0.005551
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.5327726 0.9934252
## sample estimates:
##       cor 
## 0.9385331
  1. Gunakan ilmu statistika yang telah anda pelajari, analisis statistika untuk menentukan jenis analisis yang dapat digunakan berdasarkan data tersebut.

Jawab:

Jenis analisis yang saya gunakan adalah analisis regresi untuk mengetahui hubungan sebab akibat antara Additive(A) dan Rata-rata FER. Peubah respon yang saya gunakan adalah Rata-rata FER sedangkan peubah penjelas adalah Additive(A).

#Pemodelan Regresi
(model<- lm(MeanFER~Additive, data = DataFER))
## 
## Call:
## lm(formula = MeanFER ~ Additive, data = DataFER)
## 
## Coefficients:
## (Intercept)     Additive  
##     1.32805      0.02901

Persamaan regresi berdasarkan hasil di atas yaitu: Y_duga=1.32805+ 0.02901X Interpretasi: Dari persamaan regresi di atas dapat diinterpretasikan bahwa jika Additive(A) meningkat sebesar satu satuan maka rata-rata FER akan meningkat sebesar 0.02901.

Uji Hipotesis: H0: β1 = 0

H1: β1 ≠ 0

# Uji hipotesis
summary(model)
## 
## Call:
## lm(formula = MeanFER ~ Additive, data = DataFER)
## 
## Residuals:
##       1       2       3       4       5       6 
##  0.1130  0.2858 -0.1163 -0.5154 -0.3285  0.5614 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept) 1.328048   0.322996   4.112  0.01471 * 
## Additive    0.029006   0.005334   5.438  0.00555 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.4463 on 4 degrees of freedom
## Multiple R-squared:  0.8808, Adjusted R-squared:  0.8511 
## F-statistic: 29.57 on 1 and 4 DF,  p-value: 0.005551

Berdasarkan hasil pengujian hipotesis di atas didapatkan nilai p_value=0.00555<alpha=0.05 yang berarti TOLAK H0. Cukup bukti untuk menyatakan bahwa Additive(A) berpengaruh terhadap rata-rata FER.

# Selang kepercayaan bagi penduga parameter regresi
confint(model)
##                  2.5 %     97.5 %
## (Intercept) 0.43126771 2.22482753
## Additive    0.01419588 0.04381555
# Diagnostik Model
par(mfrow = c(2, 2))
plot(model)

• Pada grafik Residuals vs Fitted terlihat bahwa data tersebar dan tidak membentuk satu pola tertentu, sehingga dapat dikatakan tidak terjadi perbedaan varians residual dan model memiliki homoskedastisitas ragam.

• Pada grafik Normal Q-Q menunjukkan point-point data berada disekitar garis lurus, maka dapat dikatakan data terdistribusi normal.

  1. Berdasarkan hasil analisis yang telah anda lakukan, kesimpulan apa yang Anda dapatkan?

Dari hasil analisis pada poin 2 di atas dapat disimpulkan bahwa terdapat hubungan sebab akibat antara Additive(A) dan Rata-rata FER. Dari Persamaan regresi Y_duga=1.32805+ 0.02901X dapat terlihat bahwa jika Additive(A) meningkat sebesar satu satuan maka rata-rata FER akan meningkat sebesar 0.02901. Selain itu, dari hasil pengujian hipotesis juga menunjukkan bahwa cukup bukti untuk menyatakan bahwa Additive(A) berpengaruh terhadap rata-rata FER.

Oleh karena itu, semakin besar Additive, maka semakin besar pula rata-rata feed efficiency ratio (FER) dari ayam.

UJI CHI-SQUARE

Multinomial

Frekuensi Harapan Sama

Diketahui data frekuensi amatan hasil survei menurut digit terakhir berat badan seseorang sebagai berikut.

Dengan alpha 5%, apakah probability digit terakhir berat badan seseorang tersebut sama satu dengan lainnya?

Jawab:

Ho: p0=p1=…=p9

H1: Setidaknya ada satu probability digit terakhir berat badan seseorang yang berbeda dengan yang lainnya

## Input Data
x <- c(0,1,2,3,4,5,6,7,8,9)
obs <- c(35,0,2,1,4,24,1,4,7,2)

#Menghitung Nilai Frekuensi Harapan (E)
n <- sum(obs) #sampel  
E <- sum(obs)/length(obs) #Frekuensi Harapan (E)=n/k

#Membuat tabel berisi Frekuensi Amatan dan Frekuensi Harapan

multinom.propsama <- rbind(obs,E)
multinom.propsama
##     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
## obs   35    0    2    1    4   24    1    4    7     2
## E      8    8    8    8    8    8    8    8    8     8
#Menghitung Statistik Uji Chi-Square
chisquare.manual <- sum((obs-E)^2/E)
chisquare.manual
## [1] 156.5
#Menghitung Chi-Square Tabel
chisquare.tabel <- qchisq(0.95,(length(x)-1)) #Nilai chi-square tabel qchist(1-alpha, k-1)
chisquare.tabel
## [1] 16.91898

Karena Chi_Square_hitung lebih besar dari chi_square tabel, maka keputusannya TOLAK HO.

Berarti dengan alpha 5% dapat dinyatakan bahwa cukup bukti untuk menyatakan bahwa Setidaknya ada satu probability digit terakhir berat badan seseorang yang berbeda dengan yang lainnya. Last digits tidak memiliki frekuensi relatif yang sama.

Frekuensi Harapan Berbeda

Diketahui data frekuensi amatan hasil survei menurut digit terakhir berat badan seseorang beserta proporsi yang dipercaya bertahun-tahun adalah sebagai berikut.

Dengan alpha 5%, ujilah apakah klaim terkait proporsi digit terakhir berat badan seseorang yang dipercaya bertahun-tahun tersebut benar?

Jawab:

Ho: p1=0.301, p2=0.176, p3=0.125, p4=0.97,p5=0.079,p6=0.067,p7=0.058,p8=0.051,p9=0.046

H1: Setidaknya ada satu proporsi yang berbeda dengan yang di claim

# Input Data
x2 <- c(1,2,3,4,5,6,7,8,9)
obs2 <- c(0,15,0,76,479,183,8,23,0)
p2 <- c(0.301,0.176,0.125,0.097,0.079,0.067,0.058,0.051,0.046)
n2 <- sum(obs) #sampel

#Menghitung Frekuensi Harapan

E2 <- n2*p2 #Frekuensi Harapan (E)=n*p

#Mengabungkan Frekuensi Amatan dan Frekuensi Harapan jadi satu tabel
multinom.propbeda <- rbind(obs2,E2)
multinom.propbeda
##       [,1]  [,2] [,3]  [,4]   [,5]   [,6] [,7]  [,8] [,9]
## obs2  0.00 15.00    0 76.00 479.00 183.00 8.00 23.00 0.00
## E2   24.08 14.08   10  7.76   6.32   5.36 4.64  4.08 3.68
#Menghitung Statistik Uji Chi-Square

chisquare.manual2 <- sum((obs2-E2)^2/E2)
chisquare.manual2
## [1] 41967.66
#Menghitung Statistik Uji Tabel

chisquare.tabel2 <- qchisq(0.99,(length(x2)-1)) #Nilai chi-square tabel qchist(1-alpha, k-1)
chisquare.tabel2
## [1] 20.09024

Karena Chi_Square_hitung lebih besar dari chi_square tabel, maka keputusannya TOLAK HO.

Berarti dengan alpha 5% dapat dinyatakan bahwa cukup bukti untuk menyatakan bahwa setidaknya ada satu proporsi yang berbeda dengan yang di claim. Berarti klaim terkait proporsi digit terakhir berat badan seseorang yang dipercaya bertahun-tahun tersebut tidak benar.

Tabel Kontingensi (Uji Kebebasan Baris dan Lajur)

Diketahui data suatu survei berikut:

Ujilah pada taraf alpha 5%, Apakah jenis kelamin dan tingkat kesibukan bebas satu sama lain?

Jawab:

Ho: JK dan Tingkat Kesibukan bebas satu sama lain

H1: JK dan Tingkat Kesibukan tidak bebas satu sama lain

#input data
dat <- matrix(c(5, 26, 4,
                16, 35, 5), nrow = 2, byrow = T)
dimnames(dat)<- list(c("Wanita", "Laki-laki"),
                     c("tidak sibuk", "cukup sibuk", "sangat sibuk"))
dat
##           tidak sibuk cukup sibuk sangat sibuk
## Wanita              5          26            4
## Laki-laki          16          35            5
#uji Chi-Square

chisq.test(dat)
## Warning in chisq.test(dat): Chi-squared approximation may be incorrect
## 
##  Pearson's Chi-squared test
## 
## data:  dat
## X-squared = 2.4872, df = 2, p-value = 0.2883

Karena p_value > alpha maka TIDAK TOLAK H0.

Berarti dengan alpha 5% dapat dinyatakan bahwa tidak cukup bukti untuk menyatakan bahwa JK dan Tingkat kesibukan tidak saling bebas satu sama lain.

UJI t Data Berpasangan

Suatu klub kesegaran jasmani ingin mengevaluasi program diet, kemudian dipilih secara acak 10 orang anggotanya untuk mengikuti program diet tersebut selama 3 bulan. Data yang diambil adalah berat badan sebelum dan sesudah program diet dilaksanakan, yaitu:

Berdasarkan data diatas, apakah program diet tersebut dapat mengurangi berat badan minimal 5 kg? Jelaskan jawaban anda!

Jawab:

Sampel = n = 10

Uji t data berpasangan

Hipotesis: Ho: μ_d ≥5

H1: μ_d <5

#input data
BBAwal<-c(90,89,92,90,91,92,91,93,92,91)
BBAkhir<-c(85,86,87,86,87,85,85,87,86,86)

#uji t
res <- t.test(BBAwal,BBAkhir, paired = TRUE, alternative = "less",  mu = 5)
res
## 
##  Paired t-test
## 
## data:  BBAwal and BBAkhir
## t = 0.26414, df = 9, p-value = 0.6012
## alternative hypothesis: true difference in means is less than 5
## 95 percent confidence interval:
##      -Inf 5.794005
## sample estimates:
## mean of the differences 
##                     5.1

Kesimpulan:

Berdasarkan hasil pengujian hipotesis di atas, terlihat bahwa nilai p_value=0.6012> α=0.05 yang berarti Tidak Tolak Ho. Karena Tidak tolak H0 maka hasilnya INKONKLUSIF. Kurang cukup bukti untuk menyatakan bahwa program diet tersebut dapat mengurangi berat badan kurang dari 5 kg.