- 1 PENDAHULUAN
- 2 SOURCE CODE
- 3 HASIL DAN PEMBAHASAN
- 4 DAFTAR PUSTAKA
1 PENDAHULUAN
1.1 Latar Belakang
Pada zaman ini, olah data sangat penting sebagai informasi dan pemecahan masalah saat pandemi. Data yang diolah akan berguna untuk meningkatkan dan memulihkan keadaan. Komputasi adalah pilihan yang tepat untukdata inputan yang menggunakan suatu algoritma. Komputasi bisa dilakukan dengan software yang mendukung analisisnya, seperti software R, spp, genstat, minitab, dan sebagainya. Dalam software R terdapat fasilitas untuk perhitungan, manipulasi, dan pembuatan grafik. Oleh karena itu, software R dapat digunakan untuk suatu analisis statistika. Namun, terdapat kelemahan dari software ini yaitu diperlukan syntax agar dapat mengetahui hasil dari analisis statistika tersebut. Maka, dalam praktikum ini akan membahas mengenai salah satu analisis yang dilakukan menggunakan aplikasi R yaitu analisis regresi linier sederhana untuk mengetahui pengaruh kecepatan mobil pengangkut terhadap banyaknya kaleng rusak pada saat pengiriman ke konsumen.
1.2 Tinjauan Pustaka
###Statistika Deskriptif
Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan dan penyajian suatu data sehingga memberikan informasi yang berguna (Walpole, 1995).Dengan statistika deskriptif, kumpulan data bisa tersaji dengan ringkas dan rapi serta mampu memberikan informasi inti dari kumpulan data seperti ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data.
###Statistika Inferensial
Statistika inferensial adalah sebuah metode yang yang digunakan ahli statistik untuk menarik kesimpulan tentang karakteristik populasi, diambil dari karakteristik sampel, dan untuk memutuskan seberapa pasti mereka dapat diandalkan dari kesimpulan tersebut. Generalisasi yang berhubungan dengan inferensia statistik memiliki sifat tidak pasti, karena mendasarkan pada informasi parsial yang didapat dari sebagian data sehingga hanya sebagai peramalan.Statistika Inferensi dibagi menjadi 2 dengan penjelasan sebagai berikut. a. Parametrik yaitu suatu metode statistika inferensi yang modelnya menetapkan asumsi-asumsi tertentu dari sebaran data populasinya. b. Non Parametrik yaitu metode yang tidak memerlukan adanya asumsi-asumsi mengenai sebaran data populasinya (belum diketahui sebaran datanya dan tidak perlu berdistribusi normal).
###Analisis Korelasi
Analisis korelasi adalah metode evaluasi statistik yang dipergunakan untuk mempelajari kekuatan hubungan antara dua variabel kontinu yang diukur secara numerik, dengan rumus sebagai berikut.
\[ r = \frac{n \sum xy - \sum x \sum y} {\sqrt(n \sum x^2 - (\sum x)^2)(n \sum y^2 -(\sum y)^2)} \]
###Analisis Regresi Linier Sederhana
Analisis regresi linier sederhana adalah metode statistik untuk menguji sejauh mana hubungan sebab akibat atara variabel prediktor (X) terhadap variabel respon (Y). Model duga hubungan linier tersebut dapat dinyatakan sebagai berikut:
\[ Y=a+bX \]
Keterangan:
Y = Variabel tak bebas (dependent)
a = nilai konstanta
b = koefisien arah regresi
1.3 Data
Data yang digunakan adalah data sekunder. Data ini diambil dari modul responsi dari mata kuliah Pengantar Analisis Regresi yang ditulis oleh Dra. Ani Budi Astuti dan Dr. Adji Achmad Rinaldo Fernandes.
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> library(rmarkdown) #membuat markdown dengan Bahasa R menggunakan Rstudio
> library(prettydoc) #membuat tampilan dokumen menjadi lebih cantik
> library(tinytex) #membantu fungsi untuk menginstall dan memperbaiki TeXLive dan meng-compile LaTeX dokumen
> library(equatiomatic) #Mengubah model menjadi persamaan LaTeX
> library(tseries) #analisis time series dan komputasi keuangan
> library(lmtest) #pengujian model regresi linier2.2 Memanggil Data
Berikut adalah data yang akan digunakan (Data terdiri dari 13 obervasi dengan 2 variabel).
> data_kholifa<- read.csv(file.choose(), header=TRUE)
> head(data_kholifa)
No. Kecepatan KalengRusak
1 1 40 27
2 2 30 54
3 3 50 86
4 4 80 136
5 5 40 65
6 6 30 109
> str(data_kholifa)
'data.frame': 13 obs. of 3 variables:
$ No. : int 1 2 3 4 5 6 7 8 9 10 ...
$ Kecepatan : int 40 30 50 80 40 30 30 40 30 50 ...
$ KalengRusak: int 27 54 86 136 65 109 28 75 53 33 ...
> paged_table(as.data.frame(data_kholifa))Keterangan:
- data_kholifa=read.csv(“D:/laporan praktikum akhir.csv”, header=TRUE, sep=“;”) untuk membaca file yang disimpan pada obyek data_kholifa dalam bentuk csv di folder D dengan nama praktikum komstat. - data_kholifa untuk memanggil file yang sudah disimpan pada obyek bernama data_kholifa.
2.3 Analisis Grafik
2.3.1 Scatter Plot
Scatter plot dapat membantu memvisualisasikan hubungan linier antara variabel respon dengan variabel prediktor.
> scatter.smooth(x=data_kholifa$Kecepatan, y=data_kholifa$KalengRusak, main="Gambar 1. Smooth Scatter Plot KalengRusak~Kecepatan", xlab="Kecepatan", ylab="Kaleng Rusak", pch=16, col="brown1") # scatterplot2.3.2 Box Plot
Box plot digunakan untuk menemukan pengamatan outlier dalam variabel. Data yang memiliki outlier di prediktor dapat secara drastis memengaruhi prediksi karena dengan mudah memengaruhi kemiringan garis yang paling sesuai.
> par(mfrow=c(1,2)) #Membagi area grafik menjadi 2 kolom
> boxplot(data_kholifa$Kecepatan, main="Gambar 2.1. Boxplot Kecepatan",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$Kecepatan)$out), col="blue") #box plot untuk Kecepatan
>
> boxplot(data_kholifa$KalengRusak, main="Gambar 2.2. Boxplot Jumlah Kaleng Rusak",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$KalengRusak)$out), col="darkgreen") #box plot untuk Jumlah Kaleng Rusak2.3.3 Density Plot
Density plot digunakan untuk memeriksa apakah variabel respons mendekati normalitas. Idealnya, distribusi yang mendekati normal (kurva berbentuk lonceng), tanpa miring ke kiri atau kanan lebih disukai, penjelasan lebih lanjut sebagai berikut.
> par(mfrow=c(1,2)) #Membagi area grafik menjadi 2 kolom
> plot(density(data_kholifa$Kecepatan), main="Gambar 3.1. Density Plot : Kecepatan Mobil saat Pengiriman", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$Kecepatan),2))) #desity plot untuk Kecepatan Mobil saat Pengiriman
> polygon(density(data_kholifa$Kecepatan), col="yellow")
>
> plot(density(data_kholifa$KalengRusak), main="Gambar 3.2. Density Plot : Banyak Kaleng Rusak", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$KalengRusak),2))) #desity plot untuk Banyak Kaleng Rusak
> polygon(density(data_kholifa$KalengRusak), col="green")2.4 Analisis Korelasi
Analisis korelasi pada kasus ini untuk mengetahui hubungan antara kecepatan mobil pada saat pengiriman dengan banyaknya kerusakan kaleng.
> cor(data_kholifa[1:2], method="pearson") #menghitung korelasi antara kecepatan dengan banyaknya kaleng rusak
No. Kecepatan
No. 1.0000000 0.2484647
Kecepatan 0.2484647 1.0000000##Analisis Regresi dengan Cara Manual ### Analisis Koefisien Model #### Penduga Beta \[ \hat\beta=(X'X) ^-~^1 X'Y \]
> X<-data_kholifa$Kecepatan
> Y<-data_kholifa$KalengRusak
> data=data.frame(X,Y)
> n<-dim(data)[1] #dimensi data
> n
[1] 13
> X<-matrix(c(rep(1,n),data_kholifa$Kecepatan),nrow=n)
> X
[,1] [,2]
[1,] 1 40
[2,] 1 30
[3,] 1 50
[4,] 1 80
[5,] 1 40
[6,] 1 30
[7,] 1 30
[8,] 1 40
[9,] 1 30
[10,] 1 50
[11,] 1 70
[12,] 1 30
[13,] 1 80
> Y
[1] 27 54 86 136 65 109 28 75 53 33 168 47 52
> k<-dim(X)[2] #dimensi data variabel X
> k
[1] 2
> b_duga<-(solve(t(X)%*%X))%*%(t(X)%*%Y) #Penduga beta
> b_duga
[,1]
[1,] 17.142857
[2,] 1.1835712.4.0.1 Penduga Respons (Y)
\[ \hat Y=X \hat\beta \]
> Y_duga<-X%*%b_duga #Penduga respon (Y)
> Y_duga
[,1]
[1,] 64.48571
[2,] 52.65000
[3,] 76.32143
[4,] 111.82857
[5,] 64.48571
[6,] 52.65000
[7,] 52.65000
[8,] 64.48571
[9,] 52.65000
[10,] 76.32143
[11,] 99.99286
[12,] 52.65000
[13,] 111.828572.4.0.2 Penduga U (sisaan)
\[ \hat u=Y-\hat Y \]
> sisa_uduga<-Y - Y_duga #sisaan (vektor selisih)
> sisa_uduga
[,1]
[1,] -37.4857143
[2,] 1.3500000
[3,] 9.6785714
[4,] 24.1714286
[5,] 0.5142857
[6,] 56.3500000
[7,] -24.6500000
[8,] 10.5142857
[9,] 0.3500000
[10,] -43.3214286
[11,] 68.0071429
[12,] -5.6500000
[13,] -59.82857142.4.1 Analisis Ragam
>
> Y_bar<-rep(mean(Y),n) #nilai rata-rata variabel Y diulang sebanyak n kali
> Y_bar
[1] 71.76923 71.76923 71.76923 71.76923 71.76923 71.76923 71.76923 71.76923
[9] 71.76923 71.76923 71.76923 71.76923 71.76923
>
> JKR<-t(Y_duga-Y_bar)%*%(Y_duga-Y_bar) #Jumlah keragaman regresi
> JKR
[,1]
[1,] 6034.393
>
> JKG<-t(Y-Y_duga)%*%(Y-Y_duga) #Jumlah keragaman galat
> JKG
[,1]
[1,] 16091.91
>
> JKT<-t(Y-Y_duga)%*%(Y-Y_duga) #Jumlah keragaman total
> JKT
[,1]
[1,] 16091.91
>
> JK<-c(JKR, JKG, JKT) #gabungan jumlah kuadrat
> JK
[1] 6034.393 16091.914 16091.914
>
> dbreg<-k-1 #derajat bebas regresi
> dbTot<-n-1 #derajat bebas total
> dbGal<-dbTot-dbreg #derajat bebas galat
> db<-c(dbreg, dbGal, dbTot) #gabungan derajat bebas
> db
[1] 1 11 12
>
> KT<-JK/db #kuadrat total
> KT
[1] 6034.393 1462.901 1340.993
>
> sk<-c("Regresi", "Galat", "Total") #sumber keragaman
> sk
[1] "Regresi" "Galat" "Total"
>
> reg<-data.frame(sk,JK,db,KT) #data frame gabungan sk, JK, db, dan KT untuk membentuk suatu tabel
> names(reg)<-c("SK","JK","db","KT")
> reg
SK JK db KT
1 Regresi 6034.393 1 6034.393
2 Galat 16091.914 11 1462.901
3 Total 16091.914 12 1340.9932.4.2 Uji t
Rumus statistik uji:
\[ se(\hat\beta~j~)= \sqrt{var(\hat\beta~j~)} \] \[ var(\hat\beta~j)=\hat\sigma^2 (X'X)^-~^1 \]
> var_cov<-reg$KT[2]*solve(t(X) %*% X) #mencari ragam peragam
> var_cov
[,1] [,2]
[1,] 835.94360 -15.6739425
[2,] -15.67394 0.3396021> sd<-rep(0,k)
> for(i in 1:k){
+ sd[i]<-sqrt(var_cov[i,i])
+ }
> sd
[1] 28.9126892 0.5827539\[ T=\frac{\hat\beta~j~-\beta~j~}{se(\hat\beta~j~)}, menyebar secara ~~t(n-k) \]
Menghitung statistik uji t masing-masing penduga beta:
> t<-b_duga/sd
> t
[,1]
[1,] 0.5929181
[2,] 2.0309971Menghitung nilai p-value masing-masing penduga beta:
> p<-2*pt(abs(t), reg$db[2], lower.tail=FALSE)
> p
[,1]
[1,] 0.56522648
[2,] 0.067135682.4.3 Uji f
Rumus: \[ F=\frac{KT Regresi} {KT Galat} \]
> f_hit<-reg$KT[1]/reg$KT[2] #F hitung
> f_hit
[1] 4.124949
>
> p_value<-pf(f_hit, reg$db[1],reg$db[2], lower.tail=FALSE) #menghitung p-value
> p_value
[1] 0.067135682.4.4 Selang Kepercayaan Parameter
\[ Selang~kepercayaan~(1-\alpha)*100\% ~~bagi~~ \beta~j \]
> alpha<-0.05
> t_tab<-qt(alpha/2,reg$db[2], lower.tail=FALSE)
> t_tab
[1] 2.200985
>
> bb_sk<-b_duga-(t_tab*sd) #menghitung batas bawah selang
> bb_sk
[,1]
[1,] -46.49354282
[2,] -0.09906122
> ba_sk<-b_duga+(t_tab*sd) #menghitung batas atas selang
> ba_sk
[,1]
[1,] 80.779257
[2,] 2.466204
>
> sk<-cbind(bb_sk, ba_sk) #membuat selang kepercayaan berdasarkan batas atas dan batas bawah
> sk
[,1] [,2]
[1,] -46.49354282 80.779257
[2,] -0.09906122 2.4662042.4.5 Koefisien Determinasi dan Adjusted Koefisien Determinasi
Koefisien determinasi: \[ R^2=\frac{JK~Regresi}{JK~Total} \]
Hasil pada Rstudio:
> R2<-reg$JK[1]/reg$JK[3]
> R2
[1] 0.3749954Adjusted koefisien determinasi: \[ adjusted~R^2=1-\frac{JK~Galat/(n-k)}{JK~Total/(n-1)} \]
Hasil pada Rstudio:
> adjusted_R2<-1-((reg$JK[1]/dbGal)/(reg$JK[3]/dbTot))
> adjusted_R2
[1] 0.59091412.5 Analisis Regresi dengan Fungsi Built-in pada R
2.5.1 Analisis Koefisien Model
Setelah melihat hubungan linier secara gambar dalam digram pencar dan dengan menghitung korelasinya, maka langkah selanjutnya yaitu membentuk model analisis regresi dengan menggunakan fungsi lm(…) - built in pada R.
> X<-data_kholifa$Kecepatan
> Y<-data_kholifa$KalengRusak
> reg<-lm(Y~X, data=data_kholifa) #membentuk analisis regresi sederhana
> print(reg)
Call:
lm(formula = Y ~ X, data = data_kholifa)
Coefficients:
(Intercept) X
17.143 1.184 > extract_eq(reg, use_coefs = TRUE) #membentuk model analisis regresi sederhana beserta nilai koefisiennya\[ \operatorname{\widehat{Y}} = 17.14 + 1.18(\operatorname{X}) \]
> summary(reg) #memanggil koefisien model menggunakan syntax sebagai berikut.
Call:
lm(formula = Y ~ X, data = data_kholifa)
Residuals:
Min 1Q Median 3Q Max
-59.829 -24.650 0.514 10.514 68.007
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 17.1429 28.9127 0.593 0.5652
X 1.1836 0.5828 2.031 0.0671 .
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 38.25 on 11 degrees of freedom
Multiple R-squared: 0.2727, Adjusted R-squared: 0.2066
F-statistic: 4.125 on 1 and 11 DF, p-value: 0.067142.5.2 Analisis Ragam
> anova(reg) #memanggil hasil analisis ragam
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X 1 6034.4 6034.4 4.1249 0.06714 .
Residuals 11 16091.9 1462.9
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 12.5.3 Uji t
> reg
Call:
lm(formula = Y ~ X, data = data_kholifa)
Coefficients:
(Intercept) X
17.143 1.184
> model_sum <- summary(reg) #membuat model_sum sebagai sebuah objek
> model_coef <- model_sum$coefficients #model koefisien
> beta.duga <- model_coef["X", "Estimate"] #mencari beta duga untuk kecepatan
> std.error <- model_coef["X", "Std. Error"] #mencari standar error untuk kecepatan
> t_hit <- beta.duga/std.error #menghitung statistik uji t
> t_hit
[1] 2.030997
> p_value <- 2*pt(-abs(t_value) ,df=nrow(data_kholifa)-ncol(data_kholifa)) #menghitung p value
Error in pt(-abs(t_value), df = nrow(data_kholifa) - ncol(data_kholifa)): object 't_value' not found
> p_value
[1] 0.067135682.5.4 Uji f
> f_statistic <- reg$fstatistic[1] #menghitung statistik uji f
> f <- summary(reg)$fstatistic
> f
value numdf dendf
4.124949 1.000000 11.000000
> p_value <- pf(f[1], f[2], f[3], lower=FALSE) #menghitung p value
> p_value
value
0.06713568 2.6 Pengujian Asumsi
2.6.1 Uji Normalitas galat
2.6.1.1 Uji Jarque Berra
H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal
> library(tseries)
> sisa<-residuals(reg)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 0.26143, df = 2, p-value = 0.87752.6.1.2 Uji Saphiro Wilk
H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.9594, p-value = 0.74442.6.2 Uji homogenitas ragam galat
2.6.2.1 Uji Breusch Pagan
H0 : asumsi homogenitas ragam galat terpenuhi H1 : asumsi homogenitas ragam galat tidak terpenuhi
> library(lmtest)
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 3.4791, df = 1, p-value = 0.062152.6.3 Uji non autokorelasi galat
2.6.3.1 Uji DW
H0 : tidak terdapat masalah autokorelasi H1 : terdapat masalah autokorelasi
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 2.2389, p-value = 0.6691
alternative hypothesis: true autocorrelation is greater than 03 HASIL DAN PEMBAHASAN
3.1 Analisis Grafik
3.1.1 Scatter Plot
> scatter.smooth(x=data_kholifa$Kecepatan, y=data_kholifa$KalengRusak, main="Gambar 1. Smooth Scatter Plot KalengRusak~Kecepatan", xlab="Kecepatan", ylab="Kaleng Rusak", pch=16, col="brown1") # scatterplotInterpretasi: Plot pencar bersama dengan garis smoothing di atas menunjukkan hubungan yang meningkat secara linier antara variabel ‘Kecepatan’ dan ‘Kaleng Rusak’. Ini adalah hal yang baik, karena salah satu asumsi yang mendasari regresi linier adalah bahwa hubungan antara variabel respon dan prediktor adalah linier dan aditif.
3.1.2 Box Plot
> par(mfrow=c(1,2)) #Membagi area grafik menjadi 2 kolom
> boxplot(data_kholifa$Kecepatan, main="Gambar 2.1. Boxplot Kecepatan",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$Kecepatan)$out), col="blue") #box plot untuk Kecepatan
>
> boxplot(data_kholifa$KalengRusak, main="Gambar 2.2. Boxplot Jumlah Kaleng Rusak",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$KalengRusak)$out), col="darkgreen") #box plot untuk Jumlah Kaleng RusakInterpretasi: Dari diagram boxplot di atas, diketahui bahwa secara visual dalam data variabel prediktor “Kecepatan” dan variabel respons “Kaleng Rusak” tidak setangkup, karena panjang garis whisker tidak sama dan median tidak berada tepat di tengah-tengah kotak. Selain itu, juga dapat diketahui bahwa dari boxplot jumlah kaleng terdapat outlier.
3.1.3 Density Plot
> par(mfrow=c(1,2)) #Membagi area grafik menjadi 2 kolom
> plot(density(data_kholifa$Kecepatan), main="Gambar 3.1. Density Plot : Kecepatan Mobil saat Pengiriman", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$Kecepatan),2))) #desity plot untuk Kecepatan Mobil saat Pengiriman
> polygon(density(data_kholifa$Kecepatan), col="yellow")
>
> plot(density(data_kholifa$KalengRusak), main="Gambar 3.2. Density Plot : Banyak Kaleng Rusak", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$KalengRusak),2))) #desity plot untuk Banyak Kaleng Rusak
> polygon(density(data_kholifa$KalengRusak), col="green") Interpretasi: Dari grafik diatas, secara visualisasi data variabel numerik bentuk distribusinya 4 cilinder.
3.2 Analisis Korelasi
> cor(data_kholifa[1:2], method="pearson") #menghitung korelasi antara kecepatan dengan banyaknya kaleng rusak
No. Kecepatan
No. 1.0000000 0.2484647
Kecepatan 0.2484647 1.0000000Interpretasi: kuat lemah hubungan diukur diantara jarak (range) dari 0 sampai dengan 1. Dari hasil analisis di atas diketahui bahwa nilai korelasinya 0.0.2484647, hal ini berarti variabel “Kecepatan” dan variabel “Kaleng Rusak” memiliki hubungan. Selain, itu karena koefisien korelasi ditemukan positif (+) maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linier sempurna dengan kemiringan (slope) positif.
3.3 Analisis Regresi
3.3.1 Analisis Koefisien Model
- -Dengan Manual
-Dengan Fungsi Built-in
> X<-data_kholifa$Kecepatan
> Y<-data_kholifa$KalengRusak
> reg<-lm(Y~X, data=data_kholifa) #membentuk analisis regresi sederhana
> print(reg)
Call:
lm(formula = Y ~ X, data = data_kholifa)
Coefficients:
(Intercept) X
17.143 1.184 Interpretasi: - nilai koefisien beta0 sebesar 17.143 yang berarti apabila kecepatan bernilai 0 maka jumlah kaleng rusak akan naik sebesar 17.143 - nilai koefisien beta1 sebesar 1.184 yang berarti apabila kecepatan naik sebesar 1 satuan maka jumlah kaleng rusak akan naik sebsar 1.184 - Bentuk persamaan regresinya adalah Y = 17.143 + 1.184X
3.3.2 Analisis Ragam
3.3.3 Uji t
-Dengan Manual
-Dengan Fungsi Built-in
> reg
Call:
lm(formula = Y ~ X, data = data_kholifa)
Coefficients:
(Intercept) X
17.143 1.184
> model_sum <- summary(reg) #membuat model_sum sebagai sebuah objek
> model_coef <- model_sum$coefficients #model koefisien
> beta.duga <- model_coef["X", "Estimate"] #mencari beta duga untuk kecepatan
> std.error <- model_coef["X", "Std. Error"] #mencari standar error untuk kecepatan
> t_hit <- beta.duga/std.error #menghitung statistik uji t
> t_hit
[1] 2.030997
> p_value <- 2*pt(-abs(t_value) ,df=nrow(data_kholifa)-ncol(data_kholifa)) #menghitung p value
Error in pt(-abs(t_value), df = nrow(data_kholifa) - ncol(data_kholifa)): object 't_value' not found
> p_value
value
0.06713568 Interpretasi: - dengan alpha sebsar 5%, nilai t-hit sebesar 2.0309971 dan p-value sebesar 8.10^-13 (p-value < alpha) maka tolak H0 maka dapat disimpulkan bahwa terdapat hubungan antara kecepatan dengan jumlah kaleng yang rusak secara parsial
3.3.4 Uji f
-Dengan Manual
-Dengan Fungsi Built-in
> f_statistic <- reg$fstatistic[1] #menghitung statistik uji f
> f <- summary(reg)$fstatistic
> f
value numdf dendf
4.124949 1.000000 11.000000
> p_value <- pf(f[1], f[2], f[3], lower=FALSE) #menghitung p value
> p_value
value
0.06713568 Interpretasi: dengan alpha sebsar 5%, nilai f-hit sebesar 4.124949 dan p-value sebesar 0.06713568 (p-value > alpha) maka terima H0 maka dapat disimpulkan bahwa tidak terdapat hubungan antara kecepatan dengan jumlah kaleng yang rusak secara simultan
3.3.5 Selang Kepercayaan
> alpha<-0.05
> t_tab<-qt(alpha/2,reg$db[2], lower.tail=FALSE)
Error in qt(alpha/2, reg$db[2], lower.tail = FALSE): Non-numeric argument to mathematical function
> t_tab
[1] 2.200985
>
> bb_sk<-b_duga-(t_tab*sd) #menghitung batas bawah selang
> bb_sk
[,1]
[1,] -46.49354282
[2,] -0.09906122
> ba_sk<-b_duga+(t_tab*sd) #menghitung batas atas selang
> ba_sk
[,1]
[1,] 80.779257
[2,] 2.466204
>
> sk<-cbind(bb_sk, ba_sk) #membuat selang kepercayaan berdasarkan batas atas dan batas bawah
> sk
[,1] [,2]
[1,] -46.49354282 80.779257
[2,] -0.09906122 2.466204Interpretasi: Selang kepercayaan tidak melewati 0 maka dapat dinyatakan bahwa tolak H0 (terdapat hubungan antara kedua variabel)
3.3.6 Koefisien Determinasi dan Adjusted Koefisien Determinasi
Koefisien determinasi:
\[ R^2=\frac{JK~Regresi}{JK~Total}=0.3749954 \]
Interpretasi: Koefisien determinasi bernilai 0.375 yang berarti kemampuan variabel bebas dalam menjelaskan varians dari variabel terikatnya sebesar 37.5%
Adjusted koefisien determinasi: \[ adjusted~R^2=1-\frac{JK~Galat/(n-k)}{JK~Total/(n-1)}=0.5909141 \]
Interpretasi: Adjusted koefisien determinasi bernilai 0.59 yang berarti kemampuan variabel prediktor dalam menjelaskan variabel respon sebesar 59%
3.4 Pengujian Asumsi
3.4.1 Uji Normalitas
3.4.1.1 Uji Jarque Berra
-Output
> library(tseries)
> sisa<-residuals(reg)
> jarque.bera.test(sisa)
Jarque Bera Test
data: sisa
X-squared = 0.26143, df = 2, p-value = 0.8775Hipotesis:
H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal
Tingkat Signifikansi: 0.05
Statistik Uji: p-value: 0.8775
Keputusan: Karena p-value( 0.8775) > alpha(0.05) maka terima H0
Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa asumsi homogenitas ragam galat terpenuhi
3.4.1.2 Uji Saphiro Wilk
> shapiro.test(sisa)
Shapiro-Wilk normality test
data: sisa
W = 0.9594, p-value = 0.7444Hipotesis:
H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal
Tingkat Signifikansi: 0.05
Statistik Uji: p-value: 0.7444
Keputusan: Karena p-value(0.7444) > alpha(0.05) maka terima H0
Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa asumsi homogenitas ragam galat terpenuhi
3.4.2 Uji homogenitas ragam galat
3.4.2.1 Uji Breusch Pagan
> library(lmtest)
> bptest(reg)
studentized Breusch-Pagan test
data: reg
BP = 3.4791, df = 1, p-value = 0.06215Hipotesis:
H0 : asumsi homogenitas ragam galat terpenuhi H1 : asumsi homogenitas ragam galat tidak terpenuhi
Tingkat Signifikansi: 0.05
Statistik Uji: p-value: 0.06215
Keputusan: Karena p-value(0.06215) > alpha(0.05) maka terima H0
Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa asumsi homogenitas ragam galat terpenuhi
3.4.3 Uji non autokorelasi galat
3.4.3.1 Uji DW
> dwtest(reg)
Durbin-Watson test
data: reg
DW = 2.2389, p-value = 0.6691
alternative hypothesis: true autocorrelation is greater than 0Hipotesis:
H0 : tidak terdapat masalah autokorelasi H1 : terdapat masalah autokorelasi
Tingkat Signifikansi: 0.05
Statistik Uji: p-value: 0.6691
Keputusan: Karena p-value(0.6691) > alpha(0.05) maka terima H0
Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa tidak terdapat masalah autokorelasi
4 DAFTAR PUSTAKA
Arikunto, Suharsimi. 2002. Prosedur Penelitian, Suatu Pendekatan Praktek.
Santoso, Singgih.; “SPSS Versi 10 Mengolah Data Statistik Secara Profesional”, Penerbit PT. Elex Media Komputindo, Gramedia, Jakarta, 2001. Jakarta: PT Rineka Cipta.
Walpole, Ronald E.; “Pengantar Statistika“, edisi ke-3, Penerbit PT. Gramedia Pustaka Utama, Jakarta, 1995.
Walpole, Ronald E., Raymond H Myers.; “Ilmu Peluang Dan Statistika untuk Insinyur dan Ilmuawan”, edisi ke-4, Penerbit ITB, Bandung, 1995.