ANALISIS REGRESI PENGARUH KECEPATAN MOBIL PENGANGKUT TERHADAP BANYAKNYA KALENG RUSAK PADA SAAT PENGIRIMAN KE KONSUMEN

Kholifatul Isnaini Putri Rifa’i

05 2022

1 PENDAHULUAN

1.1 Latar Belakang

Pada zaman ini, olah data sangat penting sebagai informasi dan pemecahan masalah saat pandemi. Data yang diolah akan berguna untuk meningkatkan dan memulihkan keadaan. Komputasi adalah pilihan yang tepat untukdata inputan yang menggunakan suatu algoritma. Komputasi bisa dilakukan dengan software yang mendukung analisisnya, seperti software R, spp, genstat, minitab, dan sebagainya. Dalam software R terdapat fasilitas untuk perhitungan, manipulasi, dan pembuatan grafik. Oleh karena itu, software R dapat digunakan untuk suatu analisis statistika. Namun, terdapat kelemahan dari software ini yaitu diperlukan syntax agar dapat mengetahui hasil dari analisis statistika tersebut. Maka, dalam praktikum ini akan membahas mengenai salah satu analisis yang dilakukan menggunakan aplikasi R yaitu analisis regresi linier sederhana untuk mengetahui pengaruh kecepatan mobil pengangkut terhadap banyaknya kaleng rusak pada saat pengiriman ke konsumen.

1.2 Tinjauan Pustaka

###Statistika Deskriptif
Statistika deskriptif adalah metode yang berkaitan dengan pengumpulan dan penyajian suatu data sehingga memberikan informasi yang berguna (Walpole, 1995).Dengan statistika deskriptif, kumpulan data bisa tersaji dengan ringkas dan rapi serta mampu memberikan informasi inti dari kumpulan data seperti ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data.

###Statistika Inferensial
Statistika inferensial adalah sebuah metode yang yang digunakan ahli statistik untuk menarik kesimpulan tentang karakteristik populasi, diambil dari karakteristik sampel, dan untuk memutuskan seberapa pasti mereka dapat diandalkan dari kesimpulan tersebut. Generalisasi yang berhubungan dengan inferensia statistik memiliki sifat tidak pasti, karena mendasarkan pada informasi parsial yang didapat dari sebagian data sehingga hanya sebagai peramalan.Statistika Inferensi dibagi menjadi 2 dengan penjelasan sebagai berikut. a. Parametrik yaitu suatu metode statistika inferensi yang modelnya menetapkan asumsi-asumsi tertentu dari sebaran data populasinya. b. Non Parametrik yaitu metode yang tidak memerlukan adanya asumsi-asumsi mengenai sebaran data populasinya (belum diketahui sebaran datanya dan tidak perlu berdistribusi normal).

###Analisis Korelasi
Analisis korelasi adalah metode evaluasi statistik yang dipergunakan untuk mempelajari kekuatan hubungan antara dua variabel kontinu yang diukur secara numerik, dengan rumus sebagai berikut.

\[ r = \frac{n \sum xy - \sum x \sum y} {\sqrt(n \sum x^2 - (\sum x)^2)(n \sum y^2 -(\sum y)^2)} \]

###Analisis Regresi Linier Sederhana
Analisis regresi linier sederhana adalah metode statistik untuk menguji sejauh mana hubungan sebab akibat atara variabel prediktor (X) terhadap variabel respon (Y). Model duga hubungan linier tersebut dapat dinyatakan sebagai berikut:

\[ Y=a+bX \]

Keterangan:
Y = Variabel tak bebas (dependent)
a = nilai konstanta
b = koefisien arah regresi

1.3 Data

Data yang digunakan adalah data sekunder. Data ini diambil dari modul responsi dari mata kuliah Pengantar Analisis Regresi yang ditulis oleh Dra. Ani Budi Astuti dan Dr. Adji Achmad Rinaldo Fernandes.

2 SOURCE CODE

2.1 Library yang Dibutuhkan

> library(rmarkdown) #membuat markdown dengan Bahasa R menggunakan Rstudio 
> library(prettydoc) #membuat tampilan dokumen menjadi lebih cantik
> library(tinytex) #membantu fungsi untuk menginstall dan memperbaiki TeXLive dan meng-compile LaTeX dokumen
> library(equatiomatic)  #Mengubah model menjadi persamaan LaTeX
> library(tseries) #analisis time series dan komputasi keuangan
> library(lmtest)  #pengujian model regresi linier

2.2 Memanggil Data

Berikut adalah data yang akan digunakan (Data terdiri dari 13 obervasi dengan 2 variabel).

> data_kholifa<- read.csv(file.choose(), header=TRUE)
> head(data_kholifa)
  No. Kecepatan KalengRusak
1   1        40          27
2   2        30          54
3   3        50          86
4   4        80         136
5   5        40          65
6   6        30         109
> str(data_kholifa)
'data.frame':   13 obs. of  3 variables:
 $ No.        : int  1 2 3 4 5 6 7 8 9 10 ...
 $ Kecepatan  : int  40 30 50 80 40 30 30 40 30 50 ...
 $ KalengRusak: int  27 54 86 136 65 109 28 75 53 33 ...
> paged_table(as.data.frame(data_kholifa))

Keterangan:
- data_kholifa=read.csv(“D:/laporan praktikum akhir.csv”, header=TRUE, sep=“;”) untuk membaca file yang disimpan pada obyek data_kholifa dalam bentuk csv di folder D dengan nama praktikum komstat. - data_kholifa untuk memanggil file yang sudah disimpan pada obyek bernama data_kholifa.

2.3 Analisis Grafik

2.3.1 Scatter Plot

Scatter plot dapat membantu memvisualisasikan hubungan linier antara variabel respon dengan variabel prediktor.

> scatter.smooth(x=data_kholifa$Kecepatan, y=data_kholifa$KalengRusak, main="Gambar 1. Smooth Scatter Plot KalengRusak~Kecepatan", xlab="Kecepatan", ylab="Kaleng Rusak", pch=16, col="brown1") # scatterplot

2.3.2 Box Plot

Box plot digunakan untuk menemukan pengamatan outlier dalam variabel. Data yang memiliki outlier di prediktor dapat secara drastis memengaruhi prediksi karena dengan mudah memengaruhi kemiringan garis yang paling sesuai.

> par(mfrow=c(1,2))  #Membagi area grafik menjadi 2 kolom
> boxplot(data_kholifa$Kecepatan, main="Gambar 2.1. Boxplot Kecepatan",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$Kecepatan)$out), col="blue")   #box plot untuk Kecepatan
> 
> boxplot(data_kholifa$KalengRusak, main="Gambar 2.2. Boxplot Jumlah Kaleng Rusak",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$KalengRusak)$out), col="darkgreen")   #box plot untuk Jumlah Kaleng Rusak

2.3.3 Density Plot

Density plot digunakan untuk memeriksa apakah variabel respons mendekati normalitas. Idealnya, distribusi yang mendekati normal (kurva berbentuk lonceng), tanpa miring ke kiri atau kanan lebih disukai, penjelasan lebih lanjut sebagai berikut.

> par(mfrow=c(1,2))   #Membagi area grafik menjadi 2 kolom
> plot(density(data_kholifa$Kecepatan), main="Gambar 3.1. Density Plot : Kecepatan Mobil saat Pengiriman", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$Kecepatan),2)))   #desity plot untuk Kecepatan Mobil saat Pengiriman
> polygon(density(data_kholifa$Kecepatan), col="yellow")
> 
> plot(density(data_kholifa$KalengRusak), main="Gambar 3.2. Density Plot : Banyak Kaleng Rusak", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$KalengRusak),2)))   #desity plot untuk Banyak Kaleng Rusak
> polygon(density(data_kholifa$KalengRusak), col="green")

2.4 Analisis Korelasi

Analisis korelasi pada kasus ini untuk mengetahui hubungan antara kecepatan mobil pada saat pengiriman dengan banyaknya kerusakan kaleng.

> cor(data_kholifa[1:2], method="pearson")  #menghitung korelasi antara kecepatan dengan banyaknya kaleng rusak
                No. Kecepatan
No.       1.0000000 0.2484647
Kecepatan 0.2484647 1.0000000

##Analisis Regresi dengan Cara Manual ### Analisis Koefisien Model #### Penduga Beta \[ \hat\beta=(X'X) ^-~^1 X'Y \]

> X<-data_kholifa$Kecepatan
> Y<-data_kholifa$KalengRusak
> data=data.frame(X,Y)
> n<-dim(data)[1]   #dimensi data
> n
[1] 13
> X<-matrix(c(rep(1,n),data_kholifa$Kecepatan),nrow=n)
> X
      [,1] [,2]
 [1,]    1   40
 [2,]    1   30
 [3,]    1   50
 [4,]    1   80
 [5,]    1   40
 [6,]    1   30
 [7,]    1   30
 [8,]    1   40
 [9,]    1   30
[10,]    1   50
[11,]    1   70
[12,]    1   30
[13,]    1   80
> Y
 [1]  27  54  86 136  65 109  28  75  53  33 168  47  52
> k<-dim(X)[2]   #dimensi data variabel X
> k
[1] 2
> b_duga<-(solve(t(X)%*%X))%*%(t(X)%*%Y)   #Penduga beta
> b_duga 
          [,1]
[1,] 17.142857
[2,]  1.183571

2.4.0.1 Penduga Respons (Y)

\[ \hat Y=X \hat\beta \]

> Y_duga<-X%*%b_duga   #Penduga respon (Y)
> Y_duga  
           [,1]
 [1,]  64.48571
 [2,]  52.65000
 [3,]  76.32143
 [4,] 111.82857
 [5,]  64.48571
 [6,]  52.65000
 [7,]  52.65000
 [8,]  64.48571
 [9,]  52.65000
[10,]  76.32143
[11,]  99.99286
[12,]  52.65000
[13,] 111.82857

2.4.0.2 Penduga U (sisaan)

\[ \hat u=Y-\hat Y \]

> sisa_uduga<-Y - Y_duga   #sisaan (vektor selisih)
> sisa_uduga   
             [,1]
 [1,] -37.4857143
 [2,]   1.3500000
 [3,]   9.6785714
 [4,]  24.1714286
 [5,]   0.5142857
 [6,]  56.3500000
 [7,] -24.6500000
 [8,]  10.5142857
 [9,]   0.3500000
[10,] -43.3214286
[11,]  68.0071429
[12,]  -5.6500000
[13,] -59.8285714

2.4.1 Analisis Ragam

> 
> Y_bar<-rep(mean(Y),n)   #nilai rata-rata variabel Y diulang sebanyak n kali
> Y_bar
 [1] 71.76923 71.76923 71.76923 71.76923 71.76923 71.76923 71.76923 71.76923
 [9] 71.76923 71.76923 71.76923 71.76923 71.76923
> 
> JKR<-t(Y_duga-Y_bar)%*%(Y_duga-Y_bar)   #Jumlah keragaman regresi
> JKR
         [,1]
[1,] 6034.393
> 
> JKG<-t(Y-Y_duga)%*%(Y-Y_duga)   #Jumlah keragaman galat
> JKG
         [,1]
[1,] 16091.91
> 
> JKT<-t(Y-Y_duga)%*%(Y-Y_duga)   #Jumlah keragaman total
> JKT
         [,1]
[1,] 16091.91
> 
> JK<-c(JKR, JKG, JKT)   #gabungan jumlah kuadrat
> JK
[1]  6034.393 16091.914 16091.914
> 
> dbreg<-k-1   #derajat bebas regresi
> dbTot<-n-1     #derajat bebas total
> dbGal<-dbTot-dbreg   #derajat bebas galat
> db<-c(dbreg, dbGal, dbTot)   #gabungan derajat bebas
> db
[1]  1 11 12
> 
> KT<-JK/db   #kuadrat total
> KT
[1] 6034.393 1462.901 1340.993
> 
> sk<-c("Regresi", "Galat", "Total")   #sumber keragaman
> sk
[1] "Regresi" "Galat"   "Total"  
> 
> reg<-data.frame(sk,JK,db,KT)   #data frame gabungan sk, JK, db, dan KT untuk membentuk suatu tabel
> names(reg)<-c("SK","JK","db","KT")   
> reg
       SK        JK db       KT
1 Regresi  6034.393  1 6034.393
2   Galat 16091.914 11 1462.901
3   Total 16091.914 12 1340.993

2.4.2 Uji t

Rumus statistik uji:

\[ se(\hat\beta~j~)= \sqrt{var(\hat\beta~j~)} \] \[ var(\hat\beta~j)=\hat\sigma^2 (X'X)^-~^1 \]

> var_cov<-reg$KT[2]*solve(t(X) %*% X)   #mencari ragam peragam
> var_cov
          [,1]        [,2]
[1,] 835.94360 -15.6739425
[2,] -15.67394   0.3396021
> sd<-rep(0,k)
> for(i in 1:k){
+   sd[i]<-sqrt(var_cov[i,i])
+ }
> sd
[1] 28.9126892  0.5827539

\[ T=\frac{\hat\beta~j~-\beta~j~}{se(\hat\beta~j~)}, menyebar secara ~~t(n-k) \]

Menghitung statistik uji t masing-masing penduga beta:

> t<-b_duga/sd
> t
          [,1]
[1,] 0.5929181
[2,] 2.0309971

Menghitung nilai p-value masing-masing penduga beta:

> p<-2*pt(abs(t), reg$db[2], lower.tail=FALSE)
> p
           [,1]
[1,] 0.56522648
[2,] 0.06713568

2.4.3 Uji f

Rumus: \[ F=\frac{KT Regresi} {KT Galat} \]

> f_hit<-reg$KT[1]/reg$KT[2]   #F hitung
> f_hit
[1] 4.124949
> 
> p_value<-pf(f_hit, reg$db[1],reg$db[2], lower.tail=FALSE)   #menghitung p-value 
> p_value
[1] 0.06713568

2.4.4 Selang Kepercayaan Parameter

\[ Selang~kepercayaan~(1-\alpha)*100\% ~~bagi~~ \beta~j \]

> alpha<-0.05
> t_tab<-qt(alpha/2,reg$db[2], lower.tail=FALSE)
> t_tab
[1] 2.200985
> 
> bb_sk<-b_duga-(t_tab*sd)   #menghitung batas bawah selang
> bb_sk
             [,1]
[1,] -46.49354282
[2,]  -0.09906122
> ba_sk<-b_duga+(t_tab*sd)   #menghitung batas atas selang
> ba_sk
          [,1]
[1,] 80.779257
[2,]  2.466204
> 
> sk<-cbind(bb_sk, ba_sk)   #membuat selang kepercayaan berdasarkan batas atas dan batas bawah
> sk
             [,1]      [,2]
[1,] -46.49354282 80.779257
[2,]  -0.09906122  2.466204

2.4.5 Koefisien Determinasi dan Adjusted Koefisien Determinasi

Koefisien determinasi: \[ R^2=\frac{JK~Regresi}{JK~Total} \]

Hasil pada Rstudio:

> R2<-reg$JK[1]/reg$JK[3]
> R2
[1] 0.3749954

Adjusted koefisien determinasi: \[ adjusted~R^2=1-\frac{JK~Galat/(n-k)}{JK~Total/(n-1)} \]

Hasil pada Rstudio:

> adjusted_R2<-1-((reg$JK[1]/dbGal)/(reg$JK[3]/dbTot))
> adjusted_R2
[1] 0.5909141

2.5 Analisis Regresi dengan Fungsi Built-in pada R

2.5.1 Analisis Koefisien Model

Setelah melihat hubungan linier secara gambar dalam digram pencar dan dengan menghitung korelasinya, maka langkah selanjutnya yaitu membentuk model analisis regresi dengan menggunakan fungsi lm(…) - built in pada R.

> X<-data_kholifa$Kecepatan
> Y<-data_kholifa$KalengRusak
> reg<-lm(Y~X, data=data_kholifa) #membentuk analisis regresi sederhana
> print(reg)

Call:
lm(formula = Y ~ X, data = data_kholifa)

Coefficients:
(Intercept)            X  
     17.143        1.184  
> extract_eq(reg, use_coefs = TRUE) #membentuk model analisis regresi sederhana beserta nilai koefisiennya

\[ \operatorname{\widehat{Y}} = 17.14 + 1.18(\operatorname{X}) \]

> summary(reg) #memanggil koefisien model menggunakan syntax sebagai berikut.

Call:
lm(formula = Y ~ X, data = data_kholifa)

Residuals:
    Min      1Q  Median      3Q     Max 
-59.829 -24.650   0.514  10.514  68.007 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  17.1429    28.9127   0.593   0.5652  
X             1.1836     0.5828   2.031   0.0671 .
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 38.25 on 11 degrees of freedom
Multiple R-squared:  0.2727,    Adjusted R-squared:  0.2066 
F-statistic: 4.125 on 1 and 11 DF,  p-value: 0.06714

2.5.2 Analisis Ragam

> anova(reg) #memanggil hasil analisis ragam 
Analysis of Variance Table

Response: Y
          Df  Sum Sq Mean Sq F value  Pr(>F)  
X          1  6034.4  6034.4  4.1249 0.06714 .
Residuals 11 16091.9  1462.9                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

2.5.3 Uji t

> reg

Call:
lm(formula = Y ~ X, data = data_kholifa)

Coefficients:
(Intercept)            X  
     17.143        1.184  
> model_sum <- summary(reg) #membuat model_sum sebagai sebuah objek 
> model_coef <- model_sum$coefficients #model koefisien 
> beta.duga <- model_coef["X", "Estimate"] #mencari beta duga untuk kecepatan
> std.error <- model_coef["X", "Std. Error"] #mencari standar error untuk kecepatan
> t_hit <- beta.duga/std.error #menghitung statistik uji t
> t_hit
[1] 2.030997
> p_value <- 2*pt(-abs(t_value)  ,df=nrow(data_kholifa)-ncol(data_kholifa)) #menghitung p value
Error in pt(-abs(t_value), df = nrow(data_kholifa) - ncol(data_kholifa)): object 't_value' not found
> p_value
[1] 0.06713568

2.5.4 Uji f

> f_statistic <- reg$fstatistic[1] #menghitung statistik uji f
> f <- summary(reg)$fstatistic 
> f
    value     numdf     dendf 
 4.124949  1.000000 11.000000 
> p_value <- pf(f[1], f[2], f[3], lower=FALSE) #menghitung p value
> p_value
     value 
0.06713568 

2.6 Pengujian Asumsi

2.6.1 Uji Normalitas galat

2.6.1.1 Uji Jarque Berra

H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal

> library(tseries)
> sisa<-residuals(reg)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 0.26143, df = 2, p-value = 0.8775

2.6.1.2 Uji Saphiro Wilk

H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal

> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.9594, p-value = 0.7444

2.6.2 Uji homogenitas ragam galat

2.6.2.1 Uji Breusch Pagan

H0 : asumsi homogenitas ragam galat terpenuhi H1 : asumsi homogenitas ragam galat tidak terpenuhi

> library(lmtest)
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 3.4791, df = 1, p-value = 0.06215

2.6.3 Uji non autokorelasi galat

2.6.3.1 Uji DW

H0 : tidak terdapat masalah autokorelasi H1 : terdapat masalah autokorelasi

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 2.2389, p-value = 0.6691
alternative hypothesis: true autocorrelation is greater than 0

3 HASIL DAN PEMBAHASAN

3.1 Analisis Grafik

3.1.1 Scatter Plot

> scatter.smooth(x=data_kholifa$Kecepatan, y=data_kholifa$KalengRusak, main="Gambar 1. Smooth Scatter Plot KalengRusak~Kecepatan", xlab="Kecepatan", ylab="Kaleng Rusak", pch=16, col="brown1") # scatterplot

Interpretasi: Plot pencar bersama dengan garis smoothing di atas menunjukkan hubungan yang meningkat secara linier antara variabel ‘Kecepatan’ dan ‘Kaleng Rusak’. Ini adalah hal yang baik, karena salah satu asumsi yang mendasari regresi linier adalah bahwa hubungan antara variabel respon dan prediktor adalah linier dan aditif.

3.1.2 Box Plot

> par(mfrow=c(1,2))  #Membagi area grafik menjadi 2 kolom
> boxplot(data_kholifa$Kecepatan, main="Gambar 2.1. Boxplot Kecepatan",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$Kecepatan)$out), col="blue")   #box plot untuk Kecepatan
> 
> boxplot(data_kholifa$KalengRusak, main="Gambar 2.2. Boxplot Jumlah Kaleng Rusak",sub=paste("Outlier rows: ", boxplot.stats(data_kholifa$KalengRusak)$out), col="darkgreen")   #box plot untuk Jumlah Kaleng Rusak

Interpretasi: Dari diagram boxplot di atas, diketahui bahwa secara visual dalam data variabel prediktor “Kecepatan” dan variabel respons “Kaleng Rusak” tidak setangkup, karena panjang garis whisker tidak sama dan median tidak berada tepat di tengah-tengah kotak. Selain itu, juga dapat diketahui bahwa dari boxplot jumlah kaleng terdapat outlier.

3.1.3 Density Plot

> par(mfrow=c(1,2))   #Membagi area grafik menjadi 2 kolom
> plot(density(data_kholifa$Kecepatan), main="Gambar 3.1. Density Plot : Kecepatan Mobil saat Pengiriman", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$Kecepatan),2)))   #desity plot untuk Kecepatan Mobil saat Pengiriman
> polygon(density(data_kholifa$Kecepatan), col="yellow")
> 
> plot(density(data_kholifa$KalengRusak), main="Gambar 3.2. Density Plot : Banyak Kaleng Rusak", ylab="Frequency", sub=paste("Skewness: ", round(e1071::skewness(data_kholifa$KalengRusak),2)))   #desity plot untuk Banyak Kaleng Rusak
> polygon(density(data_kholifa$KalengRusak), col="green")

Interpretasi: Dari grafik diatas, secara visualisasi data variabel numerik bentuk distribusinya 4 cilinder.

3.2 Analisis Korelasi

> cor(data_kholifa[1:2], method="pearson")  #menghitung korelasi antara kecepatan dengan banyaknya kaleng rusak
                No. Kecepatan
No.       1.0000000 0.2484647
Kecepatan 0.2484647 1.0000000

Interpretasi: kuat lemah hubungan diukur diantara jarak (range) dari 0 sampai dengan 1. Dari hasil analisis di atas diketahui bahwa nilai korelasinya 0.0.2484647, hal ini berarti variabel “Kecepatan” dan variabel “Kaleng Rusak” memiliki hubungan. Selain, itu karena koefisien korelasi ditemukan positif (+) maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linier sempurna dengan kemiringan (slope) positif.

3.3 Analisis Regresi

3.3.1 Analisis Koefisien Model

  • -Dengan Manual

-Dengan Fungsi Built-in

> X<-data_kholifa$Kecepatan
> Y<-data_kholifa$KalengRusak
> reg<-lm(Y~X, data=data_kholifa) #membentuk analisis regresi sederhana
> print(reg)

Call:
lm(formula = Y ~ X, data = data_kholifa)

Coefficients:
(Intercept)            X  
     17.143        1.184  

Interpretasi: - nilai koefisien beta0 sebesar 17.143 yang berarti apabila kecepatan bernilai 0 maka jumlah kaleng rusak akan naik sebesar 17.143 - nilai koefisien beta1 sebesar 1.184 yang berarti apabila kecepatan naik sebesar 1 satuan maka jumlah kaleng rusak akan naik sebsar 1.184 - Bentuk persamaan regresinya adalah Y = 17.143 + 1.184X

3.3.2 Analisis Ragam

3.3.3 Uji t

-Dengan Manual

-Dengan Fungsi Built-in

> reg

Call:
lm(formula = Y ~ X, data = data_kholifa)

Coefficients:
(Intercept)            X  
     17.143        1.184  
> model_sum <- summary(reg) #membuat model_sum sebagai sebuah objek 
> model_coef <- model_sum$coefficients #model koefisien 
> beta.duga <- model_coef["X", "Estimate"] #mencari beta duga untuk kecepatan
> std.error <- model_coef["X", "Std. Error"] #mencari standar error untuk kecepatan
> t_hit <- beta.duga/std.error #menghitung statistik uji t
> t_hit
[1] 2.030997
> p_value <- 2*pt(-abs(t_value)  ,df=nrow(data_kholifa)-ncol(data_kholifa)) #menghitung p value
Error in pt(-abs(t_value), df = nrow(data_kholifa) - ncol(data_kholifa)): object 't_value' not found
> p_value
     value 
0.06713568 

Interpretasi: - dengan alpha sebsar 5%, nilai t-hit sebesar 2.0309971 dan p-value sebesar 8.10^-13 (p-value < alpha) maka tolak H0 maka dapat disimpulkan bahwa terdapat hubungan antara kecepatan dengan jumlah kaleng yang rusak secara parsial

3.3.4 Uji f

-Dengan Manual

-Dengan Fungsi Built-in

> f_statistic <- reg$fstatistic[1] #menghitung statistik uji f
> f <- summary(reg)$fstatistic 
> f
    value     numdf     dendf 
 4.124949  1.000000 11.000000 
> p_value <- pf(f[1], f[2], f[3], lower=FALSE) #menghitung p value
> p_value
     value 
0.06713568 

Interpretasi: dengan alpha sebsar 5%, nilai f-hit sebesar 4.124949 dan p-value sebesar 0.06713568 (p-value > alpha) maka terima H0 maka dapat disimpulkan bahwa tidak terdapat hubungan antara kecepatan dengan jumlah kaleng yang rusak secara simultan

3.3.5 Selang Kepercayaan

> alpha<-0.05
> t_tab<-qt(alpha/2,reg$db[2], lower.tail=FALSE)
Error in qt(alpha/2, reg$db[2], lower.tail = FALSE): Non-numeric argument to mathematical function
> t_tab
[1] 2.200985
> 
> bb_sk<-b_duga-(t_tab*sd)   #menghitung batas bawah selang
> bb_sk
             [,1]
[1,] -46.49354282
[2,]  -0.09906122
> ba_sk<-b_duga+(t_tab*sd)   #menghitung batas atas selang
> ba_sk
          [,1]
[1,] 80.779257
[2,]  2.466204
> 
> sk<-cbind(bb_sk, ba_sk)   #membuat selang kepercayaan berdasarkan batas atas dan batas bawah
> sk
             [,1]      [,2]
[1,] -46.49354282 80.779257
[2,]  -0.09906122  2.466204

Interpretasi: Selang kepercayaan tidak melewati 0 maka dapat dinyatakan bahwa tolak H0 (terdapat hubungan antara kedua variabel)

3.3.6 Koefisien Determinasi dan Adjusted Koefisien Determinasi

Koefisien determinasi:

\[ R^2=\frac{JK~Regresi}{JK~Total}=0.3749954 \]

Interpretasi: Koefisien determinasi bernilai 0.375 yang berarti kemampuan variabel bebas dalam menjelaskan varians dari variabel terikatnya sebesar 37.5%

Adjusted koefisien determinasi: \[ adjusted~R^2=1-\frac{JK~Galat/(n-k)}{JK~Total/(n-1)}=0.5909141 \]

Interpretasi: Adjusted koefisien determinasi bernilai 0.59 yang berarti kemampuan variabel prediktor dalam menjelaskan variabel respon sebesar 59%

3.4 Pengujian Asumsi

3.4.1 Uji Normalitas

3.4.1.1 Uji Jarque Berra

-Output

> library(tseries)
> sisa<-residuals(reg)
> jarque.bera.test(sisa)

    Jarque Bera Test

data:  sisa
X-squared = 0.26143, df = 2, p-value = 0.8775

Hipotesis:

H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal

Tingkat Signifikansi: 0.05

Statistik Uji: p-value: 0.8775

Keputusan: Karena p-value( 0.8775) > alpha(0.05) maka terima H0

Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa asumsi homogenitas ragam galat terpenuhi

3.4.1.2 Uji Saphiro Wilk

> shapiro.test(sisa)

    Shapiro-Wilk normality test

data:  sisa
W = 0.9594, p-value = 0.7444

Hipotesis:

H0 : Pengamatan menyebar normal H1 : Pengamatan tidak menyebar normal

Tingkat Signifikansi: 0.05

Statistik Uji: p-value: 0.7444

Keputusan: Karena p-value(0.7444) > alpha(0.05) maka terima H0

Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa asumsi homogenitas ragam galat terpenuhi

3.4.2 Uji homogenitas ragam galat

3.4.2.1 Uji Breusch Pagan

> library(lmtest)
> bptest(reg)

    studentized Breusch-Pagan test

data:  reg
BP = 3.4791, df = 1, p-value = 0.06215

Hipotesis:

H0 : asumsi homogenitas ragam galat terpenuhi H1 : asumsi homogenitas ragam galat tidak terpenuhi

Tingkat Signifikansi: 0.05

Statistik Uji: p-value: 0.06215

Keputusan: Karena p-value(0.06215) > alpha(0.05) maka terima H0

Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa asumsi homogenitas ragam galat terpenuhi

3.4.3 Uji non autokorelasi galat

3.4.3.1 Uji DW

> dwtest(reg)

    Durbin-Watson test

data:  reg
DW = 2.2389, p-value = 0.6691
alternative hypothesis: true autocorrelation is greater than 0

Hipotesis:

H0 : tidak terdapat masalah autokorelasi H1 : terdapat masalah autokorelasi

Tingkat Signifikansi: 0.05

Statistik Uji: p-value: 0.6691

Keputusan: Karena p-value(0.6691) > alpha(0.05) maka terima H0

Kesimpulan: Dengan tingkat keyakinan 95%, kita yakin bahwa tidak terdapat masalah autokorelasi

4 DAFTAR PUSTAKA

Arikunto, Suharsimi. 2002. Prosedur Penelitian, Suatu Pendekatan Praktek.

Santoso, Singgih.; “SPSS Versi 10 Mengolah Data Statistik Secara Profesional”, Penerbit PT. Elex Media Komputindo, Gramedia, Jakarta, 2001. Jakarta: PT Rineka Cipta.

Walpole, Ronald E.; “Pengantar Statistika“, edisi ke-3, Penerbit PT. Gramedia Pustaka Utama, Jakarta, 1995.

Walpole, Ronald E., Raymond H Myers.; “Ilmu Peluang Dan Statistika untuk Insinyur dan Ilmuawan”, edisi ke-4, Penerbit ITB, Bandung, 1995.