Linear Regression

Suatu perusahaan perkebunan buah naga dikota A melakukan uji coba pemberian pupuk organik yang diharapkan dapat meningkatkan produksi buah naga. Uji coba dilakukan pada 8 petak lahan yang kondisi lahannya relatif sama. Hasil panen buah naga pada masing-masing petak lahan adalah sebagai berikut:

produksi <- c(100,120,140,150,165,190,200,220)
pupuk <- c(2,2,3,3,3,4,4,5)
uji.coba <- data.frame(produksi,pupuk)
uji.coba
##   produksi pupuk
## 1      100     2
## 2      120     2
## 3      140     3
## 4      150     3
## 5      165     3
## 6      190     4
## 7      200     4
## 8      220     5

1. Plot

Buatlah plot antara banyak pupuk dengan produksi buah naga plot

plot(uji.coba$pupuk,uji.coba$produksi,
col = "blue", xlab = "Pupuk", ylab = "Produksi", pch = 16)
title("Plot of Produksi vs Pupuk",)

Berdasarkan plot gambar diatas terlihat antara variabel pupuk dan variabel produksi memiliki pola hubungan linier positif. Secara eksploratif terlihat bahwa semakin meningkat kuantitas pupuk yang diberikan maka produksi buah naga juga akan semakin meningkat.

2. Korelasi

Tentukan korelasi antara banyaknya pupuk organik dengan produksi buah naga, interpretasikan

cat("Koefisien Korelasi (r) =",cor(uji.coba$pupuk,uji.coba$produksi,
method = "pearson") )
## Koefisien Korelasi (r) = 0.9697241

Korelasi merupakan ukuran keeratan linier antara dua peubah. Korelasi hanya mengukur keeratan linier, hubungan tidak linier tidak dapat diukur menggunakan korelasi. Nilai koefisien korelasi berada pada selang [-1,1].Parameter korelasi adalah ρ, sedangakan statistikanya adalah r. Terlihat nilai r antara antara kedua peubah (pupuk organik, dan produksi buah naga) bernilai 0.9697241 yang mendekati 1, ini menunjukkan bahwa korelasi antara kedua peubah cukup kuat dan berkorelasi positif dimana semakin meningkat kuantitas pupuk yang diberikan maka produksi buah naga juga akan semakin meningkat.

3. Peubah

Apabila ingin dilakukan analisis regresi untuk mengetahui pengaruh pupuk oraganik terhadap produksi buah naga, tentukan peubah penjelas dan responnya. Analisis regresi merupakan teknik analisis parametrik yang digunakan untuk memodelkan data. Selain itu, analisis regresi juga dapat digunakan untuk mengidentifikasi hubungan sebab akibat antara beberapa peubah. Dalam hal ini akan dapat dilihat bahwa dari kedua peubah kita dapat menentukan mana peubah penjelas dan peubah responya. a. Peubah respon yaitu produksi buah naga dimana keberadaannya diperngaruhi oleh peubah penjelas. b. Peubah penjelas yaitu pemberian pupuk dimana tidak dipengaruhi oleh peubah lainya.

4.Model

Tentukan persamaan regresi dari data tersebut, interpretasikan

regresi <- lm(produksi~pupuk, data = uji.coba)
regresi
## 
## Call:
## lm(formula = produksi ~ pupuk, data = uji.coba)
## 
## Coefficients:
## (Intercept)        pupuk  
##        35.5         38.5

Diperoleh persamaan regresi sebagai berikut Y = 35.5 + 38.5X dimana, Y : Produksi buah naga X : pemberian pupuk persamaan ini menunjukkan bahwa ketika pemberian pupuk meningkat sebesar 1 satuan maka produksi akan meningkatkan sebanyak 38,5 satuan

5. Uji Hipotesis

Lakukan pengujian hipotesis pada taraf nyata 5%, apakah pupuk organik memberikan pengaruh terhadap produksi buah naga?

summary(regresi)
## 
## Call:
## lm(formula = produksi ~ pupuk, data = uji.coba)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -12.50  -8.75  -0.25   8.25  14.00 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   35.500     13.423   2.645   0.0383 *  
## pupuk         38.500      3.958   9.727 6.78e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.84 on 6 degrees of freedom
## Multiple R-squared:  0.9404, Adjusted R-squared:  0.9304 
## F-statistic: 94.61 on 1 and 6 DF,  p-value: 6.781e-05

dengan menggunakan pengujian hipotesis, diperoleh hasil pengujian hipotesis dimana nilai p-value = 6.78e-05 < α = 0.05 yang menunjukkan bahwa menolak ho, sehingga dapat disimpulkan bahwa cukup bukti untuk menyatakan bahwa pemberian pupuk berpengaruh terhadap produksi buah naga. dapat dilihat juga nilai r-squared nya. dimana nilai r-squared itu dapat menunjukkan seberapa besar kontribusi variabel penjelas terhadap variabel responya. dapat dilihat nilai r-squared nya = 0.9404 atau sekitar 94.04 % yang berarti variabel penjelas (pemberian pupuk) mampu mejelaskan keragaman dari variabel respon (produksi buah naga) yaitu sebesar 94.04 %.Nilai p-value untuk analisis ragamnya sebesar 6.781e-05 < α = 0.05 yang menunjukkan juga bahwa menolak ho, sehingga dapat disimpulkan bahwa cukup bukti untuk menyatakan bahwa pemberian pupuk berpengaruh terhadap produksi buah naga.

6. Prediksi

Dugalah produksi buah naga jika diberikan pupuk organik 1kg dan 3.5kg

data.baru <- data.frame(pupuk = c(1,3.5))
predict(regresi, newdata = data.baru)
##      1      2 
##  74.00 170.25

a. pemberian pupuk sebanyak 1kg

#perhitungan matematisnya
Y <- 35.5 + 38.5*1
Y
## [1] 74

b. pemberian pupuk sebanyak 3.5kg

#perhitungan matematisnya
Y1 <- 35.5 + 38.5*3.5
Y1
## [1] 170.25

Dapat dilihat bahwa nilai prediksi untuk pemberian pupuk sebesar 1kg, maka produksi buah naga sebanyak 74 satuan, dan ketika pemberian pupuk sebesar 3.5 kg maka produksi buah naga sebanyak 170,25 satuan.

7. Uji Asumsi

Apakah analisis tersebut sudah memenuhi asumsi analisis regresi linier? Jika tidak, apa langkah yang akan Anda ambil? Jelaskan!

# Diagnostik Model
par(mfrow = c(2,2))
plot(regresi)

secara deskriptif dapat dilihat dari Q-Q plotnya terlihat seberannya cenderung membentuk garis linear sehingga secara eksploratif terlihat bahwa residualnya sudah menyebar normal. pada plot residuals vs fitted tidak terlihat adanya pola tertentu maka dapat dikatakan bahwa ragamnya homogen dan antar sisaanya saling bebas.

a. ragam sisaan homogenitas

grafik no 1 (tidak memiliki pola maka homogen)

library(lmtest)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(regresi, studentize = FALSE , data = uji.coba)
## 
##  Breusch-Pagan test
## 
## data:  regresi
## BP = 0.19379, df = 1, p-value = 0.6598

dengan menggunakan breusch-pagan test, kita dapat melihat apakah ragam sisaanya sudah homogen apa belum. Dapat dilihat nilai p-value = 0.6598 > alfa (0.05) maka ho tidak ditolak maka ragam residual sudah homogen.

b. antar sisaan saling bebas (autokorelasi)

grafik no 1 (tidak memiliki pola maka antar sisaan saling bebas)

library(lmtest)
dwtest(regresi)
## 
##  Durbin-Watson test
## 
## data:  regresi
## DW = 2.3996, p-value = 0.5756
## alternative hypothesis: true autocorrelation is greater than 0

karena p-value = 0.5756 > alfa (0.05) maka ho tidak ditolak, ini menunjukkan bahwa tidak ada autokorelasi atau antar sisaan saling bebas.

c. sisaan menyebar normal

shapiro.test(regresi$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  regresi$residuals
## W = 0.93203, p-value = 0.5347

disini menggunakan shapiro-wilk tes diperoleh nilai p-value = 0.5347 > alfa (0.05) menunjukkan bahwa residual telah memenuhi asumsi normalitas, atau sisaanya menyebar normal.

d. nilai tengah dari error = 0

uji t ho : E(ei) = 0 ho : E(ei) =! 0

t.test(regresi$residuals,mu=0,conf.level = 0.95) 
## 
##  One Sample t-test
## 
## data:  regresi$residuals
## t = 2.0339e-16, df = 7, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  -8.390014  8.390014
## sample estimates:
##   mean of x 
## 7.21645e-16

dengan menggunakan t.test kita ingin meliahat nilai tengah dari residual sama dengan nol atau tidak. Diperoleh p-value (1) > alfa(0.05), ini menunjukkan bahwa ho ditolak sehingga asumsi nilai tengah dari error = 0 terpenuhi.