Linear Regression
Suatu perusahaan perkebunan buah naga dikota A melakukan uji coba pemberian pupuk organik yang diharapkan dapat meningkatkan produksi buah naga. Uji coba dilakukan pada 8 petak lahan yang kondisi lahannya relatif sama. Hasil panen buah naga pada masing-masing petak lahan adalah sebagai berikut:
produksi <- c(100,120,140,150,165,190,200,220)
pupuk <- c(2,2,3,3,3,4,4,5)
uji.coba <- data.frame(produksi,pupuk)
uji.coba## produksi pupuk
## 1 100 2
## 2 120 2
## 3 140 3
## 4 150 3
## 5 165 3
## 6 190 4
## 7 200 4
## 8 220 5
1. Plot
Buatlah plot antara banyak pupuk dengan produksi buah naga plot
plot(uji.coba$pupuk,uji.coba$produksi,
col = "blue", xlab = "Pupuk", ylab = "Produksi", pch = 16)
title("Plot of Produksi vs Pupuk",)
Berdasarkan plot gambar diatas terlihat antara variabel pupuk dan
variabel produksi memiliki pola hubungan linier positif. Secara
eksploratif terlihat bahwa semakin meningkat kuantitas pupuk yang
diberikan maka produksi buah naga juga akan semakin meningkat.
2. Korelasi
Tentukan korelasi antara banyaknya pupuk organik dengan produksi buah naga, interpretasikan
cat("Koefisien Korelasi (r) =",cor(uji.coba$pupuk,uji.coba$produksi,
method = "pearson") )## Koefisien Korelasi (r) = 0.9697241
Korelasi merupakan ukuran keeratan linier antara dua peubah. Korelasi hanya mengukur keeratan linier, hubungan tidak linier tidak dapat diukur menggunakan korelasi. Nilai koefisien korelasi berada pada selang [-1,1].Parameter korelasi adalah ρ, sedangakan statistikanya adalah r. Terlihat nilai r antara antara kedua peubah (pupuk organik, dan produksi buah naga) bernilai 0.9697241 yang mendekati 1, ini menunjukkan bahwa korelasi antara kedua peubah cukup kuat dan berkorelasi positif dimana semakin meningkat kuantitas pupuk yang diberikan maka produksi buah naga juga akan semakin meningkat.
3. Peubah
Apabila ingin dilakukan analisis regresi untuk mengetahui pengaruh pupuk oraganik terhadap produksi buah naga, tentukan peubah penjelas dan responnya. Analisis regresi merupakan teknik analisis parametrik yang digunakan untuk memodelkan data. Selain itu, analisis regresi juga dapat digunakan untuk mengidentifikasi hubungan sebab akibat antara beberapa peubah. Dalam hal ini akan dapat dilihat bahwa dari kedua peubah kita dapat menentukan mana peubah penjelas dan peubah responya. a. Peubah respon yaitu produksi buah naga dimana keberadaannya diperngaruhi oleh peubah penjelas. b. Peubah penjelas yaitu pemberian pupuk dimana tidak dipengaruhi oleh peubah lainya.
4.Model
Tentukan persamaan regresi dari data tersebut, interpretasikan
regresi <- lm(produksi~pupuk, data = uji.coba)
regresi##
## Call:
## lm(formula = produksi ~ pupuk, data = uji.coba)
##
## Coefficients:
## (Intercept) pupuk
## 35.5 38.5
Diperoleh persamaan regresi sebagai berikut Y = 35.5 + 38.5X dimana, Y : Produksi buah naga X : pemberian pupuk persamaan ini menunjukkan bahwa ketika pemberian pupuk meningkat sebesar 1 satuan maka produksi akan meningkatkan sebanyak 38,5 satuan
5. Uji Hipotesis
Lakukan pengujian hipotesis pada taraf nyata 5%, apakah pupuk organik memberikan pengaruh terhadap produksi buah naga?
summary(regresi)##
## Call:
## lm(formula = produksi ~ pupuk, data = uji.coba)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.50 -8.75 -0.25 8.25 14.00
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 35.500 13.423 2.645 0.0383 *
## pupuk 38.500 3.958 9.727 6.78e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 10.84 on 6 degrees of freedom
## Multiple R-squared: 0.9404, Adjusted R-squared: 0.9304
## F-statistic: 94.61 on 1 and 6 DF, p-value: 6.781e-05
dengan menggunakan pengujian hipotesis, diperoleh hasil pengujian hipotesis dimana nilai p-value = 6.78e-05 < α = 0.05 yang menunjukkan bahwa menolak ho, sehingga dapat disimpulkan bahwa cukup bukti untuk menyatakan bahwa pemberian pupuk berpengaruh terhadap produksi buah naga. dapat dilihat juga nilai r-squared nya. dimana nilai r-squared itu dapat menunjukkan seberapa besar kontribusi variabel penjelas terhadap variabel responya. dapat dilihat nilai r-squared nya = 0.9404 atau sekitar 94.04 % yang berarti variabel penjelas (pemberian pupuk) mampu mejelaskan keragaman dari variabel respon (produksi buah naga) yaitu sebesar 94.04 %.Nilai p-value untuk analisis ragamnya sebesar 6.781e-05 < α = 0.05 yang menunjukkan juga bahwa menolak ho, sehingga dapat disimpulkan bahwa cukup bukti untuk menyatakan bahwa pemberian pupuk berpengaruh terhadap produksi buah naga.
6. Prediksi
Dugalah produksi buah naga jika diberikan pupuk organik 1kg dan 3.5kg
data.baru <- data.frame(pupuk = c(1,3.5))
predict(regresi, newdata = data.baru)## 1 2
## 74.00 170.25
a. pemberian pupuk sebanyak 1kg
#perhitungan matematisnya
Y <- 35.5 + 38.5*1
Y## [1] 74
b. pemberian pupuk sebanyak 3.5kg
#perhitungan matematisnya
Y1 <- 35.5 + 38.5*3.5
Y1## [1] 170.25
Dapat dilihat bahwa nilai prediksi untuk pemberian pupuk sebesar 1kg, maka produksi buah naga sebanyak 74 satuan, dan ketika pemberian pupuk sebesar 3.5 kg maka produksi buah naga sebanyak 170,25 satuan.
7. Uji Asumsi
Apakah analisis tersebut sudah memenuhi asumsi analisis regresi linier? Jika tidak, apa langkah yang akan Anda ambil? Jelaskan!
# Diagnostik Model
par(mfrow = c(2,2))
plot(regresi)
secara deskriptif dapat dilihat dari Q-Q plotnya terlihat seberannya
cenderung membentuk garis linear sehingga secara eksploratif terlihat
bahwa residualnya sudah menyebar normal. pada plot residuals vs fitted
tidak terlihat adanya pola tertentu maka dapat dikatakan bahwa ragamnya
homogen dan antar sisaanya saling bebas.
a. ragam sisaan homogenitas
grafik no 1 (tidak memiliki pola maka homogen)
library(lmtest)## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(regresi, studentize = FALSE , data = uji.coba)##
## Breusch-Pagan test
##
## data: regresi
## BP = 0.19379, df = 1, p-value = 0.6598
dengan menggunakan breusch-pagan test, kita dapat melihat apakah ragam sisaanya sudah homogen apa belum. Dapat dilihat nilai p-value = 0.6598 > alfa (0.05) maka ho tidak ditolak maka ragam residual sudah homogen.
b. antar sisaan saling bebas (autokorelasi)
grafik no 1 (tidak memiliki pola maka antar sisaan saling bebas)
library(lmtest)
dwtest(regresi)##
## Durbin-Watson test
##
## data: regresi
## DW = 2.3996, p-value = 0.5756
## alternative hypothesis: true autocorrelation is greater than 0
karena p-value = 0.5756 > alfa (0.05) maka ho tidak ditolak, ini menunjukkan bahwa tidak ada autokorelasi atau antar sisaan saling bebas.
c. sisaan menyebar normal
shapiro.test(regresi$residuals)##
## Shapiro-Wilk normality test
##
## data: regresi$residuals
## W = 0.93203, p-value = 0.5347
disini menggunakan shapiro-wilk tes diperoleh nilai p-value = 0.5347 > alfa (0.05) menunjukkan bahwa residual telah memenuhi asumsi normalitas, atau sisaanya menyebar normal.
d. nilai tengah dari error = 0
uji t ho : E(ei) = 0 ho : E(ei) =! 0
t.test(regresi$residuals,mu=0,conf.level = 0.95) ##
## One Sample t-test
##
## data: regresi$residuals
## t = 2.0339e-16, df = 7, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -8.390014 8.390014
## sample estimates:
## mean of x
## 7.21645e-16
dengan menggunakan t.test kita ingin meliahat nilai tengah dari residual sama dengan nol atau tidak. Diperoleh p-value (1) > alfa(0.05), ini menunjukkan bahwa ho ditolak sehingga asumsi nilai tengah dari error = 0 terpenuhi.