Pembahasan
Sumber Data
data yang digunakan pada analisis ini adalah data luas panen, produktivitas, dan produksi padi pada provinsi jawa timur tahun 2019. data ini bersumber dari website resmi Badan Pusat Statistik (BPS)
Packages yang dibutuhkan
library(readxl)
library(car)
## Loading required package: carData
library(MASS)
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
Input data
data=read_excel("D:/ade1.xlsx")
data
## # A tibble: 38 × 3
## x1 x2 y
## <dbl> <dbl> <dbl>
## 1 20504 45 91942.
## 2 58080 55 322206.
## 3 20475 55 112214.
## 4 34584 57 196431.
## 5 36194 62 224027.
## 6 39449 56 222838.
## 7 48398 58 281072.
## 8 53466 53 283894.
## 9 123591 50 616858.
## 10 81553 55 445254.
## # ℹ 28 more rows
dengan
Y = produksi padi
x1 = luas panen
x2 = produktivitas
Model Regresi
model.reg=lm(y~., data=data)
summary(model.reg)
##
## Call:
## lm(formula = y ~ ., data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -65291 -7196 2136 12421 59269
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.848e+05 3.116e+04 -5.931 9.52e-07 ***
## x1 5.708e+00 9.367e-02 60.937 < 2e-16 ***
## x2 3.230e+03 5.491e+02 5.882 1.10e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21630 on 35 degrees of freedom
## Multiple R-squared: 0.9908, Adjusted R-squared: 0.9903
## F-statistic: 1887 on 2 and 35 DF, p-value: < 2.2e-16
UJI SIGNIFIKANSI
UJI SIGNIFIKANSI SIMULTAN
Hipotesis
H0 : kedua variabel secara simultan tidak berpengaruh signifikan terhadap produksi padi
H1 : paling tidak ada satu variabel yang berpengaruh signifikan terhadap produksi padi
Taraf signifikansi : \(\alpha\)=5% daerah kritis : H0 ditolak apabila nilai p-value <\(\alpha\)=0,05
Statistik uji:
model.reg=lm(y~., data=data)
summary(model.reg)
##
## Call:
## lm(formula = y ~ ., data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -65291 -7196 2136 12421 59269
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.848e+05 3.116e+04 -5.931 9.52e-07 ***
## x1 5.708e+00 9.367e-02 60.937 < 2e-16 ***
## x2 3.230e+03 5.491e+02 5.882 1.10e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21630 on 35 degrees of freedom
## Multiple R-squared: 0.9908, Adjusted R-squared: 0.9903
## F-statistic: 1887 on 2 and 35 DF, p-value: < 2.2e-16
Kesimpulan
berdasarkan output diperoleh nilai p-value:<2,2e-16, dimana p-value:<2,2e-16<\(\alpha\)=0,05, maka H0 ditolak berarti bahwa paling tidak ada satu variabel yang berpengaruh signifikan terhadap jumlah produksi padi
Uji Signifikansi Parsial(t)
hipotesis
Variabel X1 = Luas Panen
H0 : Luas panen tidak berpengaruh signifikan terhadap jumlah produksi padi
H1 : Luas panen berpengaruh signifikan terhadap jumlah produksi padi
Variabel X2 = Produktifitas
H0 : Produktifitas tidak berpengaruh signifikan terhadap jumlah produksi padi
H1 : Produktifitas berpengaruh signifikan terhadap jumlah produksi padi
taraf signifikansi \(\alpha\) = 5%
daerah kritis : H0 ditolak apabila p-value < \(\alpha\) = 5% Statistik uji:
summary(model.reg)
##
## Call:
## lm(formula = y ~ ., data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -65291 -7196 2136 12421 59269
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.848e+05 3.116e+04 -5.931 9.52e-07 ***
## x1 5.708e+00 9.367e-02 60.937 < 2e-16 ***
## x2 3.230e+03 5.491e+02 5.882 1.10e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 21630 on 35 degrees of freedom
## Multiple R-squared: 0.9908, Adjusted R-squared: 0.9903
## F-statistic: 1887 on 2 and 35 DF, p-value: < 2.2e-16
Kesimpulan
untuk X1 : Karena p-value = 2e-16<\(\alpha\) = 5%, maka H0 ditolak yang artinya luas panen berpengaruh signifikan terhadap Jumlah Produksi Padi
Untuk X2 : Karena p-value = 1,10e-0,6<\(\alpha\) = 5%, maka H0 ditolak yang artinya produktifitas berpengaruh terhadap jumlah produksi padi
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.1
# Scatterplot for x1 vs y
ggplot(data, aes(x = x1, y = y)) +
geom_point() +
labs(x = "Luas Panen", y = "Jumlah Produksi Padi", title = "Scatterplot of Jumlah Produksi Padi vs Luas Panen")
Berdasarkan plot dapat dilihat bahwa plot linear ke kanan sehingga dapat disimpulkan bahwa Luas Panen memiliki hubungan positif dengan Jumlah Produksi Padi.
# Scatterplot for x2 vs y
ggplot(data, aes(x = x2, y = y)) +
geom_point() +
labs(x = "Produktifitas", y = "Jumlah Produksi Padi", title = "Scatterplot of Jumlah Produksi Padi vs Produktifitas")
Berdasarkan plot dapat dilihat bahwa sebaran titik menunjukkan kecenderungan naik ke arah kanan, meskipun tidak sepenuhnya membentuk garis lurus. Hal ini menunjukkan bahwa Produktifitas memiliki hubungan positif dengan Jumlah Produksi Padi, namun hubungan tersebut bersifat lemah hingga sedang karena terdapat banyak penyimpangan (outlier) dan variasi yang besar antar data. Maka dapat dikatakan kenaikan produktifitas cenderung diikuti dengan kenaikan jumlah produksi padi, tetapi tidak selalu konsisten.
UJI ASUMSI KLASIK
Uji Normalitas
Hipotesis
H0 : Residu Berdistribusi Normal
H1 : Residu tidak Berdistribusi Normal
taraf signifikansi \(\alpha\) = 5%
daerah kritis : H0 ditolak apabila p-value < \(\alpha\) = 5% Statistik uji:
shapiro.test(model.reg$residuals)
##
## Shapiro-Wilk normality test
##
## data: model.reg$residuals
## W = 0.94089, p-value = 0.04478
Berdasarkan uji Shapiro-Wilk diatas, diperoleh nilai p-value = 0.04478 < α = 0.05 sehingga H0 ditolak. Dapat disimpulkan bahwa residu tidak berdistribusi normal, yang artinya asumsi normalitas tidak terpenuhi.
Uji Homogenitas
Hipotesis
H0 : Variansi residu homogen
H1 : paling tidak terdapat satu variansi residu tidak homogen
taraf signifikansi \(\alpha\) = 5%
daerah kritis : H0 ditolak apabila p-value < \(\alpha\) = 5%
Statistik uji:
bptest(model.reg)
##
## studentized Breusch-Pagan test
##
## data: model.reg
## BP = 9.0469, df = 2, p-value = 0.01085
Berdasarkan uji Breushch-Pagan diatas, diperoleh nilai p-value = 0.01085 < α = 0.05 sehingga H0 ditolak . Dapat disimpulkan bahwa variansi residu tihomogen dan uji homogenitas tidak terpenuhi. …. Karena p-value = 0.01085 < 0.05, maka H0 ditolak. Artinya, terdapat bukti yang cukup untuk menyimpulkan bahwa residu tidak homogen atau terjadi heteroskedastisitas pada model regresi tersebut.
Uji Non Autokorelasi
Hipotesis
H0 : Tidak ada autokorelasi antar residu
H1 : Ada autokorelasi antar individu
taraf signifikansi \(\alpha\) = 5%
daerah kritis : H0 ditolak apabila p-value < \(\alpha\) = 5%
Statistik uji:
dwtest(model.reg)
##
## Durbin-Watson test
##
## data: model.reg
## DW = 1.93, p-value = 0.337
## alternative hypothesis: true autocorrelation is greater than 0
Kesimpulan Berdasarkan uji Durbin-Watson diatas, diperoleh nilai p-value = 0.337 > α = 0.05 sehingga H0 diterima. Dapat disimpulkan bahwa tidak ada autokorelasi antar residu, yang artinya asumsi non autokorelasi terpenuhi.
Uji Multikolinearitas
Hipotesis
H0 : Tidak terjadi multikolinearitas
H1 : Terjadi multikolinearitas
taraf signifikansi \(\alpha\) = 5%
daerah kritis : H0 ditolak apabila p-value < \(\alpha\) = 5%
Statistik uji:
vif(model.reg)
## x1 x2
## 1.000949 1.000949
Kesimpulan Berdasarkan uji VIF diatas, diperoleh nilai VIF dari X1,X2 < 10 sehingga H0 diterima. Dapat disimpulkan bahwa tidak terjadi multikolinearitas, yang artinya asumsi non multikolinearitas terpenuhi.
Model Regresi Linear Berganda
Analisis Regresi variabel Y Jumlah produksi padi dengan variabel independen yaitu luas panen (X1), produktifitas (X2).
modelregresi <- lm(data$y~data$`x1`+data$`x2`, data = data)
modelregresi
##
## Call:
## lm(formula = data$y ~ data$x1 + data$x2, data = data)
##
## Coefficients:
## (Intercept) data$x1 data$x2
## -1.848e+05 5.708e+00 3.230e+03
Berdasarkan hasil analisis regresi diatas didapatkan persamaan regresi:
\[Y=−184,000+5,708X~1~+3,230X~2~\]
menunjukkan bahwa baik luas panen maupun produktivitas berpengaruh positif terhadap produksi padi. Koefisien 5.708 pada X1 mengindikasikan bahwa setiap penambahan 1 hektar luas panen, dengan produktivitas tetap, akan meningkatkan produksi padi sebesar 5,708 satuan (misalnya ton). Sementara itu, koefisien 3.230 pada X2 menunjukkan bahwa peningkatan produktivitas sebesar 1 satuan, dengan luas panen tetap, akan menambah produksi sebesar 3,230 satuan. Nilai konstanta −184.000 tidak memiliki makna praktis secara langsung, karena menunjukkan produksi saat luas panen dan produktivitas sama dengan nol, yang tidak realistis. Secara keseluruhan, model ini memperlihatkan bahwa peningkatan luas panen memberikan dampak yang lebih besar terhadap produksi dibandingkan peningkatan produktivitas.