Salah satu jenis tanaman pangan di Indonesia adalah tanaman padi. Tanaman padi menghasilkan beras yang kemudian dapat dimasak menjadi nasi yang dikonsumsi oleh mayoritas masyarakat Indonesia. Berdasarkan data dari Badan Pusat Statistik, setiap provinsi di Indonesia memiliki lahan untuk ditanami padi dan tentu saja memiliki tingkat produktivitas padi yang berbeda-beda. Berikut ini adalah data mengenai “Tanaman Pangan Padi di Indonesia 2015”. Dari data ini selanjutnya akan dilakukan analisis secara deskriptif dan inferensia untuk mengetahui gambaran produktivitas padi serta dapat memprediksi produktivitas padi di setiap daerah di Indonesia dengan metode analisis regresi.
| Provinsi | Zona | Padi | Luas_Panen | Luas_Sawah | Produktivitas_Padi |
|---|---|---|---|---|---|
| Aceh | Barat | 2331046 | 461060 | 290337 | 50.56 |
| Sumatera Utara | Barat | 4044829 | 781769 | 423465 | 51.74 |
| Sumatera Barat | Barat | 2550609 | 507545 | 226377 | 50.25 |
| Riau | Barat | 393917 | 107546 | 71910 | 36.63 |
| Jambi | Barat | 541486 | 122214 | 94735 | 44.31 |
| Sumatera Selatan | Barat | 4247922 | 872737 | 620632 | 48.67 |
| Bengkulu | Barat | 578654 | 128833 | 85131 | 44.92 |
| Lampung | Barat | 3641895 | 707266 | 377463 | 51.49 |
| Kep. Bangka Belitung | Barat | 27068 | 11848 | 10654 | 22.85 |
| Kep. Riau | Barat | 959 | 263 | 246 | 36.46 |
| Dki Jakarta | Barat | 6361 | 1137 | 650 | 55.95 |
| Jawa Barat | Barat | 11373144 | 1857612 | 912794 | 61.22 |
| Jawa Tengah | Barat | 11301422 | 1875793 | 965262 | 60.25 |
| Di Yogyakarta | Barat | 945136 | 155838 | 53553 | 60.65 |
| Jawa Timur | Barat | 13154967 | 2152070 | 1091752 | 61.13 |
| Banten | Barat | 2188996 | 386676 | 199492 | 56.61 |
| Bali | Tengah | 853710 | 137385 | 75922 | 62.14 |
| Nusa Tenggara Barat | Tengah | 2417392 | 467503 | 264666 | 51.71 |
| Nusa Tenggara Timur | Tengah | 948088 | 266242 | 177238 | 35.61 |
| Kalimantan Barat | Barat | 1275707 | 433944 | 330724 | 29.4 |
| Kalimantan Tengah | Barat | 893202 | 254670 | 196553 | 35.07 |
| Kalimantan Selatan | Tengah | 2140276 | 511213 | 450152 | 41.87 |
| Kalimantan Timur | Tengah | 408782 | 99209 | 57000 | 41.2 |
| Kalimantan Utara | Tengah | 112102 | 41115 | 21448 | 27.27 |
| Sulawesi Utara | Tengah | 674169 | 137438 | 55820 | 49.05 |
| Sulawesi Tengah | Tengah | 1015368 | 209057 | 128323 | 48.57 |
| Sulawesi Selatan | Tengah | 5471806 | 1044030 | 628148 | 52.41 |
| Sulawesi Tenggara | Tengah | 660720 | 140380 | 103812 | 47.07 |
| Gorontalo | Tengah | 331220 | 59668 | 32058 | 55.51 |
| Sulawesi Barat | Tengah | 461844 | 93470 | 61292 | 49.41 |
| Maluku | Timur | 117791 | 21141 | 13394 | 55.72 |
| Maluku Utara | Timur | 75265 | 21438 | 11802 | 35.11 |
| Papua Barat | Timur | 30219 | 7174 | 10126 | 42.12 |
| Papua | Timur | 181769 | 41354 | 44462 | 43.95 |
source: Badan Pusat Statistik
Berikut adalah hasil statistik deskriptif dari Data Produktivitas Padi 2015
## Provinsi Zona Padi Luas_Panen
## Aceh : 1 Barat :18 Min. : 959 Min. : 263
## Bali : 1 Tengah:12 1st Qu.: 346894 1st Qu.: 68119
## Banten : 1 Timur : 4 Median : 873456 Median : 148109
## Bengkulu : 1 Mean : 2217584 Mean : 415195
## Di Yogyakarta: 1 3rd Qu.: 2395806 3rd Qu.: 497535
## Dki Jakarta : 1 Max. :13154967 Max. :2152070
## (Other) :28
## Luas_Sawah Produktivitas_Padi
## Min. : 246 Min. :22.85
## 1st Qu.: 46735 1st Qu.:41.37
## Median : 99274 Median :48.86
## Mean : 237865 Mean :46.97
## 3rd Qu.: 320627 3rd Qu.:54.73
## Max. :1091752 Max. :62.14
##
a.) Barchart
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.5.1
#BarChartProduksi
a <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Total = c(59497320, 15495477, 405044))
ggplot(a, aes(Zona, Total)) +
geom_col(alpha=.2, col="red", fill="blue")+
geom_label(aes(Zona, Total), label=c(59497320, 15495477, 405044))+
labs(title="Bar Chart Produksi Padi", subtitle="(dalam juta ton)", x="Zona", y="Total")
#BarChartLuasLahanSawah
b <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Total = c(5951730, 2055879, 79784))
ggplot(b, aes(Zona, Total)) +
geom_col(alpha=.2, col="red", fill="blue")+
geom_label(aes(Zona, Total), label=c(5951730, 2055879, 79784))+
labs(title="Bar Chart Luas Lahan Sawah", subtitle="(dalam juta ha)", x="Zona", y="Total")
#BarChartLuasLahanPanen
c <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Total = c(10818821, 3206710, 91107))
ggplot(c, aes(Zona, Total)) +
geom_col(alpha=.2, col="blue", fill="red")+
geom_label(aes(Zona, Total), label=c(10818821, 3206710, 91107))+
labs(title="Bar Chart Luas Lahan Panen", subtitle="(dalam juta ha)", x="Zona", y="Total")
#BarChartProduktivitasPadi
d <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Mean = c(45.16, 29.57, 9.31))
ggplot(d, aes(Zona, Mean)) +
geom_col(alpha=.2, col="red", fill="blue")+
geom_label(aes(Zona, Mean), label=c(45.16, 29.57, 9.31))+
labs(title="Bar Chart Produktivitas Padi", x="Zona", y="Mean")
b.) Histogram
#Histogram Produktivitas
theme_set(theme_grey())
ggplot(datapadi2015, aes(Produktivitas_Padi))+
geom_histogram(binwidth=1, col="red", fill="blue", alpha=.4, aes(y=..density..))+
labs(title= "Histogram Produktivitas Padi", x="Produktivitas Padi", y="Density")+
geom_density(alpha=.3, col="blue", fill="red")+
geom_vline(aes(xintercept=mean(Produktivitas_Padi)), color="blue", linetype="dashed", size=1)
#Histogram Produksi
theme_set(theme_grey())
ggplot(datapadi2015, aes(Padi))+
geom_histogram(col="red", fill="green", alpha=.3, aes(y=..density..))+
labs(title= "Histogram Produksi Padi", x="Produksi Padi", y="Density")+
geom_density(alpha=.5, col="green", fill="red")+
geom_vline(aes(xintercept=mean(Padi)), color="green", linetype="dashed", size=1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
#Histogram Luas Lahan Panen
theme_set(theme_grey())
ggplot(datapadi2015, aes(Luas_Panen))+
geom_histogram(col="red", fill="blue", alpha=.4, aes(y=..density..))+
labs(title= "Histogram Luas Lahan Panen", x="Luas Lahan Panen", y="Density")+
geom_density(alpha=.3, col="blue", fill="red")+
geom_vline(aes(xintercept=mean(Luas_Panen)), color="blue", linetype="dashed", size=1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
#Histogram Luas Lahan Sawah
theme_set(theme_grey())
ggplot(datapadi2015, aes(Luas_Sawah))+
geom_histogram(col="red", fill="green", alpha=.3, aes(y=..density..))+
labs(title= "Histogram Luas Lahan Sawah", x="Luas Lahan Sawah", y="Density")+
geom_density(alpha=.5, col="green", fill="red")+
geom_vline(aes(xintercept=mean(Luas_Sawah)), color="blue", linetype="dashed", size=1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
c.) Boxplot
#BoxplotProduktivitasPadi
ggplot(datapadi2015,aes(group=Zona, Produktivitas_Padi))+
geom_boxplot(aes(Zona, Produktivitas_Padi), fill="purple", alpha=.2)+
labs(title="Box Plot", subtitle="Produktivitas Padi 2015",
x="Zona", y="Produktivitas Padi")
#BoxplotProduksiPadi
ggplot(datapadi2015,aes(group=Zona, Padi))+
geom_boxplot(aes(Zona, Padi), fill="red", alpha=.2)+
labs(title="Box Plot", subtitle="Produksi Padi 2015",
x="Zona", y="Produksi Padi")
#BoxplotLuasLahanPanen
ggplot(datapadi2015,aes(group=Zona, Luas_Panen))+
geom_boxplot(aes(Zona, Luas_Panen), fill="green", alpha=.2)+
labs(title="Box Plot", subtitle="Luas Lahan Panen 2015",
x="Zona", y="Luas Panen")
#BoxplotLuasLahanSawah
ggplot(datapadi2015,aes(group=Zona, Luas_Sawah))+
geom_boxplot(aes(Zona, Luas_Sawah), fill="blue", alpha=.2)+
labs(title="Box Plot", subtitle="Luas Lahan Sawah 2015",
x="Zona", y="Luas Lahan Sawah")
a.) Scatterplot
ggplot(datapadi2015, aes(Padi, Produktivitas_Padi))+
geom_point(col="Red")
ggplot(datapadi2015, aes(Luas_Panen, Produktivitas_Padi))+
geom_point(col="Blue")
ggplot(datapadi2015, aes(Luas_Sawah, Produktivitas_Padi))+
geom_point(col="Green")
b.) Koefisien korelasi
cor.test(Padi,Produktivitas_Padi)
##
## Pearson's product-moment correlation
##
## data: Padi and Produktivitas_Padi
## t = 3.3882, df = 32, p-value = 0.001881
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.2126145 0.7258728
## sample estimates:
## cor
## 0.5138359
cor.test(Luas_Panen,Produktivitas_Padi)
##
## Pearson's product-moment correlation
##
## data: Luas_Panen and Produktivitas_Padi
## t = 3.1031, df = 32, p-value = 0.003985
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.1705189 0.7045311
## sample estimates:
## cor
## 0.4809512
cor.test(Luas_Sawah,Produktivitas_Padi)
##
## Pearson's product-moment correlation
##
## data: Luas_Sawah and Produktivitas_Padi
## t = 2.6679, df = 32, p-value = 0.01188
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.1032943 0.6683216
## sample estimates:
## cor
## 0.42656
c.) Penjelasan
\(H_0 : \rho\) = 0 (Tidak ada korelasi)
\(H_1 : \rho \neq\) 0 (Ada korelasi)
Nilai korelasi pearson beserta statistik uji untuk masing-masing variabel x terhadap y
| x | y | r | p-value | Kesimpulan |
|---|---|---|---|---|
| Produksi Padi | Produktivitas Padi | 0.514 | 0.001 | Berkorelasi positif namun lemah |
| Luas Panen | Produktivitas Padi | 0.481 | 0.004 | Berkorelasi positif namun lemah |
| Luas Lahan Sawah | Produktivitas Padi | 0.426 | 0.012 | Berkorelasi positif namun lemah |
Berikut ini adalah model regresi linear bergada
lm(Produktivitas_Padi~ log(Padi) + log(Luas_Panen) + log(Luas_Sawah), data=datapadi2015)
##
## Call:
## lm(formula = Produktivitas_Padi ~ log(Padi) + log(Luas_Panen) +
## log(Luas_Sawah), data = datapadi2015)
##
## Coefficients:
## (Intercept) log(Padi) log(Luas_Panen) log(Luas_Sawah)
## -15.241 40.454 -38.214 -2.269
summary(lm(Produktivitas_Padi~log(Padi) + log(Luas_Panen) + log(Luas_Sawah), data=datapadi2015))
##
## Call:
## lm(formula = Produktivitas_Padi ~ log(Padi) + log(Luas_Panen) +
## log(Luas_Sawah), data = datapadi2015)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.7629 -0.8357 -0.4566 0.6934 4.6998
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -15.241 1.981 -7.692 1.4e-08 ***
## log(Padi) 40.454 1.199 33.735 < 2e-16 ***
## log(Luas_Panen) -38.214 1.900 -20.118 < 2e-16 ***
## log(Luas_Sawah) -2.269 1.073 -2.114 0.0429 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.435 on 30 degrees of freedom
## Multiple R-squared: 0.9822, Adjusted R-squared: 0.9804
## F-statistic: 550.9 on 3 and 30 DF, p-value: < 2.2e-16
Penjelasan
Pembentukan model regresi dilakukan setelah melakukan transformasi data produksi padi, luas panen, dan luas lahan sawah untuk mengetahui pengaruhnya terhadap produktivitas padi di Indonesia tahun 2015. Hal ini dilakukan karena perbedaan digit yang sangat jauh antara variabel prediktor dengen variabel respon. Berikut adalah hasil model regresi yang terbentuk untuk memprediksi nilai produktivitas padi.
y = -15.241 + 40.454log(Padi) - 38.214log(Luas_Panen) - 2.269log(Luas_Sawah)
Setelah diperoleh model regresi, selanjutnya dilakukan uji serentak. Dari output di atas, dapat dilihat bahwa nilai statistik uji F = 550.9 dan p-value = 0.000. Artinya, terdapat minimal 1 variabel prediktor yang berpengaruh signifikan terhadap model. Untuk mengetahui variabel prediktor yang berpengaruh terhadap model, maka dilakukan pengujian sercara parsial. Berikut adalah hasilnya.
| Estimate | t | p-value | Kesimpulan | |
|---|---|---|---|---|
| Intercept | -15.241 | -7.692 | 0 | Berpengaruh signifikan |
| log(Padi) | 40.454 | 33.735 | 0 | Berpengaruh signifikan |
| log(Luas_Panen) | -38.214 | -20.118 | 0 | Berpengaruh signifikan |
| log(Luas_Sawah) | -2.269 | -2.114 | 0.0429 | Berpengaruh signifikan |
Karena semua variabel prediktor berpengaruh signifikan terhadap model, maka selanjutnya model ini dapat diinterpretasikan. Model ini memberikan nilai \(R^2\) = 98.22%. Artinya, 98.22% variabilitas produktivitas padi dijelaskan oleh variabel prediktor dan sisanya dijelaskan oleh variabel lain di luar model.