PENDAHULUAN

Salah satu jenis tanaman pangan di Indonesia adalah tanaman padi. Tanaman padi menghasilkan beras yang kemudian dapat dimasak menjadi nasi yang dikonsumsi oleh mayoritas masyarakat Indonesia. Berdasarkan data dari Badan Pusat Statistik, setiap provinsi di Indonesia memiliki lahan untuk ditanami padi dan tentu saja memiliki tingkat produktivitas padi yang berbeda-beda. Berikut ini adalah data mengenai “Tanaman Pangan Padi di Indonesia 2015”. Dari data ini selanjutnya akan dilakukan analisis secara deskriptif dan inferensia untuk mengetahui gambaran produktivitas padi serta dapat memprediksi produktivitas padi di setiap daerah di Indonesia dengan metode analisis regresi.

Provinsi Zona Padi Luas_Panen Luas_Sawah Produktivitas_Padi
Aceh Barat 2331046 461060 290337 50.56
Sumatera Utara Barat 4044829 781769 423465 51.74
Sumatera Barat Barat 2550609 507545 226377 50.25
Riau Barat 393917 107546 71910 36.63
Jambi Barat 541486 122214 94735 44.31
Sumatera Selatan Barat 4247922 872737 620632 48.67
Bengkulu Barat 578654 128833 85131 44.92
Lampung Barat 3641895 707266 377463 51.49
Kep. Bangka Belitung Barat 27068 11848 10654 22.85
Kep. Riau Barat 959 263 246 36.46
Dki Jakarta Barat 6361 1137 650 55.95
Jawa Barat Barat 11373144 1857612 912794 61.22
Jawa Tengah Barat 11301422 1875793 965262 60.25
Di Yogyakarta Barat 945136 155838 53553 60.65
Jawa Timur Barat 13154967 2152070 1091752 61.13
Banten Barat 2188996 386676 199492 56.61
Bali Tengah 853710 137385 75922 62.14
Nusa Tenggara Barat Tengah 2417392 467503 264666 51.71
Nusa Tenggara Timur Tengah 948088 266242 177238 35.61
Kalimantan Barat Barat 1275707 433944 330724 29.4
Kalimantan Tengah Barat 893202 254670 196553 35.07
Kalimantan Selatan Tengah 2140276 511213 450152 41.87
Kalimantan Timur Tengah 408782 99209 57000 41.2
Kalimantan Utara Tengah 112102 41115 21448 27.27
Sulawesi Utara Tengah 674169 137438 55820 49.05
Sulawesi Tengah Tengah 1015368 209057 128323 48.57
Sulawesi Selatan Tengah 5471806 1044030 628148 52.41
Sulawesi Tenggara Tengah 660720 140380 103812 47.07
Gorontalo Tengah 331220 59668 32058 55.51
Sulawesi Barat Tengah 461844 93470 61292 49.41
Maluku Timur 117791 21141 13394 55.72
Maluku Utara Timur 75265 21438 11802 35.11
Papua Barat Timur 30219 7174 10126 42.12
Papua Timur 181769 41354 44462 43.95

source: Badan Pusat Statistik

A. STATISTIK DESKRIPTIF

Berikut adalah hasil statistik deskriptif dari Data Produktivitas Padi 2015

##           Provinsi      Zona         Padi            Luas_Panen     
##  Aceh         : 1   Barat :18   Min.   :     959   Min.   :    263  
##  Bali         : 1   Tengah:12   1st Qu.:  346894   1st Qu.:  68119  
##  Banten       : 1   Timur : 4   Median :  873456   Median : 148109  
##  Bengkulu     : 1               Mean   : 2217584   Mean   : 415195  
##  Di Yogyakarta: 1               3rd Qu.: 2395806   3rd Qu.: 497535  
##  Dki Jakarta  : 1               Max.   :13154967   Max.   :2152070  
##  (Other)      :28                                                   
##    Luas_Sawah      Produktivitas_Padi
##  Min.   :    246   Min.   :22.85     
##  1st Qu.:  46735   1st Qu.:41.37     
##  Median :  99274   Median :48.86     
##  Mean   : 237865   Mean   :46.97     
##  3rd Qu.: 320627   3rd Qu.:54.73     
##  Max.   :1091752   Max.   :62.14     
## 

B. VISUALISASI DATA

a.) Barchart

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 3.5.1
#BarChartProduksi
a <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Total = c(59497320, 15495477, 405044))
ggplot(a, aes(Zona, Total)) +
  geom_col(alpha=.2, col="red", fill="blue")+
  geom_label(aes(Zona, Total), label=c(59497320, 15495477, 405044))+
  labs(title="Bar Chart Produksi Padi", subtitle="(dalam juta ton)", x="Zona", y="Total")

#BarChartLuasLahanSawah
b <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Total = c(5951730, 2055879, 79784))
ggplot(b, aes(Zona, Total)) +
  geom_col(alpha=.2, col="red", fill="blue")+
  geom_label(aes(Zona, Total), label=c(5951730, 2055879, 79784))+
  labs(title="Bar Chart Luas Lahan Sawah", subtitle="(dalam juta ha)", x="Zona", y="Total")

#BarChartLuasLahanPanen
c <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Total = c(10818821, 3206710, 91107))
ggplot(c, aes(Zona, Total)) +
  geom_col(alpha=.2, col="blue", fill="red")+
  geom_label(aes(Zona, Total), label=c(10818821, 3206710, 91107))+
  labs(title="Bar Chart Luas Lahan Panen", subtitle="(dalam juta ha)", x="Zona", y="Total")

#BarChartProduktivitasPadi
d <- data.frame(Zona = c("Barat", "Tengah", "Timur"), Mean = c(45.16, 29.57, 9.31))
ggplot(d, aes(Zona, Mean)) +
  geom_col(alpha=.2, col="red", fill="blue")+
  geom_label(aes(Zona, Mean), label=c(45.16, 29.57, 9.31))+
  labs(title="Bar Chart Produktivitas Padi", x="Zona", y="Mean")

b.) Histogram

#Histogram Produktivitas
theme_set(theme_grey())
ggplot(datapadi2015, aes(Produktivitas_Padi))+
  geom_histogram(binwidth=1, col="red", fill="blue", alpha=.4, aes(y=..density..))+
  labs(title= "Histogram Produktivitas Padi", x="Produktivitas Padi", y="Density")+
  geom_density(alpha=.3, col="blue", fill="red")+
  geom_vline(aes(xintercept=mean(Produktivitas_Padi)), color="blue", linetype="dashed", size=1) 

#Histogram Produksi
theme_set(theme_grey())
ggplot(datapadi2015, aes(Padi))+
  geom_histogram(col="red", fill="green", alpha=.3, aes(y=..density..))+
  labs(title= "Histogram Produksi Padi", x="Produksi Padi", y="Density")+
  geom_density(alpha=.5, col="green", fill="red")+
  geom_vline(aes(xintercept=mean(Padi)), color="green", linetype="dashed", size=1)  
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

#Histogram Luas Lahan Panen
theme_set(theme_grey())
ggplot(datapadi2015, aes(Luas_Panen))+
  geom_histogram(col="red", fill="blue", alpha=.4, aes(y=..density..))+
  labs(title= "Histogram Luas Lahan Panen", x="Luas Lahan Panen", y="Density")+
  geom_density(alpha=.3, col="blue", fill="red")+
  geom_vline(aes(xintercept=mean(Luas_Panen)), color="blue", linetype="dashed", size=1)
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

#Histogram Luas Lahan Sawah
theme_set(theme_grey())
ggplot(datapadi2015, aes(Luas_Sawah))+
  geom_histogram(col="red", fill="green", alpha=.3, aes(y=..density..))+
  labs(title= "Histogram Luas Lahan Sawah", x="Luas Lahan Sawah", y="Density")+
  geom_density(alpha=.5, col="green", fill="red")+
  geom_vline(aes(xintercept=mean(Luas_Sawah)), color="blue", linetype="dashed", size=1) 
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

c.) Boxplot

#BoxplotProduktivitasPadi
ggplot(datapadi2015,aes(group=Zona, Produktivitas_Padi))+
  geom_boxplot(aes(Zona, Produktivitas_Padi), fill="purple", alpha=.2)+
  labs(title="Box Plot", subtitle="Produktivitas Padi 2015",
       x="Zona", y="Produktivitas Padi")

#BoxplotProduksiPadi
ggplot(datapadi2015,aes(group=Zona, Padi))+
  geom_boxplot(aes(Zona, Padi), fill="red", alpha=.2)+
  labs(title="Box Plot", subtitle="Produksi Padi 2015",
       x="Zona", y="Produksi Padi")

#BoxplotLuasLahanPanen
ggplot(datapadi2015,aes(group=Zona, Luas_Panen))+
  geom_boxplot(aes(Zona, Luas_Panen), fill="green", alpha=.2)+
  labs(title="Box Plot", subtitle="Luas Lahan Panen 2015",
       x="Zona", y="Luas Panen")

#BoxplotLuasLahanSawah
ggplot(datapadi2015,aes(group=Zona, Luas_Sawah))+
  geom_boxplot(aes(Zona, Luas_Sawah), fill="blue", alpha=.2)+
  labs(title="Box Plot", subtitle="Luas Lahan Sawah 2015",
       x="Zona", y="Luas Lahan Sawah")

C. ANALISIS KORELASI

a.) Scatterplot

ggplot(datapadi2015, aes(Padi, Produktivitas_Padi))+
  geom_point(col="Red")

ggplot(datapadi2015, aes(Luas_Panen, Produktivitas_Padi))+
  geom_point(col="Blue")

ggplot(datapadi2015, aes(Luas_Sawah, Produktivitas_Padi))+
  geom_point(col="Green")

b.) Koefisien korelasi

cor.test(Padi,Produktivitas_Padi)
## 
##  Pearson's product-moment correlation
## 
## data:  Padi and Produktivitas_Padi
## t = 3.3882, df = 32, p-value = 0.001881
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.2126145 0.7258728
## sample estimates:
##       cor 
## 0.5138359
cor.test(Luas_Panen,Produktivitas_Padi)
## 
##  Pearson's product-moment correlation
## 
## data:  Luas_Panen and Produktivitas_Padi
## t = 3.1031, df = 32, p-value = 0.003985
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.1705189 0.7045311
## sample estimates:
##       cor 
## 0.4809512
cor.test(Luas_Sawah,Produktivitas_Padi)
## 
##  Pearson's product-moment correlation
## 
## data:  Luas_Sawah and Produktivitas_Padi
## t = 2.6679, df = 32, p-value = 0.01188
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.1032943 0.6683216
## sample estimates:
##     cor 
## 0.42656

c.) Penjelasan

\(H_0 : \rho\) = 0 (Tidak ada korelasi)

\(H_1 : \rho \neq\) 0 (Ada korelasi)

Nilai korelasi pearson beserta statistik uji untuk masing-masing variabel x terhadap y

x y r p-value Kesimpulan
Produksi Padi Produktivitas Padi 0.514 0.001 Berkorelasi positif namun lemah
Luas Panen Produktivitas Padi 0.481 0.004 Berkorelasi positif namun lemah
Luas Lahan Sawah Produktivitas Padi 0.426 0.012 Berkorelasi positif namun lemah

D. MODEL REGRESI LINEAR

Berikut ini adalah model regresi linear bergada

lm(Produktivitas_Padi~ log(Padi) + log(Luas_Panen) + log(Luas_Sawah), data=datapadi2015)
## 
## Call:
## lm(formula = Produktivitas_Padi ~ log(Padi) + log(Luas_Panen) + 
##     log(Luas_Sawah), data = datapadi2015)
## 
## Coefficients:
##     (Intercept)        log(Padi)  log(Luas_Panen)  log(Luas_Sawah)  
##         -15.241           40.454          -38.214           -2.269
summary(lm(Produktivitas_Padi~log(Padi) + log(Luas_Panen) + log(Luas_Sawah), data=datapadi2015))
## 
## Call:
## lm(formula = Produktivitas_Padi ~ log(Padi) + log(Luas_Panen) + 
##     log(Luas_Sawah), data = datapadi2015)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.7629 -0.8357 -0.4566  0.6934  4.6998 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      -15.241      1.981  -7.692  1.4e-08 ***
## log(Padi)         40.454      1.199  33.735  < 2e-16 ***
## log(Luas_Panen)  -38.214      1.900 -20.118  < 2e-16 ***
## log(Luas_Sawah)   -2.269      1.073  -2.114   0.0429 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.435 on 30 degrees of freedom
## Multiple R-squared:  0.9822, Adjusted R-squared:  0.9804 
## F-statistic: 550.9 on 3 and 30 DF,  p-value: < 2.2e-16

Penjelasan

Pembentukan model regresi dilakukan setelah melakukan transformasi data produksi padi, luas panen, dan luas lahan sawah untuk mengetahui pengaruhnya terhadap produktivitas padi di Indonesia tahun 2015. Hal ini dilakukan karena perbedaan digit yang sangat jauh antara variabel prediktor dengen variabel respon. Berikut adalah hasil model regresi yang terbentuk untuk memprediksi nilai produktivitas padi.

y = -15.241 + 40.454log(Padi) - 38.214log(Luas_Panen) - 2.269log(Luas_Sawah)

Setelah diperoleh model regresi, selanjutnya dilakukan uji serentak. Dari output di atas, dapat dilihat bahwa nilai statistik uji F = 550.9 dan p-value = 0.000. Artinya, terdapat minimal 1 variabel prediktor yang berpengaruh signifikan terhadap model. Untuk mengetahui variabel prediktor yang berpengaruh terhadap model, maka dilakukan pengujian sercara parsial. Berikut adalah hasilnya.

Estimate t p-value Kesimpulan
Intercept -15.241 -7.692 0 Berpengaruh signifikan
log(Padi) 40.454 33.735 0 Berpengaruh signifikan
log(Luas_Panen) -38.214 -20.118 0 Berpengaruh signifikan
log(Luas_Sawah) -2.269 -2.114 0.0429 Berpengaruh signifikan

Karena semua variabel prediktor berpengaruh signifikan terhadap model, maka selanjutnya model ini dapat diinterpretasikan. Model ini memberikan nilai \(R^2\) = 98.22%. Artinya, 98.22% variabilitas produktivitas padi dijelaskan oleh variabel prediktor dan sisanya dijelaskan oleh variabel lain di luar model.