Produksi dan Pendapatan Produk Surat & Paket Kantor Pos Surabaya dan Kantor Pos Sidoarjo Tahun 2017

Analisis pada data produksi dan pendapatan Produk Surat & Paket Kantor Pos Surabaya dan Kantor Pos Sidoarjo Tahun 2017 bertujuan untuk mengetahui bagaimana karakateristik kinerja kantor pos Surabaya dan Sidoarjo pada Tahun 2017 menggunakan metode statistika deskriptif. Kemudian selanjutnya akan dilakukan pengujian 2 sampel t untuk mengetahui apakah terdapat perbedaan produksi dan pendapatan antara kedua kantor pos, analisis regresi untuk mengetahui pengaruh produksi terhadap pendapatan dan juga forecasting untuk mengetahui nilai peramalan produksi dan pendapatan perode kedepan.

Data yang digunakan untuk analisis disajikan dalam tabel sebagai berikut.

Bulan Produksi Surabaya Produksi Sidoarjo Pendapatan Surabaya Pendapatan Sidoarjo
Jan-17 154627 41452 4134659780 1230360735
Feb-17 144802 39682 3759428358 1195922413
Mar-17 167235 46617 4236482952 1312689203
Apr-17 144874 44014 3622897185 1163595211
May-17 149125 40604 4037142634 1186762151
Jun-17 131106 33164 3447340796 1025934530
Jul-17 160925 44490 4105751005 1180752166
Aug-17 170080 48804 4423610945 1252123672
Sep-17 147623 46574 3870910686 1228725434
Oct-17 164070 54616 4281490145 1426273230
Nov-17 160670 54746 4200662758 1509368308
Dec-17 153653 53567 4058023173 1517118804
(sumber: web ipos PT Pos Indonesia (Persero))

Karakteristik Produksi dan Pendapatan Produk Surat & Paket Kantor Pos Surabaya Tahun 2017

Karakteristik produksi dan pendapatan produk surat & paket kantor pos Surabaya yaitu sebagai berikut.

library(ggplot2)
dt1 <- read.csv("C:/Documents/teas2/produksiratketlp.csv", header=TRUE, sep=";")
ggplot() +
      geom_line(aes(x = Bulan, y = dt1[,2]), 
                lwd=1.2, col = "navy", data = dt1) +
      scale_x_continuous(breaks=seq(1,12)) + labs(
        title <- "Produksi surat & paket tahun 2017",
        xlab <- "Bulan", ylab <- "Kantor Pos")

Produksi surat dan paket mengalami penurunan drastis pada Bulan Juni, sedangkan produksi tertinggi terjadi pada Bulan Agustus.

library(ggplot2)
dt2 = read.csv("C:/Documents/teas2/pendapatanlp.csv", header=TRUE, sep=";")
ggplot() +
      geom_line(aes(x = Bulan, y = dt2[,2]), 
                lwd=1.2, col = "red", data = dt2) +
      scale_x_continuous(breaks=seq(1,12)) + labs(
        title <- "Produksi surat & paket tahun 2017",
        xlab <- "Bulan", ylab <- "Kantor Pos")

Pendapatan yang diperoleh Kantor Pos Surabaya atas produk surat dan paket paling rendah pada Bulan Juni, sedangkan paling tinggi terjadi pada Bulan Agustus. Keadaan tersebut cukup berbanding lurus dengan produksi.

Karakteristik Produksi dan Pendapatan Produk Surat & Paket Kantor Pos Sidoarjo Tahun 2017

Karakteristik produksi dan pendapatan produk surat & paket kantor pos Sidoarjo yaitu sebagai berikut.

library(ggplot2)
dt1 <- read.csv("C:/Documents/teas2/produksiratketlp.csv", header=TRUE, sep=";")
ggplot() +
      geom_line(aes(x = Bulan, y = dt1[,3]), 
                lwd=1.2, col = "navy", data = dt1) +
      scale_x_continuous(breaks=seq(1,12)) + labs(
        title <- "Produksi surat & paket tahun 2017",
        xlab <- "Bulan", ylab <- "Kantor Pos")

Sama halnya dengan kantor pos Surabaya, produksi surat dan paket di kantor pos Sidoarjo mengalami penurunan drastis pada Bulan Juni, namun produksi tertinggi terjadi pada Bulan November.

library(ggplot2)
dt2 = read.csv("C:/Documents/teas2/pendapatanlp.csv", header=TRUE, sep=";")
ggplot() +
      geom_line(aes(x = Bulan, y = dt2[,3]), 
                lwd=1.2, col = "red", data = dt2) +
      scale_x_continuous(breaks=seq(1,12)) + labs(
        title <- "Produksi surat & paket tahun 2017",
        xlab <- "Bulan", ylab <- "Kantor Pos")

Sedikit berbeda dengan produksi, pendapatan paling tinggi di Kantor Pos Sidoarjo justru terjadi pada bulan Desember bukan di bulan November. Namun pendapatan paling rendah tetap pada bulan Juni.

Scatterplot Antara Produksi dan Pendapatan

Berikut ini merupakan scatterplot antara produksi dan pendapatan yang menunjukkan hubungan antara variabel produksi dan pendapatan.

Surabaya

Sidoarjo

sda <- read.csv("C:/Documents/teas2/sda.csv", header=TRUE, sep=";")
plot(sda)

Secara visual, pendapatan dan produksi baik di kantor pos Surabaya dan Sidoarjo berbanding lurus yang mana jika produksi naik, pendapatan otomatis naik pula.

Korelasi Antara produksi dan pendapatan

Berikut ini merupakan hasil pengujian korelasi Pearson untuk mengetahui hubungan antara produksi dan pendaptan.

Surabaya

y1<-sby$Pendapatan
x1<-sby$Produksi
cor.test(x1,y1)
## 
##  Pearson's product-moment correlation
## 
## data:  x1 and y1
## t = 10.112, df = 10, p-value = 1.435e-06
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.8413692 0.9874510
## sample estimates:
##       cor 
## 0.9544177

Sidoarjo

y2<-sda$Pendapatan
x2<-sda$Produksi
cor.test(x2,y2)
## 
##  Pearson's product-moment correlation
## 
## data:  x2 and y2
## t = 7.4822, df = 10, p-value = 2.105e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.7365921 0.9780101
## sample estimates:
##       cor 
## 0.9211111

Hasil dari uji korelasi menunjukkan bahwa baik kantor pos Surabaya dan Sidoarjo, antara produksi dan pendapatan memiliki korelasi positif dilihat nilai estimasinya yang hampir mendekati 1. Artinya ada keterkaitan yang kuat antara produksi dan pendapatan. Nilai korelasi pada kantor pos Surabaya sedikit lebih kuat dibandingkan Kantor Pos Sidoarjo.

Analisis Regresi Sederhana

Berikut ini merupakan hasil analisis regresi linier sederhana untuk mengetahui pengaruh produksi surat & paket terhadap pendapatan pada Kantor Pos Surabaya dan kantor pos Sidoarjo.

Surabaya

summary(lm(y1~x1))
## 
## Call:
## lm(formula = y1 ~ x1)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -167246399  -40918591   15393523   31564777  143070058 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 248245504  373399047   0.665    0.521    
## x1              24448       2418  10.112 1.44e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 89960000 on 10 degrees of freedom
## Multiple R-squared:  0.9109, Adjusted R-squared:  0.902 
## F-statistic: 102.3 on 1 and 10 DF,  p-value: 1.435e-06

Model Regresi: Y = 248245504 + 24448X artinya, ketika produksi mengalami kenaikan 1 satuan maka akan menaikkan pendapatan sebesar 24.448 rupiah.

Uji serentak diperoleh keputusan gagal tolak H0 yang mana menunjukkan bahwa produksi secara signifikan memengaruhi pendapatan. Serta nilai kebaikan model (Ad-Rsquare) sebesar 90%, menyatakan bahwa model dapat menjelaskan variabilitas variabel dengan sangat baik.

Sidoarjo

summary(lm(y2~x2))
## 
## Call:
## lm(formula = y2 ~ x2)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -81251233 -59815744  19203302  49386207  85355237 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 325237119  127345963   2.554   0.0287 *  
## x2              20657       2761   7.482 2.11e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 60240000 on 10 degrees of freedom
## Multiple R-squared:  0.8484, Adjusted R-squared:  0.8333 
## F-statistic: 55.98 on 1 and 10 DF,  p-value: 2.105e-05

Model Regresi: Y = -6433000 + 0,04107X artinya, ketika produksi mengalami kenaikan 1 satuan maka akan menaikkan pendapatan sebesar 0,04107 rupiah.

Uji serentak diperoleh keputusan gagal tolak H0 yang mana menunjukkan bahwa produksi secara signifikan memengaruhi pendapatan. Serta nilai kebaikan model (Ad-Rsquare) sebesar 83%, menyatakan bahwa model dapat menjelaskan variabilitas variabel dengan baik.

Pengujian Rata-rata 2 Sampel T

Pengujian ini bertujuan untuk mengetahui apakah rata-rata produksi surat dan paket pada Kantor pos Surabaya dan Kantor pos Sidoarjo sama atau tidak. Berikut ini merupakan hasil dari pengujian.

test <- read.csv("C:/Documents/teas2/produksittest.csv", header=TRUE, sep=";")
attach(test)
t.test(SBY, SDA, var.equal = T, conf.level = 0.95)
## 
##  Two Sample t-test
## 
## data:  SBY and SDA
## t = 28.865, df = 22, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  100585.5 116157.9
## sample estimates:
## mean of x mean of y 
## 154065.83  45694.17

Hipotesis

\(\text{H}_0: \mu_{1} = \mu_{2}\) (tidak ada perbedaan rata-rata produksi surat & paket kantor pos surabaya dan kantor pos sidoarjo)

\(\text{H}_1: \mu_{1}\) \(\neq\) \(\mu_{2}\) (Terdapat perbedaan rata-rata produksi surat & paket kantor pos surabaya dan kantor pos sidoarjo)

Taraf Signifikansi

\(\alpha =5\%\)

Daerah Penolakan

Tolak \(\text{H}_0\) jika: \(|T|\) > \(T_{\alpha/2;df}\) atau \(\text{p-value} \leq \alpha\)

Statistik Uji

\(|T|\) = 28.865 \(T_{\alpha/2;22}\) = 2.405

Keputusan

Tolak \(\text{H}_0\), karena \(|T|\)(28.865) > \(T_{\alpha/2;22}\)(2.405) dan \(\text{p-value}(0.002) \leq \alpha\)(0.05)

Kesimpulan

Terdapat perbedaan rata-rata produksi surat & paket kantor pos surabaya dan kantor pos sidoarjo

boxplot(test)

Secara visual menggunakan boxplot, dapat diketahui bahwa median data antara produksi surat & paket kantor pos Surabaya dan kantor pos Sidoarjo berbeda jauh, sehingga sesuai dengan hasil pengujian bahwa rata-rata produksi kedua kantor pos tersebut memang berbeda. Terlihat kantor pos Surabaya lebih unggul karena median produksinya lebih tinggi daripada kantor pos sidoarjo.

Peramalan Produksi Surat dan Paket

Pada pembahasan kali ini akan dilakukan peramalan (forecast) data untuk beberapa periode ke depan dengan tujuan mengetahui perkiraan produksi surat dan paket untuk kantor pos surabaya dan Sidoarjo.

Time Series Plot Produksi Kantor Pos Surabaya dan Sidoarjo

ts = ts(t(dt1)) 
plot(ts[2,],type='o',col='blue')

plot(ts[3,],type='o',col='red')

Metode Peramalan Untuk Data Produksi Kantor Pos Surabaya

Berikut ini merupakan hasil peramalan menggunakan metode mean, naive, random walk with drift dan arima.

library(forecast)
mf = meanf(ts[2,],h=6,level=c(90,95),fan=FALSE,lambda=NULL)
plot(mf)

mn = naive(ts[2,],h=6,level=c(90,95),fan=FALSE,lambda=NULL)
plot(mn)

md = rwf(ts[2,],drift=T,h=6,level=c(90,95),fan=FALSE,lambda=NULL)
plot(md)

ts[2,] %>%
        auto.arima() %>%
        forecast(h=6) %>%
        autoplot() 

Secara visual, dapat diketahui bahwa hasil peramalannya cenderung hampir sama. Lurus dan tidak berfluktuasi.

accuracy(md)
##                        ME     RMSE      MAE        MPE     MAPE     MASE
## Training set 1.322918e-11 17191.59 15008.68 -0.6383277 9.815592 0.999464
##                    ACF1
## Training set -0.5424719
accuracy(mn)
##                     ME     RMSE      MAE        MPE     MAPE MASE
## Training set -88.54545 17191.82 15016.73 -0.6961367 9.823696    1
##                    ACF1
## Training set -0.5424719
accuracy(mf)
##                         ME     RMSE      MAE        MPE     MAPE MASE
## Training set -9.701265e-12 10741.26 8868.667 -0.5064612 5.860371    1

Berdasarkan kesalahan peramalan dengan melihat nilai RMSE terkecil dapat diketahui metode random walk dengan drift menghasilkan kesalahan terkecil daripada metode lain.

library(tseries)
adf= adf.test(ts[2,])
adf
## 
##  Augmented Dickey-Fuller Test
## 
## data:  ts[2, ]
## Dickey-Fuller = -2.2889, Lag order = 2, p-value = 0.4623
## alternative hypothesis: stationary

Berdasarkan hasil pengujian augmented dickey fuller dengan tujuan mengetahui apakah data stasioner atau tidak, didapatkan keputusan gagal tolak H0 karena pvalue sebesar 0,4623 lebih besar daripada alpha 0,05 sehingga data tidak stationer. Jika data tidak stasioner, maka tidak dapat dilakukan peramalan dengan menggunakan metode ARIMA sebelum dilakukan differencing.

auto.arima(ts[2,])
## Series: ts[2, ] 
## ARIMA(0,0,0) with non-zero mean 
## 
## Coefficients:
##             mean
##       154065.833
## s.e.    3100.747
## 
## sigma^2 estimated as 125863332:  log likelihood=-128.41
## AIC=260.82   AICc=262.15   BIC=261.79
diff_data = diff(ts[2,])
forecast(auto.arima(diff_data))
##    Point Forecast    Lo 80   Hi 80     Lo 95    Hi 95
## 12              0 -22032.2 22032.2 -33695.35 33695.35
## 13              0 -22032.2 22032.2 -33695.35 33695.35
## 14              0 -22032.2 22032.2 -33695.35 33695.35
## 15              0 -22032.2 22032.2 -33695.35 33695.35
## 16              0 -22032.2 22032.2 -33695.35 33695.35
## 17              0 -22032.2 22032.2 -33695.35 33695.35
## 18              0 -22032.2 22032.2 -33695.35 33695.35
## 19              0 -22032.2 22032.2 -33695.35 33695.35
## 20              0 -22032.2 22032.2 -33695.35 33695.35
## 21              0 -22032.2 22032.2 -33695.35 33695.35
plot(forecast(auto.arima(diff_data)))

Kesimpulan yang dapat diambil bahwa data produksi baik kantor pos surabaya maupun sidoarjo kurang tepat diramalkan menggunakan metode arima karena tidak sesuai dan datanya kurang banyak sehingga kurang representatif.