Analisis pada data produksi dan pendapatan Produk Surat & Paket Kantor Pos Surabaya dan Kantor Pos Sidoarjo Tahun 2017 bertujuan untuk mengetahui bagaimana karakateristik kinerja kantor pos Surabaya dan Sidoarjo pada Tahun 2017 menggunakan metode statistika deskriptif. Kemudian selanjutnya akan dilakukan pengujian 2 sampel t untuk mengetahui apakah terdapat perbedaan produksi dan pendapatan antara kedua kantor pos, analisis regresi untuk mengetahui pengaruh produksi terhadap pendapatan dan juga forecasting untuk mengetahui nilai peramalan produksi dan pendapatan perode kedepan.
Data yang digunakan untuk analisis disajikan dalam tabel sebagai berikut.
| Bulan | Produksi Surabaya | Produksi Sidoarjo | Pendapatan Surabaya | Pendapatan Sidoarjo |
|---|---|---|---|---|
| Jan-17 | 154627 | 41452 | 4134659780 | 1230360735 |
| Feb-17 | 144802 | 39682 | 3759428358 | 1195922413 |
| Mar-17 | 167235 | 46617 | 4236482952 | 1312689203 |
| Apr-17 | 144874 | 44014 | 3622897185 | 1163595211 |
| May-17 | 149125 | 40604 | 4037142634 | 1186762151 |
| Jun-17 | 131106 | 33164 | 3447340796 | 1025934530 |
| Jul-17 | 160925 | 44490 | 4105751005 | 1180752166 |
| Aug-17 | 170080 | 48804 | 4423610945 | 1252123672 |
| Sep-17 | 147623 | 46574 | 3870910686 | 1228725434 |
| Oct-17 | 164070 | 54616 | 4281490145 | 1426273230 |
| Nov-17 | 160670 | 54746 | 4200662758 | 1509368308 |
| Dec-17 | 153653 | 53567 | 4058023173 | 1517118804 |
Karakteristik produksi dan pendapatan produk surat & paket kantor pos Surabaya yaitu sebagai berikut.
library(ggplot2)
dt1 <- read.csv("C:/Documents/teas2/produksiratketlp.csv", header=TRUE, sep=";")
ggplot() +
geom_line(aes(x = Bulan, y = dt1[,2]),
lwd=1.2, col = "navy", data = dt1) +
scale_x_continuous(breaks=seq(1,12)) + labs(
title <- "Produksi surat & paket tahun 2017",
xlab <- "Bulan", ylab <- "Kantor Pos")
Produksi surat dan paket mengalami penurunan drastis pada Bulan Juni, sedangkan produksi tertinggi terjadi pada Bulan Agustus.
library(ggplot2)
dt2 = read.csv("C:/Documents/teas2/pendapatanlp.csv", header=TRUE, sep=";")
ggplot() +
geom_line(aes(x = Bulan, y = dt2[,2]),
lwd=1.2, col = "red", data = dt2) +
scale_x_continuous(breaks=seq(1,12)) + labs(
title <- "Produksi surat & paket tahun 2017",
xlab <- "Bulan", ylab <- "Kantor Pos")
Pendapatan yang diperoleh Kantor Pos Surabaya atas produk surat dan paket paling rendah pada Bulan Juni, sedangkan paling tinggi terjadi pada Bulan Agustus. Keadaan tersebut cukup berbanding lurus dengan produksi.
Karakteristik produksi dan pendapatan produk surat & paket kantor pos Sidoarjo yaitu sebagai berikut.
library(ggplot2)
dt1 <- read.csv("C:/Documents/teas2/produksiratketlp.csv", header=TRUE, sep=";")
ggplot() +
geom_line(aes(x = Bulan, y = dt1[,3]),
lwd=1.2, col = "navy", data = dt1) +
scale_x_continuous(breaks=seq(1,12)) + labs(
title <- "Produksi surat & paket tahun 2017",
xlab <- "Bulan", ylab <- "Kantor Pos")
Sama halnya dengan kantor pos Surabaya, produksi surat dan paket di kantor pos Sidoarjo mengalami penurunan drastis pada Bulan Juni, namun produksi tertinggi terjadi pada Bulan November.
library(ggplot2)
dt2 = read.csv("C:/Documents/teas2/pendapatanlp.csv", header=TRUE, sep=";")
ggplot() +
geom_line(aes(x = Bulan, y = dt2[,3]),
lwd=1.2, col = "red", data = dt2) +
scale_x_continuous(breaks=seq(1,12)) + labs(
title <- "Produksi surat & paket tahun 2017",
xlab <- "Bulan", ylab <- "Kantor Pos")
Sedikit berbeda dengan produksi, pendapatan paling tinggi di Kantor Pos Sidoarjo justru terjadi pada bulan Desember bukan di bulan November. Namun pendapatan paling rendah tetap pada bulan Juni.
Berikut ini merupakan scatterplot antara produksi dan pendapatan yang menunjukkan hubungan antara variabel produksi dan pendapatan.
sda <- read.csv("C:/Documents/teas2/sda.csv", header=TRUE, sep=";")
plot(sda)
Secara visual, pendapatan dan produksi baik di kantor pos Surabaya dan Sidoarjo berbanding lurus yang mana jika produksi naik, pendapatan otomatis naik pula.
Berikut ini merupakan hasil pengujian korelasi Pearson untuk mengetahui hubungan antara produksi dan pendaptan.
y1<-sby$Pendapatan
x1<-sby$Produksi
cor.test(x1,y1)
##
## Pearson's product-moment correlation
##
## data: x1 and y1
## t = 10.112, df = 10, p-value = 1.435e-06
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.8413692 0.9874510
## sample estimates:
## cor
## 0.9544177
y2<-sda$Pendapatan
x2<-sda$Produksi
cor.test(x2,y2)
##
## Pearson's product-moment correlation
##
## data: x2 and y2
## t = 7.4822, df = 10, p-value = 2.105e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.7365921 0.9780101
## sample estimates:
## cor
## 0.9211111
Hasil dari uji korelasi menunjukkan bahwa baik kantor pos Surabaya dan Sidoarjo, antara produksi dan pendapatan memiliki korelasi positif dilihat nilai estimasinya yang hampir mendekati 1. Artinya ada keterkaitan yang kuat antara produksi dan pendapatan. Nilai korelasi pada kantor pos Surabaya sedikit lebih kuat dibandingkan Kantor Pos Sidoarjo.
Berikut ini merupakan hasil analisis regresi linier sederhana untuk mengetahui pengaruh produksi surat & paket terhadap pendapatan pada Kantor Pos Surabaya dan kantor pos Sidoarjo.
summary(lm(y1~x1))
##
## Call:
## lm(formula = y1 ~ x1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -167246399 -40918591 15393523 31564777 143070058
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 248245504 373399047 0.665 0.521
## x1 24448 2418 10.112 1.44e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 89960000 on 10 degrees of freedom
## Multiple R-squared: 0.9109, Adjusted R-squared: 0.902
## F-statistic: 102.3 on 1 and 10 DF, p-value: 1.435e-06
Model Regresi: Y = 248245504 + 24448X artinya, ketika produksi mengalami kenaikan 1 satuan maka akan menaikkan pendapatan sebesar 24.448 rupiah.
Uji serentak diperoleh keputusan gagal tolak H0 yang mana menunjukkan bahwa produksi secara signifikan memengaruhi pendapatan. Serta nilai kebaikan model (Ad-Rsquare) sebesar 90%, menyatakan bahwa model dapat menjelaskan variabilitas variabel dengan sangat baik.
summary(lm(y2~x2))
##
## Call:
## lm(formula = y2 ~ x2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -81251233 -59815744 19203302 49386207 85355237
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 325237119 127345963 2.554 0.0287 *
## x2 20657 2761 7.482 2.11e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 60240000 on 10 degrees of freedom
## Multiple R-squared: 0.8484, Adjusted R-squared: 0.8333
## F-statistic: 55.98 on 1 and 10 DF, p-value: 2.105e-05
Model Regresi: Y = -6433000 + 0,04107X artinya, ketika produksi mengalami kenaikan 1 satuan maka akan menaikkan pendapatan sebesar 0,04107 rupiah.
Uji serentak diperoleh keputusan gagal tolak H0 yang mana menunjukkan bahwa produksi secara signifikan memengaruhi pendapatan. Serta nilai kebaikan model (Ad-Rsquare) sebesar 83%, menyatakan bahwa model dapat menjelaskan variabilitas variabel dengan baik.
Pengujian ini bertujuan untuk mengetahui apakah rata-rata produksi surat dan paket pada Kantor pos Surabaya dan Kantor pos Sidoarjo sama atau tidak. Berikut ini merupakan hasil dari pengujian.
test <- read.csv("C:/Documents/teas2/produksittest.csv", header=TRUE, sep=";")
attach(test)
t.test(SBY, SDA, var.equal = T, conf.level = 0.95)
##
## Two Sample t-test
##
## data: SBY and SDA
## t = 28.865, df = 22, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 100585.5 116157.9
## sample estimates:
## mean of x mean of y
## 154065.83 45694.17
\(\text{H}_0: \mu_{1} = \mu_{2}\) (tidak ada perbedaan rata-rata produksi surat & paket kantor pos surabaya dan kantor pos sidoarjo)
\(\text{H}_1: \mu_{1}\) \(\neq\) \(\mu_{2}\) (Terdapat perbedaan rata-rata produksi surat & paket kantor pos surabaya dan kantor pos sidoarjo)
\(\alpha =5\%\)
Tolak \(\text{H}_0\) jika: \(|T|\) > \(T_{\alpha/2;df}\) atau \(\text{p-value} \leq \alpha\)
\(|T|\) = 28.865 \(T_{\alpha/2;22}\) = 2.405
Tolak \(\text{H}_0\), karena \(|T|\)(28.865) > \(T_{\alpha/2;22}\)(2.405) dan \(\text{p-value}(0.002) \leq \alpha\)(0.05)
Terdapat perbedaan rata-rata produksi surat & paket kantor pos surabaya dan kantor pos sidoarjo
boxplot(test)
Secara visual menggunakan boxplot, dapat diketahui bahwa median data antara produksi surat & paket kantor pos Surabaya dan kantor pos Sidoarjo berbeda jauh, sehingga sesuai dengan hasil pengujian bahwa rata-rata produksi kedua kantor pos tersebut memang berbeda. Terlihat kantor pos Surabaya lebih unggul karena median produksinya lebih tinggi daripada kantor pos sidoarjo.
Pada pembahasan kali ini akan dilakukan peramalan (forecast) data untuk beberapa periode ke depan dengan tujuan mengetahui perkiraan produksi surat dan paket untuk kantor pos surabaya dan Sidoarjo.
ts = ts(t(dt1))
plot(ts[2,],type='o',col='blue')
plot(ts[3,],type='o',col='red')
Berikut ini merupakan hasil peramalan menggunakan metode mean, naive, random walk with drift dan arima.
library(forecast)
mf = meanf(ts[2,],h=6,level=c(90,95),fan=FALSE,lambda=NULL)
plot(mf)
mn = naive(ts[2,],h=6,level=c(90,95),fan=FALSE,lambda=NULL)
plot(mn)
md = rwf(ts[2,],drift=T,h=6,level=c(90,95),fan=FALSE,lambda=NULL)
plot(md)
ts[2,] %>%
auto.arima() %>%
forecast(h=6) %>%
autoplot()
Secara visual, dapat diketahui bahwa hasil peramalannya cenderung hampir sama. Lurus dan tidak berfluktuasi.
accuracy(md)
## ME RMSE MAE MPE MAPE MASE
## Training set 1.322918e-11 17191.59 15008.68 -0.6383277 9.815592 0.999464
## ACF1
## Training set -0.5424719
accuracy(mn)
## ME RMSE MAE MPE MAPE MASE
## Training set -88.54545 17191.82 15016.73 -0.6961367 9.823696 1
## ACF1
## Training set -0.5424719
accuracy(mf)
## ME RMSE MAE MPE MAPE MASE
## Training set -9.701265e-12 10741.26 8868.667 -0.5064612 5.860371 1
Berdasarkan kesalahan peramalan dengan melihat nilai RMSE terkecil dapat diketahui metode random walk dengan drift menghasilkan kesalahan terkecil daripada metode lain.
library(tseries)
adf= adf.test(ts[2,])
adf
##
## Augmented Dickey-Fuller Test
##
## data: ts[2, ]
## Dickey-Fuller = -2.2889, Lag order = 2, p-value = 0.4623
## alternative hypothesis: stationary
Berdasarkan hasil pengujian augmented dickey fuller dengan tujuan mengetahui apakah data stasioner atau tidak, didapatkan keputusan gagal tolak H0 karena pvalue sebesar 0,4623 lebih besar daripada alpha 0,05 sehingga data tidak stationer. Jika data tidak stasioner, maka tidak dapat dilakukan peramalan dengan menggunakan metode ARIMA sebelum dilakukan differencing.
auto.arima(ts[2,])
## Series: ts[2, ]
## ARIMA(0,0,0) with non-zero mean
##
## Coefficients:
## mean
## 154065.833
## s.e. 3100.747
##
## sigma^2 estimated as 125863332: log likelihood=-128.41
## AIC=260.82 AICc=262.15 BIC=261.79
diff_data = diff(ts[2,])
forecast(auto.arima(diff_data))
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## 12 0 -22032.2 22032.2 -33695.35 33695.35
## 13 0 -22032.2 22032.2 -33695.35 33695.35
## 14 0 -22032.2 22032.2 -33695.35 33695.35
## 15 0 -22032.2 22032.2 -33695.35 33695.35
## 16 0 -22032.2 22032.2 -33695.35 33695.35
## 17 0 -22032.2 22032.2 -33695.35 33695.35
## 18 0 -22032.2 22032.2 -33695.35 33695.35
## 19 0 -22032.2 22032.2 -33695.35 33695.35
## 20 0 -22032.2 22032.2 -33695.35 33695.35
## 21 0 -22032.2 22032.2 -33695.35 33695.35
plot(forecast(auto.arima(diff_data)))
Kesimpulan yang dapat diambil bahwa data produksi baik kantor pos surabaya maupun sidoarjo kurang tepat diramalkan menggunakan metode arima karena tidak sesuai dan datanya kurang banyak sehingga kurang representatif.