Analisis ini bertujuan untuk mengkaji hubungan antara Jumlah Pengguna QRIS (X) dan Jumlah Usaha E-commerce (Y) pada beberapa provinsi di Indonesia.
Metode yang digunakan dalam analisis ini meliputi: 1. Statistik deskriptif 2. Visualisasi data 3. Analisis korelasi Pearson 4. Regresi linear sederhana
Melalui analisis ini, diharapkan dapat diketahui arah hubungan, kekuatan hubungan, serta model statistik yang dapat digunakan untuk menjelaskan keterkaitan antara kedua variabel.
Dataset yang digunakan merupakan data jumlah pengguna QRIS dan jumlah usaha e-commerce pada 10 provinsi di Indonesia.
data_qris <- data.frame(
Provinsi = c(
"Jawa Barat",
"Jawa Timur",
"Jawa Tengah",
"DKI Jakarta",
"DI Yogyakarta",
"Banten",
"Bali",
"Sumatera Utara",
"Lampung",
"Sulawesi Selatan"
),
X = c(
14940000,
16410000,
17880000,
19180000,
20650000,
21170000,
22160000,
23710000,
25160000,
26610000
),
Y = c(
642672,
571958,
541072,
253261,
173977,
105384,
86156,
74672,
58792,
51682
)
)
data_qris
## Provinsi X Y
## 1 Jawa Barat 14940000 642672
## 2 Jawa Timur 16410000 571958
## 3 Jawa Tengah 17880000 541072
## 4 DKI Jakarta 19180000 253261
## 5 DI Yogyakarta 20650000 173977
## 6 Banten 21170000 105384
## 7 Bali 22160000 86156
## 8 Sumatera Utara 23710000 74672
## 9 Lampung 25160000 58792
## 10 Sulawesi Selatan 26610000 51682
Berdasarkan tabel data di atas, variabel X menyatakan jumlah pengguna QRIS, sedangkan variabel Y menyatakan jumlah usaha e-commerce. Data menunjukkan bahwa nilai X cenderung meningkat dari satu provinsi ke provinsi berikutnya, sedangkan nilai Y justru cenderung menurun. Secara awal, hal ini memberi indikasi adanya hubungan negatif antara kedua variabel.
Statistik deskriptif digunakan untuk memberikan gambaran umum mengenai data.
summary(data_qris[, c("X","Y")])
## X Y
## Min. :14940000 Min. : 51682
## 1st Qu.:18205000 1st Qu.: 77543
## Median :20910000 Median :139681
## Mean :20787000 Mean :255963
## 3rd Qu.:23322500 3rd Qu.:469119
## Max. :26610000 Max. :642672
sd_X <- sd(data_qris$X)
sd_Y <- sd(data_qris$Y)
sd_X
## [1] 3771289
sd_Y
## [1] 236266.1
Dari hasil statistik deskriptif dapat diketahui nilai minimum, maksimum, median, mean, dan kuartil dari masing-masing variabel.
Secara umum, data memperlihatkan bahwa kenaikan jumlah pengguna QRIS tidak diikuti kenaikan jumlah usaha e-commerce pada dataset ini.
Scatter plot digunakan untuk melihat pola hubungan antara variabel X dan Y.
plot(
data_qris$X,
data_qris$Y,
main = "Scatter Plot Jumlah Pengguna QRIS vs Jumlah Usaha E-commerce",
xlab = "Jumlah Pengguna QRIS (X)",
ylab = "Jumlah Usaha E-commerce (Y)",
pch = 19,
col = "blue"
)
text(
data_qris$X,
data_qris$Y,
labels = data_qris$Provinsi,
pos = 4,
cex = 0.7
)
abline(lm(Y ~ X, data = data_qris), col = "red", lwd = 2)
Berdasarkan scatter plot, terlihat bahwa titik-titik data membentuk pola menurun dari kiri atas ke kanan bawah. Hal ini menunjukkan adanya kecenderungan hubungan negatif antara jumlah pengguna QRIS dan jumlah usaha e-commerce. Garis regresi yang menurun juga mendukung dugaan bahwa semakin besar jumlah pengguna QRIS, maka jumlah usaha e-commerce pada data ini cenderung semakin kecil.
Analisis korelasi Pearson digunakan untuk mengetahui arah dan kekuatan hubungan antara kedua variabel.
nilai_korelasi <- cor(data_qris$X, data_qris$Y)
nilai_korelasi
## [1] -0.914041
uji_korelasi <- cor.test(data_qris$X, data_qris$Y, method = "pearson")
uji_korelasi
##
## Pearson's product-moment correlation
##
## data: data_qris$X and data_qris$Y
## t = -6.3737, df = 8, p-value = 0.0002151
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.9797925 -0.6700062
## sample estimates:
## cor
## -0.914041
Nilai korelasi Pearson menunjukkan arah dan kekuatan hubungan linear antara variabel X dan Y.
Pada hasil ini, nilai korelasi bernilai negatif, sehingga dapat disimpulkan bahwa hubungan antara jumlah pengguna QRIS dan jumlah usaha e-commerce bersifat berlawanan arah. Artinya, ketika jumlah pengguna QRIS meningkat, jumlah usaha e-commerce pada data ini cenderung menurun.
Nilai p-value dari cor.test() digunakan
untuk menguji signifikansi hubungan: - Jika p-value <
0,05, maka hubungan dianggap signifikan secara statistik. -
Jika p-value > 0,05, maka hubungan tidak signifikan
secara statistik.
Model regresi linear sederhana digunakan untuk memodelkan pengaruh variabel X terhadap Y.
Model umum: \[ Y = \beta_0 + \beta_1 X + \varepsilon \]
model <- lm(Y ~ X, data = data_qris)
summary(model)
##
## Call:
## lm(formula = Y ~ X, data = data_qris)
##
## Residuals:
## Min 1Q Median 3Q Max
## -128647 -90846 18990 62326 129164
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.446e+06 1.895e+05 7.632 6.12e-05 ***
## X -5.726e-02 8.984e-03 -6.374 0.000215 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 101600 on 8 degrees of freedom
## Multiple R-squared: 0.8355, Adjusted R-squared: 0.8149
## F-statistic: 40.62 on 1 and 8 DF, p-value: 0.0002151
coef(model)
## (Intercept) X
## 1.446297e+06 -5.726341e-02
b0 <- coef(model)[1]
b1 <- coef(model)[2]
cat("Persamaan regresi yang diperoleh adalah:\n\n")
Persamaan regresi yang diperoleh adalah:
cat("Y =", round(b0, 3), "+ (", round(b1, 6), ")X")
Y = 1446297 + ( -0.057263 )X
Dari hasil model regresi linear sederhana diperoleh persamaan regresi:
\[ \hat{Y} = \beta_0 + \beta_1 X \]
Interpretasinya adalah sebagai berikut:
Nilai p-value pada output
summary(model) digunakan untuk melihat apakah variabel X
berpengaruh signifikan terhadap Y.
data_qris$Prediksi_Y <- predict(model)
data_qris$Residual <- resid(model)
data_qris
## Provinsi X Y Prediksi_Y Residual
## 1 Jawa Barat 14940000 642672 590781.736 51890.26
## 2 Jawa Timur 16410000 571958 506604.529 65353.47
## 3 Jawa Tengah 17880000 541072 422427.322 118644.68
## 4 DKI Jakarta 19180000 253261 347984.894 -94723.89
## 5 DI Yogyakarta 20650000 173977 263807.687 -89830.69
## 6 Banten 21170000 105384 234030.715 -128646.72
## 7 Bali 22160000 86156 177339.943 -91183.94
## 8 Sumatera Utara 23710000 74672 88581.664 -13909.66
## 9 Lampung 25160000 58792 5549.725 53242.28
## 10 Sulawesi Selatan 26610000 51682 -77482.214 129164.21
Nilai prediksi menunjukkan hasil estimasi jumlah usaha e-commerce berdasarkan model regresi. Residual merupakan selisih antara nilai aktual dan nilai prediksi.
Plot diagnostik digunakan untuk memeriksa asumsi dasar regresi linear.
par(mfrow = c(2,2))
plot(model)
par(mfrow = c(1,1))
Empat plot diagnostik memiliki fungsi sebagai berikut:
Residuals vs Fitted
Digunakan untuk melihat apakah terdapat pola tertentu pada residual.
Jika titik menyebar acak, maka asumsi linearitas cukup
terpenuhi.
Normal Q-Q
Digunakan untuk memeriksa apakah residual berdistribusi normal. Jika
titik-titik mengikuti garis diagonal, maka asumsi normalitas residual
cukup baik.
Scale-Location
Digunakan untuk memeriksa homogenitas varians residual. Jika titik
menyebar merata, maka varians residual dapat dianggap homogen.
Residuals vs Leverage
Digunakan untuk mendeteksi adanya observasi yang terlalu berpengaruh
terhadap model.
r2 <- summary(model)$r.squared
adj_r2 <- summary(model)$adj.r.squared
r2
## [1] 0.835471
adj_r2
## [1] 0.8149049
Nilai R-squared menunjukkan proporsi variasi variabel Y yang dapat dijelaskan oleh variabel X.
Sebagai interpretasi, jika nilai R-squared tinggi, maka jumlah pengguna QRIS mampu menjelaskan sebagian besar variasi jumlah usaha e-commerce pada data ini.
Berdasarkan hasil analisis statistik yang telah dilakukan, dapat disimpulkan bahwa:
knitr::kable(
data_qris,
caption = "Data Jumlah Pengguna QRIS dan Jumlah Usaha E-commerce"
)
| Provinsi | X | Y | Prediksi_Y | Residual |
|---|---|---|---|---|
| Jawa Barat | 14940000 | 642672 | 590781.736 | 51890.26 |
| Jawa Timur | 16410000 | 571958 | 506604.529 | 65353.47 |
| Jawa Tengah | 17880000 | 541072 | 422427.322 | 118644.68 |
| DKI Jakarta | 19180000 | 253261 | 347984.894 | -94723.89 |
| DI Yogyakarta | 20650000 | 173977 | 263807.687 | -89830.69 |
| Banten | 21170000 | 105384 | 234030.715 | -128646.72 |
| Bali | 22160000 | 86156 | 177339.943 | -91183.94 |
| Sumatera Utara | 23710000 | 74672 | 88581.664 | -13909.66 |
| Lampung | 25160000 | 58792 | 5549.725 | 53242.28 |
| Sulawesi Selatan | 26610000 | 51682 | -77482.214 | 129164.21 |