Pendahuluan

Analisis ini bertujuan untuk mengkaji hubungan antara Jumlah Pengguna QRIS (X) dan Jumlah Usaha E-commerce (Y) pada beberapa provinsi di Indonesia.

Metode yang digunakan dalam analisis ini meliputi: 1. Statistik deskriptif 2. Visualisasi data 3. Analisis korelasi Pearson 4. Regresi linear sederhana

Melalui analisis ini, diharapkan dapat diketahui arah hubungan, kekuatan hubungan, serta model statistik yang dapat digunakan untuk menjelaskan keterkaitan antara kedua variabel.

Dataset

Dataset yang digunakan merupakan data jumlah pengguna QRIS dan jumlah usaha e-commerce pada 10 provinsi di Indonesia.

data_qris <- data.frame(
  Provinsi = c(
    "Jawa Barat",
    "Jawa Timur",
    "Jawa Tengah",
    "DKI Jakarta",
    "DI Yogyakarta",
    "Banten",
    "Bali",
    "Sumatera Utara",
    "Lampung",
    "Sulawesi Selatan"
  ),
  X = c(
    14940000,
    16410000,
    17880000,
    19180000,
    20650000,
    21170000,
    22160000,
    23710000,
    25160000,
    26610000
  ),
  Y = c(
    642672,
    571958,
    541072,
    253261,
    173977,
    105384,
    86156,
    74672,
    58792,
    51682
  )
)

data_qris
##            Provinsi        X      Y
## 1        Jawa Barat 14940000 642672
## 2        Jawa Timur 16410000 571958
## 3       Jawa Tengah 17880000 541072
## 4       DKI Jakarta 19180000 253261
## 5     DI Yogyakarta 20650000 173977
## 6            Banten 21170000 105384
## 7              Bali 22160000  86156
## 8    Sumatera Utara 23710000  74672
## 9           Lampung 25160000  58792
## 10 Sulawesi Selatan 26610000  51682

Interpretasi Dataset

Berdasarkan tabel data di atas, variabel X menyatakan jumlah pengguna QRIS, sedangkan variabel Y menyatakan jumlah usaha e-commerce. Data menunjukkan bahwa nilai X cenderung meningkat dari satu provinsi ke provinsi berikutnya, sedangkan nilai Y justru cenderung menurun. Secara awal, hal ini memberi indikasi adanya hubungan negatif antara kedua variabel.

Statistik Deskriptif

Statistik deskriptif digunakan untuk memberikan gambaran umum mengenai data.

summary(data_qris[, c("X","Y")])
##        X                  Y         
##  Min.   :14940000   Min.   : 51682  
##  1st Qu.:18205000   1st Qu.: 77543  
##  Median :20910000   Median :139681  
##  Mean   :20787000   Mean   :255963  
##  3rd Qu.:23322500   3rd Qu.:469119  
##  Max.   :26610000   Max.   :642672
sd_X <- sd(data_qris$X)
sd_Y <- sd(data_qris$Y)

sd_X
## [1] 3771289
sd_Y
## [1] 236266.1

Interpretasi Statistik Deskriptif

Dari hasil statistik deskriptif dapat diketahui nilai minimum, maksimum, median, mean, dan kuartil dari masing-masing variabel.

  • Variabel X memiliki rentang nilai dari 14.940.000 hingga 26.610.000.
  • Variabel Y memiliki rentang nilai dari 51.682 hingga 642.672.
  • Rata-rata dan sebaran data menunjukkan bahwa jumlah pengguna QRIS cukup besar, sedangkan jumlah usaha e-commerce memiliki variasi yang cukup lebar.
  • Nilai simpangan baku pada kedua variabel menunjukkan adanya penyebaran data terhadap rata-ratanya.

Secara umum, data memperlihatkan bahwa kenaikan jumlah pengguna QRIS tidak diikuti kenaikan jumlah usaha e-commerce pada dataset ini.

Visualisasi Data

Scatter plot digunakan untuk melihat pola hubungan antara variabel X dan Y.

plot(
  data_qris$X,
  data_qris$Y,
  main = "Scatter Plot Jumlah Pengguna QRIS vs Jumlah Usaha E-commerce",
  xlab = "Jumlah Pengguna QRIS (X)",
  ylab = "Jumlah Usaha E-commerce (Y)",
  pch = 19,
  col = "blue"
)

text(
  data_qris$X,
  data_qris$Y,
  labels = data_qris$Provinsi,
  pos = 4,
  cex = 0.7
)

abline(lm(Y ~ X, data = data_qris), col = "red", lwd = 2)

Interpretasi Scatter Plot

Berdasarkan scatter plot, terlihat bahwa titik-titik data membentuk pola menurun dari kiri atas ke kanan bawah. Hal ini menunjukkan adanya kecenderungan hubungan negatif antara jumlah pengguna QRIS dan jumlah usaha e-commerce. Garis regresi yang menurun juga mendukung dugaan bahwa semakin besar jumlah pengguna QRIS, maka jumlah usaha e-commerce pada data ini cenderung semakin kecil.

Analisis Korelasi

Analisis korelasi Pearson digunakan untuk mengetahui arah dan kekuatan hubungan antara kedua variabel.

nilai_korelasi <- cor(data_qris$X, data_qris$Y)
nilai_korelasi
## [1] -0.914041
uji_korelasi <- cor.test(data_qris$X, data_qris$Y, method = "pearson")
uji_korelasi
## 
##  Pearson's product-moment correlation
## 
## data:  data_qris$X and data_qris$Y
## t = -6.3737, df = 8, p-value = 0.0002151
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.9797925 -0.6700062
## sample estimates:
##       cor 
## -0.914041

Interpretasi Korelasi

Nilai korelasi Pearson menunjukkan arah dan kekuatan hubungan linear antara variabel X dan Y.

  • Jika nilai korelasi mendekati -1, maka hubungan bersifat negatif sangat kuat.
  • Jika nilai korelasi mendekati 0, maka hubungan linear lemah.
  • Jika nilai korelasi mendekati 1, maka hubungan bersifat positif sangat kuat.

Pada hasil ini, nilai korelasi bernilai negatif, sehingga dapat disimpulkan bahwa hubungan antara jumlah pengguna QRIS dan jumlah usaha e-commerce bersifat berlawanan arah. Artinya, ketika jumlah pengguna QRIS meningkat, jumlah usaha e-commerce pada data ini cenderung menurun.

Nilai p-value dari cor.test() digunakan untuk menguji signifikansi hubungan: - Jika p-value < 0,05, maka hubungan dianggap signifikan secara statistik. - Jika p-value > 0,05, maka hubungan tidak signifikan secara statistik.

Model Regresi Linear Sederhana

Model regresi linear sederhana digunakan untuk memodelkan pengaruh variabel X terhadap Y.

Model umum: \[ Y = \beta_0 + \beta_1 X + \varepsilon \]

model <- lm(Y ~ X, data = data_qris)
summary(model)
## 
## Call:
## lm(formula = Y ~ X, data = data_qris)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -128647  -90846   18990   62326  129164 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.446e+06  1.895e+05   7.632 6.12e-05 ***
## X           -5.726e-02  8.984e-03  -6.374 0.000215 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 101600 on 8 degrees of freedom
## Multiple R-squared:  0.8355, Adjusted R-squared:  0.8149 
## F-statistic: 40.62 on 1 and 8 DF,  p-value: 0.0002151

Koefisien Regresi

coef(model)
##   (Intercept)             X 
##  1.446297e+06 -5.726341e-02
b0 <- coef(model)[1]
b1 <- coef(model)[2]

cat("Persamaan regresi yang diperoleh adalah:\n\n")

Persamaan regresi yang diperoleh adalah:

cat("Y =", round(b0, 3), "+ (", round(b1, 6), ")X")

Y = 1446297 + ( -0.057263 )X

Interpretasi Regresi

Dari hasil model regresi linear sederhana diperoleh persamaan regresi:

\[ \hat{Y} = \beta_0 + \beta_1 X \]

Interpretasinya adalah sebagai berikut:

  • Intercept (\(\beta_0\)) merupakan nilai prediksi Y ketika X = 0.
  • Koefisien slope (\(\beta_1\)) menunjukkan perubahan rata-rata Y untuk setiap kenaikan 1 satuan X.
  • Jika koefisien slope bernilai negatif, maka setiap kenaikan jumlah pengguna QRIS akan diikuti penurunan jumlah usaha e-commerce pada model ini.

Nilai p-value pada output summary(model) digunakan untuk melihat apakah variabel X berpengaruh signifikan terhadap Y.

  • Jika p-value < 0,05, maka X berpengaruh signifikan terhadap Y.
  • Jika p-value > 0,05, maka pengaruh X terhadap Y tidak signifikan.

Prediksi dan Residual

data_qris$Prediksi_Y <- predict(model)
data_qris$Residual <- resid(model)

data_qris
##            Provinsi        X      Y Prediksi_Y   Residual
## 1        Jawa Barat 14940000 642672 590781.736   51890.26
## 2        Jawa Timur 16410000 571958 506604.529   65353.47
## 3       Jawa Tengah 17880000 541072 422427.322  118644.68
## 4       DKI Jakarta 19180000 253261 347984.894  -94723.89
## 5     DI Yogyakarta 20650000 173977 263807.687  -89830.69
## 6            Banten 21170000 105384 234030.715 -128646.72
## 7              Bali 22160000  86156 177339.943  -91183.94
## 8    Sumatera Utara 23710000  74672  88581.664  -13909.66
## 9           Lampung 25160000  58792   5549.725   53242.28
## 10 Sulawesi Selatan 26610000  51682 -77482.214  129164.21

Interpretasi Prediksi dan Residual

Nilai prediksi menunjukkan hasil estimasi jumlah usaha e-commerce berdasarkan model regresi. Residual merupakan selisih antara nilai aktual dan nilai prediksi.

  • Residual yang kecil menunjukkan prediksi model cukup dekat dengan data aktual.
  • Residual positif berarti nilai aktual lebih besar dari prediksi.
  • Residual negatif berarti nilai aktual lebih kecil dari prediksi.

Diagnostik Model

Plot diagnostik digunakan untuk memeriksa asumsi dasar regresi linear.

par(mfrow = c(2,2))
plot(model)

par(mfrow = c(1,1))

Interpretasi Diagnostik Model

Empat plot diagnostik memiliki fungsi sebagai berikut:

  1. Residuals vs Fitted
    Digunakan untuk melihat apakah terdapat pola tertentu pada residual. Jika titik menyebar acak, maka asumsi linearitas cukup terpenuhi.

  2. Normal Q-Q
    Digunakan untuk memeriksa apakah residual berdistribusi normal. Jika titik-titik mengikuti garis diagonal, maka asumsi normalitas residual cukup baik.

  3. Scale-Location
    Digunakan untuk memeriksa homogenitas varians residual. Jika titik menyebar merata, maka varians residual dapat dianggap homogen.

  4. Residuals vs Leverage
    Digunakan untuk mendeteksi adanya observasi yang terlalu berpengaruh terhadap model.

Koefisien Determinasi

r2 <- summary(model)$r.squared
adj_r2 <- summary(model)$adj.r.squared

r2
## [1] 0.835471
adj_r2
## [1] 0.8149049

Interpretasi Koefisien Determinasi

Nilai R-squared menunjukkan proporsi variasi variabel Y yang dapat dijelaskan oleh variabel X.

  • Semakin besar nilai R-squared, semakin baik model dalam menjelaskan variasi data.
  • Nilai Adjusted R-squared merupakan versi penyesuaian dari R-squared yang mempertimbangkan jumlah variabel dalam model.

Sebagai interpretasi, jika nilai R-squared tinggi, maka jumlah pengguna QRIS mampu menjelaskan sebagian besar variasi jumlah usaha e-commerce pada data ini.

Kesimpulan

Berdasarkan hasil analisis statistik yang telah dilakukan, dapat disimpulkan bahwa:

  1. Terdapat hubungan antara jumlah pengguna QRIS dan jumlah usaha e-commerce pada data 10 provinsi.
  2. Arah hubungan antara kedua variabel bersifat negatif, yang berarti ketika jumlah pengguna QRIS meningkat, jumlah usaha e-commerce pada data ini cenderung menurun.
  3. Hasil korelasi Pearson menunjukkan kekuatan hubungan linear antara kedua variabel.
  4. Model regresi linear sederhana dapat digunakan untuk menjelaskan hubungan antara variabel X dan Y.
  5. Nilai p-value pada uji korelasi dan regresi digunakan untuk menentukan apakah hubungan tersebut signifikan secara statistik.
  6. Nilai koefisien determinasi menunjukkan seberapa besar variasi jumlah usaha e-commerce dapat dijelaskan oleh jumlah pengguna QRIS.

Lampiran Tabel Data

knitr::kable(
  data_qris,
  caption = "Data Jumlah Pengguna QRIS dan Jumlah Usaha E-commerce"
)
Data Jumlah Pengguna QRIS dan Jumlah Usaha E-commerce
Provinsi X Y Prediksi_Y Residual
Jawa Barat 14940000 642672 590781.736 51890.26
Jawa Timur 16410000 571958 506604.529 65353.47
Jawa Tengah 17880000 541072 422427.322 118644.68
DKI Jakarta 19180000 253261 347984.894 -94723.89
DI Yogyakarta 20650000 173977 263807.687 -89830.69
Banten 21170000 105384 234030.715 -128646.72
Bali 22160000 86156 177339.943 -91183.94
Sumatera Utara 23710000 74672 88581.664 -13909.66
Lampung 25160000 58792 5549.725 53242.28
Sulawesi Selatan 26610000 51682 -77482.214 129164.21