Regresi Linear Berganda adalah metode statistik yang digunakan untuk memodelkan hubungan antara satu variabel dependen (respons) dan dua atau lebih variabel independen (prediktor).
Tujuan dari analisis ini adalah untuk memahami bagaimana setiap variabel independen mempengaruhi variabel dependen serta untuk memprediksi nilai variabel dependen berdasarkan kombinasi nilai variabel independen.
Variabel Dependen Variabel dependen adalah variabel yang dipengaruhi oleh variabel independen. Variabel ini merupakan variabel yang akan diamati untuk melihat adanya perubahan atau pengaruh dari variabel independen.
Variabel Independen Variabel independen merupakan faktor atau elemen yang dianggap sebagai penyebab atau pengaruh terhadap perubahan pada variabel lainnya. Dalam penelitian, variabel independen adalah variabel yang dikontrol dan dimanipulasi oleh peneliti untuk melihat efeknya terhadap variabel dependen.
Kriminalitas merupakan salah satu masalah sosial yang kompleks dan sering terjadi di berbagai wilayah, termasuk di Provinsi Sumatera Barat. Tingkat kriminalitas yang tinggi dapat berdampak negatif pada kehidupan masyarakat, baik secara ekonomi, sosial, maupun keamanan. Oleh karena itu, penting untuk memahami faktor-faktor yang dapat mempengaruhi tingkat kriminalitas di suatu daerah.
Dalam studi kasus ini, kami akan menganalisis faktor-faktor yang mempengaruhi tingkat kriminalitas di Sumatera Barat pada tahun 2022 menggunakan analisis regresi linear berganda.
Dataset yang digunakan terdiri dari satu variabel terikat (Jumlah Kriminal di Sumatera Barat Tahun 2022) dan empat variabel bebas: • Tingkat Pengangguraan Terbuka (X1)
• Pengeluaran Perkapita (X2)
• Rata-Rata Gaji Bersih Buruh/Karyawan Perbulannya (X3)
• Jumlah Penduduk (X4)
• Penyelesaian Tindak Pidana Menurut Kepolisian Resort di Provinsi Sumatera Barat (X5)
Data ini diperoleh dari Badan Pusat Statistika Sumatera Barat Tahun 2022.
Uji Normalitas Uji normalitas adalah untuk melihat apakah nilai residu terdistribusi normal atau tidak.
Uji Multikolinearitas Uji multikolinearitas dirancang untuk menentukan apakah ada korelasi yang tinggi antara variabel independen dalam model regresi linear berganda.
Uji Heteroskedastisitas Uji Heteroskedastisitas yang diperiksa adalah apakah ada perbedaan yang tidak sama antara satu residu dan pengamatan lain.
Uji Autokorelasi Uji autokorelasi adalah untuk melihat apakah terjadi korelasi antara suatu periode t dengan periode sebelumnya (t-1).
Uji Linearitas Uji linearitas dipergunakan untuk melihat apakah model yang dibangun mempunyai hubungan linear atau tidak.
library(readxl)
Faktor_faktor_yang_mempengaruhi_Kriminalitas_2 <- read_excel("Faktor-faktor yang mempengaruhi Kriminalitas (2).xlsx")
print(Faktor_faktor_yang_mempengaruhi_Kriminalitas_2)
## # A tibble: 19 × 6
## Jumlah Kejahatan Yang Dilapor…¹ Tingkat Pengangguran…² Pengeluaran Perkapit…³
## <dbl> <dbl> <dbl>
## 1 55 1.39 15631
## 2 469 4.61 21904
## 3 228 5.89 24911
## 4 308 4.87 25642
## 5 284 5.91 22973
## 6 394 6.6 26469
## 7 242 4.93 22395
## 8 221 3.72 23409
## 9 210 5.38 19552
## 10 265 3.71 23416
## 11 259 6.23 25626
## 12 653 6.33 20472
## 13 1542 11.7 35465
## 14 304 3.9 27386
## 15 65 5 24371
## 16 169 4.84 21090
## 17 411 4.9 27918
## 18 604 5.16 28829
## 19 320 5.19 27105
## # ℹ abbreviated names: ¹`Jumlah Kejahatan Yang Dilaporkan Tahun 2022`,
## # ²`Tingkat Pengangguran Terbuka (%)`, ³`Pengeluaran Perkapita`
## # ℹ 3 more variables: `Rata-rata Gaji Bersih Perbulan` <dbl>,
## # `Jumlah Penduduk` <dbl>, `Penyelesaian Tindak Pidana (%)` <dbl>
# Membuat data frame menjadi matriks
Matriks <- data.matrix(Faktor_faktor_yang_mempengaruhi_Kriminalitas_2)
Matriks
## Jumlah Kejahatan Yang Dilaporkan Tahun 2022
## [1,] 55
## [2,] 469
## [3,] 228
## [4,] 308
## [5,] 284
## [6,] 394
## [7,] 242
## [8,] 221
## [9,] 210
## [10,] 265
## [11,] 259
## [12,] 653
## [13,] 1542
## [14,] 304
## [15,] 65
## [16,] 169
## [17,] 411
## [18,] 604
## [19,] 320
## Tingkat Pengangguran Terbuka (%) Pengeluaran Perkapita
## [1,] 1.39 15631
## [2,] 4.61 21904
## [3,] 5.89 24911
## [4,] 4.87 25642
## [5,] 5.91 22973
## [6,] 6.60 26469
## [7,] 4.93 22395
## [8,] 3.72 23409
## [9,] 5.38 19552
## [10,] 3.71 23416
## [11,] 6.23 25626
## [12,] 6.33 20472
## [13,] 11.69 35465
## [14,] 3.90 27386
## [15,] 5.00 24371
## [16,] 4.84 21090
## [17,] 4.90 27918
## [18,] 5.16 28829
## [19,] 5.19 27105
## Rata-rata Gaji Bersih Perbulan Jumlah Penduduk
## [1,] 1987340 89401
## [2,] 2271905 516518
## [3,] 3339847 397829
## [4,] 2520604 240317
## [5,] 2190273 376276
## [6,] 2363643 436129
## [7,] 2447970 540905
## [8,] 2028035 388375
## [9,] 2050318 307425
## [10,] 2234342 188649
## [11,] 2514387 234713
## [12,] 2297547 442479
## [13,] 3251587 919145
## [14,] 3265495 75850
## [15,] 2525053 66413
## [16,] 3301995 57850
## [17,] 2831386 122311
## [18,] 3012114 143325
## [19,] 2214211 96719
## Penyelesaian Tindak Pidana (%)
## [1,] 73
## [2,] 75
## [3,] 77
## [4,] 85
## [5,] 96
## [6,] 83
## [7,] 74
## [8,] 51
## [9,] 70
## [10,] 42
## [11,] 83
## [12,] 91
## [13,] 123
## [14,] 94
## [15,] 68
## [16,] 71
## [17,] 76
## [18,] 52
## [19,] 85
# Membuat Matriks 1
Matriks.1 <- matrix(data = rep(x = 1, times = 19))
Matriks.1
## [,1]
## [1,] 1
## [2,] 1
## [3,] 1
## [4,] 1
## [5,] 1
## [6,] 1
## [7,] 1
## [8,] 1
## [9,] 1
## [10,] 1
## [11,] 1
## [12,] 1
## [13,] 1
## [14,] 1
## [15,] 1
## [16,] 1
## [17,] 1
## [18,] 1
## [19,] 1
# Membuat Matriks Y
Y <- Matriks[,1]
Y
## [1] 55 469 228 308 284 394 242 221 210 265 259 653 1542 304 65
## [16] 169 411 604 320
# Membuat Matriks X1, X2, X3, X4, X5
X <- Matriks[,2:6]
X
## Tingkat Pengangguran Terbuka (%) Pengeluaran Perkapita
## [1,] 1.39 15631
## [2,] 4.61 21904
## [3,] 5.89 24911
## [4,] 4.87 25642
## [5,] 5.91 22973
## [6,] 6.60 26469
## [7,] 4.93 22395
## [8,] 3.72 23409
## [9,] 5.38 19552
## [10,] 3.71 23416
## [11,] 6.23 25626
## [12,] 6.33 20472
## [13,] 11.69 35465
## [14,] 3.90 27386
## [15,] 5.00 24371
## [16,] 4.84 21090
## [17,] 4.90 27918
## [18,] 5.16 28829
## [19,] 5.19 27105
## Rata-rata Gaji Bersih Perbulan Jumlah Penduduk
## [1,] 1987340 89401
## [2,] 2271905 516518
## [3,] 3339847 397829
## [4,] 2520604 240317
## [5,] 2190273 376276
## [6,] 2363643 436129
## [7,] 2447970 540905
## [8,] 2028035 388375
## [9,] 2050318 307425
## [10,] 2234342 188649
## [11,] 2514387 234713
## [12,] 2297547 442479
## [13,] 3251587 919145
## [14,] 3265495 75850
## [15,] 2525053 66413
## [16,] 3301995 57850
## [17,] 2831386 122311
## [18,] 3012114 143325
## [19,] 2214211 96719
## Penyelesaian Tindak Pidana (%)
## [1,] 73
## [2,] 75
## [3,] 77
## [4,] 85
## [5,] 96
## [6,] 83
## [7,] 74
## [8,] 51
## [9,] 70
## [10,] 42
## [11,] 83
## [12,] 91
## [13,] 123
## [14,] 94
## [15,] 68
## [16,] 71
## [17,] 76
## [18,] 52
## [19,] 85
# Menggabungkan Matriks 1 dan Matriks X
X1_X2_1 <- cbind(Matriks.1, X)
X1_X2_1
## Tingkat Pengangguran Terbuka (%) Pengeluaran Perkapita
## [1,] 1 1.39 15631
## [2,] 1 4.61 21904
## [3,] 1 5.89 24911
## [4,] 1 4.87 25642
## [5,] 1 5.91 22973
## [6,] 1 6.60 26469
## [7,] 1 4.93 22395
## [8,] 1 3.72 23409
## [9,] 1 5.38 19552
## [10,] 1 3.71 23416
## [11,] 1 6.23 25626
## [12,] 1 6.33 20472
## [13,] 1 11.69 35465
## [14,] 1 3.90 27386
## [15,] 1 5.00 24371
## [16,] 1 4.84 21090
## [17,] 1 4.90 27918
## [18,] 1 5.16 28829
## [19,] 1 5.19 27105
## Rata-rata Gaji Bersih Perbulan Jumlah Penduduk
## [1,] 1987340 89401
## [2,] 2271905 516518
## [3,] 3339847 397829
## [4,] 2520604 240317
## [5,] 2190273 376276
## [6,] 2363643 436129
## [7,] 2447970 540905
## [8,] 2028035 388375
## [9,] 2050318 307425
## [10,] 2234342 188649
## [11,] 2514387 234713
## [12,] 2297547 442479
## [13,] 3251587 919145
## [14,] 3265495 75850
## [15,] 2525053 66413
## [16,] 3301995 57850
## [17,] 2831386 122311
## [18,] 3012114 143325
## [19,] 2214211 96719
## Penyelesaian Tindak Pidana (%)
## [1,] 73
## [2,] 75
## [3,] 77
## [4,] 85
## [5,] 96
## [6,] 83
## [7,] 74
## [8,] 51
## [9,] 70
## [10,] 42
## [11,] 83
## [12,] 91
## [13,] 123
## [14,] 94
## [15,] 68
## [16,] 71
## [17,] 76
## [18,] 52
## [19,] 85
# Transpose Matriks X1_X2_1
I = t(X1_X2_1)
I
## [,1] [,2] [,3] [,4]
## 1.00 1.00 1.00 1.00
## Tingkat Pengangguran Terbuka (%) 1.39 4.61 5.89 4.87
## Pengeluaran Perkapita 15631.00 21904.00 24911.00 25642.00
## Rata-rata Gaji Bersih Perbulan 1987340.00 2271905.00 3339847.00 2520604.00
## Jumlah Penduduk 89401.00 516518.00 397829.00 240317.00
## Penyelesaian Tindak Pidana (%) 73.00 75.00 77.00 85.00
## [,5] [,6] [,7] [,8]
## 1.00 1.0 1.00 1.00
## Tingkat Pengangguran Terbuka (%) 5.91 6.6 4.93 3.72
## Pengeluaran Perkapita 22973.00 26469.0 22395.00 23409.00
## Rata-rata Gaji Bersih Perbulan 2190273.00 2363643.0 2447970.00 2028035.00
## Jumlah Penduduk 376276.00 436129.0 540905.00 388375.00
## Penyelesaian Tindak Pidana (%) 96.00 83.0 74.00 51.00
## [,9] [,10] [,11] [,12]
## 1.00 1.00 1.00 1.00
## Tingkat Pengangguran Terbuka (%) 5.38 3.71 6.23 6.33
## Pengeluaran Perkapita 19552.00 23416.00 25626.00 20472.00
## Rata-rata Gaji Bersih Perbulan 2050318.00 2234342.00 2514387.00 2297547.00
## Jumlah Penduduk 307425.00 188649.00 234713.00 442479.00
## Penyelesaian Tindak Pidana (%) 70.00 42.00 83.00 91.00
## [,13] [,14] [,15] [,16]
## 1.00 1.0 1 1.00
## Tingkat Pengangguran Terbuka (%) 11.69 3.9 5 4.84
## Pengeluaran Perkapita 35465.00 27386.0 24371 21090.00
## Rata-rata Gaji Bersih Perbulan 3251587.00 3265495.0 2525053 3301995.00
## Jumlah Penduduk 919145.00 75850.0 66413 57850.00
## Penyelesaian Tindak Pidana (%) 123.00 94.0 68 71.00
## [,17] [,18] [,19]
## 1.0 1.00 1.00
## Tingkat Pengangguran Terbuka (%) 4.9 5.16 5.19
## Pengeluaran Perkapita 27918.0 28829.00 27105.00
## Rata-rata Gaji Bersih Perbulan 2831386.0 3012114.00 2214211.00
## Jumlah Penduduk 122311.0 143325.00 96719.00
## Penyelesaian Tindak Pidana (%) 76.0 52.00 85.00
# Perkalian Matriks X'X
Xt_X <- I%*%X1_X2_1
Xt_X
## Tingkat Pengangguran Terbuka (%)
## 19.00 1.002500e+02
## Tingkat Pengangguran Terbuka (%) 100.25 5.976783e+02
## Pengeluaran Perkapita 464564.00 2.555115e+06
## Rata-rata Gaji Bersih Perbulan 48648052.00 2.631299e+08
## Jumlah Penduduk 5640629.00 3.534315e+07
## Penyelesaian Tindak Pidana (%) 1469.00 8.179920e+03
## Pengeluaran Perkapita
## 4.645640e+05
## Tingkat Pengangguran Terbuka (%) 2.555115e+06
## Pengeluaran Perkapita 1.167815e+10
## Rata-rata Gaji Bersih Perbulan 1.209536e+12
## Jumlah Penduduk 1.433597e+11
## Penyelesaian Tindak Pidana (%) 3.649292e+07
## Rata-rata Gaji Bersih Perbulan Jumlah Penduduk
## 4.864805e+07 5.640629e+06
## Tingkat Pengangguran Terbuka (%) 2.631299e+08 3.534315e+07
## Pengeluaran Perkapita 1.209536e+12 1.433597e+11
## Rata-rata Gaji Bersih Perbulan 1.284133e+14 1.449820e+13
## Jumlah Penduduk 1.449820e+13 2.550180e+12
## Penyelesaian Tindak Pidana (%) 3.806122e+09 4.714478e+08
## Penyelesaian Tindak Pidana (%)
## 1.469000e+03
## Tingkat Pengangguran Terbuka (%) 8.179920e+03
## Pengeluaran Perkapita 3.649292e+07
## Rata-rata Gaji Bersih Perbulan 3.806122e+09
## Jumlah Penduduk 4.714478e+08
## Penyelesaian Tindak Pidana (%) 1.194590e+05
# Invers matriks X'X atau (X’X)^-1
Xt_X_inv = solve(Xt_X)
Xt_X_inv
## Tingkat Pengangguran Terbuka (%)
## 3.505730e+00 2.729336e-01
## Tingkat Pengangguran Terbuka (%) 2.729336e-01 7.902450e-02
## Pengeluaran Perkapita -9.690215e-05 -1.466504e-05
## Rata-rata Gaji Bersih Perbulan -4.261072e-07 -2.562269e-08
## Jumlah Penduduk -8.300771e-07 -3.221668e-07
## Penyelesaian Tindak Pidana (%) -1.534497e-02 -2.199712e-03
## Pengeluaran Perkapita
## -9.690215e-05
## Tingkat Pengangguran Terbuka (%) -1.466504e-05
## Pengeluaran Perkapita 8.283376e-09
## Rata-rata Gaji Bersih Perbulan -2.159891e-11
## Jumlah Penduduk 3.461811e-11
## Penyelesaian Tindak Pidana (%) 2.169027e-07
## Rata-rata Gaji Bersih Perbulan Jumlah Penduduk
## -4.261072e-07 -8.300771e-07
## Tingkat Pengangguran Terbuka (%) -2.562269e-08 -3.221668e-07
## Pengeluaran Perkapita -2.159891e-11 3.461811e-11
## Rata-rata Gaji Bersih Perbulan 4.236511e-13 3.172950e-13
## Jumlah Penduduk 3.172950e-13 2.965026e-12
## Penyelesaian Tindak Pidana (%) -1.157763e-09 -1.184743e-10
## Penyelesaian Tindak Pidana (%)
## -1.534497e-02
## Tingkat Pengangguran Terbuka (%) -2.199712e-03
## Pengeluaran Perkapita 2.169027e-07
## Rata-rata Gaji Bersih Perbulan -1.157763e-09
## Jumlah Penduduk -1.184743e-10
## Penyelesaian Tindak Pidana (%) 3.187894e-04
# Perkalian Matriks X'Y
Xt_Y = I%*%Y
Xt_Y
## [,1]
## 7.003000e+03
## Tingkat Pengangguran Terbuka (%) 4.638133e+04
## Pengeluaran Perkapita 1.882940e+08
## Rata-rata Gaji Bersih Perbulan 1.890115e+10
## Jumlah Penduduk 2.993856e+09
## Penyelesaian Tindak Pidana (%) 6.033260e+05
# Parameter Regresi (β) : (X'X)^-1 X'Y
B = Xt_X_inv%*%Xt_Y
B
## [,1]
## -8.335197e+02
## Tingkat Pengangguran Terbuka (%) 3.931258e+01
## Pengeluaran Perkapita 2.718078e-02
## Rata-rata Gaji Bersih Perbulan 1.953162e-05
## Jumlah Penduduk 5.654549e-04
## Penyelesaian Tindak Pidana (%) 1.451246e+00
# Analisis Regresi Linier Berganda
# Mendefinisikan Variabel
Y.RLB <- Faktor_faktor_yang_mempengaruhi_Kriminalitas_2$`Jumlah Kejahatan Yang Dilaporkan Tahun 2022`
X1.RLB <- Faktor_faktor_yang_mempengaruhi_Kriminalitas_2$`Tingkat Pengangguran Terbuka (%)`
X2.RLB <- Faktor_faktor_yang_mempengaruhi_Kriminalitas_2$`Pengeluaran Perkapita`
X3.RLB <- Faktor_faktor_yang_mempengaruhi_Kriminalitas_2$`Rata-rata Gaji Bersih Perbulan`
X4.RLB <- Faktor_faktor_yang_mempengaruhi_Kriminalitas_2$`Jumlah Penduduk`
X5.RLB <- Faktor_faktor_yang_mempengaruhi_Kriminalitas_2$`Penyelesaian Tindak Pidana (%)`
# Membuat Matriks Scatterplot
pairs(Faktor_faktor_yang_mempengaruhi_Kriminalitas_2, main = "Matriks Scatter Plot Y; X1; X2; X3; X4; X5", col = 'red')
Berdasarkan matriks scatterplot tersebut dapat dilihat bahwa hubungan antara:
1.Laporan Kejahatan yang Dilaporkan (Y) dengan Variabel Lain:
• Dengan Tingkat Pengangguran Terbuka (X1): Tampak bahwa Laporan Kejahatan memiliki sebaran data yang tidak membentuk pola yang jelas terhadap tingkat pengangguran terbuka. Artinya, tidak ada hubungan yang signifikan antara tingkat pengangguran dengan jumlah laporan kejahatan yang dilaporkan.
• Dengan Pengeluaran Per Kapita (X2): Hubungan antara laporan kejahatan dan pengeluaran per kapita juga tidak menunjukkan pola yang kuat, menunjukkan bahwa peningkatan pengeluaran per kapita tidak berkorelasi langsung dengan kenaikan atau penurunan laporan kejahatan.
• Dengan Rata-rata Gaji Bersih Perbulan (X3): Sama halnya dengan pengeluaran per kapita, variabel rata-rata gaji bersih per bulan tidak menunjukkan korelasi yang jelas terhadap jumlah laporan kejahatan.
• Dengan Jumlah Penduduk (X4): Scatter plot menunjukkan sedikit kecenderungan bahwa dengan meningkatnya jumlah penduduk, laporan kejahatan mungkin cenderung bertambah, meskipun korelasinya tampak lemah.
• Dengan Penyelesaian Tindak Pidana (X5): Tidak ada korelasi yang kuat terlihat antara laporan kejahatan yang dilaporkan dengan tingkat penyelesaian tindak pidana.
2.Hubungan Antarvariabel Independen (X1 - X5):
• Tingkat Pengangguran Terbuka (X1) dengan Pengeluaran Per Kapita (X2): Tidak ada pola jelas di antara kedua variabel ini, menunjukkan tingkat pengangguran terbuka tidak berpengaruh signifikan terhadap pengeluaran per kapita.
• Tingkat Pengangguran Terbuka (X1) dengan Rata-rata Gaji Bersih Perbulan (X3): Data menunjukkan sebaran yang acak, menandakan bahwa tingkat pengangguran tidak berhubungan langsung dengan rata-rata gaji.
• Pengeluaran Per Kapita (X2) dengan Rata-rata Gaji Bersih Perbulan (X3): Ada sedikit kecenderungan bahwa dengan meningkatnya gaji bersih per bulan, pengeluaran per kapita juga bisa meningkat. Hal ini menunjukkan korelasi positif yang lemah.
• Pengeluaran Per Kapita (X2) dengan Jumlah Penduduk (X4): Hubungan ini tidak menunjukkan pola yang signifikan, sehingga peningkatan pengeluaran per kapita tidak memiliki kaitan yang jelas dengan jumlah penduduk.
• Jumlah Penduduk (X4) dengan Penyelesaian Tindak Pidana (X5): Tidak ada hubungan yang signifikan antara jumlah penduduk dan tingkat penyelesaian tindak pidana.
Secara keseluruhan, hubungan antar variabel pada scatter plot ini sebagian besar tidak menunjukkan pola atau korelasi yang kuat. Artinya, perubahan satu variabel tidak selalu berkaitan langsung dengan perubahan variabel lainnya, kecuali beberapa hubungan lemah yang dapat diidentifikasi.
# ANALISIS REGRESI LINIER BERGANDA
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
model.berganda = lm(Y.RLB~X1.RLB+X2.RLB+X3.RLB+X4.RLB+X5.RLB, data=
Faktor_faktor_yang_mempengaruhi_Kriminalitas_2)
summary(model.berganda) #Model
##
## Call:
## lm(formula = Y.RLB ~ X1.RLB + X2.RLB + X3.RLB + X4.RLB + X5.RLB,
## data = Faktor_faktor_yang_mempengaruhi_Kriminalitas_2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -249.065 -140.065 -8.541 92.788 254.086
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -8.335e+02 3.358e+02 -2.482 0.0275 *
## X1.RLB 3.931e+01 5.042e+01 0.780 0.4495
## X2.RLB 2.718e-02 1.632e-02 1.665 0.1198
## X3.RLB 1.953e-05 1.167e-04 0.167 0.8697
## X4.RLB 5.655e-04 3.088e-04 1.831 0.0901 .
## X5.RLB 1.451e+00 3.202e+00 0.453 0.6579
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 179.4 on 13 degrees of freedom
## Multiple R-squared: 0.7774, Adjusted R-squared: 0.6918
## F-statistic: 9.081 on 5 and 13 DF, p-value: 0.0006745
anova(model.berganda) #TabelANOVA
## Analysis of Variance Table
##
## Response: Y.RLB
## Df Sum Sq Mean Sq F value Pr(>F)
## X1.RLB 1 1294228 1294228 40.2315 2.565e-05 ***
## X2.RLB 1 48505 48505 1.5078 0.24124
## X3.RLB 1 3303 3303 0.1027 0.75375
## X4.RLB 1 108044 108044 3.3586 0.08985 .
## X5.RLB 1 6607 6607 0.2054 0.65789
## Residuals 13 418204 32170
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Interval prediksi
prediksi.RLB <- predict(model.berganda,
Faktor_faktor_yang_mempengaruhi_Kriminalitas_2,
interval = "prediction",
level = 0.95)
prediksi.RLB
## fit lwr upr
## 1 -158.7033 -624.458183 307.0516
## 2 388.3641 -43.080334 819.8086
## 3 477.0647 28.846137 925.2832
## 4 363.3779 -47.114972 773.8708
## 5 418.1080 -6.132851 842.3488
## 6 558.6218 148.777301 968.4664
## 7 430.0673 -3.014696 863.1492
## 8 282.2308 -169.447906 733.9096
## 9 224.8888 -215.565640 665.3432
## 10 160.0602 -283.484094 603.6045
## 11 410.2154 -4.408904 824.8397
## 12 398.9140 -38.245094 836.0730
## 13 1351.7578 843.377592 1860.1379
## 14 307.2595 -175.583629 790.1025
## 15 211.0226 -212.780295 634.8255
## 16 130.2391 -350.778340 611.2566
## 17 352.7025 -66.545267 771.9503
## 18 368.2680 -84.900742 821.4366
## 19 328.5409 -123.203020 780.2847
# Interval selang kepercayaan
C.RLB <- predict(model.berganda,
Faktor_faktor_yang_mempengaruhi_Kriminalitas_2,
interval = "confidence",
level = 0.95)
C.RLB
## fit lwr upr
## 1 -158.7033 -417.13370 99.72709
## 2 388.3641 198.61957 578.10871
## 3 477.0647 251.76814 702.36125
## 4 363.3779 227.86751 498.88830
## 5 418.1080 245.36844 590.84752
## 6 558.6218 425.08830 692.15537
## 7 430.0673 236.62826 623.50628
## 8 282.2308 50.12665 514.33504
## 9 224.8888 15.46395 434.31362
## 10 160.0602 -55.78747 375.90793
## 11 410.2154 262.66211 557.76866
## 12 398.9140 196.51164 601.31626
## 13 1351.7578 1022.65434 1680.86117
## 14 307.2595 19.16900 595.34991
## 15 211.0226 39.36142 382.68380
## 16 130.2391 -154.78100 415.25928
## 17 352.7025 192.61700 512.78804
## 18 368.2680 133.27746 603.25844
## 19 328.5409 96.30994 560.77178
# PLOT SISAAN
# Membuat sebaran dari plot sisaan
prediction <- as.data.frame(prediksi.RLB)
residual <- resid(model.berganda)
err_percent <- 100*abs(residual/Y)
# Histogram dari sisaan
hist(residual,
main = "Histogram dari Residual",
col = "lightpink")
Histogram residual menunjukkan distribusi yang relatif seimbang, dengan sedikit kecenderungan ke arah nilai negatif. Hal ini mengindikasikan bahwa model mampu menangkap tren data secara umum, namun masih terdapat beberapa variasi yang tidak dapat dijelaskan. Tidak adanya outlier yang signifikan menunjukkan bahwa tidak ada data yang sangat mempengaruhi model.
# Plot Kenormalan Sisaan
qqnorm(residual, main = "Plot Kenormalan Residual",
xlab = "Residual",
ylab = "Sample Quantiles")
qqline(residual, col = 'red')
Plot kenormalan residual menunjukkan bahwa penyebaran titik-titik residual cenderung dekat dengan garis lurus. Walaupun terdapat beberapa penyimpangan kecil di bagian ujung kiri dan kanan plot. Dimana titik-titik ini sedikit menjauhi garis lurus. Titik-titik residual yang menjauhi garis lurus ini mungkin menunjukkan adanya outlier.
Akan tetapi, kebanyakan titik-titik residualnya mendekati garis lurus, yang mengindikasikan bahwa tidak ada pelanggaran terhadap asumsi normalitas. Artinya model regresi yang digunakan sudah cukup valid untuk estimasi atau prediksi. Untuk konfirmasi lebih lanjut mengenai terpenuhi atau tidaknya asumsi normalitas, dapat dilakukan analisis lebih lanjut seperti uji shapiro wilk.
# Plot Sisaan dengan Nilai Dugaan
plot(prediction$fit, residual,
ylab="Residuals",
xlab="Fitted Values",
main="Residual Versus the Fitted Values",
col = 'red')
abline(0, 0) #garis horizontal
Plot residual versus fitted values ini memberikan gambaran visual mengenai sebaran residual (selisih antara nilai aktual dan nilai prediksi) terhadap nilai prediksi dari sebuah model. Dalam plot ini, kita mencari pola tertentu yang dapat mengindikasikan apakah asumsi-asumsi dalam model regresi terpenuhi atau tidak.
Titik-titik pada plot terlihat menyebar secara acak di sekitar garis horizontal nol. Ini mengindikasikan bahwa tidak ada pola yang jelas antara besarnya residual dengan nilai prediksi. Artinya, rata-rata nilai residual pada setiap level nilai prediksi cenderung mendekati nol.
Tidak terlihat adanya pola tertentu seperti bentuk corong (heteroskedastisitas), kurva, atau kelompok data yang terpisah. Ini menunjukkan bahwa varians dari residual relatif konstan untuk semua level nilai prediksi. Tidak terlihat adanya titik data yang jauh menyimpang dari pola umum. Ini menunjukkan bahwa tidak ada data ekstrim yang sangat mempengaruhi model.
# Plot Sisaan dengan Urutan
plot(residual, type = "b",
xlab = "Observation Order",
main = "Residual Versus the Order of the Data",
col = 'red')
Grafik ini adalah plot residual terhadap urutan observasi. Plot ini berguna dalam mengidentifikasi keberadaan autokorelasi. Dari plot tersebut terlihat adanya beberapa fluktuasi berulang dari residual positif ke negatif, namun tidak ada pola yang sangat kuat, yang mengindikasikan bahwa model mungkin cukup baik. Pola naik-turun pada residual ini berpotensi mengidentifikasi adanya autokorelasi. Sehingga disarankan untuk melakukan analisis lebih lanjut.
# Variance Inflation Factor (VIF)
library(performance)
multicollinearity(model.berganda)
## # Check for Multicollinearity
##
## Low Correlation
##
## Term VIF VIF 95% CI Increased SE Tolerance Tolerance 95% CI
## X2.RLB 2.64 [1.83, 4.28] 1.63 0.38 [0.23, 0.55]
## X3.RLB 1.63 [1.25, 2.63] 1.28 0.61 [0.38, 0.80]
## X4.RLB 2.60 [1.80, 4.20] 1.61 0.39 [0.24, 0.56]
## X5.RLB 1.88 [1.38, 3.01] 1.37 0.53 [0.33, 0.72]
##
## Moderate Correlation
##
## Term VIF VIF 95% CI Increased SE Tolerance Tolerance 95% CI
## X1.RLB 5.43 [3.46, 8.98] 2.33 0.18 [0.11, 0.29]
multicollinearity(model.berganda)
## # Check for Multicollinearity
##
## Low Correlation
##
## Term VIF VIF 95% CI Increased SE Tolerance Tolerance 95% CI
## X2.RLB 2.64 [1.83, 4.28] 1.63 0.38 [0.23, 0.55]
## X3.RLB 1.63 [1.25, 2.63] 1.28 0.61 [0.38, 0.80]
## X4.RLB 2.60 [1.80, 4.20] 1.61 0.39 [0.24, 0.56]
## X5.RLB 1.88 [1.38, 3.01] 1.37 0.53 [0.33, 0.72]
##
## Moderate Correlation
##
## Term VIF VIF 95% CI Increased SE Tolerance Tolerance 95% CI
## X1.RLB 5.43 [3.46, 8.98] 2.33 0.18 [0.11, 0.29]
# Durbin-Watson
library(lmtest)
dwtest(model.berganda)
##
## Durbin-Watson test
##
## data: model.berganda
## DW = 1.4865, p-value = 0.06508
## alternative hypothesis: true autocorrelation is greater than 0
• Model regresi linear berganda yang digunakan dalam analisis faktor-faktor yang mempengaruhi tingkat kriminalitas di Sumatera Barat tahun 2022 menunjukkan kesesuaian yang cukup baik dengan asumsi klasik, terutama dalam hal normalitas dan homoskedastisitas.
• Meskipun demikian, adanya indikasi autokorelasi memerlukan pengujian lebih lanjut dan kehati-hatian dalam interpretasi hasil. Model ini dapat digunakan sebagai dasar untuk memahami hubungan antara variabel-variabel independen dengan tingkat kriminalitas, namun perlu disertai dengan catatan mengenai keterbatasan dan asumsi yang mendasarinya.
Badan Pusat Statistik. (2022). Provinsi Sumatera Barat Dalam Angka 2022. BPS Provinsi Sumatera Barat.
Badan Pusat Statistik. (2022). Statistik Kriminal Sumatera Barat. BPS Provinsi Sumatera Barat.
Cohen, J., Cohen, P., West, S.G., & Aiken, L.S. (2003). Applied Multiple Regression/Correlation Analysis for the Behavioral Sciences (3rd ed.). Lawrence Erlbaum Associates.
Kepolisian Daerah Sumatera Barat. (2022). Laporan Tahunan Kepolisian Daerah Sumatera Barat.
Montgomery, D.C., Peck, E.A., & Vining, G.G. (2021). Introduction to Linear Regression Analysis (6th ed.). Wiley.