tugas_1

Analisis Regresi

Analisis regresi adalah metode statistik yang digunakan untuk mempelajari hubungan antara satu atau lebih variabel independen (prediktor) dengan satu variabel dependen (variabel respons). Tujuan utamanya adalah untuk memahami dan memodelkan hubungan antara variabel-variabel tersebut, sehingga dapat digunakan untuk melakukan prediksi atau membuat inferensi tentang variabel dependen berdasarkan nilai variabel independen.

Secara umum, analisis regresi melibatkan pemodelan hubungan antara variabel independen ( X ) dan variabel dependen ( Y ) dalam bentuk persamaan matematis. Persamaan tersebut sering kali disebut sebagai model regresi. Model regresi dapat berupa model linier atau non-linier, tergantung pada hubungan antara variabel-variabel tersebut.

Metode analisis regresi memiliki banyak variasi, tetapi regresi linier adalah salah satu yang paling umum. Dalam regresi linier, hubungan antara variabel independen dan dependen diasumsikan sebagai linier, sehingga modelnya berbentuk persamaan linier. Regresi linier sederhana melibatkan satu variabel independen, sedangkan regresi linier berganda melibatkan lebih dari satu variabel independen.

Analisis Regresi Linear Berganda

Analisis regresi linear berganda adalah metode statistik yang digunakan untuk memahami hubungan antara satu variabel dependen dengan dua atau lebih variabel independen. Tujuannya adalah untuk mengukur seberapa kuat dan sebagaimana variabel independen mempengaruhi variabel dependen dalam suatu hubungan linear. Dalam analisis ini, kita mencari model matematis yang dapat digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai-nilai variabel independen yang diberikan.

Definisi umumnya mirip dengan analisis regresi pada umumnya, namun menekankan pada fakta bahwa terdapat lebih dari satu variabel independen yang digunakan dalam model. Dalam regresi linear berganda, kita mencari model garis lurus yang paling baik menyesuaikan data observasi yang ada di ruang multidimensi. Proses ini sering melibatkan penggunaan metode kuadrat terkecil untuk meminimalkan kesalahan antara nilai yang diamati dan nilai yang diprediksi oleh model.

Analisis regresi linear berganda adalah salah satu alat analisis statistik yang paling umum digunakan untuk memahami dan memprediksi hubungan antara variabel-variabel dalam data multidimensi.

Berikut kita mulai dengan menginput data.

Masukkan data konsumsi

library(haven)
data <- read_dta("b1_ks1.dta")

## Filter data untuk hanya menampilkan yang mengkonsumsi kategori "A"
data_Konsumsi <- subset(data, ks1type %in% c("A"))

Masukkan data pendapatan

library(haven)
data_pendapatan<- read_dta("b3a_tk1.dta")

Menggabungkan data konsumsi dan pendapatan

data_regresi1 <- merge(data_Konsumsi, data_pendapatan, by = "hhid14_9", all = TRUE)
names(data_regresi1)[4] <- "konsumsi"
names(data_regresi1)[50] <- "pendapatan"
selected_columns <- data_regresi1[, c("hhid14_9", "ks1type", "konsumsi", "pendapatan")]
head(selected_columns,10)
    hhid14_9 ks1type konsumsi pendapatan
1  001060000       A   300000         NA
2  001060000       A   300000         NA
3  001060000       A   300000         NA
4  001060004       A    75000         NA
5  001060004       A    75000         NA
6  001080000       A    75000         NA
7  001080003       A    30000         NA
8  001080003       A    30000         NA
9  001220000       A   225000         NA
10 001220000       A   225000         NA

Buat model regresi

model <- lm(konsumsi ~ pendapatan , data = data_regresi1)

# Melihat ringkasan model
summary(model)

Call:
lm(formula = konsumsi ~ pendapatan, data = data_regresi1)

Residuals:
   Min     1Q Median     3Q    Max 
-59407 -58518 -18772  24411 690720 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  5.941e+04  2.655e+03  22.372   <2e-16 ***
pendapatan  -1.270e-03  1.293e-03  -0.983    0.326    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 84120 on 1253 degrees of freedom
  (33498 observations deleted due to missingness)
Multiple R-squared:  0.00077,   Adjusted R-squared:  -2.744e-05 
F-statistic: 0.9656 on 1 and 1253 DF,  p-value: 0.326

Model regresi linear sederhana dinyatakan sebagai:

\[ Y_i = \beta_0 + \beta_1 X_1 + \varepsilon_i\] \[ Y_i = 59410 + 0 X_i + \varepsilon_i\]

Pada hasil regresi di atas menunjukkan bahwa variabel pendapatan tidak memiliki pengaruh terhadap pengeluaran konsumsi beras.

Masukkan data tingkat pendidikan

library(haven)
data_pendidikan<- read_dta("b3a_dl1.dta")

Menggabungkan data dependent dan independent

data_regresi2 <- merge(data_regresi1, data_pendidikan, by = "hhid14_9", all = TRUE)
names(data_regresi2)[68] <- "pendidikan"
selected_columns <- data_regresi2[, c("hhid14_9", "ks1type", "konsumsi", "pendapatan", "pendidikan")]
head(selected_columns,10)
    hhid14_9 ks1type konsumsi pendapatan pendidikan
1  001060000       A   300000         NA          2
2  001060000       A   300000         NA          2
3  001060000       A   300000         NA          3
4  001060000       A   300000         NA          2
5  001060000       A   300000         NA          2
6  001060000       A   300000         NA          3
7  001060000       A   300000         NA          2
8  001060000       A   300000         NA          2
9  001060000       A   300000         NA          3
10 001060004       A    75000         NA          2

Buat model regresi

model <- lm(konsumsi ~ pendapatan + pendidikan , data = data_regresi2)

# Melihat ringkasan model
summary(model)

Call:
lm(formula = konsumsi ~ pendapatan + pendidikan, data = data_regresi2)

Residuals:
   Min     1Q Median     3Q    Max 
-70068 -65642 -22835  25631 680218 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  7.029e+04  2.111e+03  33.300   <2e-16 ***
pendapatan  -1.770e-03  9.489e-04  -1.865   0.0622 .  
pendidikan  -1.088e+02  6.797e+01  -1.600   0.1097    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 95480 on 3357 degrees of freedom
  (95435 observations deleted due to missingness)
Multiple R-squared:  0.002036,  Adjusted R-squared:  0.001441 
F-statistic: 3.424 on 2 and 3357 DF,  p-value: 0.03268

\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_nX_n + \varepsilon \] \[ Y = 70,290 + 0X_1 + 0X_2 + \varepsilon \]

Pada hasil regresi di atas menunjukkan bahwa variabel pendapatan dan tingkat pendidikan tidak memiliki pengaruh terhadap pengeluaran konsumsi beras.

Uji Asumsi Klasik

Normalitas Residual, Uji Jarque-Bera

library(tseries)
Registered S3 method overwritten by 'quantmod':
  method            from
  as.zoo.data.frame zoo 
residuals <- residuals(model)

# Uji Jarque-Bera terhadap residu
result <- jarque.bera.test(residuals)

# Menampilkan hasil uji
print(result)

    Jarque Bera Test

data:  residuals
X-squared = 27489, df = 2, p-value < 2.2e-16

Nilai Jarque-Bera yang diperoleh adalah 27489 dan nilai p-value dari residual dengan menggunakan uji Jarque-Bera sebesar 0.000 < 5%, . Hal ini menunjukkan bahwa residual terdistribusi tidak normal.

uji Goldfeld-Quandt

library(lmtest)
Loading required package: zoo

Attaching package: 'zoo'
The following objects are masked from 'package:base':

    as.Date, as.Date.numeric
result <- gqtest(model)

# Menampilkan hasil uji
print(result)

    Goldfeld-Quandt test

data:  model
GQ = 0.92034, df1 = 1677, df2 = 1677, p-value = 0.9554
alternative hypothesis: variance increases from segment 1 to 2

Nilai uji Goldfeld-Quandt adalah 0.92034, dan karena nilai p-value 0.9554 lebih besar dari 0,05, kita gagal menolak hipotesis nol, kita tidak memiliki cukup bukti untuk mengatakan bahwa heteroskedastisitas ada di dalam model regresi.

Korelasi Serial di antara residual

Uji Durbin Watson

library(lmtest)
result <- dwtest(model)

# Menampilkan hasil uji
print(result)

    Durbin-Watson test

data:  model
DW = 0.4951, p-value < 2.2e-16
alternative hypothesis: true autocorrelation is greater than 0

Nilai uji Durbin-Watson adalah 0.4951, dan nilai p-value 0.000.Karena nilai p ini lebih kecil dari 0,05, kita tolak hipotesis nol dan menyimpulkan bahwa residual dalam model regresi ini berautokorelasi.

Uji Breusch-Godfrey

library(lmtest)
result <- bgtest(model)

# Menampilkan hasil uji
print(result)

    Breusch-Godfrey test for serial correlation of order up to 1

data:  model
LM test = 1880.7, df = 1, p-value < 2.2e-16

Dari output tersebut kita dapat melihat bahwa statistik uji adalah X^2= 1880,7 dengan derajat kebebasan 1, p-value = 0.000.Karena p-value < 0,05, kita tolak hipotesis nol dan menyimpulkan bahwa terdapat autokorelasi di antara residu pada beberapa orde ≤ 1.

Uji Multicolinearitas di Antara Variabel Bebas

library(car)
Loading required package: carData
vif(model)
pendapatan pendidikan 
  1.014402   1.014402 

Variabel pendapatan memiliki multicolinearitas yang rendah begitupun dengan variabel pendidikan yang memiliki multicolinearitas yang rendah.

Kesimpulan uji asumsi klasik

# Kalimat dengan bullet point
kalimat <- c("• Normalitas: Gagal", "• Homoschedastisitas: Lulus", "• Korelasi serial di residual", "   Durbin-Watson:Gagal", "   Breusch-Godfrey:Gagal", "• Multikolinearitas pada variabel Bebas: Lulus")

# Menampilkan kalimat dengan bullet point
print(kalimat)
[1] "• Normalitas: Gagal"                           
[2] "• Homoschedastisitas: Lulus"                   
[3] "• Korelasi serial di residual"                 
[4] "   Durbin-Watson:Gagal"                        
[5] "   Breusch-Godfrey:Gagal"                      
[6] "• Multikolinearitas pada variabel Bebas: Lulus"

Input-Output

Install dan memuat paket

library(leontief)
library(matrixcalc)
library(readxl)

Baca data input-output dari file Excel

data_io <- read_excel("data_input_output.xlsx")

Persiapkan Matriks Total Input-Output

input_output <- as.matrix(data_io[, -1]) # Mengambil semua kolom kecuali kolom pertama (nama sektor)

Hitung total output

total_output <- colSums(input_output)

Hitung matriks Leontief

leontief_matrix <- input_output / total_output

Tampilkan matriks Leontief

head(leontief_matrix)
     Pertanian, Kehutanan, dan Perikanan Pertambangan dan Penggalian
[1,]                        2.734528e-02                3.011629e-05
[2,]                        2.809680e-05                1.228477e-03
[3,]                        7.716226e-03                1.039371e-04
[4,]                        2.613515e-03                1.047460e-05
[5,]                        2.117570e-04                1.590752e-06
[6,]                        1.809214e-05                2.682404e-06
     Industri Pengolahan Pengadaan Listrik dan Gas
[1,]        0.0684660539              4.775809e-06
[2,]        0.1597638158              1.287485e-02
[3,]        0.0990706555              1.103150e-03
[4,]        0.0012304924              1.066018e-01
[5,]        0.0023272237              6.967527e-07
[6,]        0.0001804766              1.052627e-06
     Pengadaan Air, Pengelolaan Sampah, Limbah dan Daur Ulang   Konstruksi
[1,]                                             5.812755e-06 5.706994e-04
[2,]                                             3.085891e-07 3.019149e+00
[3,]                                             1.439300e-03 8.588844e-02
[4,]                                             1.470745e-04 2.081223e-04
[5,]                                             5.549624e-05 4.963709e-05
[6,]                                             3.062216e-04 2.214854e-02
     Perdagangan Besar dan Eceran; Reparasi Mobil dan Sepeda Motor
[1,]                                                  1.282217e-05
[2,]                                                  1.618202e-06
[3,]                                                  1.422720e-03
[4,]                                                  3.362129e-03
[5,]                                                  3.093088e-05
[6,]                                                  2.611474e-05
     Transportasi dan Pergudangan Penyediaan Akomodasi dan Makan Minum
[1,]                 3.187085e-05                         1.210336e-01
[2,]                 3.047650e-03                         7.119561e-08
[3,]                 7.144202e-03                         8.239472e-03
[4,]                 1.405566e-04                         2.988648e-03
[5,]                 3.759515e-05                         2.999414e-05
[6,]                 3.725371e-07                         7.429308e-06
     Informasi dan Komunikasi Jasa Keuangan dan Asuransi  Real Estate
[1,]             5.884096e-08               4.119389e-06 0.000000e+00
[2,]             4.497234e-05               5.608268e-06 1.146343e-06
[3,]             4.249886e-03               1.385608e-03 8.648828e-04
[4,]             8.499120e-04               7.541331e-04 1.718183e-02
[5,]             7.164188e-05               2.458797e-05 8.948406e-06
[6,]             2.443483e-04               3.587530e-03 6.799811e-04
     Jasa Perusahaan
[1,]    0.000000e+00
[2,]    1.436893e-06
[3,]    4.456966e-05
[4,]    6.264078e-06
[5,]    9.966571e-06
[6,]    2.277381e-04
     Administrasi Pemerintahan, Pertahanan dan Jaminan Sosial Wajib
[1,]                                                   1.592334e-02
[2,]                                                   1.353627e-05
[3,]                                                   1.336568e-03
[4,]                                                   2.644066e-01
[5,]                                                   2.320857e-04
[6,]                                                   1.758978e-03
     Jasa Pendidikan Jasa Kesehatan dan Kegiatan Sosial Jasa Lainnya
[1,]    8.349494e-04                       6.612555e-04 1.093011e-01
[2,]    2.482754e-05                       5.789844e-06 1.210020e-06
[3,]    2.461572e-02                       2.037331e-02 4.606655e-03
[4,]    6.601521e-05                       1.930010e-03 9.344782e-04
[5,]    6.888891e-06                       8.637616e-05 3.464229e-04
[6,]    2.264785e-02                       4.426882e-04 6.081215e-04
     Total Permintaan Antara Konsumsi Rumah Tangga Konsumsi LNPRT
[1,]             0.021225495          1.034784e+01   0.000000e+00
[2,]             0.044446081          9.404683e-05   1.362917e-12
[3,]             1.443158834          9.525439e-02   0.000000e+00
[4,]             0.011344984          5.306262e-03   0.000000e+00
[5,]             0.003861712          4.056676e-04   0.000000e+00
[6,]             1.261160726          1.140992e-04   0.000000e+00
     Total Konsumsi Pemerintah Pembentukan Modal Tetap Bruto
[1,]              0.000000e+00                  0.0426422661
[2,]              1.082724e-09                  0.0054268917
[3,]              9.538807e-03                  0.0557512191
[4,]              0.000000e+00                  0.0000134795
[5,]              9.213768e-04                  0.0000000000
[6,]              0.000000e+00                  5.6432304323
     Perubahan Inventori Total Ekspor Luar Negeri Total Ekspor Antar Provinsi
[1,]        1.755509e-03             5.519701e-03                1.519894e-01
[2,]        1.329830e-02             4.981088e-05                1.046495e-02
[3,]       -2.757389e-01             5.439318e-03                2.681360e+01
[4,]        0.000000e+00             2.908896e-06                3.986104e-03
[5,]        0.000000e+00             2.610214e-06                2.534788e-04
[6,]       -5.611407e-08             9.275378e-06                9.787384e-03
     Total Ekspor Total Konsumsi Akhir Total Output
[1,] 0.7050464559           1.03726848   0.28047686
[2,] 0.1346231159           0.13183568   0.08558875
[3,] 0.0334167894           5.41681924   0.96973952
[4,] 0.0003989581           0.03910291   0.11770728
[5,] 0.0075819018           0.01158219   0.01515066
[6,] 0.0361787020           3.85100886   2.49260984

Matriks Leontief merupakan alat yang ampuh untuk menganalisis hubungan antar industri dalam suatu perekonomian. Matriks ini digunakan untuk melacak aliran barang dan jasa antar sektor, memungkinkan para ekonom untuk memahami bagaimana perubahan dalam satu sektor dapat memengaruhi sektor lainnya. Matrix ini juga menggambarkan seberapa besar output dari setiap sektor yang diperlukan sebagai input oleh sektor lainnya dalam proses produksi.

Dalam matrix leontief di atas terdapat 17 sektor ekonomi yang saling terhubung satu sama lain. Setiap angka dalam matrix mewakili proporsi dari output dari satu sektor yang diperlukan sebagai input oleh sektor lainnya. Misalnya, angka pertama (baris 1, kolom 1) menunjukkan bahwa sektor pertanian membutuhkan sekitar 2.73% dari outputnya sendiri sebagai input, dan sektor kedua (baris 1, kolom 2) membutuhkan sekitar 3.01e-05% dari output pertanian sebagai input.