library(haven)
data <- read_dta("b1_ks1.dta")
## Filter data untuk hanya menampilkan yang mengkonsumsi kategori "A"
data_Konsumsi <- subset(data, ks1type %in% c("A"))tugas_1
Analisis Regresi
Analisis regresi adalah metode statistik yang digunakan untuk mempelajari hubungan antara satu atau lebih variabel independen (prediktor) dengan satu variabel dependen (variabel respons). Tujuan utamanya adalah untuk memahami dan memodelkan hubungan antara variabel-variabel tersebut, sehingga dapat digunakan untuk melakukan prediksi atau membuat inferensi tentang variabel dependen berdasarkan nilai variabel independen.
Secara umum, analisis regresi melibatkan pemodelan hubungan antara variabel independen ( X ) dan variabel dependen ( Y ) dalam bentuk persamaan matematis. Persamaan tersebut sering kali disebut sebagai model regresi. Model regresi dapat berupa model linier atau non-linier, tergantung pada hubungan antara variabel-variabel tersebut.
Metode analisis regresi memiliki banyak variasi, tetapi regresi linier adalah salah satu yang paling umum. Dalam regresi linier, hubungan antara variabel independen dan dependen diasumsikan sebagai linier, sehingga modelnya berbentuk persamaan linier. Regresi linier sederhana melibatkan satu variabel independen, sedangkan regresi linier berganda melibatkan lebih dari satu variabel independen.
Analisis Regresi Linear Berganda
Analisis regresi linear berganda adalah metode statistik yang digunakan untuk memahami hubungan antara satu variabel dependen dengan dua atau lebih variabel independen. Tujuannya adalah untuk mengukur seberapa kuat dan sebagaimana variabel independen mempengaruhi variabel dependen dalam suatu hubungan linear. Dalam analisis ini, kita mencari model matematis yang dapat digunakan untuk memprediksi nilai variabel dependen berdasarkan nilai-nilai variabel independen yang diberikan.
Definisi umumnya mirip dengan analisis regresi pada umumnya, namun menekankan pada fakta bahwa terdapat lebih dari satu variabel independen yang digunakan dalam model. Dalam regresi linear berganda, kita mencari model garis lurus yang paling baik menyesuaikan data observasi yang ada di ruang multidimensi. Proses ini sering melibatkan penggunaan metode kuadrat terkecil untuk meminimalkan kesalahan antara nilai yang diamati dan nilai yang diprediksi oleh model.
Analisis regresi linear berganda adalah salah satu alat analisis statistik yang paling umum digunakan untuk memahami dan memprediksi hubungan antara variabel-variabel dalam data multidimensi.
Berikut kita mulai dengan menginput data.
Masukkan data konsumsi
Masukkan data pendapatan
library(haven)
data_pendapatan<- read_dta("b3a_tk1.dta")Menggabungkan data konsumsi dan pendapatan
data_regresi1 <- merge(data_Konsumsi, data_pendapatan, by = "hhid14_9", all = TRUE)
names(data_regresi1)[4] <- "konsumsi"
names(data_regresi1)[50] <- "pendapatan"
selected_columns <- data_regresi1[, c("hhid14_9", "ks1type", "konsumsi", "pendapatan")]
head(selected_columns,10) hhid14_9 ks1type konsumsi pendapatan
1 001060000 A 300000 NA
2 001060000 A 300000 NA
3 001060000 A 300000 NA
4 001060004 A 75000 NA
5 001060004 A 75000 NA
6 001080000 A 75000 NA
7 001080003 A 30000 NA
8 001080003 A 30000 NA
9 001220000 A 225000 NA
10 001220000 A 225000 NA
Buat model regresi
model <- lm(konsumsi ~ pendapatan , data = data_regresi1)
# Melihat ringkasan model
summary(model)
Call:
lm(formula = konsumsi ~ pendapatan, data = data_regresi1)
Residuals:
Min 1Q Median 3Q Max
-59407 -58518 -18772 24411 690720
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 5.941e+04 2.655e+03 22.372 <2e-16 ***
pendapatan -1.270e-03 1.293e-03 -0.983 0.326
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 84120 on 1253 degrees of freedom
(33498 observations deleted due to missingness)
Multiple R-squared: 0.00077, Adjusted R-squared: -2.744e-05
F-statistic: 0.9656 on 1 and 1253 DF, p-value: 0.326
Model regresi linear sederhana dinyatakan sebagai:
\[ Y_i = \beta_0 + \beta_1 X_1 + \varepsilon_i\] \[ Y_i = 59410 + 0 X_i + \varepsilon_i\]
Pada hasil regresi di atas menunjukkan bahwa variabel pendapatan tidak memiliki pengaruh terhadap pengeluaran konsumsi beras.
Masukkan data tingkat pendidikan
library(haven)
data_pendidikan<- read_dta("b3a_dl1.dta")Menggabungkan data dependent dan independent
data_regresi2 <- merge(data_regresi1, data_pendidikan, by = "hhid14_9", all = TRUE)
names(data_regresi2)[68] <- "pendidikan"
selected_columns <- data_regresi2[, c("hhid14_9", "ks1type", "konsumsi", "pendapatan", "pendidikan")]
head(selected_columns,10) hhid14_9 ks1type konsumsi pendapatan pendidikan
1 001060000 A 300000 NA 2
2 001060000 A 300000 NA 2
3 001060000 A 300000 NA 3
4 001060000 A 300000 NA 2
5 001060000 A 300000 NA 2
6 001060000 A 300000 NA 3
7 001060000 A 300000 NA 2
8 001060000 A 300000 NA 2
9 001060000 A 300000 NA 3
10 001060004 A 75000 NA 2
Buat model regresi
model <- lm(konsumsi ~ pendapatan + pendidikan , data = data_regresi2)
# Melihat ringkasan model
summary(model)
Call:
lm(formula = konsumsi ~ pendapatan + pendidikan, data = data_regresi2)
Residuals:
Min 1Q Median 3Q Max
-70068 -65642 -22835 25631 680218
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.029e+04 2.111e+03 33.300 <2e-16 ***
pendapatan -1.770e-03 9.489e-04 -1.865 0.0622 .
pendidikan -1.088e+02 6.797e+01 -1.600 0.1097
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 95480 on 3357 degrees of freedom
(95435 observations deleted due to missingness)
Multiple R-squared: 0.002036, Adjusted R-squared: 0.001441
F-statistic: 3.424 on 2 and 3357 DF, p-value: 0.03268
\[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_nX_n + \varepsilon \] \[ Y = 70,290 + 0X_1 + 0X_2 + \varepsilon \]
Pada hasil regresi di atas menunjukkan bahwa variabel pendapatan dan tingkat pendidikan tidak memiliki pengaruh terhadap pengeluaran konsumsi beras.
Uji Asumsi Klasik
Normalitas Residual, Uji Jarque-Bera
library(tseries)Registered S3 method overwritten by 'quantmod':
method from
as.zoo.data.frame zoo
residuals <- residuals(model)
# Uji Jarque-Bera terhadap residu
result <- jarque.bera.test(residuals)
# Menampilkan hasil uji
print(result)
Jarque Bera Test
data: residuals
X-squared = 27489, df = 2, p-value < 2.2e-16
Nilai Jarque-Bera yang diperoleh adalah 27489 dan nilai p-value dari residual dengan menggunakan uji Jarque-Bera sebesar 0.000 < 5%, . Hal ini menunjukkan bahwa residual terdistribusi tidak normal.
uji Goldfeld-Quandt
library(lmtest)Loading required package: zoo
Attaching package: 'zoo'
The following objects are masked from 'package:base':
as.Date, as.Date.numeric
result <- gqtest(model)
# Menampilkan hasil uji
print(result)
Goldfeld-Quandt test
data: model
GQ = 0.92034, df1 = 1677, df2 = 1677, p-value = 0.9554
alternative hypothesis: variance increases from segment 1 to 2
Nilai uji Goldfeld-Quandt adalah 0.92034, dan karena nilai p-value 0.9554 lebih besar dari 0,05, kita gagal menolak hipotesis nol, kita tidak memiliki cukup bukti untuk mengatakan bahwa heteroskedastisitas ada di dalam model regresi.
Korelasi Serial di antara residual
Uji Durbin Watson
library(lmtest)
result <- dwtest(model)
# Menampilkan hasil uji
print(result)
Durbin-Watson test
data: model
DW = 0.4951, p-value < 2.2e-16
alternative hypothesis: true autocorrelation is greater than 0
Nilai uji Durbin-Watson adalah 0.4951, dan nilai p-value 0.000.Karena nilai p ini lebih kecil dari 0,05, kita tolak hipotesis nol dan menyimpulkan bahwa residual dalam model regresi ini berautokorelasi.
Uji Breusch-Godfrey
library(lmtest)
result <- bgtest(model)
# Menampilkan hasil uji
print(result)
Breusch-Godfrey test for serial correlation of order up to 1
data: model
LM test = 1880.7, df = 1, p-value < 2.2e-16
Dari output tersebut kita dapat melihat bahwa statistik uji adalah X^2= 1880,7 dengan derajat kebebasan 1, p-value = 0.000.Karena p-value < 0,05, kita tolak hipotesis nol dan menyimpulkan bahwa terdapat autokorelasi di antara residu pada beberapa orde ≤ 1.
Uji Multicolinearitas di Antara Variabel Bebas
library(car)Loading required package: carData
vif(model)pendapatan pendidikan
1.014402 1.014402
Variabel pendapatan memiliki multicolinearitas yang rendah begitupun dengan variabel pendidikan yang memiliki multicolinearitas yang rendah.
Kesimpulan uji asumsi klasik
# Kalimat dengan bullet point
kalimat <- c("• Normalitas: Gagal", "• Homoschedastisitas: Lulus", "• Korelasi serial di residual", " Durbin-Watson:Gagal", " Breusch-Godfrey:Gagal", "• Multikolinearitas pada variabel Bebas: Lulus")
# Menampilkan kalimat dengan bullet point
print(kalimat)[1] "• Normalitas: Gagal"
[2] "• Homoschedastisitas: Lulus"
[3] "• Korelasi serial di residual"
[4] " Durbin-Watson:Gagal"
[5] " Breusch-Godfrey:Gagal"
[6] "• Multikolinearitas pada variabel Bebas: Lulus"
Input-Output
Install dan memuat paket
library(leontief)
library(matrixcalc)
library(readxl)Baca data input-output dari file Excel
data_io <- read_excel("data_input_output.xlsx")Persiapkan Matriks Total Input-Output
input_output <- as.matrix(data_io[, -1]) # Mengambil semua kolom kecuali kolom pertama (nama sektor)Hitung total output
total_output <- colSums(input_output)Hitung matriks Leontief
leontief_matrix <- input_output / total_outputTampilkan matriks Leontief
head(leontief_matrix) Pertanian, Kehutanan, dan Perikanan Pertambangan dan Penggalian
[1,] 2.734528e-02 3.011629e-05
[2,] 2.809680e-05 1.228477e-03
[3,] 7.716226e-03 1.039371e-04
[4,] 2.613515e-03 1.047460e-05
[5,] 2.117570e-04 1.590752e-06
[6,] 1.809214e-05 2.682404e-06
Industri Pengolahan Pengadaan Listrik dan Gas
[1,] 0.0684660539 4.775809e-06
[2,] 0.1597638158 1.287485e-02
[3,] 0.0990706555 1.103150e-03
[4,] 0.0012304924 1.066018e-01
[5,] 0.0023272237 6.967527e-07
[6,] 0.0001804766 1.052627e-06
Pengadaan Air, Pengelolaan Sampah, Limbah dan Daur Ulang Konstruksi
[1,] 5.812755e-06 5.706994e-04
[2,] 3.085891e-07 3.019149e+00
[3,] 1.439300e-03 8.588844e-02
[4,] 1.470745e-04 2.081223e-04
[5,] 5.549624e-05 4.963709e-05
[6,] 3.062216e-04 2.214854e-02
Perdagangan Besar dan Eceran; Reparasi Mobil dan Sepeda Motor
[1,] 1.282217e-05
[2,] 1.618202e-06
[3,] 1.422720e-03
[4,] 3.362129e-03
[5,] 3.093088e-05
[6,] 2.611474e-05
Transportasi dan Pergudangan Penyediaan Akomodasi dan Makan Minum
[1,] 3.187085e-05 1.210336e-01
[2,] 3.047650e-03 7.119561e-08
[3,] 7.144202e-03 8.239472e-03
[4,] 1.405566e-04 2.988648e-03
[5,] 3.759515e-05 2.999414e-05
[6,] 3.725371e-07 7.429308e-06
Informasi dan Komunikasi Jasa Keuangan dan Asuransi Real Estate
[1,] 5.884096e-08 4.119389e-06 0.000000e+00
[2,] 4.497234e-05 5.608268e-06 1.146343e-06
[3,] 4.249886e-03 1.385608e-03 8.648828e-04
[4,] 8.499120e-04 7.541331e-04 1.718183e-02
[5,] 7.164188e-05 2.458797e-05 8.948406e-06
[6,] 2.443483e-04 3.587530e-03 6.799811e-04
Jasa Perusahaan
[1,] 0.000000e+00
[2,] 1.436893e-06
[3,] 4.456966e-05
[4,] 6.264078e-06
[5,] 9.966571e-06
[6,] 2.277381e-04
Administrasi Pemerintahan, Pertahanan dan Jaminan Sosial Wajib
[1,] 1.592334e-02
[2,] 1.353627e-05
[3,] 1.336568e-03
[4,] 2.644066e-01
[5,] 2.320857e-04
[6,] 1.758978e-03
Jasa Pendidikan Jasa Kesehatan dan Kegiatan Sosial Jasa Lainnya
[1,] 8.349494e-04 6.612555e-04 1.093011e-01
[2,] 2.482754e-05 5.789844e-06 1.210020e-06
[3,] 2.461572e-02 2.037331e-02 4.606655e-03
[4,] 6.601521e-05 1.930010e-03 9.344782e-04
[5,] 6.888891e-06 8.637616e-05 3.464229e-04
[6,] 2.264785e-02 4.426882e-04 6.081215e-04
Total Permintaan Antara Konsumsi Rumah Tangga Konsumsi LNPRT
[1,] 0.021225495 1.034784e+01 0.000000e+00
[2,] 0.044446081 9.404683e-05 1.362917e-12
[3,] 1.443158834 9.525439e-02 0.000000e+00
[4,] 0.011344984 5.306262e-03 0.000000e+00
[5,] 0.003861712 4.056676e-04 0.000000e+00
[6,] 1.261160726 1.140992e-04 0.000000e+00
Total Konsumsi Pemerintah Pembentukan Modal Tetap Bruto
[1,] 0.000000e+00 0.0426422661
[2,] 1.082724e-09 0.0054268917
[3,] 9.538807e-03 0.0557512191
[4,] 0.000000e+00 0.0000134795
[5,] 9.213768e-04 0.0000000000
[6,] 0.000000e+00 5.6432304323
Perubahan Inventori Total Ekspor Luar Negeri Total Ekspor Antar Provinsi
[1,] 1.755509e-03 5.519701e-03 1.519894e-01
[2,] 1.329830e-02 4.981088e-05 1.046495e-02
[3,] -2.757389e-01 5.439318e-03 2.681360e+01
[4,] 0.000000e+00 2.908896e-06 3.986104e-03
[5,] 0.000000e+00 2.610214e-06 2.534788e-04
[6,] -5.611407e-08 9.275378e-06 9.787384e-03
Total Ekspor Total Konsumsi Akhir Total Output
[1,] 0.7050464559 1.03726848 0.28047686
[2,] 0.1346231159 0.13183568 0.08558875
[3,] 0.0334167894 5.41681924 0.96973952
[4,] 0.0003989581 0.03910291 0.11770728
[5,] 0.0075819018 0.01158219 0.01515066
[6,] 0.0361787020 3.85100886 2.49260984
Matriks Leontief merupakan alat yang ampuh untuk menganalisis hubungan antar industri dalam suatu perekonomian. Matriks ini digunakan untuk melacak aliran barang dan jasa antar sektor, memungkinkan para ekonom untuk memahami bagaimana perubahan dalam satu sektor dapat memengaruhi sektor lainnya. Matrix ini juga menggambarkan seberapa besar output dari setiap sektor yang diperlukan sebagai input oleh sektor lainnya dalam proses produksi.
Dalam matrix leontief di atas terdapat 17 sektor ekonomi yang saling terhubung satu sama lain. Setiap angka dalam matrix mewakili proporsi dari output dari satu sektor yang diperlukan sebagai input oleh sektor lainnya. Misalnya, angka pertama (baris 1, kolom 1) menunjukkan bahwa sektor pertanian membutuhkan sekitar 2.73% dari outputnya sendiri sebagai input, dan sektor kedua (baris 1, kolom 2) membutuhkan sekitar 3.01e-05% dari output pertanian sebagai input.