PML - Penduga Model Berpangkat Penuh Part 2

Video Pembelajaran - P6

Video Pembelajaran dapat diakses melalui link berikut : https://ipb.link/materipml

Model Regresi Linier

Model regresi linier digunakan untuk memodelkan hubungan antara variabel dependen \(y\) dan satu atau lebih variabel independen \(x_1, x_2, \dots, x_k\). Rumus umumnya adalah:

\[ y_i = \beta_0 + \beta_1 x_{i1} + \beta_2 x_{i2} + \dots + \beta_k x_{ik} + \epsilon_i \]

Di mana:

  • \(y_i\) adalah nilai dependen pada pengamatan ke-\(i\).

  • \(x_{ij}\) adalah nilai variabel independen ke-\(j\) pada pengamatan ke-\(i\).

  • \(\beta_0\) adalah intercept atau konstanta.

  • \(\beta_j\) adalah koefisien regresi untuk variabel \(x_j\), yang menunjukkan perubahan rata-rata dalam \(y\) untuk setiap unit perubahan dalam \(x_j\), dengan asumsi variabel lain konstan.

  • \(\epsilon_i\) adalah error atau residual untuk pengamatan ke-\(i\), yang diasumsikan berdistribusi normal dengan rata-rata 0 dan varians konstan \(\sigma^2\).

Asumsi dalam Regresi Linier:

  1. Linearitas: Hubungan antara variabel dependen dan independen adalah linear.

  2. Independensi Error: Error dari pengamatan satu tidak berkorelasi dengan error dari pengamatan lainnya.

  3. Homoskedastisitas: Varians error adalah konstan untuk semua nilai dari variabel independen.

  4. Normalitas Error: Error mengikuti distribusi normal dengan rata-rata nol.

Sintaks R untuk Model Regresi Linier

# Data simulasi
set.seed(123)
n <- 100
k <- 3
X <- matrix(rnorm(n * k), n, k)
X <- cbind(1, X)  # Menambahkan intercept
beta <- c(2, -1, 0.5, 1.5)
epsilon <- rnorm(n)
y <- X %*% beta + epsilon

# Model regresi linier
model <- lm(y ~ X[, 2] + X[, 3] + X[, 4])

# Menampilkan ringkasan model
summary(model)
## 
## Call:
## lm(formula = y ~ X[, 2] + X[, 3] + X[, 4])
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2.49138 -0.65392  0.05664  0.67033  2.53210 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   1.9807     0.1073   18.45  < 2e-16 ***
## X[, 2]       -1.0555     0.1169   -9.03 1.80e-14 ***
## X[, 3]        0.5462     0.1095    4.99 2.69e-06 ***
## X[, 4]        1.4426     0.1122   12.85  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.052 on 96 degrees of freedom
## Multiple R-squared:  0.7666, Adjusted R-squared:  0.7593 
## F-statistic: 105.1 on 3 and 96 DF,  p-value: < 2.2e-16

Selang Kepercayaan untuk Parameter Koefisien

Selang kepercayaan memberikan rentang nilai di mana kita memperkirakan parameter populasi (\(\beta_j\)) berada dengan tingkat keyakinan tertentu, misalnya 95%. Jika kita membuat banyak sampel dan menghitung selang kepercayaan untuk masing-masing sampel, sekitar 95% dari selang tersebut akan mencakup nilai parameter yang sebenarnya.

Formula untuk selang kepercayaan parameter \(\beta_j\) adalah:

\[ \hat{\beta_j} \pm t_{\alpha/2, \, n-p} \times \text{SE}(\hat{\beta_j}) \]

Di mana:

  • \(t_{\alpha/2, \, n-p}\) adalah nilai kritis dari distribusi \(t\) dengan \(n-p\) derajat bebas.

  • \(\text{SE}(\hat{\beta_j})\) adalah standar error dari koefisien \(\hat{\beta_j}\), yang menunjukkan seberapa jauh nilai koefisien yang diperkirakan mungkin berbeda dari nilai sebenarnya dalam populasi.

Standar error \(\text{SE}(\hat{\beta_j})\) dihitung sebagai:

\[ \text{SE}(\hat{\beta_j}) = \sqrt{\hat{\sigma}^2 (\mathbf{X}^\top \mathbf{X})^{-1}_{jj}} \]

Di mana \(\hat{\sigma}^2\) adalah estimasi dari varians error.

Sintaks R untuk Selang Kepercayaan

# Selang kepercayaan untuk koefisien model
confint(model)
##                  2.5 %     97.5 %
## (Intercept)  1.7675984  2.1937494
## X[, 2]      -1.2874488 -0.8234525
## X[, 3]       0.3289499  0.7634865
## X[, 4]       1.2198366  1.6653894

Selang Kepercayaan untuk Dugaan Rata-Rata Peubah Respon

Selang kepercayaan untuk rata-rata prediksi pada titik \(x^*\) adalah interval di mana kita memperkirakan rata-rata respons pada nilai tersebut berada, dengan tingkat keyakinan tertentu. Selang kepercayaan untuk rata-rata prediksi dihitung sebagai:

\[ \hat{y}^* \pm t_{\alpha/2, \, n-p} \times \sqrt{\mathbf{x}^{*\top} (\mathbf{X}^\top \mathbf{X})^{-1} \mathbf{x}^* \sigma^2} \]

Di mana:

  • \(\hat{y}^*\) adalah prediksi untuk nilai \(x^*\).

  • \(\mathbf{x}^*\) adalah vektor baris dari nilai-nilai prediktor untuk pengamatan baru.

  • \((\mathbf{X}^\top \mathbf{X})^{-1}\) adalah matriks invers dari \(\mathbf{X}^\top \mathbf{X}\).

Selang kepercayaan ini mengevaluasi ketidakpastian dalam estimasi rata-rata \(y\) pada \(x^*\).

Sintaks R untuk Selang Kepercayaan Dugaan Rata-Rata

# Prediksi dengan selang kepercayaan
new_data <- data.frame(X1 = 0.5, X2 = -1.2, X3 = 0.3)
predict(model, newdata = new_data, interval = "confidence")
##             fit         lwr         upr
## 1    5.35622369  4.82255910  5.88988829
## 2    4.25723345  3.91189662  4.60257028
## 3   -0.18171504 -0.58088781  0.21745772
## 4    2.50004051  2.26482724  2.73525377
## 5    0.72669353  0.42672737  1.02665969
## 6   -0.54112742 -0.97842920 -0.10382564
## 7   -0.07217818 -0.39860672  0.25425035
## 8    1.54702076  0.99679321  2.09724832
## 9    4.87954711  4.45283746  5.30625677
## 10   2.87507908  2.54432685  3.20583130
## 11   0.54647578  0.19921191  0.89373965
## 12   2.28453599  2.01339599  2.55567599
## 13   2.45194822  1.97849317  2.92540326
## 14   1.08902441  0.83656453  1.34148430
## 15   1.41924271  1.02509364  1.81339177
## 16   2.67655295  2.07406625  3.27903965
## 17   0.87651177  0.61581591  1.13720764
## 18   2.66327156  2.07420484  3.25233828
## 19  -1.00716025 -1.41406583 -0.60025467
## 20   0.06693652 -0.38924449  0.52311754
## 21   2.34394820  1.95421927  2.73367712
## 22   2.58472218  2.27742494  2.89201943
## 23   4.39670090  4.00372158  4.78968021
## 24   3.63087655  3.32714037  3.93461273
## 25   3.12290617  2.61022272  3.63558963
## 26   3.49098455  3.00771412  3.97425499
## 27   0.20854345 -0.11806267  0.53514957
## 28   0.82671154  0.54395159  1.10947148
## 29   3.93274597  3.50585488  4.35963707
## 30  -0.84672266 -1.25089240 -0.44255292
## 31   5.14033441  4.56216276  5.71850605
## 32   2.40843078  2.14598981  2.67087175
## 33   1.36793164  1.08257784  1.65328545
## 34  -0.24233775 -0.57025860  0.08558310
## 35  -0.83660590 -1.34503872 -0.32817307
## 36  -0.02813953 -0.51198890  0.45570985
## 37   0.33432248 -0.04036034  0.70900530
## 38   3.05462090  2.76941111  3.33983068
## 39   3.81423511  3.32401333  4.30445690
## 40   0.46610687  0.03499018  0.89722357
## 41   1.95955386  1.56344055  2.35566718
## 42   1.33242489  1.06565135  1.59919842
## 43   4.61574013  4.04391156  5.18756869
## 44  -2.77658000 -3.40569078 -2.14746922
## 45  -0.42736066 -0.88274984  0.02802853
## 46   5.62044066  5.10619370  6.13468762
## 47   1.46179380  1.07514436  1.84844325
## 48   0.88723435  0.42841030  1.34605839
## 49   1.34557188  0.76779659  1.92334716
## 50   2.06599728  1.72160889  2.41038566
## 51   1.60173641  1.29237973  1.91109308
## 52   1.62029829  1.29516711  1.94542947
## 53   1.71123717  1.45553850  1.96693583
## 54   0.11593979 -0.28896042  0.52083999
## 55   4.45974638  4.07083066  4.84866210
## 56   0.09919186 -0.28995321  0.48833693
## 57   5.48199653  5.00476576  5.95922729
## 58   2.07014423  1.79447598  2.34581248
## 59   2.21965409  1.89944663  2.53986156
## 60  -0.66322899 -1.08690954 -0.23954844
## 61   1.40322269  1.03865811  1.76778728
## 62   1.23107847  0.87215040  1.59000653
## 63   1.71206374  1.36756697  2.05656052
## 64   6.70172835  5.88668112  7.51677558
## 65   6.19222697  5.62220765  6.76224629
## 66   4.05577230  3.65838898  4.45315562
## 67   1.66323123  1.37991615  1.94654630
## 68  -0.87350847 -1.34731867 -0.39969827
## 69   0.72872669  0.39759822  1.05985516
## 70   0.14713739 -0.36724252  0.66151729
## 71   3.60031505  3.31174794  3.88888216
## 72   5.84210722  5.24118963  6.44302482
## 73   1.88775208  1.55349256  2.22201161
## 74   1.87895847  1.21280915  2.54510780
## 75   3.52760788  3.18496354  3.87025222
## 76  -0.34462836 -0.71891994  0.02966322
## 77   2.55405111  2.32657730  2.78152491
## 78   3.54621989  3.16840558  3.92403420
## 79   2.64543303  2.39466240  2.89620366
## 80   1.91249585  1.68174835  2.14324335
## 81  -1.01173923 -1.50576571 -0.51771274
## 82   3.32648282  2.92892325  3.72404239
## 83   2.73778881  2.49217678  2.98340084
## 84   0.44457493  0.14601775  0.74313212
## 85   2.25476319  2.03172796  2.47779842
## 86   1.71615926  1.49928222  1.93303630
## 87   1.74811868  1.32944986  2.16678750
## 88   3.93475239  3.51884940  4.35065538
## 89   2.42055155  2.11305207  2.72805103
## 90   0.73789513  0.40622732  1.06956294
## 91   2.73473934  2.33484308  3.13463560
## 92   2.74529390  2.41968702  3.07090077
## 93   3.43253904  3.11558752  3.74949057
## 94   1.32127117  0.95690734  1.68563501
## 95   2.71739644  2.08146504  3.35332784
## 96   3.80135604  3.27931816  4.32339393
## 97   2.69331477  1.98082451  3.40580502
## 98  -2.26921787 -2.80310393 -1.73533180
## 99   1.92588526  1.67523567  2.17653484
## 100  4.21962272  3.74989483  4.68935061

Selang Prediksi untuk Dugaan Peubah Respon

Selang prediksi lebih luas daripada selang kepercayaan karena selang prediksi mencakup ketidakpastian tambahan terkait varians error individual. Selang prediksi untuk suatu observasi baru pada titik \(x^*\) diberikan oleh:

\[ \hat{y}^* \pm t_{\alpha/2, \, n-p} \times \sqrt{\mathbf{x}^{*\top} (\mathbf{X}^\top \mathbf{X})^{-1} \mathbf{x}^* \sigma^2 + \sigma^2} \]

Komponen \(\sigma^2\) tambahan mencerminkan varians tambahan dari error dalam observasi baru yang sebenarnya

Sintaks R untuk Selang Prediksi

# Prediksi dengan selang prediksi
predict(model, newdata = new_data, interval = "prediction")
##             fit         lwr        upr
## 1    5.35622369  3.20184395  7.5106034
## 2    4.25723345  2.14162203  6.3728449
## 3   -0.18171504 -2.30677812  1.9433480
## 4    2.50004051  0.39959307  4.6004879
## 5    0.72669353 -1.38198707  2.8353741
## 6   -0.54112742 -2.67368153  1.5914267
## 7   -0.07217818 -2.18478552  2.0404292
## 8    1.54702076 -0.61152146  3.7055630
## 9    4.87954711  2.74913980  7.0099544
## 10   2.87507908  0.76179935  4.9883588
## 11   0.54647578 -1.56945106  2.6624026
## 12   2.28453599  0.17976259  4.3893094
## 13   2.45194822  0.31168799  4.5922084
## 14   1.08902441 -1.01342420  3.1914730
## 15   1.41924271 -0.70488244  3.5433679
## 16   2.67655295  0.50410171  4.8490042
## 17   0.87651177 -1.22694170  2.9799652
## 18   2.66327156  0.49450376  4.8320394
## 19  -1.00716025 -3.13368942  1.1193689
## 20   0.06693652 -2.06956887  2.2034419
## 21   2.34394820  0.22063880  4.4672576
## 22   2.58472218  0.47498624  4.6944581
## 23   4.39670090  2.27279249  6.5206093
## 24   3.63087655  1.52165636  5.7400967
## 25   3.12290617  0.97362758  5.2721848
## 26   3.49098455  1.34853164  5.6334375
## 27   0.20854345 -1.90409133  2.3211782
## 28   0.82671154 -1.27959028  2.9330134
## 29   3.93274597  1.80230232  6.0631896
## 30  -0.84672266 -2.97273003  1.2792847
## 31   5.14033441  2.97450047  7.3061683
## 32   2.40843078  0.30476031  4.5121012
## 33   1.36793164 -0.73871996  3.4745832
## 34  -0.24233775 -2.35517618  1.8705007
## 35  -0.83660590 -2.98487453  1.3116627
## 36  -0.02813953 -2.17072311  2.1144440
## 37   0.33432248 -1.78627682  2.4549218
## 38   3.05462090  0.94798880  5.1612530
## 39   3.81423511  1.67020350  5.9582667
## 40   0.46610687 -1.66518752  2.5974013
## 41   1.95955386 -0.16493665  4.0840444
## 42   1.33242489 -0.77179047  3.4366402
## 43   4.61574013  2.45159086  6.7798894
## 44  -2.77658000 -4.95656498 -0.5965950
## 45  -0.42736066 -2.56369712  1.7089758
## 46   5.62044066  3.47078857  7.7700927
## 47   1.46179380 -0.66095252  3.5845401
## 48   0.88723435 -1.24983694  3.0243056
## 49   1.34557188 -0.82015628  3.5113000
## 50   2.06599728 -0.04945953  4.1814541
## 51   1.60173641 -0.50830049  3.7117733
## 52   1.62029829 -0.49210897  3.7327056
## 53   1.71123717 -0.39160281  3.8140771
## 54   0.11593979 -2.01020657  2.2420861
## 55   4.45974638  2.33658609  6.5829067
## 56   0.09919186 -2.02401045  2.2223942
## 57   5.48199653  3.34089789  7.6230952
## 58   2.07014423 -0.03521729  4.1755058
## 59   2.21965409  0.10799906  4.3313091
## 60  -0.66322899 -2.79303165  1.4665737
## 61   1.40322269 -0.71561225  3.5220576
## 62   1.23107847 -0.88679394  3.3489509
## 63   1.71206374 -0.40341072  3.8275382
## 64   6.70172835  4.46100165  8.9424551
## 65   6.19222697  4.02855504  8.3558989
## 66   4.05577230  1.93104463  6.1805000
## 67   1.66323123 -0.44314519  3.7696076
## 68  -0.87350847 -3.01384729  1.2668304
## 69   0.72872669 -1.38461196  2.8420653
## 70   0.14713739 -2.00254651  2.2968213
## 71   3.60031505  1.49322579  5.7074043
## 72   5.84210722  3.67009062  8.0141238
## 73   1.88775208 -0.22607941  4.0015836
## 74   1.87895847 -0.31200229  4.0699192
## 75   3.52760788  1.41243429  5.6427815
## 76  -0.34462836 -2.46515856  1.7759018
## 77   2.55405111  0.45445627  4.6536459
## 78   3.54621989  1.42506506  5.6673747
## 79   2.64543303  0.54318660  4.7476795
## 80   1.91249585 -0.18745619  4.0124479
## 81  -1.01173923 -3.15664396  1.1331655
## 82   3.32648282  1.20172218  5.4512435
## 83   2.73778881  0.63615149  4.8394261
## 84   0.44457493 -1.66390569  2.5530556
## 85   2.25476319  0.15564460  4.3538818
## 86   1.71615926 -0.38231395  3.8146325
## 87   1.74811868 -0.38069266  3.8769300
## 88   3.93475239  1.80648327  6.0630215
## 89   2.42055155  0.31078614  4.5303170
## 90   0.73789513 -1.37552809  2.8513183
## 91   2.73473934  0.60954024  4.8599384
## 92   2.74529390  0.63281337  4.8577744
## 93   3.43253904  1.32137528  5.5437028
## 94   1.32127117 -0.79752923  3.4400716
## 95   2.71739644  0.53543335  4.8993595
## 96   3.80135604  1.64982689  5.9528852
## 97   2.69331477  0.48782241  4.8988071
## 98  -2.26921787 -4.42365248 -0.1147833
## 99   1.92588526 -0.17634674  4.0281173
## 100  4.21962272  2.08018390  6.3590615

Pengujian Hipotesis

Pengujian hipotesis dalam konteks regresi linier umumnya dilakukan untuk menentukan apakah ada cukup bukti dalam data untuk menyimpulkan bahwa koefisien regresi \(\beta_j\) berbeda dari nol (tidak signifikan).

Hipotesis nol dan alternatif adalah:

  • \(H_0: \beta_j = 0\) (Koefisien \(\beta_j\) tidak berpengaruh)

  • \(H_a: \beta_j \neq 0\) (Koefisien \(\beta_j\) berpengaruh)

Uji statistik t digunakan untuk menguji hipotesis ini:

\[ t = \frac{\hat{\beta_j}}{\text{SE}(\hat{\beta_j})} \]

Jika nilai \(p\) yang dihasilkan lebih kecil dari tingkat signifikansi yang ditetapkan (misalnya 0,05), maka kita menolak hipotesis nol, yang berarti ada bukti yang cukup untuk mengatakan bahwa \(\beta_j\) signifikan secara statistik.

Sintaks R untuk Pengujian Hipotesis

# Pengujian hipotesis untuk parameter model
summary(model)$coefficients
##               Estimate Std. Error   t value     Pr(>|t|)
## (Intercept)  1.9806739  0.1073437 18.451709 2.476233e-33
## X[, 2]      -1.0554506  0.1168766 -9.030473 1.799878e-14
## X[, 3]       0.5462182  0.1094559  4.990302 2.685950e-06
## X[, 4]       1.4426130  0.1122308 12.853984 1.376966e-22

Contoh Soal

Seorang ekonom ingin mempelajari pengaruh jumlah jam kerja (dalam minggu) terhadap pendapatan bulanan karyawan (dalam ribuan dolar) di sebuah perusahaan teknologi. Dia mengumpulkan data dari 5 karyawan sebagai berikut:

\[ \begin{array}{c|c} \text{Jam Kerja (X)} & \text{Pendapatan Bulanan (Y)} \\ \hline 35 & 4.0 \\ 40 & 4.5 \\ 45 & 5.0 \\ 50 & 6.0 \\ 55 & 6.5 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Pembahasan

1. Estimasi Parameter \(\beta_0\) dan \(\beta_1\) Menggunakan Metode Matriks

Pertama, kita perlu menyusun matriks \(X\) dan vektor \(Y\) berdasarkan data yang diberikan.

Matriks \(X\) dan vektor \(Y\) adalah:

\[ X = \begin{bmatrix} 1 & 35 \\ 1 & 40 \\ 1 & 45 \\ 1 & 50 \\ 1 & 55 \\ \end{bmatrix}, \quad Y = \begin{bmatrix} 4.0 \\ 4.5 \\ 5.0 \\ 6.0 \\ 6.5 \\ \end{bmatrix} \]

Estimasi parameter \(\beta\) dapat dihitung dengan persamaan:

\[ \hat{\beta} = (X'X)^{-1} X'Y \]

Mari kita hitung langkah-langkahnya.

a. Hitung \(X'X\):

\[ X'X = \begin{bmatrix} 1 & 1 & 1 & 1 & 1 \\ 35 & 40 & 45 & 50 & 55 \\ \end{bmatrix} \begin{bmatrix} 1 & 35 \\ 1 & 40 \\ 1 & 45 \\ 1 & 50 \\ 1 & 55 \\ \end{bmatrix} = \begin{bmatrix} 5 & 225 \\ 225 & 10225 \\ \end{bmatrix} \]

b. Hitung \((X'X)^{-1}\):

\[ (X'X)^{-1} = \frac{1}{(5)(10225) - (225)^2} \begin{bmatrix} 10225 & -225 \\ -225 & 5 \\ \end{bmatrix} \]

\[ = \frac{1}{51125 - 50625} \begin{bmatrix} 10225 & -225 \\ -225 & 5 \\ \end{bmatrix} \]

\[ = \frac{1}{500} \begin{bmatrix} 10225 & -225 \\ -225 & 5 \\ \end{bmatrix} \]

\[ = \begin{bmatrix} 20.45 & -0.45 \\ -0.45 & 0.01 \\ \end{bmatrix} \]

c. Hitung \(X'Y\):

\[ X'Y = \begin{bmatrix} 1 & 1 & 1 & 1 & 1 \\ 35 & 40 & 45 & 50 & 55 \\ \end{bmatrix} \begin{bmatrix} 4.0 \\ 4.5 \\ 5.0 \\ 6.0 \\ 6.5 \\ \end{bmatrix} = \begin{bmatrix} 26.0 \\ 1175.0 \\ \end{bmatrix} \]

d. Hitung \(\hat{\beta} = (X'X)^{-1} X'Y\):

\[ \hat{\beta} = \begin{bmatrix} 20.45 & -0.45 \\ -0.45 & 0.01 \\ \end{bmatrix} \begin{bmatrix} 26.0 \\ 1175.0 \\ \end{bmatrix} = \begin{bmatrix} 20.45 \times 26.0 + (-0.45) \times 1175.0 \\ -0.45 \times 26.0 + 0.01 \times 1175.0 \\ \end{bmatrix} = \begin{bmatrix} 4.95 \\ 0.05 \\ \end{bmatrix} \]

Jadi, estimasi parameter regresi adalah \(\hat{\beta_0} = 4.95\) dan \(\hat{\beta_1} = 0.05\).

2. Selang Kepercayaan 95% untuk Koefisien \(\beta_1\)

Untuk menghitung selang kepercayaan untuk \(\beta_1\), kita perlu menghitung varians estimator \(\hat{\beta}\) dan kesalahan standar (standard error) dari \(\hat{\beta_1}\).

a. Hitung Residual Sum of Squares (RSS):

\[ RSS = \sum (Y_i - \hat{Y}_i)^2 \]

Dimana \(\hat{Y} = X\hat{\beta}\):

\[ \hat{Y} = \begin{bmatrix} 1 & 35 \\ 1 & 40 \\ 1 & 45 \\ 1 & 50 \\ 1 & 55 \\ \end{bmatrix} \begin{bmatrix} 4.95 \\ 0.05 \\ \end{bmatrix} = \begin{bmatrix} 4.95 + 35 \times 0.05 \\ 4.95 + 40 \times 0.05 \\ 4.95 + 45 \times 0.05 \\ 4.95 + 50 \times 0.05 \\ 4.95 + 55 \times 0.05 \\ \end{bmatrix} = \begin{bmatrix} 6.7 \\ 7.05 \\ 7.3 \\ 7.55 \\ 7.8 \\ \end{bmatrix} \]

Kemudian:

\[ RSS = (4.0 - 6.7)^2 + (4.5 - 7.05)^2 + (5.0 - 7.3)^2 + (6.0 - 7.55)^2 + (6.5 - 7.8)^2 \]

\[ = (-2.7)^2 + (-2.55)^2 + (-2.3)^2 + (-1.55)^2 + (-1.3)^2 \]

\[ = 7.29 + 6.5025 + 5.29 + 2.4025 + 1.69 = 23.175 \]

b. Hitung estimasi varians \(\sigma^2\):

\[ \hat{\sigma}^2 = \frac{RSS}{n - 2} = \frac{23.175}{5 - 2} = \frac{23.175}{3} = 7.725 \]

c. Hitung varians dan kesalahan standar \(\hat{\beta_1}\):

\[ \text{Var}(\hat{\beta_1}) = \hat{\sigma}^2 (X'X)^{-1}_{22} = 7.725 \times 0.01 = 0.07725 \]

\[ SE(\hat{\beta_1}) = \sqrt{\text{Var}(\hat{\beta_1})} = \sqrt{0.07725} = 0.2780 \]

d. Tentukan selang kepercayaan 95% untuk \(\beta_1\):

Untuk \(n - 2 = 3\), derajat kebebasan, nilai \(t\) kritis untuk 95% kepercayaan adalah sekitar 3.182 (dari tabel distribusi \(t\)).

\[ CI_{95\%} = \hat{\beta_1} \pm t_{(0.025, 3)} \times SE(\hat{\beta_1}) = 0.05 \pm 3.182 \times 0.2780 \]

\[ CI_{95\%} = 0.05 \pm 0.884 \]

\[ CI_{95\%} = (-0.834, 0.934) \]

Jadi, selang kepercayaan 95% untuk \(\beta_1\) adalah \((-0.834, 0.934)\).

Latihan Soal

Soal 1: Pengaruh Pendidikan terhadap Gaji

Seorang ekonom ingin mengkaji pengaruh lama pendidikan (dalam tahun) terhadap gaji bulanan (dalam ribuan dolar) dari para pekerja di sektor swasta. Data yang dikumpulkan dari 6 pekerja adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Lama Pendidikan (X)} & \text{Gaji Bulanan (Y)} \\ \hline 12 & 2.5 \\ 14 & 3.0 \\ 16 & 3.5 \\ 18 & 4.5 \\ 20 & 5.0 \\ 22 & 5.5 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 2: Hubungan Antara Konsumsi Listrik dan Pendapatan Rumah Tangga

Seorang peneliti ingin mengetahui hubungan antara konsumsi listrik bulanan (dalam kWh) dan pendapatan rumah tangga bulanan (dalam ribuan dolar). Data dari 5 rumah tangga adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Konsumsi Listrik (X)} & \text{Pendapatan Bulanan (Y)} \\ \hline 100 & 3.2 \\ 150 & 4.1 \\ 200 & 5.0 \\ 250 & 5.8 \\ 300 & 6.5 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 3: Dampak Iklan Terhadap Penjualan Produk

Seorang manajer pemasaran ingin mempelajari dampak jumlah uang yang dihabiskan untuk iklan (dalam ribuan dolar) terhadap penjualan produk (dalam ribuan unit). Data dari 6 bulan kampanye iklan adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Biaya Iklan (X)} & \text{Penjualan (Y)} \\ \hline 5 & 20 \\ 10 & 25 \\ 15 & 30 \\ 20 & 35 \\ 25 & 40 \\ 30 & 45 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 4: Hubungan Antara Umur dan Pengeluaran untuk Hiburan

Seorang sosiolog ingin mengkaji hubungan antara umur individu (dalam tahun) dan pengeluaran bulanan mereka untuk hiburan (dalam ratusan dolar). Data dari 7 individu adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Umur (X)} & \text{Pengeluaran untuk Hiburan (Y)} \\ \hline 20 & 1.5 \\ 25 & 2.0 \\ 30 & 2.5 \\ 35 & 3.0 \\ 40 & 3.5 \\ 45 & 4.0 \\ 50 & 4.5 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 5: Pengaruh Suku Bunga terhadap Investasi

Seorang analis keuangan ingin mengetahui pengaruh tingkat suku bunga (dalam persen) terhadap jumlah investasi perusahaan (dalam juta dolar). Data dari 6 perusahaan adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Tingkat Suku Bunga (X)} & \text{Jumlah Investasi (Y)} \\ \hline 3 & 10 \\ 4 & 12 \\ 5 & 15 \\ 6 & 18 \\ 7 & 20 \\ 8 & 22 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 6: Efek Populasi Terhadap Tingkat Pengangguran

Seorang ekonom ingin mengetahui pengaruh jumlah populasi (dalam ribuan) terhadap tingkat pengangguran (dalam persen) di beberapa kota. Data dari 6 kota adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Populasi (X)} & \text{Tingkat Pengangguran (Y)} \\ \hline 50 & 4.5 \\ 75 & 5.0 \\ 100 & 5.5 \\ 125 & 6.0 \\ 150 & 6.5 \\ 175 & 7.0 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 7: Pengaruh Harga Rumah terhadap Luas Tanah

Seorang agen real estate ingin mengetahui hubungan antara harga rumah (dalam ribuan dolar) dan luas tanah (dalam meter persegi). Data dari 5 rumah adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Harga Rumah (X)} & \text{Luas Tanah (Y)} \\ \hline 200 & 150 \\ 250 & 175 \\ 300 & 200 \\ 350 & 225 \\ 400 & 250 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 8: Hubungan Antara Jam Belajar dan Nilai Ujian

Seorang guru ingin mengetahui hubungan antara jumlah jam belajar siswa per minggu (X) dan nilai ujian akhir mereka (Y). Data dari 6 siswa adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Jam Belajar (X)} & \text{Nilai Ujian (Y)} \\ \hline 5 & 60 \\ 10 & 70 \\ 15 & 75 \\ 20 & 85 \\ 25 & 90 \\ 30 & 95 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 9: Pengaruh Ukuran Perusahaan terhadap Keuntungan

Seorang analis bisnis ingin mengkaji pengaruh ukuran perusahaan (dalam jumlah karyawan) terhadap keuntungan tahunan (dalam juta dolar). Data dari 5 perusahaan adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Ukuran Perusahaan (X)} & \text{Keuntungan Tahunan (Y)} \\ \hline 50 & 1.5 \\ 100 & 2.0 \\ 150 & 2.5 \\ 200 & 3.0 \\ 250 & 3.5 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

**Pertanyaan

:**

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).

Soal 10: Hubungan Antara Belanja Pemerintah dan Pertumbuhan Ekonomi

Seorang ekonom ingin mempelajari hubungan antara belanja pemerintah (dalam miliaran dolar) dan pertumbuhan ekonomi tahunan (dalam persen). Data dari 6 tahun adalah sebagai berikut:

\[ \begin{array}{c|c} \text{Belanja Pemerintah (X)} & \text{Pertumbuhan Ekonomi (Y)} \\ \hline 100 & 2.0 \\ 150 & 2.5 \\ 200 & 3.0 \\ 250 & 3.5 \\ 300 & 4.0 \\ 350 & 4.5 \\ \end{array} \]

Model regresi yang digunakan adalah \(Y = \beta_0 + \beta_1 X + \varepsilon\).

Pertanyaan:

  1. Tentukan estimasi untuk parameter \(\beta_0\) dan \(\beta_1\) menggunakan metode matriks.
  2. Hitung selang kepercayaan 95% untuk koefisien \(\beta_1\).