Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang
Fakultas : Sains dan Teknologi
Jurusan : Teknik Informatika
Mata Kuliah : Linier Algebra
suatu metode yang digunakan untuk melihat hubungan antar satu variabel independent (bebas) dan mempunyai hubungan garis lurus dengan variabel dependennya (terikat). Sebuah variabel hasil observasi yang diperoleh sangat mungkin dipengaruhi oleh variabel lainnya, misalkan tinggi badan dan berat badan seseorang. Untuk suatu tinggi tertentu ada besaran berat badan yang mempengaruhi, demikian juga sebaliknya. Contoh lain misalnya produksi padi yang dipengaruhi oleh luas lahan yang ditanami, jenis pupuk yang dipakai, banyaknya pupuk yang dipakai dll.
Analisis regresi linier berganda adalah hubungan secara linear antara dua atau lebih variabel independen (X1, X2,….Xn) dengan variabel dependen (Y). maka data yang digunakan biasanya berskala interval atau rasio.
Contoh Dataset Linear Sederhana:
y1 <- c (10, 11, 12, 13, 14, 15, 16, 17)
x <- c (2, 3, 4, 5, 6, 7, 8)
Contoh Dataset Linier Ganda:
y <- c (5, 6, 2, 4, 1, 6, 7, 3, 6, 2)
X1 <- c (83, 100, 70, 64, 87, 90, 84, 59, 94, 79 )
X2 <- c (12, 23, 40, 10, 35, 20, 32, 21, 20, 10)
length (y1)
## [1] 8
length (x)
## [1] 7
length (y)
## [1] 10
length (X1)
## [1] 10
length (X2)
## [1] 10
regresisederhana <- lm(y ~ X1)
summary(regresisederhana)
##
## Call:
## lm(formula = y ~ X1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.6737 -0.9237 0.5895 1.0105 2.5632
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -2.19474 4.01339 -0.547 0.599
## X1 0.07895 0.04897 1.612 0.146
##
## Residual standard error: 1.933 on 8 degrees of freedom
## Multiple R-squared: 0.2452, Adjusted R-squared: 0.1509
## F-statistic: 2.599 on 1 and 8 DF, p-value: 0.1456
regresiganda <- lm(y ~ X1 + X2)
summary(regresiganda)
##
## Call:
## lm(formula = y ~ X1 + X2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1033 -0.3136 0.4096 0.6266 3.0042
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.43524 4.26328 -0.337 0.746
## X1 0.08238 0.05067 1.626 0.148
## X2 -0.04653 0.06357 -0.732 0.488
##
## Residual standard error: 1.992 on 7 degrees of freedom
## Multiple R-squared: 0.2989, Adjusted R-squared: 0.09858
## F-statistic: 1.492 on 2 and 7 DF, p-value: 0.2886
anova(regresiganda)
Disini saya akan menganalisis variasi usia mobil (y) dikaitkan dengan harga mobil (X1) dan peminat (X2) untuk di kalangan remaja.
Variable Terikat : Usia Mobil,
Variable Bebas : Harga Mobil dan Peminat
Data usia mobil (tahun), harga ($US) dan pemiat (orang) yang diperoleh untuk setiap kalangan remaja.
Taksiran parameter model dapat diperoleh dari “Estimate”
ksi=b0+b1x1+b2x2
$yprediksi=b0+b1x1+b2x2$
dimana b0 = -1.43524 , b1 = 0.08238 dan b2 = -0.04653 ,Sehingga Persamaan Regresi
yprediksi = 56.2721 + 0.08238 x1 - 0.04653 x2, Kita menggunakan taraf kesignifikanan alpha \(a\) = 5%.
Kesignifikanan Model: Uji F
Nilai F -statistic = 2.599 dengan nilai p-value = 0.1456 memberikan informasi tentang kesignifikanan model. Karena nilai p-value < \(a\), ini berarti model signifikan secara statistis.
Kriteria kesimpulan:
Pengujian signifikan : p-value < \(a\) Pengujian tidak signifikan : p-value >= \(a\)
Jadi, penaksiran, peramalan, atau inferensi yang lain dapat dilakukan dengan menggunakan model regresi tersebut karena model signifikan
Daya ramal model:
R2(Koefisien Determinasi) Multiple R-squared = 0.2989 Artinya model mempunyai daya ramal 29.89% (variasi Y dapat dijelaskan oleh model).
Kemampuan variable independen dalam menjelaskan varians dari variable dependen sebesar 29.89%,
sisanya 66% varians variable dependen dijelaskan oleh faktor lain yang tidak terdapat dalam model regresi tersebut.
Nilai R-squared terletak antara 0 dan 1.
Adjusted R-squared = 0.1509 , artinya tinggi dan umur secara bersama sama dapat menjelaskan sekitar 15.09% variasi berat (Y).
R-squared
Nilai R-squared akan meningkat jika ada penambahan variable independen dalam model. akibatnya, hasil bisa bias jika peneliti menambahkan sembarang peubah independent. Adjusted R square Interpretasinya sama dengan R-squared.
nilainya dapat naik turun tergantung dari hubungan antara variable independen tambahan dengan variable independennya.
Umumnya peneliti menyarankan menggunakan Adjusted R square.
Jika ingin membandingkan model gunakan Adjusted R square.
Kesignifikanan masing masing variable bebas
Hanya variable X2 yang signifikan karena nilai t value=1.612 dengan nilai p= 0.146 < \(alpha\) koefisien regresi untuk X2, yaitu b2=-0.04653 dapat diinterpretasi bahwa:
Seiring dengan bertambahnya peminat (X2) mobil setiap tahun, maka usia (y) dan harga mobil (X1) dapat bertambah sebesar 4.01339 peminat juga tiap tahunnya.