Dosen Pengampu : Prof. Dr. Suhartono,M.Kom.

Lembaga : UIN Maulana Malik Ibrahim Malang

Jurusan : Teknik Informatika

1 Pengertian Analisis regresi

Analisis regresi merupakan suatu metode atau teknik analisis hipotesis penelitian untuk menguji ada tidaknya perngaruh antara variabel satu dengan variabel lain, yang dinyatakan dalam bentuk persamaan matematik (regresi).

Terdapat dua jenis dasar regresi yaitu, regresi linear sederhana dan regresi linear berganda. Kalau regresi linear sederhana menggunakan satu variabel independen untuk menjelaskan atau memprediksi hasil dari variabel dependen Y.

Sedangkan regresi linear multiples atau berganda berfungsi untuk mencari pengaruh dari dua atau lebih variabel independent (variabel bebas atau X) terhadap variabel dependent (variabel terikat Y).

Dengan demikian secara sederhana dapat dikatakan bahwa, apabila kita ingin mengetahui ada tidaknya pengaruh satu variabel X terhadap variabel Y maka digunakan analisis regresi sederhana. Sementara apabila kita ingin mengetahui pengaruh dua variabel X atau lebih terhadap variabel Y maka digunakan analisis regresi linear ganda (multiples).

2 Menganalisis Dengan R

2.1 Contoh Menampilkan Data

Contoh Data set Regresi Linear Sederhana

y1 <- c (31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 41)
x <- c (46, 45, 49, 58, 44, 63, 47, 61, 53, 53, 42, 67 )

Contoh Data set Regresi Linear Ganda

y <- c (43, 26, 39, 38, 37, 33, 54, 27, 38, 36, 25, 33)
X1 <- c (47, 45, 49, 58, 42, 63, 47, 61, 53, 52, 42, 67 )
X2 <- c (7, 6, 13, 9, 16, 8, 15, 12, 17, 9, 11, 11)

2.1.1 Pengecekan Jumlah Data

length (y1)

## [1] 12

length (x)

## [1] 12

length (y)

## [1] 12

length (X1)

## [1] 12

length (X2)

## [1] 12

3 Analisis Regresi Linear Sederhana

#analisis Regresilinier
regresiS <- lm(y1 ~ x)
  summary(regresiS)

## 
## Call:
## lm(formula = y1 ~ x)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.5147 -3.0124  0.0596  2.4900  6.0549 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  28.9638     6.6469   4.358  0.00143 **
## x             0.1424     0.1256   1.134  0.28328   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.432 on 10 degrees of freedom
## Multiple R-squared:  0.1139, Adjusted R-squared:  0.02532 
## F-statistic: 1.286 on 1 and 10 DF,  p-value: 0.2833

4 Analisis Regresi Linear Ganda

#analisis Regresilinier Ganda
regresiG <- lm(y ~  X1 + X2)
   summary(regresiG)

## 
## Call:
## lm(formula = y ~ X1 + X2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -11.5219  -4.1555  -0.3114   2.5584  14.8015 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept) 31.66744   18.77363   1.687    0.126
## X1          -0.08871    0.30057  -0.295    0.775
## X2           0.78004    0.70650   1.104    0.298
## 
## Residual standard error: 8.247 on 9 degrees of freedom
## Multiple R-squared:  0.1382, Adjusted R-squared:  -0.0533 
## F-statistic: 0.7217 on 2 and 9 DF,  p-value: 0.5121

anova(regresiG)

 

 

Df

<int>

Sum Sq

<dbl>

Mean Sq

<dbl>

F value

<dbl>

Pr(>F)

<dbl>
X1 1 15.25562 15.25562 0.2243144 0.6470498
X2 1 82.90475 82.90475 1.2190090 0.2981982
Residuals 9 612.08963 68.00996 NA NA

3 rows

5 Interpretasi Hasil Analisis Regresi

Taksiran parameter model dapat diperoleh dari “Estimate”

𝑦prediksi = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 dimana

𝑏0 =1,9393, 𝑏1 =0,4231, dan 𝑏2 =0,8861

Sehingga Persaman Regresi :

𝑦prediksi = 1,9393 + 0,4231𝑥1 + 0,8861 𝑥2 Kita menggunakan taraf kesignifikanan alpha = 5%.

5.1 Kesignifikanan Model: Uji F

Nilai F -statistic = 2.336 dengan nilai p-value = 0.1523 memberikan informasi tentang kesignifikanan model. Karena nilai p-value < a, ini berarti model signifikan secara statistis.

5.2 Kriteria Kesimpulan

Pengujian signifikan : p-value < a Pengujian tidak signifikan : p-value >= a

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat dilakukan dengan menggunakan model regresi tersebut karena model signifikan

5.3 Daya ramal model

R2(Koefisien Determinasi) Multiple R-squared = 0.3417 Artinya model mempunyai daya ramal 34.17% (variasi Y dapat dijelaskan oleh model).

Kemampuan variable independen dalam menjelaskan varians dari variable dependen sebesar 34.17%,

sisanya 66% varians variable dependen dijelaskan oleh faktor lain yang tidak terdapat dalam model regresi tersebut.

  1. Nilai R-squared terletak antara 0 dan 1.

  2. Adjusted R-squared = 0.1955 , artinya tinggi dan umur secara bersama sama dapat menjelaskan sekitar 19,55% variasi berat (Y).

5.4 Nilai R-squared

  • Nilai R-squared akan meningkat jika ada penambahan variable independen dalam model. akibatnya, hasil bisa bias jika peneliti menambahkan sembarang peubah independent.

5.5 Adjusted R square

  • Interpretasinya sama dengan R-squared.

  • nilainya dapat naik turun tergantung dari hubungan antara variable independen tambahan dengan variable independennya.

  • Umumnya peneliti menyarankan menggunakan Adjusted R square.

  • Jika ingin membandingkan model gunakan Adjusted R square.

5.6 Kesignifikanan masing masing perubah bebas

Hanya peubah X2 yang signifikan karena nilai t value=2.116 dengan nilai p=0.0635 < alpha koefisien regresi untuk X2, yaitu b2=1.069854 dapat diinterpretasi bahwa:

Seiring dengan bertambahnya umur (X2) anak-anak setiap tahun, maka berat (y) dan tinggi (X1) dapat bertambah sebesar 1.069854 kg/cm juga tiap tahunnya.

6 Daftar pustaka

https://rpubs.com/suhartono-uinmaliki/871813

https://www.jojonomic.com/blog/analisis-regresi/