Dosen Pengampu : Prof. Dr. Suhartono, M.Kom

Lembaga : Universitas Islam Negeri Maulana Malik Ibrahim Malang

Fakultas : Sains dan Teknologi

Jurusan : Teknik Informatika

Kelas : (C) Linear Algebra

NIM : 210605110035

Menganalisis dengan R

a.) Menampilkan Data

Jika banyak data sedikit yang ditampilkan, bisa langsung diketik pada syntax dengan syarat kedua variable memiliki jumlah data yang sama.

Contoh DataSet Regresi Linear Sederhana

y <- c (16, 17, 18, 19, 20)
x <- c (1, 2, 3, 4, 5)

Contoh DataSet Regresi Linear Ganda

y1 <- c (91, 92, 93, 94, 95, 96, 97, 98, 99, 100)
x1 <- c (21, 22, 23, 24, 25, 26, 27, 28, 29, 30)
x2 <- c (1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

b.) Mengecek Jumlah Data

length (y)
## [1] 5
length (x)
## [1] 5
length (y1)
## [1] 10
length (x1)
## [1] 10
length (x2)
## [1] 10

c.) Mengecek Jumlah Data

Sederhana <- lm(y ~ x)
  summary(Sederhana)
## Warning in summary.lm(Sederhana): essentially perfect fit: summary may be
## unreliable
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##          1          2          3          4          5 
## -1.668e-15  2.011e-15  3.764e-16 -1.144e-16 -6.051e-16 
## 
## Coefficients:
##              Estimate Std. Error   t value Pr(>|t|)    
## (Intercept) 1.500e+01  1.641e-15 9.139e+15   <2e-16 ***
## x           1.000e+00  4.948e-16 2.021e+15   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.565e-15 on 3 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 4.084e+30 on 1 and 3 DF,  p-value: < 2.2e-16
Ganda <- lm(y1 ~  x1 + x2)
   summary(Ganda)
## Warning in summary.lm(Ganda): essentially perfect fit: summary may be unreliable
## 
## Call:
## lm(formula = y1 ~ x1 + x2)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -2.896e-14 -3.940e-15  2.352e-15  7.644e-15  1.215e-14 
## 
## Coefficients: (1 not defined because of singularities)
##              Estimate Std. Error   t value Pr(>|t|)    
## (Intercept) 7.000e+01  3.578e-14 1.956e+15   <2e-16 ***
## x1          1.000e+00  1.394e-15 7.172e+14   <2e-16 ***
## x2                 NA         NA        NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.266e-14 on 8 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 5.143e+29 on 1 and 8 DF,  p-value: < 2.2e-16

Contoh Model Dataset Regresi Linear Ganda

Permisalan menghitung berat badan dan tinggi badan untuk meneliti seseorang memiliki masalah atau kekurangan gizi.

  • Variable terikat : berat badan

  • Variable bebas : tinggi badan dan umur

  • Jumlah sample : 12 orang

  • Data berat (kg), tinggi (cm), dan umur (tahun)

Interpretasi Hasil Analisis Regresi Ganda

Taksiran parameter model dapat diperoleh dari “Estimate”

𝑦prediksi=𝑏0+𝑏1𝑥1+𝑏2𝑥2

dimana b0 = 19.608816 , b1 = -0.009868 dan b2 = 1.069854,Sehingga Persamaan Regresi

yprediksi = 56.2721 -0.009868 x1 + 1.069854 x2, Kita menggunakan taraf kesignifikanan alpha (a ) = 5%.

Kesignifikanan Model : Uji F

Nilai F -statistic = 2.336 dengan nilai p-value = 0.1523 memberikan informasi tentang kesignifikanan model. Karena nilai p-value < a , ini berarti model signifikan secara statistis.

Kriteria kesimpulan :

Pengujian signifikan : p-value < a

Pengujian tidak signifikan : p-value >= a

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat dilakukan dengan menggunakan model regresi tersebut karena model signifikan

Daya ramal model :

R2(Koefisien Determinasi) Multiple R-squared = 0.3417 Artinya model mempunyai daya ramal 34.17% (variasi Y dapat dijelaskan oleh model).

Kemampuan variable independen dalam menjelaskan varians dari variable dependen sebesar 34.17%,

sisanya 66% varians variable dependen dijelaskan oleh faktor lain yang tidak terdapat dalam model regresi tersebut.

  • Nilai R-squared terletak antara 0 dan 1.

  • Adjusted R-squared = 0.1955 , artinya tinggi dan umur secara bersama sama dapat menjelaskan sekitar 19,55% variasi berat (Y).

R-squared

  • Nilai R-squared akan meningkat jika ada penambahan variable independen dalam model. akibatnya, hasil bisa bias jika peneliti menambahkan sembarang peubah independent.

Adjusted R square

  • Interpretasinya sama dengan R-squared.

  • nilainya dapat naik turun tergantung dari hubungan antara variable independen tambahan dengan variable independennya.

  • Umumnya peneliti menyarankan menggunakan Adjusted R square.

  • Jika ingin membandingkan model gunakan Adjusted R square.

Kesignifikanan masing masing peubah bebas

Hanya peubah X2 yang signifikan karena nilai t value=2.116 dengan nilai p=0.0635 < alpha koefisien regresi untuk X2, yaitu b2=1.069854 dapat diinterpretasi bahwa:

Seiring dengan bertambahnya umur (X2) anak-anak setiap tahun, maka berat (y) dan tinggi (X1) dapat bertambah sebesar 1.069854 kg/cm juga tiap tahunnya.

Referensi

https://rpubs.com/suhartono-uinmaliki/871813

https://www.researchgate.net/publication/348929450_ANALISIS_REGRESI_LINEAR_GANDA_DENGAN_SOFTWARE_R