Menganalisis dengan R

Menampilkan Data Jika data yang diteliti relative sedikit, data bisa langsung diketik dengan catatan bahwa setiap variabel harus memiliki jumlah data yang sama.

Contoh Dataset Regresi

Linear Sederhana

y1 <- c (10, 9, 27, 22, 7, 16, 93, 63)
x <- c (1, 4, 2, 3, 5, 7, 8, 6)

Linear Ganda

y <- c (22, 21, 32, 27, 36, 31, 11, 25, 39, 34, 10, 42)
X1 <- c (17, 25, 69, 48, 22, 63, 7, 21, 63, 32, 72, 97 )
X2 <- c (10, 7, 11, 8, 14, 8, 9, 12, 17, 9, 6, 15)

Mengecek jumlah

length (y1)
## [1] 8
length (x)
## [1] 8
length (y)
## [1] 12
length (X1)
## [1] 12
length (X2)
## [1] 12

Analisis Regresi Linear Sederhana

regresisederhana <- lm(y1 ~ x)
  summary(regresisederhana)
## 
## Call:
## lm(formula = y1 ~ x)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -34.131 -20.449   4.381  16.679  35.167 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)   -3.786     20.613  -0.184    0.860
## x              7.702      4.082   1.887    0.108
## 
## Residual standard error: 26.45 on 6 degrees of freedom
## Multiple R-squared:  0.3724, Adjusted R-squared:  0.2678 
## F-statistic:  3.56 on 1 and 6 DF,  p-value: 0.1081

Analisis Regresi Linear Ganda

regresiganda <- lm(y ~  X1 + X2)
   summary(regresiganda)
## 
## Call:
## lm(formula = y ~ X1 + X2)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -11.2311  -3.1940   0.5249   3.8763  10.8246 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  1.74338    7.13049   0.244   0.8123  
## X1           0.10263    0.07785   1.318   0.2200  
## X2           2.01644    0.63938   3.154   0.0117 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.023 on 9 degrees of freedom
## Multiple R-squared:  0.6129, Adjusted R-squared:  0.5269 
## F-statistic: 7.126 on 2 and 9 DF,  p-value: 0.01396
anova(regresiganda)
## Analysis of Variance Table
## 
## Response: y
##           Df Sum Sq Mean Sq F value  Pr(>F)  
## X1         1 212.43  212.43  4.3064 0.06779 .
## X2         1 490.62  490.62  9.9460 0.01167 *
## Residuals  9 443.95   49.33                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Contoh Model Dataset Regresi Linear Ganda

Kita akan meneliti variasi berat badan (y) dikaitkan dengan tinggi badan (X1) dan umur (X2) untuk anak-anak yang memiliki masalah atau kekurangan gizi.

  1. Peubah terikat: berat badan,

  2. Peubah Bebas : tinggi badan dan umur

  3. Andaikan bahwa sebuah sampel acak terdiri dari 12 anak yang mengunjungi sebuah klinik.

  4. berat (kg), tinggi (cm), dan umur (tahun) diperoleh untuk setiap anak .

Interpretasi Hasil Analisis Regresi Ganda

Taksiran parameter model dapat diperoleh dari “Estimate”

yprediksi=b0+b1x1+b2x2

dimana b0 = 19.608816 , b1 = -0.009868 dan b2 = 1.069854,Sehingga Persamaan Regresi

yprediksi = 56.2721 -0.009868 x1 + 1.069854 x2, Kita menggunakan taraf kesignifikanan alpha (a) = 5%.

Kesignifikanan Model: Uji

NilaiF -statistic = 2.336dengan nilai p-value = 0.1523 memberikan informasi tentang kesignifikanan model. Karena nilai p-value < a, ini berarti model signifikan secara statistis.

Kriteria kesimpulan:

Pengujian signifikan : p-value < a Pengujian tidak signifikan : p-value >= a

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat dilakukan dengan menggunakan model regresi tersebut karena model signifikan

Daya ramal model:

R2(Koefisien Determinasi) Multiple R-squared = 0.3417 Artinya model mempunyai daya ramal 34.17% (variasi Y dapat dijelaskan oleh model).

Kemampuan variable independen dalam menjelaskan varians dari variable dependen sebesar 34.17%,

sisanya 66% varians variable dependen dijelaskan oleh faktor lain yang tidak terdapat dalam model regresi tersebut.

NilaiR-squared terletak antara 0 dan 1.

Adjusted R-squared = 0.1955 , artinya tinggi dan umur secara bersama sama dapat menjelaskan sekitar 19,55% variasi berat (Y).

R-squared

Nilai R-squared akan meningkat jika ada penambahan variable independen dalam model. akibatnya, hasil bisa bias jika peneliti menambahkan sembarang peubah independent.

Adjusted R square

  1. sama dengan R-squared.

  2. nilainya dapat naik turun tergantung dari hubungan antara variable independen tambahan dengan variable independennya.

  3. peneliti menyarankan menggunakan Adjusted R square.

  4. Jika ingin membandingkan model gunakan Adjusted R square.

Kesignifikanan masing masing peubah bebas

Hanya peubah X2 yang signifikan karena nilai t value=2.116 dengan nilai p=0.0635 < alpha koefisien regresi untuk X2, yaitu b2=1.069854 dapat diinterpretasi bahwa:

Seiring dengan bertambahnya umur (X2) anak-anak setiap tahun, maka berat (y) dan tinggi (X1) dapat bertambah sebesar 1.069854 kg/cm juga tiap tahunnya.