Pengertian Analisis Regresi

Analisis Regresi merupakan salah satu analisis yang bertujuan untuk mengetahui pengaruh suatu variable terhadap variable lainnya. Dalam analisis regresi variable yang mempengaruhi disebut independent variable dan variable yang dipengaruhi disebut dependent variable. Jika dalam persamaan regresi hanya terdapat satu variable bebas dan satu variable terikat maka disebut persamaan regresi sederhana sedangkan jjika variable bebasnya lebih dari satu maka disebut persamaan regresi berganda.

Menampilkan Data

Regrensi Linear Sederhana
y1 <- c (51, 52, 53,54, 55, 56, 57, 58, 59, 60)
x <- c (61, 62, 63, 64, 65, 66, 67, 68, 69,70)
Regrensi Linear Ganda
y <- c (51, 52, 53, 27, 31, 43, 72, 37, 28, 13, 35)
X1 <- c (47, 45, 41, 58, 42, 23, 47, 11, 43, 52, 32)
X2 <- c (9, 23, 11, 19, 13, 9, 18, 22, 37, 19, 21)

Mengecheck Jumlah Data

length (y1)
## [1] 10
length (x)
## [1] 10
length (y)
## [1] 11
length (X1)
## [1] 11
length (X2)
## [1] 11

Menganalisis Regresi Linear Sederhana

sederhana <- lm(y1 ~ x)
  summary(sederhana)
## Warning in summary.lm(sederhana): essentially perfect fit: summary may be
## unreliable
## 
## Call:
## lm(formula = y1 ~ x)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -1.350e-14 -2.166e-15  1.403e-15  3.924e-15  5.671e-15 
## 
## Coefficients:
##               Estimate Std. Error    t value Pr(>|t|)    
## (Intercept) -1.000e+01  4.300e-14 -2.326e+14   <2e-16 ***
## x            1.000e+00  6.558e-16  1.525e+15   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.957e-15 on 8 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:      1 
## F-statistic: 2.325e+30 on 1 and 8 DF,  p-value: < 2.2e-16

Menganalisis Regresi Linear Ganda

ganda <- lm(y ~  X1 + X2)
summary(ganda)
## 
## Call:
## lm(formula = y ~ X1 + X2)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -25.839  -7.816  -3.029   6.951  32.164 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept) 54.56952   20.63947   2.644   0.0295 *
## X1          -0.07465    0.40508  -0.184   0.8584  
## X2          -0.62360    0.67483  -0.924   0.3825  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 17.17 on 8 degrees of freedom
## Multiple R-squared:  0.1015, Adjusted R-squared:  -0.1231 
## F-statistic: 0.4518 on 2 and 8 DF,  p-value: 0.6518
anova(ganda)
## Analysis of Variance Table
## 
## Response: y
##           Df  Sum Sq Mean Sq F value Pr(>F)
## X1         1   14.62  14.622  0.0496 0.8293
## X2         1  251.63 251.631  0.8539 0.3825
## Residuals  8 2357.38 294.673

Penaksiran Hasil Parameret Model

Penaksiran Hasil Parameret Model dapat diperoleh dari "Estimate"

yprediksi=b0+b1x1+b2x2

Dimana b0 = 19.608816 , b1 = -0.009868 dan b2 = 1.069854,Sehingga Persamaan Regresi

yprediksi = 56.2721 -0.009868 x1 + 1.069854 x2, Kita menggunakan taraf kesignifikanan alpha (a) = 5%.

INTERPRETASI HASIL ANALISIS REGRESI LINIER

Kesignifikanan Model

Kesignifikanan Model: Uji F
Nilai F -statistic = 2.336 dengan nilai p-value = 0.1523 memberikan informasi tentang kesignifikanan model. Karena nilai p-value < a, ini berarti model signifikan secara statistis.

Kriteria Kesimpulan

Pengujian signifikan : p-value < a Pengujian tidak signifikan : p-value >= a

Jadi, penaksiran, peramalan, atau inferensi yang lain dapat dilakukan dengan menggunakan model regresi tersebut karena model signifikan

Daya Ramal Model

R2(Koefisien Determinasi) Multiple R-squared = 0.3417 Artinya model mempunyai daya ramal 34.17% (variasi Y dapat dijelaskan oleh model).

Kemampuan variable independen dalam menjelaskan varians dari variable dependen sebesar 34.17%,

sisanya 66% varians variable dependen dijelaskan oleh faktor lain yang tidak terdapat dalam model regresi tersebut.

*Nilai R-squared terletak antara 0 dan 1.

*Adjusted R-squared = 0.1955 , artinya tinggi dan umur secara bersama sama dapat menjelaskan sekitar 19,55% variasi berat (Y).

R-squared

Nilai R-squared akan meningkat jika ada penambahan variable independen dalam model. akibatnya, hasil bisa bias jika peneliti menambahkan sembarang peubah independent.

Adjusted R square

*Interpretasinya sama dengan R-squared.

*Nilainya dapat naik turun tergantung dari hubungan antara variable independen tambahan dengan variable independennya.

*Umumnya peneliti menyarankan menggunakan Adjusted R square.

*Jika ingin membandingkan model gunakan Adjusted R square.

Kesignifikanan masing masing perubah bebas

Hanya peubah X2 yang signifikan karena nilai t value=2.116 dengan nilai p=0.0635 < alpha koefisien regresi untuk X2, yaitu b2=1.069854 dapat diinterpretasi bahwa:

Seiring dengan bertambahnya umur (X2) anak-anak setiap tahun, maka berat (y) dan tinggi (X1) dapat bertambah sebesar 1.069854 kg/cm juga tiap tahunnya.