Regresi Linier Sederhana

Data yang akan digunakan pada metode regresi linier sederhana adalah data sekunder tentang pengaruh lama belajar terhadap nilai IPK mahasiswa Statistika ITS dengan IPK sebagai variabel respon dan lama belajar sebagai variabel prediktor. Data disajikan dalam tabel sebagai berikut.

No IPK (Y) Lama Belajar (X)
1 2,30 1
2 3,27 2
3 3,63 3
4 3,42 3
5 3,80 5
6 3,67 4
7 3,38 2
8 3,09 1
9 3,45 3
10 3,36 1
11 3,19 3
12 3,13 4
13 3,27 3
14 3,44 3
15 3,20 2

Data diatas akan di analisis statistik sederhana meliputi statistika deskriptif, visualisasi data, analisis korelasi, dan analisis regresi linier. Berikut analisis pada data nilai IPK dan lama belajar mahasiswa Statistika ITS

Statistika Deskriptif

Statistika deskriptif yang akan digunakan adalah nilai minimum, quartil 1, median, rata-rata, quartil 3, dan nilai maksimum. Berikut hasil analisa statistika deskriptif pada data nilai IPK dan lama belajar:

data <- read.csv("E:/Data_Regresi.csv", header=TRUE)
summary(data)
##       IPK         Lama_Belajar  
##  Min.   :2.300   Min.   :1.000  
##  1st Qu.:3.195   1st Qu.:2.000  
##  Median :3.360   Median :3.000  
##  Mean   :3.307   Mean   :2.667  
##  3rd Qu.:3.445   3rd Qu.:3.000  
##  Max.   :3.800   Max.   :5.000

Dari statistika deskriptif diatas dapat diketahui bahwa rata-rata IPK mahasiswa Statistika ITS sebesar 3,307, dengan nilai IPK terbesar adalah 3,8 dan nilai IPK terkecil adalah 2,3. Median nilai IPK mahasiswa Statistika ITS sebesar 3,307. Rata-rata lama belajar mahasiswa Statistika ITS sebesar 2,67 jam, dengan lama belajar terbesar adalah 5 jam dan lama belajar terkecil adalah 1 jam. Median lama belajar mahasiswa Statistika ITS adalah 3 jam

Visualisasi Data

Visualisasi data yang akan digunakan adalah histogram, scatterplot, dan boxplot. Berikut hasil visualisasi data pada data nilai IPK dan lama belajar:

par(mfrow=c(2,2))
hist(data$IPK,main="Histogram IPK",xlab="IPK", las=1)
hist(data$Lama_Belajar,main="Histogram Lama Belajar", xlab="Lama Belajar", las=1)
boxplot(data$Lama_Belajar, data$IPK, main="Boxplot IPK vs Lama Belajar", names=c("Lama Belajar","IPK"))
plot(data$Lama_Belajar, data$IPK, main="Scatterplot IPK vs Lama Belajar",xlab="Lama Belajar",ylab="IPK", pch=20,las=1)
abline(lm(data$IPK~data$Lama_Belajar),col="red")

Dari visualisasi diatas dapat diketahui bahwa histogram IPK memiliki bentuk seperti lonceng yang mengindikasikan bahwa secara visual nilai IPK mengikuti distribusi normal, sedangkan histogram lama belajar memiliki bentuk yang skewness ke kanan yang artinya ada nilai yang besar namun kebanyakan nilainya kecil. Hasil scatterplot menunjukkan bahwa terdapat korelasi positif yang kuat antara variabel Lama Belajar dengan variabel IPK. Jika waktu Lama Belajar meningkat maka nilai IPK juga meningkat, begitu juga sebaliknya jika waktu Lama Belajar menurun maka nilai IPK juga akan menurun. Hasil boxplot dapat diketahui bawah terdapat data outlier pada variabel IPK dan terdapat data outlier juga pada variabel lama belajar.

Analisis Korelasi

Pengujian korelasi dilakukan untuk mengetahui bagaimana hubungan antara dua variabel. Berikut adalah uji korelasi antara variabel IPK dan variabel Lama Belajar

Lama_Belajar=data$Lama_Belajar
IPK=data$IPK
cor.test(Lama_Belajar, IPK)
## 
##  Pearson's product-moment correlation
## 
## data:  Lama_Belajar and IPK
## t = 2.9467, df = 13, p-value = 0.01134
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.1783640 0.8647499
## sample estimates:
##       cor 
## 0.6328077

Hipotesis

\(\text{H}_0: \rho_{xy} = 0\) (Tidak ada korelasi antara variabel Lama Belajar dengan IPK)

\(\text{H}_1: \rho_{xy}\) \(\neq\) \(0\) (Terdapat korelasi antara variabel Lama Belajar dengan IPK)

Taraf Signifikansi

\(\alpha =5\%\)

Daerah Penolakan

Tolak \(\text{H}_0\) jika \(\text{p-value} \leq \alpha\) atau \(T\) > \(T_{\alpha/2;n-1}\)

Statistik Uji

\(T\) = 2.947 \(T_{\alpha/2;n-1}\) = 2.145

Keputusan

Tolak \(\text{H}_0\), karena \(T\)(2.947) > \(T_{\alpha/2;n-1}\)(2.145). Jadi dapat disimpulkan bahwa terdapat korelasi antara variabel Lama Belajar dengan IPK.

NILAI KORELASI

\(\rho_{xy} = 0.6328\)

Nilai korelasi sebesar 0.6328 menunjukkan bahwa terdapat korelasi positif yang kuat antara variabel Lama Belajar dengan variabel IPK. Jika waktu Lama Belajar meningkat maka nilai IPK juga meningkat, begitu juga sebaliknya jika waktu Lama Belajar menurun maka nilai IPK juga akan menurun.

Analisis Regresi

Model_Regresi=summary(lm(IPK~Lama_Belajar))
Model_Regresi
## 
## Call:
## lm(formula = IPK ~ Lama_Belajar)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.69776 -0.04078  0.07155  0.10422  0.36224 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    2.8124     0.1823  15.427 9.76e-10 ***
## Lama_Belajar   0.1853     0.0629   2.947   0.0113 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2766 on 13 degrees of freedom
## Multiple R-squared:  0.4004, Adjusted R-squared:  0.3543 
## F-statistic: 8.683 on 1 and 13 DF,  p-value: 0.01134

Model Regresi

Model regresi yang didapat adalah sebagai berikut. \(\hat{y}\) = 2.8124 + 0.1853\(x\)

Nilai \(R^{2}\)

\(R^{2}\) = 0.3543

Nilai sebesar 0.3543 menunjukkan bahwa variabilitas nilai IPK yang dapat dijelaskan oleh variabel lama belajar adalah sebesar 35.43%, sedangkan sisanya dijelaskan oleh variabel diluar model.

Hipotesis

\(H_{0}\): \(\beta_{1}\) = 0

\(H_{1}\): \(\beta_{1}\) \(\neq\) 0

Taraf Signifikan

\(\alpha =5\%\)

Daerah Penolakan

Tolak \(H_{0}\) jika \(F\) > \(F_{\alpha;k,n-k-1}\). \(F_{\alpha;k,n-k-1}\) = 4.67

Statistik Uji

Statistik Uji: \(F\) = 8.683

Keputusan

Tolak \(H_{0}\) karena \(F\)(8.683) > \(F_{\alpha;k,n-k-1}\)(4.67). Jadi dapat disimpulkan bahwa Variabel lama belajar berpengaruh signifikan terhadap nilai IPK