Data yang akan digunakan pada metode regresi linier sederhana adalah data sekunder tentang pengaruh lama belajar terhadap nilai IPK mahasiswa Statistika ITS dengan IPK sebagai variabel respon dan lama belajar sebagai variabel prediktor. Data disajikan dalam tabel sebagai berikut.
| No | IPK (Y) | Lama Belajar (X) |
|---|---|---|
| 1 | 2,30 | 1 |
| 2 | 3,27 | 2 |
| 3 | 3,63 | 3 |
| 4 | 3,42 | 3 |
| 5 | 3,80 | 5 |
| 6 | 3,67 | 4 |
| 7 | 3,38 | 2 |
| 8 | 3,09 | 1 |
| 9 | 3,45 | 3 |
| 10 | 3,36 | 1 |
| 11 | 3,19 | 3 |
| 12 | 3,13 | 4 |
| 13 | 3,27 | 3 |
| 14 | 3,44 | 3 |
| 15 | 3,20 | 2 |
Data diatas akan di analisis statistik sederhana meliputi statistika deskriptif, visualisasi data, analisis korelasi, dan analisis regresi linier. Berikut analisis pada data nilai IPK dan lama belajar mahasiswa Statistika ITS
Statistika deskriptif yang akan digunakan adalah nilai minimum, quartil 1, median, rata-rata, quartil 3, dan nilai maksimum. Berikut hasil analisa statistika deskriptif pada data nilai IPK dan lama belajar:
data <- read.csv("E:/Data_Regresi.csv", header=TRUE)
summary(data)
## IPK Lama_Belajar
## Min. :2.300 Min. :1.000
## 1st Qu.:3.195 1st Qu.:2.000
## Median :3.360 Median :3.000
## Mean :3.307 Mean :2.667
## 3rd Qu.:3.445 3rd Qu.:3.000
## Max. :3.800 Max. :5.000
Dari statistika deskriptif diatas dapat diketahui bahwa rata-rata IPK mahasiswa Statistika ITS sebesar 3,307, dengan nilai IPK terbesar adalah 3,8 dan nilai IPK terkecil adalah 2,3. Median nilai IPK mahasiswa Statistika ITS sebesar 3,307. Rata-rata lama belajar mahasiswa Statistika ITS sebesar 2,67 jam, dengan lama belajar terbesar adalah 5 jam dan lama belajar terkecil adalah 1 jam. Median lama belajar mahasiswa Statistika ITS adalah 3 jam
Visualisasi data yang akan digunakan adalah histogram, scatterplot, dan boxplot. Berikut hasil visualisasi data pada data nilai IPK dan lama belajar:
par(mfrow=c(2,2))
hist(data$IPK,main="Histogram IPK",xlab="IPK", las=1)
hist(data$Lama_Belajar,main="Histogram Lama Belajar", xlab="Lama Belajar", las=1)
boxplot(data$Lama_Belajar, data$IPK, main="Boxplot IPK vs Lama Belajar", names=c("Lama Belajar","IPK"))
plot(data$Lama_Belajar, data$IPK, main="Scatterplot IPK vs Lama Belajar",xlab="Lama Belajar",ylab="IPK", pch=20,las=1)
abline(lm(data$IPK~data$Lama_Belajar),col="red")
Dari visualisasi diatas dapat diketahui bahwa histogram IPK memiliki bentuk seperti lonceng yang mengindikasikan bahwa secara visual nilai IPK mengikuti distribusi normal, sedangkan histogram lama belajar memiliki bentuk yang skewness ke kanan yang artinya ada nilai yang besar namun kebanyakan nilainya kecil. Hasil scatterplot menunjukkan bahwa terdapat korelasi positif yang kuat antara variabel Lama Belajar dengan variabel IPK. Jika waktu Lama Belajar meningkat maka nilai IPK juga meningkat, begitu juga sebaliknya jika waktu Lama Belajar menurun maka nilai IPK juga akan menurun. Hasil boxplot dapat diketahui bawah terdapat data outlier pada variabel IPK dan terdapat data outlier juga pada variabel lama belajar.
Pengujian korelasi dilakukan untuk mengetahui bagaimana hubungan antara dua variabel. Berikut adalah uji korelasi antara variabel IPK dan variabel Lama Belajar
Lama_Belajar=data$Lama_Belajar
IPK=data$IPK
cor.test(Lama_Belajar, IPK)
##
## Pearson's product-moment correlation
##
## data: Lama_Belajar and IPK
## t = 2.9467, df = 13, p-value = 0.01134
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.1783640 0.8647499
## sample estimates:
## cor
## 0.6328077
\(\text{H}_0: \rho_{xy} = 0\) (Tidak ada korelasi antara variabel Lama Belajar dengan IPK)
\(\text{H}_1: \rho_{xy}\) \(\neq\) \(0\) (Terdapat korelasi antara variabel Lama Belajar dengan IPK)
\(\alpha =5\%\)
Tolak \(\text{H}_0\) jika \(\text{p-value} \leq \alpha\) atau \(T\) > \(T_{\alpha/2;n-1}\)
\(T\) = 2.947 \(T_{\alpha/2;n-1}\) = 2.145
Tolak \(\text{H}_0\), karena \(T\)(2.947) > \(T_{\alpha/2;n-1}\)(2.145). Jadi dapat disimpulkan bahwa terdapat korelasi antara variabel Lama Belajar dengan IPK.
NILAI KORELASI
\(\rho_{xy} = 0.6328\)
Nilai korelasi sebesar 0.6328 menunjukkan bahwa terdapat korelasi positif yang kuat antara variabel Lama Belajar dengan variabel IPK. Jika waktu Lama Belajar meningkat maka nilai IPK juga meningkat, begitu juga sebaliknya jika waktu Lama Belajar menurun maka nilai IPK juga akan menurun.
Model_Regresi=summary(lm(IPK~Lama_Belajar))
Model_Regresi
##
## Call:
## lm(formula = IPK ~ Lama_Belajar)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.69776 -0.04078 0.07155 0.10422 0.36224
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.8124 0.1823 15.427 9.76e-10 ***
## Lama_Belajar 0.1853 0.0629 2.947 0.0113 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2766 on 13 degrees of freedom
## Multiple R-squared: 0.4004, Adjusted R-squared: 0.3543
## F-statistic: 8.683 on 1 and 13 DF, p-value: 0.01134
Model regresi yang didapat adalah sebagai berikut. \(\hat{y}\) = 2.8124 + 0.1853\(x\)
Nilai \(R^{2}\)
\(R^{2}\) = 0.3543
Nilai sebesar 0.3543 menunjukkan bahwa variabilitas nilai IPK yang dapat dijelaskan oleh variabel lama belajar adalah sebesar 35.43%, sedangkan sisanya dijelaskan oleh variabel diluar model.
\(H_{0}\): \(\beta_{1}\) = 0
\(H_{1}\): \(\beta_{1}\) \(\neq\) 0
\(\alpha =5\%\)
Tolak \(H_{0}\) jika \(F\) > \(F_{\alpha;k,n-k-1}\). \(F_{\alpha;k,n-k-1}\) = 4.67
Statistik Uji: \(F\) = 8.683
Tolak \(H_{0}\) karena \(F\)(8.683) > \(F_{\alpha;k,n-k-1}\)(4.67). Jadi dapat disimpulkan bahwa Variabel lama belajar berpengaruh signifikan terhadap nilai IPK