Notes Theme: - Kelas A: cayman
- Kelas B: tactile
- Kelas C: architect
- Kelas D: hpstr
Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Model regresi linier sederhana adalah model probabilistik yang menyatakan hubungan linier antara dua variabel di mana salah satu variabel dianggap memengaruhi variabel yang lain. Variabel yang memengaruhi dinamakan variabel independen dan variabel yang dipengaruhi dinamakan variabel dependen. Jika persamaan regresi hanya terdapat satu variabel bebas dengan satu variabel terikat, maka disebut dengan persamaan regresi sederhana. Pada regresi sederhana dapat diketahui seberapa besar perubahan dari variabel bebas dapat memengaruhi suatu variabel terikat.
Analisis regresi linier sederhana adalah hubungan secara linear antara satu variabel independen (X) dengan variabel dependen (Y). Analisis regresi sederhana dapat digunakan untuk mengetahui arah dari hubungan antara variabel bebas dengan variabel terikat, apakah memiliki hubungan positif atau negatif serta untuk memprediksi nilai dari variabel terikat apabila nilai variabel bebas mengalami kenaikan ataupun penurunan. Pada regresi sederhana biasanya data yang digunakan memiliki skala interval atau rasio.
Dalam percobaan ini, peneliti tertarik untuk menyelidiki pengaruh (hubungan) linier dari intelegency quotient (IQ) terhadap hasil belajar statistika mahasiswa.Disini IQ adalah variabel independen, sedangkan hasil belajar statistika adalah variabel dependen.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif merupakan proses transformasi data penelitian dalam bentuk tabulasi sehingga mudah dipahami dan diinterpretasikan. Statistik deskriptif berfungsi mempelajari tata cara pengumpulan, pencatatan, penyusunan, dan penyajian data penelitian dalam bentuk tabel frekuensi atau grafik dan selanjutnya dilakukan pengukuran nilai-nilai statistiknya seperti mean, median, modus, dan standar deviasi. Pada umumnya memberikan informasi mengenai karakteristik variabel penelitian utama dan data demografi responden.
2.2 Statistika Inferensial
Statistika inferensial merupakan penerapan metode statistik untuk menaksir dan atau menguji karakteristik populasi yang dihipotesiskan berdasarkan data sampel. Ilmu pengetahuan statistik yang bertugas mempelajari tata cara penarikan kesimpulan mengenai keseluruhan populasi berdasarkan data hasil penelitian pada sampel. Berdasarkan asumsi yang mendasarinya, statistik inferensial dibedakan menjadi dua yaitu: - Statistik Parametrik. Pendugaan dan uji hipotesis dari parameter populasi didasarkan anggapan bahwa skor-skor yang dianalisis telah ditarik dari suatu populasi dengan distribusi tertentu. - Statistik Nonparametrik. Pendugaan dan uji hipotesis dari parameter populasi anggapan bahwa skor-skor yang dianalisis telah ditarik dari suatu populasi dengan bebas sebaran (tidak mengikuti distribusi tertentu)
2.3 Analisis Regresi Linier Sederhana
Analisis regresi linier sederhana adalah hubungan secara linear antara satu variabel independen (X) dengan variabel dependen (Y). Analisis regresi sederhana dapat digunakan untuk mengetahui arah dari hubungan antara variabel bebas dengan variabel terikat, apakah memiliki hubungan positif atau negatif serta untuk memprediksi nilai dari variabel terikat apabila nilai variabel bebas mengalami kenaikan ataupun penurunan. Pada regresi sederhana biasanya data yang digunakan memiliki skala interval atau rasio.
Rumus regresi linier sederhana sebagai berikut:
\[ Y = a + bX \] dimana: Y = Variabel tak bebas (nilai yang akan diprediksi) X = Variabel bebas (variabel independen) a = Konstanta (nilai dari Y apabila X=0) b = Koefisien regresi (pengaruh positif atau negatif)
2.4 Analisis Korelasi
Analisis koefisien korelasi pada penelitian ini menggunakan analisis koefisien korelasi pearson. Analisis koefisien korelasi pearson digunakan untuk mengukur hubungan antara tingkat IQ (X) dan hasil belajar mahasiswa (Y).
Rumus yang digunakan untuk uji korelasi menurut Sugiyono (2012) yaitu :
\[ r = \frac{n \sum xy - \sum x \sum y}{\sqrt{(n \sum x^2 - (\sum x)^2)(n \sum y^2 - (\sum y)^2)}} \] dimana: r = Koefisien korelasi n = Jumlah data X = Variabel bebas (Independen) Y = Variabel terikat (Dependen)
2.5 Uji Asumsi
2.5.1 Asumsi Normalitas
Uji Saphiro Wilk digunakan untuk menguji apakah galat dari model regresi yang terbentuk berdistribusi normal atau tidak. Uji ini lebih tepat digunakan untuk sampel kecil, kurang dari 50 sampel. Apabila menggunakan R syntax-nya sebagai berikut.
2.5.2 Asumsi Homoskedastisitas
Homoskedastisitas digunakan untuk melihat adanya kesamaan ragam dari residual antar pengamatan. Uji yang dapat digunakan adalah uji Breusch Pagan. Apabila menggunakan R syntax-nya sebagai berikut.
2.5.3 Asumsi Non Autokorelasi
Non Autokorelasi digunakan untuk melihat apakah terdapat hubungan di antara periode satu ke periode sebelumnya. Karena analisis regresi ingin melihat adanya hubungan antara variabel prediktor dengan variabel respon. Uji yang digunakan adalah uji Durbin-Watson. Apabila menggunakan R syntax-nya sebagai berikut.
3 SOURCE CODE
3.1 Library
3.2 Data
Berikut adalah data yang akan digunakan (Data terdiri dari 10 observasi dengan 2 variabel)
> # Import File dari CSV
> DataKarin=read.csv("C:/Users/ASUS/Downloads/DataKarin.csv",header=TRUE)
Error in file(file, "rt"): cannot open the connection
> DataKarin
Error in eval(expr, envir, enclos): object 'DataKarin' not found
> # Input Data Manual
> Tingkat_IQ = c(90,97,106,110,115,118,122,127,135,140)
> Hasil_Belajar_Mahasiswa = c(59,62,69,65,69,74,70,76,81,85)
> DataKarin = data.frame(Tingkat_IQ,Hasil_Belajar_Mahasiswa);DataKarin
Tingkat_IQ Hasil_Belajar_Mahasiswa
1 90 59
2 97 62
3 106 69
4 110 65
5 115 69
6 118 74
7 122 70
8 127 76
9 135 81
10 140 85Dalam syntax di atas, pendefinisian data dapat menggunakan 2 cara, yakni import file cs menggunakan syntax read.csv() serta dapat menginput secara manual menggunakan data frame.
3.3 Plot
3.3.1 Scatter Plot
> scatter.smooth(x=DataKarin$Tingkat_IQ, y=DataKarin$Hasil_Belajar_Mahasiswa, main="Smooth Scatter Plot Tingkat IQ ~ Hasil Belajar Mahasiswa", xlab="Tingkat IQ", ylab="Hasil Belajar Mahasiswa", pch=16, col="brown1")3.3.2 Box Plot
> par(mfrow=c(1,2))
> boxplot(DataKarin$Tingkat_IQ, main="Boxplot Tingkat IQ", sub=paste("Outlier rows: ", boxplot.stats(DataKarin$Tingkat_IQ)$out), col="darkseagreen1")
> boxplot(DataKarin$Hasil_Belajar_Mahasiswa, main="Boxplot Hasil Belajar Mahasiswa", sub=paste("Outlier rows: ", boxplot.stats(DataKarin$Hasil_Belajar_Mahasiswa)$out), col="darksalmon")3.4 Analisis Korelasi
Analisis korelasi pada kasus ini untuk mengetahui hubungan antara Tingkat IQ dengan Hasil Belajar Mahasiswa.
3.5 Analisis Regresi
Analisis untuk meramalkan pengaruh variabel prediktor terhadap variabel kriterium untuk membuktikan ada atau tidaknya hubungan fungsional antara variabel bebas (X) dengan sebuah variabel terikat (Y). Setelah melihat hubungan linier secara visual dan dengan menghitung korelasinya, maka langkah selanjutnya yaitu membentuk model analisis regresi sebagai berikut:
3.5.1 Analisis Koefisien Model
3.5.1.1 Penduga Beta
\[ \hat{\beta}=\left( X^{t}X \right)^{-1}(X^{t}Y) \]
> X<-DataKarin$Tingkat_IQ
> Y<-DataKarin$Hasil_Belajar_Mahasiswa
> DataKarin2<-data.frame(X,Y)
> n<-dim(DataKarin)[1]
> n
[1] 103.5.1.2 Penduga Respons (Y)
\[ \hat{Y} = X\hat{\beta} \]
3.5.2 Analisis Ragam
3.5.3 Hasil Uji Simultan (Uji F)
Adapun rumusnya adalah sebagai berikut.
\[ F = \frac{KTRegresi}{KTGalat} \]
3.5.4 Hasil Uji Parsial (Uji t)
Rumus statistik uji:
\[ \text{se}(\hat{\beta}j) = \sqrt{\text{var}(\hat{\beta}j)} \] \[ \text{var}(\hat{\beta}j) = \hat{\sigma}^2 (X^\prime X)^{-1} \]
> var_cov<-anregresi$KT[2]*solve(t(X)%*%X)
> var_cov
[,1] [,2]
[1,] 34.5646338 -0.293023380
[2,] -0.2930234 0.002526064\[ T = \frac{\hat{\beta}j - \beta_j}{se(\hat{\beta}j)} \] Menghitung statistik uji t masing-masing penduga beta:
Menghitung nilai p-value masing-masing penduga beta:
3.5.5 Selang Kepercayaan Parameter
\[ Selang~kepercayaan~(1-\alpha) \times 100\%~bagi~{\beta}j \]
3.5.6 Koefisien Determinasi dan Adjusted Koefisien Determinasi
Koefisien determinasi:
\[ R^2 = \frac{JKRegresi}{JKTotal} \] Syntax pada Rstudio:
Adjusted koefisien determinasi:
\[ adjusted~R^2 = 1-\frac{JKGalat/(n-k)}{JKTotal/(n-1)} \] Syntax pada Rstudio:
3.6 Uji Asumsi
3.6.1 Asumsi Normalitas
3.6.2 Asumsi Homoskedastisitas
4 HASIL DAN PEMBAHASAN
4.1 Plot
4.1.1 Scatter Plot
Plot pencar atau scatter plot dapat membantu memvisualisasikan hubungan linier antara variabel dependen (respon) dan variabel independen (prediktor).
> scatter.smooth(x=DataKarin$Tingkat_IQ, y=DataKarin$Hasil_Belajar_Mahasiswa, main="Smooth Scatter Plot Tingkat IQ ~ Hasil Belajar Mahasiswa", xlab="Tingkat IQ", ylab="Hasil Belajar Mahasiswa", pch=16, col="brown1")
Plot pencar bersama dengan garis smoothing di atas menunjukkan hubungan
yang meningkat secara linier antara variabel ‘Tingkat IQ’ dan ‘Hasil
Belajar Mahasiswa’. Ini adalah hal yang baik, karena salah satu asumsi
yang mendasari regresi linier adalah bahwa hubungan antara variabel
respon dan prediktor adalah linier dan aditif.
4.1.2 Box Plot
Box plot digunakan untuk menemukan pengamatan outlier dalam variabel. Data yang memiliki outlier di prediktor dapat secara drastis memengaruhi prediksi karena mereka dapat dengan mudah memengaruhi arah/kemiringan garis yang paling sesuai.
> par(mfrow=c(1,2))
> boxplot(DataKarin$Tingkat_IQ, main="Boxplot Tingkat IQ", sub=paste("Outlier rows: ", boxplot.stats(DataKarin$Tingkat_IQ)$out), col="darkseagreen1")
> boxplot(DataKarin$Hasil_Belajar_Mahasiswa, main="Boxplot Hasil Belajar Mahasiswa", sub=paste("Outlier rows: ", boxplot.stats(DataKarin$Hasil_Belajar_Mahasiswa)$out), col="darksalmon")
Dari diagram boxplot di atas, diketahui bahwa secara visual dalam data
variabel prediktor ‘Tingkat IQ’ setangkup, karena panjang garis whisker
sama dan median berada tepat di tengah-tengah kotak. Sedangkan, pada
variabel respons ‘Hasil Belajar Mahasiswa’ tidak setangkup, karena
panjang garis whisker tidak sama dan median tidak berada tepat di
tengah-tengah kotak. Selain itu, juga dapat diketahui bahwa dari kedua
variabel data tidak terdeteksi adanya pencilan atau outlier.
4.2 Analisis Korelasi
Analisis korelasi pada kasus ini untuk mengukur kekuatan hubungan antara dua variabel yaitu variabel respons “Hasil Belajar Mahasiswa” dan variabel prediktor “Tingkat IQ” dengan menggunakan metode pearson.
> cor(DataKarin[1:2],method="pearson")
Tingkat_IQ Hasil_Belajar_Mahasiswa
Tingkat_IQ 1.0000000 0.9609772
Hasil_Belajar_Mahasiswa 0.9609772 1.0000000Kuat lemah hubungan diukur diantara jarak (range) dari 0 sampai dengan 1. Dari hasil analisis di atas diketahui bahwa nilai korelasinya 0.9609772, hal ini berarti variabel “Tingkat IQ” dan variabel “Hasil Belajar Mahasiswa” memiliki hubungan yang sangat kuat. Selain, itu karena koefisien korelasi ditemukan positif (+) maka hubungan tersebut disebut sebagai korelasi sempurna atau hubungan linier sempurna dengan kemiringan (slope) positif.
4.3 Analisis Regresi
4.3.1 Analisis Koefisien Model
> X<-DataKarin$Tingkat_IQ
> Y<-DataKarin$Hasil_Belajar_Mahasiswa
> DataKarin2<-data.frame(X,Y)
> n<-dim(DataKarin)[1]
> n
[1] 10> X<-matrix(c(rep(1,n),DataKarin$Tingkat_IQ),nrow=n)
> X
[,1] [,2]
[1,] 1 90
[2,] 1 97
[3,] 1 106
[4,] 1 110
[5,] 1 115
[6,] 1 118
[7,] 1 122
[8,] 1 127
[9,] 1 135
[10,] 1 140- nilai koefisien beta0 sebesar 13.714789 yang berarti apabila Tingkat IQ bernilai 0 maka hasil belajar mahasiswa akan naik sebesar 13.714789
- nilai koefisien beta1 sebesar 0.493838 yang berarti apabila Tingkat IQ naik sebesar 1 satuan maka hasil belajar mahasiswa akan naik sebesar 0.493838
- Bentuk persamaan regresinya adalah Y = 13.714789 + 0.493838X
4.3.2 Analisis Ragam
> dbRegresi<-k-1
> dbTotal<-n-1
> dbGalat<-dbTotal-dbRegresi
> db<-c(dbRegresi, dbGalat, dbTotal)
> db
[1] 1 8 9> anregresi<-data.frame(sk,JK,db,KT)
> names(anregresi)<-c("SK", "JK", "db", "KT")
> anregresi
SK JK db KT
1 Regresi 554.08627 1 554.086268
2 Galat 45.91373 8 5.739217
3 Total 600.00000 9 66.666667Dalam analisis ragam di atas diketahui bahwa semua komponen keragaman memiliki nilai yang sama. Hal tersebut dibuktikan pada derajat bebas df regresi = 1 dan df galat (residuals) = 8. Sum square atau jumlah keragaman regresi dan galat sama yaitu berturut-turut 554.08627 dan 45.91373. Mean square atau kuadrat tengah regresi dan galat sama yaitu berturut-turut 554.086268 dan 5.739217.
4.3.3 Hasil Uji Simultan (Uji F)
Hipotesis:
\[ \begin{align} & \text{Hipotesis :}\\ & H_0:\beta_1=\beta_2=0\\ & H_1:\text{setidaknya ada satu }\beta_i\neq0\\ \end{align} \]
Tingkat signifikansi : 0.05 Statistik uji : p-value = 9.677645e-06 Keputusan : Karena p-value (9.677645e-06) < alpha(0.05), maka tolak H0 Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa terdapat hubungan diantara dua variabel
4.3.4 Hasil Uji Parsial (Uji t)
\[ \begin{align} & \text{Hipotesis :}\\ & H_0:\beta_1=\beta_2=0\\ & H_1:\text{setidaknya ada satu }\beta_i\neq0\\ \end{align} \]
Tingkat signifikansi : 0.05 Statistik uji : p-value = 4.795339e-02 Keputusan : Karena p-value (4.795339e-02) < alpha(0.05), maka tolak H0 Kesimpulan : Dengan taraf nyata 5%, dapat disimpulkan bahwa terdapat hubungan diantara dua variabel
4.3.5 Selang Kepercayaan
> selangkepercayaan<-cbind(batasbawah_sk, batasatas_sk)
> selangkepercayaan
[,1] [,2]
[1,] 0.1573996 27.2721779
[2,] 0.3779384 0.6097377Selang kepercayaan tidak melewati 0 maka dapat dinyatakan bahwa tolak H0. Jadi, dapat disimpulkan bahwa terdapat hubungan antara kedua variabel.
4.3.6 Koefisien Determinasi dan Adjusted Koefisien Determinasi
Koefisien Determinasi
Interpretasi : Koefisien determinasi bernilai 0.9234771 yang berarti kemampuan variabel bebas dalam menjelaskan varians dari variabel terikatnya sebesar 92.35%
Adjusted Koefisien Determinasi
Interpretasi : Adjusted koefisien determinasi bernilai -0.03891175. Karena bernilai negatif, maka variabel prediktor dikatakan kurang mampu dalam menjelaskan variabel respon dengan baik.
4.4 Uji Asumsi
4.4.1 Asumsi Normalitas
\[ \begin{align} & \text{Hipotesis :}\\ & H_{0}:\text{Galat populasi berdistribusi normal}\\ & H_{1}:\text{Galat populasi tidak berdistribusi normal} \end{align} \]
> model = lm(Hasil_Belajar_Mahasiswa~Tingkat_IQ)
> sisaan = residuals(model)
> shapiro.test(sisaan)
Shapiro-Wilk normality test
data: sisaan
W = 0.94439, p-value = 0.6028Dari output diperoleh p-value sebesar 0.6028 > alpha(0.05), maka terima Ho. Dapat disimpulkan bahwa pada data tersebut tidak terbukti adanya pelanggaran normalitas.
4.4.2 Asumsi Homoskedastisitas
\[ \begin{align} & \text{Hipotesis :}\\ & H_{0}:\text{Ragam populasi bersifat konstan}\\ & H_{1}:\text{Ragam populasi tidak bersifat konstan} \end{align} \]
> library(lmtest)
> model = lm(Hasil_Belajar_Mahasiswa~Tingkat_IQ)
> bptest(model)
studentized Breusch-Pagan test
data: model
BP = 0.060409, df = 1, p-value = 0.8059Dari output diperoleh p-value sebesar 0.8059 > alpha(0.05), maka terima H0. Dapat disimpulkan bahwa tidak terbukti adanya pelanggaran asumsi homogenitas ragam galat pada model data tersebut.
4.4.3 Asumsi Non Autokorelasi
\[ \begin{align} & \text{Hipotesis :}\\ & H_{0}:\text{Tidak terjadi autokorelasi}\\ & H_{1}:\text{Terjadi autokorelasi} \end{align} \]
> library(lmtest)
> model = lm(Hasil_Belajar_Mahasiswa~Tingkat_IQ)
> dwtest(model)
Durbin-Watson test
data: model
DW = 2.3693, p-value = 0.5854
alternative hypothesis: true autocorrelation is greater than 0Dari output diperoleh p-value sebesar 0.5854 > alpha(0.05), maka terima H0. Dapat disimpulkan bahwa tidak terdapat masalah autokorelasi pada model data tersebut.
4.5 Interpretasi Model
Model yang terbentuk dari analisis regresi pengaruh tingkat IQ terhadap hasil belajar mahasiswa adalah sebagai berikut.
\[ Y = 13.714789 + 0.493838X \] dimana: - \(Y\) = Hasil Belajar Mahasiswa - \(X\) = Tingkat IQ
5 KESIMPULAN
Setelah melakukan analisis regresi dan pengujian asumsinya, dapat disimpulkan bahwa model yang terbentuk adalah \(Y = 13.714789 + 0.493838X\). Dalam hal ini, koefisien variabel \(X\) bernilai positif yang artinya tingkat IQ memberikan pengaruh positif (Memberikan pengaruh yang signifikan) terhadap hasil belajar mahasiswa. Model regresi yang terbentuk merupakan model regresi terbaik karena telah memenuhi asumsi normalitas, homoskedastisitas, dan non autokorelasi.
6 DAFTAR PUSTAKA
Suyono. 2018. Analisis Regresi Untuk Penelitian. Yogyakarta: Deepublish.