1 PENDAHULUAN
1.1 Latar Belakang
Perkembangan teknologi yang semakin pesat mengharuskan setiap orang untuk dapat melakukan segala sesuatu dengan lebih cepat pula. Tak terkecuali dalam bidang penelitian, baik itu di dunia pendidikan, pertanian, peternakan, hingga kedokteran, semuanya dituntut untuk dapat terus berkembang mengikuti perkembangan zaman. Berbagai penelitian dilakukan untuk memenuhi kebutuhan perkembangan zaman ini dan ilmu statistika sering digunakan dalam melakukan pengujian.
Salah satu penerapan ilmu statistika yang sering digunakan adalah analisis regresi linier. Analisis ini digunakan untuk melihat hubungan antara dua variabel atau lebih dan memprediksi nilai dari variabel dependen berdasarkan nilai variabel independen. Misalnya, dalam penelitian pendidikan, analisis regresi linier sering digunakan untuk mengetahui sejauh mana faktor-faktor tertentu, seperti latar belakang keluarga, tingkat pendidikan orang tua, atau jumlah waktu yang dihabiskan untuk belajar dapat mempengaruhi hasil akademik siswa.
Analisis regresi linier memungkinkan peneliti untuk mengetahui apakah terdapat hubungan yang signifikan antara variabel-variabel yang diteliti dan seberapa kuat hubungan tersebut. Dalam laporan ini akan dibahas bagaimana IPK mahasiswa berpengaruh terhadap IQ mahasiswa. Penelitian ini penting karena dapat memberikan wawasan mengenai faktor-faktor yang mempengaruhi prestasi akademik mahasiswa dan bagaimana dukungan akademik, khususnya melalui pencapaian IPK, dapat berdampak pada kemampuan intelektual mahasiswa.
IQ (Intelligence Quotient) adalah ukuran kemampuan intelektual seseorang yang mencakup kemampuan logika, pemecahan masalah, dan adaptasi terhadap lingkungan. Pada kesempatan kali ini, akan dibuktikan apakah tingkat IPK mahasiswa mempengaruhi IQ mahasiswa. Dengan menggunakan analisis regresi linier, akan dilakukan pengujian untuk mengetahui apakah terdapat hubungan yang signifikan antara IPK sebagai variabel independen (X) dan IQ sebagai variabel dependen (Y). Pengujian ini diharapkan dapat memberikan informasi yang berharga bagi mahasiswa dan pendidik mengenai pentingnya dukungan akademik dalam perkembangan intelektual mahasiswa.
Dalam era teknologi saat ini, proses analisis data dapat dilakukan dengan lebih efisien menggunakan berbagai software statistik. Salah satu software yang sering digunakan adalah R atau RStudio, yang bersifat open-source dan memiliki paket yang lengkap untuk melakukan analisis statistik, termasuk analisis regresi linier. Dengan demikian, diharapkan penelitian ini tidak hanya memberikan kontribusi teoritis tetapi juga praktis dalam upaya meningkatkan hasil belajar dan kemampuan intelektual mahasiswa melalui pemahaman yang lebih baik mengenai faktor-faktor yang mempengaruhinya.
1.2 Tinjauan Pustaka
1.2.1 Analisis Regresi Linier
Analisis regresi linier adalah teknik statistika yang digunakan untuk menjelaskan pengaruh variabel bebas atau variabel prediktor terhadap variabel tak bebas variabel respon. Terdapat dua jenis analisis regresi linier yang umum digunakan adalah regresi linier sederhana dan regresi linier berganda.
1.2.1.1 Analisis Regresi Linier Sederhana
Regresi linier sederhana melibatkan satu variabel bebas dan satu variabel tak bebas. Model ini digunakan untuk menentukan apakah terdapat hubungan antara variabel independen (X) dan variabel dependen (Y) serta melihat apakah hubungan tersebut positif atau negatif. Persamaan regresi linier sederhana adalah:
\[ \hat{Y_i} = \beta_0 + \beta_1 X_i + \epsilon_i \]
Dimana:
\(\hat{Y}\) adalah variabel dependen hasil pendugaan regresi
\(\beta_0\) dan \(\beta_1\) adalah parameter-parameter model yang akan diduga
\(\epsilon\) adalah nilai galat atau residual dari pendugaan
1.2.1.2 Analisis Regresi Linier Berganda
Regresi linier berganda melibatkan lebih dari satu variabel bebas. Model ini memberikan kemudahan bagi pengguna untuk memasukkan lebih dari satu variabel independen untuk mengetahui pengaruhnya terhadap variabel dependen. Persamaan regresi linier berganda adalah:
\[ \hat{Y_i} = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \cdots + \beta_n X_n + \epsilon_i \]
Dimana:
\(\hat{Y}\) adalah variabel dependen hasil pendugaan regresi
\(\beta_0, \beta_1, \beta_2, \ldots, \beta_n\) adalah koefisien regresi untuk masing-masing variabel independen
\(X_1, X_2, \ldots, X_n\) adalah variabel-variabel independen
\(\epsilon\) adalah nilai galat atau residual dari pendugaan
1.2.1.3 Koefisien Determinasi
Koefisien determinasi, yang sering dilambangkan dengan \(R^2\), adalah ukuran statistik yang digunakan dalam konteks analisis regresi untuk menunjukkan seberapa baik model regresi yang dibuat dapat menjelaskan variabilitas dari variabel dependen. Dengan kata lain, \(R^2\) menunjukkan proporsi variansi total dalam variabel dependen yang dapat dijelaskan oleh variabel independen dalam model.
Secara matematis, koefisien determinasi dihitung sebagai berikut:
\[ R^2 = \frac{SS_{xx}^2}{SS_{xx} SS_{yy}} \]
Di mana \(SS\) merupakan jumlah kuadrat variabel x atau y. Nilai \(R^2\) berkisar antara 0 sampai 1. Nilai \(R^2 = 0\) berarti model tidak menjelaskan variabilitas data sama sekali. Nilai \(R^2 = 1\) berarti model menjelaskan semua variabilitas dalam data. Nilai \(0 < R^2 < 1\) berarti sebagian variabilitas data dijelaskan oleh model. Misalnya \(R^2 = 0.7\) berarti 70% variabilitas dalam data dapat dijelaskan oleh model, sementara 30% sisanya tidak dapat dijelaskan oleh model.
1.2.2 Uji Asumsi Analisis Regresi
Analisis regresi sebagai metode analisis statistika parametrik memiliki asumsi yang harus dipenuhi supaya dapat menghasilkan kesimpulan yang tepat. Beberapa asumsi yang perlu dilakukan pengujian asumsi meliputi normalitas residual, homogenitas ragam residual atau homoskedastisitas, nonautokorelasi, dan nonmultikolinearitas.
1.2.2.1 Asumsi Normalitas Residual
Normalitas adalah salah satu asumsi penting dalam analisis regresi yang merupakan metode statistika parametrik. Asumsi ini mensyaratkan bahwa residual data memiliki distribusi normal. Untuk memeriksa normalitas data, RStudio menyediakan beberapa metode pengujian mulai dari melihat secara grafis seperti Histogram dan QQ Plot serta pengujian statistik seperti Shapiro-Wilk dan Jarque-Bera. Hipotesis yang diajukan dalam pengujian asumsi normalitas adalah sebagai berikut:
- \(H_0:\) Residual berdistribusi normal.
- \(H_1:\) Residual tidak berdistribusi normal.
Dalam proses pengambilan keputusan, jika nilai signifikansi (p-value) ≤ α, maka \(H_0\) ditolak atau \(H_1\) diterima, yang artinya residual tidak berdistribusi normal. Sebaliknya, jika nilai signifikansi (p-value) > α, maka \(H_0\) diterima atau \(H_1\) ditolak, yang berarti residual data berdistribusi normal. Jika asumsi normalitas tidak terpenuhi, maka diperlukan upaya penanganan mulai dari menambah banyaknya pengamatan, menghilangkan data yang menyebabkan ketidaknormalan, transformasi data, dan menggunakan analisis lain (metode bootstrap atau analisis non parametrik).
1.2.2.2 Asumsi Homogenitas Ragam Residual
Salah satu asumsi penting dalam analisis regresi adalah homogenitas ragam residual, yang mengharuskan setiap residual memiliki ragam yang sama. Hal ini untuk memastikan bahwa ragam residual bersifat konstan antar pengamatan.
RStudio menyediakan beberapa metode pengujian untuk menguji homogenitas ragam. Metode pengujian dapat dilakukan dengan melihat secara grafis (Plot Fitted Value vs Residual) atau dengan melakukan uji statistik (Breusch-Pagan, Levene, Glejser, Harvey Godfrey, Park, Goldferd, Quant, dan White). Dalam pengujian statistik ini, hipotesis yang diajukan adalah sebagai berikut:
- \(H_0 : σ_1² = σ_2² = … = σ_i²\) (Ragam residual homogen)
- \(H_1 :\) setidaknya ada satu pasang i, j dimana \(σ_i² ≠ σ_j²\) (Ragam residual tidak homogen atau ragam residual heterogen)
Dalam pengambilan keputusan, jika nilai signifikansi (p-value) ≤ α, maka \(H_0\) ditolak atau \(H_1\) diterima, yang berarti ragam residual tidak homogen. Sebaliknya, jika nilai signifikansi (p-value) > α, maka \(H_0\) diterima atau \(H_1\) ditolak, yang berarti ragam residual bersifat homogen.
Apabila residual data tidak bersifat homogen (heterogen) maka kemungkinan hal ini disebabkan oleh ragam galat yang tidak konstan, kesalahan penentuan model, atau terdapat nilai pencilan atau outlier. Hal ini berakibat pada penduga OLS yang konsisten tetapi bias dan ragam penduga yang semakin tinggi. Untuk mengatasi hal ini biasanya ditangani dengan metode Weightened Least square (WLS) atau White method.
1.2.2.3 Asumsi Nonautokorelasi
Nonautokorelasi adalah asumsi kebebasan antar residual. Pelanggaran dari asumsi ini disebut dengan masalah autokorelasi, akibat kesalahan spesifik model atau tidak digunakannya variabel prediktor yang penting. Autokorelasi biasa terjadi pada data deret waktu sedangkan pada data cross section jarang terjadi.
RStudio menyediakan beberapa metode pengujian untuk menguji homogenitas ragam. Metode pengujian yang dapat digunakan adalah metode grafik dan metode statistik uji dengan uji Durbin Watson, uji Run, dan metode Lagrange Multiplier.
Akibat dari pelanggaran asumsi ini adalah penduga tidak lagi efisien (ragam besar) sehingga estimasi parameter tidak bersifat BLUE. Hal ini perlu diatasi dengan mengevaluasi model (mengidentifikasi penyebab autokorelasi, transformasi variabel, dan Generalized Least Square (GLS).
1.3 Data
Data yang digunakan merupakan data sekunder yang diperoleh dari sampel data Mahasiswa STIMIK ASIA berupa data IPK dan nilai IQ mahasiswa yang diambil dari SNATIKA 2015.
library(readxl)
DATA <- read_excel("F:/IRUL/KULIAH/SEMESTER 4/KOMPUTASI STATISTIKA/DATA IPK DAN IQ MAHASISWA.xlsx")
rmarkdown::paged_table(DATA)Sumber: https://jurnal.stiki.ac.id/SNATIKA/article/view/314/241
1.4 Rumusan Masalah
Rumusan masalah berdasarkan latar belakang di atas antara lain:
- Apa pengertian analisis regresi linier?
- Apa manfaat mempelajari analisis regresi linier?
- Bagaimana cara mengolah data dan mengujinya dengan software R?
1.5 Tujuan
Tujuan penulisan laporan ini adalah sebagai berikut:
- Untuk mengetahui pengertian dan kegunaan analisis regresi linier.
- Untuk memenuhi tugas praktikum mengenai analisis regresi linier dalam Praktikum Komputasi Statistika.
- Untuk mengetahui cara menganalisis data menggunakan software R.
2 SOURCE CODE
2.2 Import Data
DATA <- read_excel("F:/IRUL/KULIAH/SEMESTER 4/KOMPUTASI STATISTIKA/DATA IPK DAN IQ MAHASISWA.xlsx")
head(DATA)## # A tibble: 6 × 3
## Mahasiswa IPK IQ
## <dbl> <dbl> <dbl>
## 1 1 2.75 125
## 2 2 3 130
## 3 3 3.02 110
## 4 4 3.3 117
## 5 5 2.5 105
## 6 6 2.72 115
2.3 Analisis Regresi Linier
##
## Call:
## lm(formula = IQ ~ IPK, data = DATA)
##
## Residuals:
## Min 1Q Median 3Q Max
## -13.7649 -6.3805 0.6195 6.1498 14.2096
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 61.149 8.667 7.055 1.13e-07 ***
## IPK 20.734 2.943 7.045 1.16e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.861 on 28 degrees of freedom
## Multiple R-squared: 0.6393, Adjusted R-squared: 0.6264
## F-statistic: 49.63 on 1 and 28 DF, p-value: 1.158e-07
2.4 Asumsi Normalitas Residual
##
## Jarque Bera Test
##
## data: sisa
## X-squared = 1.2105, df = 2, p-value = 0.5459
##
## Shapiro-Wilk normality test
##
## data: sisa
## W = 0.96625, p-value = 0.4422
2.5 Asumsi Homogenitas Ragam Residual
##
## studentized Breusch-Pagan test
##
## data: reg1
## BP = 4.7966, df = 1, p-value = 0.02852
3 HASIL DAN PEMBAHASAN
3.1 Regresi Linier
3.1.1 Pembentukan Model
Model regresi:
\[IQ =61.149+20.734*IPK\] Interpretasi:
Apabila IPK (X) sebagai variabel prediktor dianggap konstan, maka IQ mahasiswa sebesar 61.149.
Apabila koefisien regresi IPK (X) bertambah 1 akan meningkatkan IQ mahasiswa sebesar 20.743.
3.1.2 Koefisien Determinasi
\[Adj \ R^2 = 0.6264\]
Nilai \(Adjusted \ R^2 = 0.6264\) artinya variabel IPK dapat menjelaskan pengaruhnya terhadap IQ mahasiswa sebesar 62.64% sedangkan 37.36% sisanya dijelaskan oleh variabel lain di luar model.
3.2 Pengujian Asumsi
3.2.1 Uji Asumsi Normalitas
Hipotesis:
\(H_0:\) Residual berdistribusi normal
\(H_1:\) Residual tidak berdistribusi normal
Taraf pengujian:
α = 0.01
Kriteria pengujian:
p-value ≤ α maka tolak \(H_0\)
p-value > α maka terima \(H_0\)
Uji Jarque Bera:
p-value = 0.5459
Uji Saphiro Wilk:
p-value = 0.4422
Keputusan:
p-value (0.5459 dan 0.4422) > α (0.01) maka terima \(H_0\)
Kesimpulan:
Dengan taraf nyata sebesar 1% dapat disimpulkan bahwa residual berdistribusi normal.
3.2.2 Uji Asumsi Homogenitas Ragam
Hipotesis:
\(H_0:\) Ragam residual homogen
\(H_1:\) Ragam residual tidak homogen
Taraf pengujian:
α = 0.01
Kriteria pengujian:
p-value ≤ α maka tolak \(H_0\)
p-value > α maka terima \(H_0\)
Uji Breusch Pagan:
p-value = 0.02852
Keputusan:
p-value (0.02852) > α (0.01) maka terima \(H_0\)
Kesimpulan:
Dengan taraf nyata sebesar 1% dapat disimpulkan bahwa ragam residual homogen
3.2.3 Uji Asumsi Nonautokorelasi
Hipotesis:
\(H_0:\) Tidak terjadi autokorelasi
\(H_1:\) Terjadi autokorelasi
Taraf pengujian:
α = 0.01
Kriteria pengujian:
p-value ≤ α maka tolak \(H_0\)
p-value > α maka terima \(H_0\)
Uji Durbin Watson:
p-value = 0.0791
Keputusan:
p-value (0.0791) > α (0.01) maka terima \(H_0\)
Kesimpulan:
Dengan taraf nyata sebesar 1% dapat disimpulkan bahwa tidak terjadi autokorelasi
4 KESIMPULAN
Berdasarkan hasil analisis regresi linier sederhana menggunakan RStudio menunjukkan bahwa terdapat pengaruh signifikan antara IPK mahasiswa dan IQ mahasiswa. Persamaan regresi yang diperoleh adalah IQ = 61.149 + 20.734 * IPK dengan koefisien determinasi (R²) sebesar 0.6393, yang berarti 63.93% variabilitas IQ dapat dijelaskan oleh IPK. Uji asumsi pada taraf signifikansi sebesar 1% menunjukkan bahwa residual model berdistribusi normal dan tidak terjadi heteroskedastisitas dalam data serta tidak ditemukan autokorelasi signifikan pada residual. Penggunaan RStudio terbukti efisien dan akurat dalam analisis statistik, membantu mengurangi kemungkinan kesalahan dalam perhitungan.
5 DAFTAR PUSTAKA
- Efendi, A., Wardhani, N. W. S., Fitriani, R., & Sumarminingsih, E. (2020). Analisis regresi: Teori dan aplikasi dengan R. Malang: UBPress.
- Subekti, P. (2015). Perbandingan perhitungan matematis dan SPSS analisis regresi linear: Studi kasus (Pengaruh IQ mahasiswa terhadap IPK). Seminar Nasional Teknologi Informasi, Komunikasi dan Aplikasinya, 03, 70-75. Diambil dari https://jurnal.stiki.ac.id/SNATIKA/article/view/314/241
- Walpole, R. E. (1995). Pengantar Statistika. Edisi Ketiga. PT Gramedia Pustaka. Jakarta
- Yitnosumarto, Suntoyo. (1991). Percobaan (Perancangan, analisis, dan Interpretasinya). PT Gramedia Pustaka Utama. Jakarta