1 PENDAHULUAN
1.1 Latar Belakang
1.2 Statistika Deskriptif
1.3 Regresi Linier Sederhana
Gambar 1. Ilustrasi Garis Regresi Linier
Persamaan regresi linier sederhana secara matematik diekspresikan oleh : \[ \widehat{Y} = a + b X \]
yang mana:
\(\widehat{Y}=\) Garis regresi atau variabel response
\(a=\) Konstanta(intersep)
\(b=\) Konstanta regresi(slope)
\(X=\) Variabel bebas atau predictor
Besarnya konstanta \(a\) dan \(b\) dapat ditentukan menggunakan persamaan:
\[
a=\frac {(\sum{Y_i})(\sum{X_i^2})-(\sum{X_i})(\sum{X_iY_i})}{n\sum{X_i^2}-(\sum{X_i})^2}
\] \[
b=\frac {n(\sum{X_iY_i})-(\sum{X_i})(\sum{Y_i})}{n\sum{X_i^2}-(\sum{X_i})^2}
\]
\[ n=jumlah \space data \]
Koefisien Korelasi (r)
Untuk mengukur kekuatan hubungan antar variable predictor X dan response Y, dilakukan analisis korelasi yang hasilnya dinyatakan oleh suatu bilangan yang dikenal dengan koefisien korelasi. Biasanya analisis regresi sering dilakukan bersama-sama dengan analisis korelasi. Persamaan koefisien korelasi (r) diekspresikan oleh: \[
r=\frac{n\sum{X_iY_i}-(\sum{X_i})(\sum{Y_i})}{\sqrt{[n\sum{X_i^2}-(\sum{X_i})^2][n\sum{Y_i^2}-(\sum{Y_i})^2]}}
\]
Koefisien Determinasi (\(r^2\))
Uji koefisien determinasi dilakukan untuk mengetahui seberapa besar variabel predictor secara simultan mampu menjelaskan variabel response. Semakin tinggi nilai \(r^2\) berarti semakin baik model prediksi dari model penelitian yang diajukan. Nilai koefisien determinasi yaitu antara 0 sampai 1.
1.4 Uji Signifikansi dan Uji Hipotesis
Pengujian hipotesis dimaksudkan untuk melihat apakah suatu hipotesis yang diajukan ditolak atau dapat diterima. Hipotesis merupakan asumsi atau pernyataan yang mungkin benar atau salah mengenai suatu populasi. Dengan mengamati seluruh populasi, maka suatu hipotesis akan dapat diketahui apakah suatu penelitian itu benar atau salah. Untuk keperluan praktis, pengambilan sampel secara acak dari populasi akan sangat membantu. Dalam pengujian hipotesis terdapat asumsi atau pernyataan istilah hipotesis nol. Hipotesis nol merupakan hipotesis yang akan diuji, dinyatakan oleh \(H_0\) dan penolakan \(H_0\) dimaknai dengan penerimaan hipotesis lainnya yang dinyatakan oleh \(H_1\).
Jika telah ditentukan Koefisien Determinasi (\(r^2\)), maka selanjutnya dilakukan uji signifikan hipotesis yang diajukan. Dalam modul ini hanya dibahas uji signifikansi menggunakan uji-t. Dengan uji signifikansi ini dapat diketahui apakah variabel bebas atau predictor atau independent (X) berpengaruh secara signifikan terhadap variabel tak bebas atau response atau dependent (Y).
Langkah-Langkah Dalam Uji-t Pada Regresi Linier Sederhana
1. Menentukan hipotesis \[
H_0: \beta=0; variabel \space X \space tidak \space berpengaruh \space signifikan \space terhadap \space Y
\] \[
H_1: \beta \ne 0; variabel \space X \space berpengaruh \space signifikan \space terhadap \space Y
\] 2. Menentukan tingkat signifikansi (\(\alpha\)) 3. Menghitung nilai t menggunakan rumus: \[
t_{hit}=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}}
\] 4. Menentukan daerah penolakan \(H_0\)
5. Menentukan t tabel
6. Pengujian nilai t hitung dengan t tabel
7. Kesimpulan hasil uji signifikan
1.5 Data
Dalam kasus ini digunakan data sekunder yang berasal dari pengukuran berat badan mahasiswa dalam kilogram(kg) yang diambil secara acak diprediksi dipengaruhi oleh konsumsi jumlah kalori per hari dalam satuan kilokalori(kkal) yang bertujuan untuk mengetahui apakah konsumsi jumlah kalori per hari memengaruhi berat badan mahasiswa.
2 SOURCE CODE
2.1 Data Hasil Pengamatan
Kalori/hari(X) | Berat badan(Y) |
---|---|
530 | 89 |
300 | 48 |
358 | 56 |
510 | 72 |
302 | 54 |
300 | 42 |
387 | 60 |
527 | 85 |
415 | 63 |
512 | 74 |
2.2 Perhitungan Model Regresi
> X <- c(530,300,358,510,302,300,387,527,415,512)
> X2 <- X^2
> Y <- c(89,48,56,72,54,42,60,85,63,74)
> Y2 <- Y^2
> XY <- X*Y
> n <- 10
> data <- data.frame(X,X2,Y,Y2,XY)
> data
X X2 Y Y2 XY1 530 280900 89 7921 47170
2 300 90000 48 2304 14400
3 358 128164 56 3136 20048
4 510 260100 72 5184 36720
5 302 91204 54 2916 16308
6 300 90000 42 1764 12600
7 387 149769 60 3600 23220
8 527 277729 85 7225 44795
9 415 172225 63 3969 26145
10 512 262144 74 5476 37888
Source code di atas merupakan pendefinisian data jumlah konsumsi kalori per hari yang didefinisikan sebagai \(X\) dan berat badan mahasiswa sebagai \(Y\). Kemudian dibentuk data frame dinamai dengan data yang berisikan \(X\), \(X^2\), \(Y\), \(Y^2\), dan \(XY\).
> a <- (sum(Y)*sum(X2)-sum(X)*sum(XY))/(n*(sum(X2))-sum(X)^2)
> a
1] 2.608041 [
Setelah membentuk data frame, hitung model regresi dengan menghitung \(a\) terlebih dahulu.
> b <- (n*(sum(XY))-sum(X)*sum(Y))/(n*(sum(X2))-sum(X)^2)
> b
1] 0.1489784 [
Kemudian hitung nilai \(b\).
> y <- a+b*X
> y
1] 81.56660 47.30156 55.94231 78.58703 47.59952 47.30156 60.26269 81.11966
[9] 64.43408 78.88499 [
Setelah didapat nilai \(a\) dan \(b\) maka model regresi dapat dibentuk dan didapatkan hasil seperti di atas.
2.3 Plot Hubungan Berat Badan Mahasiswa Dengan Konsumsi Kalori per Hari
> plot(data$X,data$Y,main = "Hubungan X dengan Y",xlab = "Kalori per hari(kkal)",ylab ="Berat badan(kg)",col="purple")
> abline(lm(data$Y~data$X),col="red")
Membuat scatter plot dengan syntax
plot
yang berisikan data$X
sebagai variabel \(X\) dan data$Y
sebagai variabel \(Y\) dimana simbol $
artinya memanggil variabel \(X\) dan \(Y\) pada data frame yang bernama data. main
untuk memberikan judul pada plot, xlab
untuk memberikan judul pada variabel \(X\), ylab
untuk memberikan judul pada variabel \(Y\), dan col
untuk memberikan warna ungu pada plot. abline
untuk membuat garis linier pada plot yang berisikan fungsi lm(data$Y~data$X),col="red"
.
2.4 Koefisien Korelasi (\(r\))
> r=(n*sum(XY)-sum(X)*sum(Y))/(sqrt((n*sum(X2)-sum(X)^2)*(n*sum(Y2)-sum(Y)^2)))
> r
1] 0.9500932 [
Menghitung nilai \(r\) dengan syntax di atas.
2.5 Koefisien Determinasi (\(r^2\))
> r2=r^2
> r2
1] 0.9026771 [
Menghitung nilai \(r^2\) setelah mendapatkan \(r\).
2.6 Mencari t Hitung
> thit=(r*sqrt(n-2))/(sqrt(1-r2))
> thit
1] 8.613976
[>
> ttab=qt(p=0.025,df=8,lower.tail=F,log.p=F)
> ttab
1] 2.306004 [
Menghitung nilai \(t_{hitung}\) dengan rumus seperti di atas dan untuk mencari nilai \(t_{tabel}\) dapat menggunakan syntax qt(p=0.025,df=8,lower.tail=F,log.p=F)
.
3 HASIL DAN PEMBAHASAN
Berdasarkan plot di atas Hubungan antara \(X\) dengan \(Y\) memiliki hubungan yang positif ditandai dengan adanya garis merah dimana semakin jumlah konsumsi kalori per hari maka semakin tinggi pula berat badan mahasiswa.
Perhitungan model regresi \[ a=\frac {(\sum{Y_i})(\sum{X_i^2})-(\sum{X_i})(\sum{X_iY_i})}{n\sum{X_i^2}-(\sum{X_i})^2} \] \[ a=\frac {(643)(1802235)-(4141)(279294)}{10(1802235)-(4141)^2} \] \[ a=\frac {2280651}{874469}=2,608 \]
\[ b=\frac {n(\sum{X_iY_i})-(\sum{X_i})(\sum{Y_i})}{n\sum{X_i^2}-(\sum{X_i})^2} \]
\[ b=\frac {10(279294)-(4141)(643)}{10(1802235)-(4141)^2} \] \[ b=\frac {130227}{874469}=0,149 \]
\[ \widehat{Y}=a+bX \] \[ \widehat{Y}=2,608+0,149X \] Didapatkan hasil model regresi \(\widehat{Y}=2,608+0,149X\)
Perhitungan koefisien korelasi \[ r=\frac{n\sum{X_iY_i}-(\sum{X_i})(\sum{Y_i})}{\sqrt{[n\sum{X_i^2}-(\sum{X_i})^2][n\sum{Y_i^2}-(\sum{Y_i})^2]}} \] \[ r=\frac {10(279294)-(4141)(643)}{\sqrt{(10(1802235)-4141^2)(10(43495)-643^2)}} \] \[ r=\frac{130277}{137120,2318}=0,95 \] Didapatkan hasil koefisien korelasi 0,95 Nilai ini memberi arti bahwa hubungan variable bebas \(X\) dengan variabel terikat \(Y\) adalah sangat kuat, prosentasenya adalah 95%. Jadi, berat badan memang sangat dipengaruhi oleh konsumsi jumlah kalori/hari.
Perhitungan koefisien determinasi \[ r^2=0,95^2=0,90 \] Didapatkan hasil koefisien determinasi 0,90 Nilai ini berarti 90% variabel bebas \(X\) dapat menjelaskan variabel tak bebas \(Y\) dan 10% dijelaskan oleh variabel lainnya.
Uji-t
1. Menentukan Hipotesis
\[
H_0: \beta=0; variabel \space X \space tidak \space berpengaruh \space signifikan \space terhadap \space Y
\] \[
H_1: \beta \ne 0; variabel \space X \space berpengaruh \space signifikan \space terhadap \space Y
\] 2. Tingkat Signifikansi (\(\alpha\)) = 5%
3. Nilai t Hitung
\[
t=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}}
\] \[
t=\frac{0,95\sqrt{10-2}}{\sqrt{1-0,90}}=8,497
\] 4. Derajat Kebebasan, \(df=n-k=10-2=8\)
5. Nilai t tabel
\(t_{tab}=t_{(\alpha)(df)}=t_{(0,05)(8)}=2,306\)
6. Keputusan
Karena \(t_{hit}>t_{tab}\to 8,497>2,306\), maka tolak \(H_0\)
7. Kesimpulan
Dengan \(\alpha\) = 5% sudah cukup bukti bahwa terdapat pengaruh nyata jumlah konsumsi kalori per hari terhadap berat badan mahasiswa.
4 DAFTAR PUSTAKA
Hasan, Ikbal. 2014. Pokok-pokok Materi Statistik 1 (Statistik Deskriptif). Jakarta:Bumi Aksara
Walpole, R. E. 1993. Pengantar Statistika, halaman 2-5. Jakarta:PT Gramedia Pustaka Utama
Nazir. 1983. Metode Statistika Dasar I. Gramedia Pustaka Utama:Jakarta
Sudijono, Anas. 1996. Pengantar Statistik Pendidikan. Jakarta:Rajawali
Spiegel, Murray. R. 2004. Statistika. Jakarta:Erlangga
Supranto. J. 2001. Statistika Teori dan Aplikasi Edisi Ke-6 Jilid 2. Jakarta:Erlangga
Walpole, R. E. 1995. Ilmu Peluang Dan Statistika Untuk Insinyur dan Ilmuawan. Bandung:ITB