1 PENDAHULUAN

1.1 Latar Belakang

    Statistika adalah ilmu yang mempelajari tentang seluk beluk data yaitu tentang pengumpulan data, pengolahan, penganalisisan, penafsiran, dan penarikan kesimpulan dari data yang berbentuk angka-angka, (Ikbal, 2014). Statistika deskriptif atau statistika deduktif adalah bagian dari statistik yang mempelajri cara pengumpulan dan penyajian data sehingga mudah dipahami yang berhubungan dengan hal menguraikan atau memberikan keterangan-keterangan mengenai suatu data atau keadaan atau fenomena.
    Analisis regresi merupakan suatu kajian dari hubungan antara satu variabel, yaitu variabel yang diterangkan (the explained variabel) dengan satu atau lebih variabel, yaitu variabel yang menerangkan (the explanatory). Apabila variabel bebasnya hanya satu, maka analisis regresinya disebut dengan regresi sederhana. Apabila variabel bebasnya lebih dari satu, maka analisis regresinya dikenal dengan regresi linear berganda. Dikatakan berganda karena terdapat beberapa variabel bebas yang mempengaruhi variabel tak bebas.
    Analisis atau uji regresi banyak digunakan dalam perhitungan hasil akhir untuk penulisan karya ilmiah/penelitian. Hasil perhitungan analisis/uji regresi akan dimuat dalam kesimpulan penelitian dan akan menentukan apakah penelitian yang sedang dilakukan berhasil atau tidak. Analisis perhitungan pada uji regresi menyangkut beberapa perhitungan statistika seperti uji signifikansi (uji-t, uji-F), anova dan penentuan hipotesis. Hasil dari analisis/ uji regresi berupa suatu persamaan regresi. Persamaan regresi ini merupakan suatu fungsi prediksi variabel yang mempengaruhi variabel lain.

1.2 Statistika Deskriptif

    Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu himpunan data sehingga memberikan informasi yang berguna. Pengklasifikasian menjadi statistika deskriptif dan statistika inferensial dilakukan berdasarkan aktivitas yang dilakukan.

1.3 Regresi Linier Sederhana

    Regresi linier sederhana merupakan suatu model persamaan yang menggambarkan hubungan satu variabel bebas atau predictor (X) dengan satu variabel tak bebas atau response (Y), yang biasanya digambarkan dengan garis lurus.

Gambar 1. Ilustrasi Garis Regresi Linier

Persamaan regresi linier sederhana secara matematik diekspresikan oleh : \[ \widehat{Y} = a + b X \]

yang mana:

\(\widehat{Y}=\) Garis regresi atau variabel response
\(a=\) Konstanta(intersep)
\(b=\) Konstanta regresi(slope)
\(X=\) Variabel bebas atau predictor

Besarnya konstanta \(a\) dan \(b\) dapat ditentukan menggunakan persamaan:
\[ a=\frac {(\sum{Y_i})(\sum{X_i^2})-(\sum{X_i})(\sum{X_iY_i})}{n\sum{X_i^2}-(\sum{X_i})^2} \] \[ b=\frac {n(\sum{X_iY_i})-(\sum{X_i})(\sum{Y_i})}{n\sum{X_i^2}-(\sum{X_i})^2} \]

\[ n=jumlah \space data \]

Koefisien Korelasi (r)
Untuk mengukur kekuatan hubungan antar variable predictor X dan response Y, dilakukan analisis korelasi yang hasilnya dinyatakan oleh suatu bilangan yang dikenal dengan koefisien korelasi. Biasanya analisis regresi sering dilakukan bersama-sama dengan analisis korelasi. Persamaan koefisien korelasi (r) diekspresikan oleh: \[ r=\frac{n\sum{X_iY_i}-(\sum{X_i})(\sum{Y_i})}{\sqrt{[n\sum{X_i^2}-(\sum{X_i})^2][n\sum{Y_i^2}-(\sum{Y_i})^2]}} \]

Koefisien Determinasi (\(r^2\))
Uji koefisien determinasi dilakukan untuk mengetahui seberapa besar variabel predictor secara simultan mampu menjelaskan variabel response. Semakin tinggi nilai \(r^2\) berarti semakin baik model prediksi dari model penelitian yang diajukan. Nilai koefisien determinasi yaitu antara 0 sampai 1.

1.4 Uji Signifikansi dan Uji Hipotesis

Pengujian hipotesis dimaksudkan untuk melihat apakah suatu hipotesis yang diajukan ditolak atau dapat diterima. Hipotesis merupakan asumsi atau pernyataan yang mungkin benar atau salah mengenai suatu populasi. Dengan mengamati seluruh populasi, maka suatu hipotesis akan dapat diketahui apakah suatu penelitian itu benar atau salah. Untuk keperluan praktis, pengambilan sampel secara acak dari populasi akan sangat membantu. Dalam pengujian hipotesis terdapat asumsi atau pernyataan istilah hipotesis nol. Hipotesis nol merupakan hipotesis yang akan diuji, dinyatakan oleh \(H_0\) dan penolakan \(H_0\) dimaknai dengan penerimaan hipotesis lainnya yang dinyatakan oleh \(H_1\).

Jika telah ditentukan Koefisien Determinasi (\(r^2\)), maka selanjutnya dilakukan uji signifikan hipotesis yang diajukan. Dalam modul ini hanya dibahas uji signifikansi menggunakan uji-t. Dengan uji signifikansi ini dapat diketahui apakah variabel bebas atau predictor atau independent (X) berpengaruh secara signifikan terhadap variabel tak bebas atau response atau dependent (Y).

Langkah-Langkah Dalam Uji-t Pada Regresi Linier Sederhana
1. Menentukan hipotesis \[ H_0: \beta=0; variabel \space X \space tidak \space berpengaruh \space signifikan \space terhadap \space Y \] \[ H_1: \beta \ne 0; variabel \space X \space berpengaruh \space signifikan \space terhadap \space Y \] 2. Menentukan tingkat signifikansi (\(\alpha\)) 3. Menghitung nilai t menggunakan rumus: \[ t_{hit}=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}} \] 4. Menentukan daerah penolakan \(H_0\)

Gambar 2. Daerah Penolakan
5. Menentukan t tabel
6. Pengujian nilai t hitung dengan t tabel
7. Kesimpulan hasil uji signifikan

1.5 Data

Dalam kasus ini digunakan data sekunder yang berasal dari pengukuran berat badan mahasiswa dalam kilogram(kg) yang diambil secara acak diprediksi dipengaruhi oleh konsumsi jumlah kalori per hari dalam satuan kilokalori(kkal) yang bertujuan untuk mengetahui apakah konsumsi jumlah kalori per hari memengaruhi berat badan mahasiswa.

2 SOURCE CODE

2.1 Data Hasil Pengamatan

Kalori/hari(X) Berat badan(Y)
530 89
300 48
358 56
510 72
302 54
300 42
387 60
527 85
415 63
512 74

2.2 Perhitungan Model Regresi

> X <- c(530,300,358,510,302,300,387,527,415,512)
> X2 <- X^2
> Y <- c(89,48,56,72,54,42,60,85,63,74)
> Y2 <- Y^2
> XY <- X*Y
> n <- 10
> data <- data.frame(X,X2,Y,Y2,XY)
> data
     X     X2  Y   Y2    XY
1  530 280900 89 7921 47170
2  300  90000 48 2304 14400
3  358 128164 56 3136 20048
4  510 260100 72 5184 36720
5  302  91204 54 2916 16308
6  300  90000 42 1764 12600
7  387 149769 60 3600 23220
8  527 277729 85 7225 44795
9  415 172225 63 3969 26145
10 512 262144 74 5476 37888

Source code di atas merupakan pendefinisian data jumlah konsumsi kalori per hari yang didefinisikan sebagai \(X\) dan berat badan mahasiswa sebagai \(Y\). Kemudian dibentuk data frame dinamai dengan data yang berisikan \(X\), \(X^2\), \(Y\), \(Y^2\), dan \(XY\).

> a <- (sum(Y)*sum(X2)-sum(X)*sum(XY))/(n*(sum(X2))-sum(X)^2)
> a
[1] 2.608041

Setelah membentuk data frame, hitung model regresi dengan menghitung \(a\) terlebih dahulu.

> b <- (n*(sum(XY))-sum(X)*sum(Y))/(n*(sum(X2))-sum(X)^2)
> b
[1] 0.1489784

Kemudian hitung nilai \(b\).

> y <- a+b*X
> y
 [1] 81.56660 47.30156 55.94231 78.58703 47.59952 47.30156 60.26269 81.11966
 [9] 64.43408 78.88499

Setelah didapat nilai \(a\) dan \(b\) maka model regresi dapat dibentuk dan didapatkan hasil seperti di atas.

2.3 Plot Hubungan Berat Badan Mahasiswa Dengan Konsumsi Kalori per Hari

> plot(data$X,data$Y,main = "Hubungan X dengan Y",xlab = "Kalori per hari(kkal)",ylab ="Berat badan(kg)",col="purple")
> abline(lm(data$Y~data$X),col="red")

Membuat scatter plot dengan syntax plot yang berisikan data$X sebagai variabel \(X\) dan data$Y sebagai variabel \(Y\) dimana simbol $ artinya memanggil variabel \(X\) dan \(Y\) pada data frame yang bernama data. main untuk memberikan judul pada plot, xlab untuk memberikan judul pada variabel \(X\), ylab untuk memberikan judul pada variabel \(Y\), dan col untuk memberikan warna ungu pada plot. abline untuk membuat garis linier pada plot yang berisikan fungsi lm(data$Y~data$X),col="red".

2.4 Koefisien Korelasi (\(r\))

> r=(n*sum(XY)-sum(X)*sum(Y))/(sqrt((n*sum(X2)-sum(X)^2)*(n*sum(Y2)-sum(Y)^2)))
> r
[1] 0.9500932

Menghitung nilai \(r\) dengan syntax di atas.

2.5 Koefisien Determinasi (\(r^2\))

> r2=r^2
> r2
[1] 0.9026771

Menghitung nilai \(r^2\) setelah mendapatkan \(r\).

2.6 Mencari t Hitung

> thit=(r*sqrt(n-2))/(sqrt(1-r2))
> thit
[1] 8.613976
> 
> ttab=qt(p=0.025,df=8,lower.tail=F,log.p=F)
> ttab
[1] 2.306004

Menghitung nilai \(t_{hitung}\) dengan rumus seperti di atas dan untuk mencari nilai \(t_{tabel}\) dapat menggunakan syntax qt(p=0.025,df=8,lower.tail=F,log.p=F).

3 HASIL DAN PEMBAHASAN

Berdasarkan plot di atas Hubungan antara \(X\) dengan \(Y\) memiliki hubungan yang positif ditandai dengan adanya garis merah dimana semakin jumlah konsumsi kalori per hari maka semakin tinggi pula berat badan mahasiswa.

Perhitungan model regresi \[ a=\frac {(\sum{Y_i})(\sum{X_i^2})-(\sum{X_i})(\sum{X_iY_i})}{n\sum{X_i^2}-(\sum{X_i})^2} \] \[ a=\frac {(643)(1802235)-(4141)(279294)}{10(1802235)-(4141)^2} \] \[ a=\frac {2280651}{874469}=2,608 \]

\[ b=\frac {n(\sum{X_iY_i})-(\sum{X_i})(\sum{Y_i})}{n\sum{X_i^2}-(\sum{X_i})^2} \]

\[ b=\frac {10(279294)-(4141)(643)}{10(1802235)-(4141)^2} \] \[ b=\frac {130227}{874469}=0,149 \]

\[ \widehat{Y}=a+bX \] \[ \widehat{Y}=2,608+0,149X \] Didapatkan hasil model regresi \(\widehat{Y}=2,608+0,149X\)

Perhitungan koefisien korelasi \[ r=\frac{n\sum{X_iY_i}-(\sum{X_i})(\sum{Y_i})}{\sqrt{[n\sum{X_i^2}-(\sum{X_i})^2][n\sum{Y_i^2}-(\sum{Y_i})^2]}} \] \[ r=\frac {10(279294)-(4141)(643)}{\sqrt{(10(1802235)-4141^2)(10(43495)-643^2)}} \] \[ r=\frac{130277}{137120,2318}=0,95 \] Didapatkan hasil koefisien korelasi 0,95 Nilai ini memberi arti bahwa hubungan variable bebas \(X\) dengan variabel terikat \(Y\) adalah sangat kuat, prosentasenya adalah 95%. Jadi, berat badan memang sangat dipengaruhi oleh konsumsi jumlah kalori/hari.

Perhitungan koefisien determinasi \[ r^2=0,95^2=0,90 \] Didapatkan hasil koefisien determinasi 0,90 Nilai ini berarti 90% variabel bebas \(X\) dapat menjelaskan variabel tak bebas \(Y\) dan 10% dijelaskan oleh variabel lainnya.

Uji-t
1. Menentukan Hipotesis
\[ H_0: \beta=0; variabel \space X \space tidak \space berpengaruh \space signifikan \space terhadap \space Y \] \[ H_1: \beta \ne 0; variabel \space X \space berpengaruh \space signifikan \space terhadap \space Y \] 2. Tingkat Signifikansi (\(\alpha\)) = 5%
3. Nilai t Hitung
\[ t=\frac{r\sqrt{n-2}}{\sqrt{1-r^2}} \] \[ t=\frac{0,95\sqrt{10-2}}{\sqrt{1-0,90}}=8,497 \] 4. Derajat Kebebasan, \(df=n-k=10-2=8\)
5. Nilai t tabel
\(t_{tab}=t_{(\alpha)(df)}=t_{(0,05)(8)}=2,306\)
6. Keputusan
Karena \(t_{hit}>t_{tab}\to 8,497>2,306\), maka tolak \(H_0\)
7. Kesimpulan
Dengan \(\alpha\) = 5% sudah cukup bukti bahwa terdapat pengaruh nyata jumlah konsumsi kalori per hari terhadap berat badan mahasiswa.

4 DAFTAR PUSTAKA

Hasan, Ikbal. 2014. Pokok-pokok Materi Statistik 1 (Statistik Deskriptif). Jakarta:Bumi Aksara

Walpole, R. E. 1993. Pengantar Statistika, halaman 2-5. Jakarta:PT Gramedia Pustaka Utama

Nazir. 1983. Metode Statistika Dasar I. Gramedia Pustaka Utama:Jakarta

Sudijono, Anas. 1996. Pengantar Statistik Pendidikan. Jakarta:Rajawali

Spiegel, Murray. R. 2004. Statistika. Jakarta:Erlangga

Supranto. J. 2001. Statistika Teori dan Aplikasi Edisi Ke-6 Jilid 2. Jakarta:Erlangga

Walpole, R. E. 1995. Ilmu Peluang Dan Statistika Untuk Insinyur dan Ilmuawan. Bandung:ITB