Kalori adalah satuan energi yang diperoleh dari makanan dan minuman yang kita konsumsi. Tubuh manusia membutuhkan kalori untuk menjalankan fungsi-fungsi dasar seperti bernapas, berpikir, dan aktivitas fisik. Namun, ketika asupan kalori melebihi kebutuhan tubuh, kelebihan kalori ini disimpan sebagai lemak, yang kemudian berkontribusi terhadap peningkatan berat badan.
Penelitian mengenai hubungan antara konsumsi kalori dan berat badan telah dilakukan secara ekstensif. Studi menunjukkan bahwa pola makan tinggi kalori, terutama dari makanan dan minuman yang tinggi gula dan lemak, dapat meningkatkan risiko penambahan berat badan. Selain itu, faktor-faktor lain seperti aktivitas fisik, genetik, lingkungan, dan perilaku makan juga memainkan peran penting dalam regulasi berat badan.
Untuk memahami hubungan antara konsumsi kalori dan berat badan secara kuantitatif, analisis regresi sederhana dapat digunakan. Analisis regresi sederhana adalah metode statistik yang digunakan untuk memodelkan dan menganalisis hubungan antara satu variabel dependen (misalnya, berat badan) dengan satu variabel independen (misalnya, konsumsi kalori). Dengan menggunakan analisis regresi sederhana, kita dapat mengevaluasi sejauh mana perubahan dalam konsumsi kalori mempengaruhi berat badan.
Regresi linier adalah salah satu metode statistik yang digunakan untuk memodelkan hubungan antara dua variabel, yaitu variabel independen (X) dan variabel dependen (Y), dengan asumsi bahwa hubungan tersebut bersifat linier. Metode ini sering digunakan untuk melakukan prediksi atau estimasi nilai variabel dependen berdasarkan nilai variabel independen yang diketahui. Istilah regresi pertama kali diperkenalkan oleh seorang antropolog dan ahli meteorologi dari Inggris, Francis Galton dalam artikel “Family Likeness in Stature” pada tahun 1886. Secara umum analisis regresi merupakan suatu cara yang bertujuan untuk mengetahui hubungan sebuah variabel terikat dengan sebuah atau lebih variabel bebas. Drapper and Smith (1992) menyatakan analisis regresi merupakan metode analisis yang dapat digunakan untuk menganalisis dan mengambil kesimpulan yang bermakna tentang hubungan ketergantungan variabel terhadap variabel lainnya. Tujuan analisis regresi adalah untuk mengetahui ada tidaknya pengaruh signifikan antara satu atau lebih variabel bebas terhadap variabel terikatnya baik secara parsial atau simultan (Sunyoto, 2011). Singkatnya, analisis regresi memiliki keunggulan dalam meramalkan atau memprediksi nilai variabel terikatnya. Apabila dalam analisis hanya melibatkan hubungan fungsional ataupun kausal satu variabel terikat dengan satu variabel bebas yang digunakan adalah analisis regresi linier sederhana (Sugiyono, 2014).
Regresi Linear Sederhana adalah regresi yang memiliki satu variabel independen (X) dan satu variabel dependen (Y). Analisis Regresi Sederhana ini bertujuan untuk menguji pengaruh antara variabel X terhadap variabel Y. Variabel yang dipengaruhi disebut variabel dependen, sedangkan variabel yang mempengaruhi disebut variabel independen. Analisis ini untuk mengetahui arah hubungan antara variabel independen dengan variabel dependen apakah positif atau negatif dan untuk memprediksi nilai dari variabel dependen apabila nilai variabel independen mengalami kenaikan atau penurunan. Data yang digunakan biasanya berskala interval atau rasio.
Secara umum model regresi linier sederhana didefinisikan sebagai berikut:
\[ Y_i = \beta_{0} + \beta_1X_i + ϵ_i \]
dengan \(i = 1,2,3,..,n\)
dimana :
\(Y_i\) = Peubah respon pada amatan ke-i
\(X_i\) = Peubah prediktor pada amatan ke-i
\(𝛽_0,𝛽_1\) = Koefisien regresi
\(ϵ_i\) = Galat pada amatan ke-i
Regresi Linier Berganda (RLB) adalah regresi linier yang memiliki satu variabel dependen dan lebih dari satu variabel independen. Model dari RLB adalah : \[ Y_i = \beta_{0} + \beta_1X_1 + \beta_2X_2+...+\beta_nX_n+ ϵ_i \]
dimana :
\(Y_i\) = Peubah respon pada amatan ke-i
\(X_1,X_2,...,X_n\) = Peubah prediktor
\(𝛽_0,𝛽_1,...,𝛽_n\) = Koefisien regresi
\(ϵ_i\) = Galat pada amatan ke-i
Sebelum melakukan analisis regresi terlebih dahulu dilakukan pengujian asumsi. Tujuan pengujian asumsi klasik adalah untuk memberikan kepastian bahwa persamaan regresi yang diperoleh memiliki ketepatan dalam estimasi, tidak bias, dan konsisten. Asumsi-asumsi yang harus dipenuhi dalam analisis regresi antara lain: normalitas, homoskedastisitas, dan autokorelasi.
Analisis regresi linier mengasumsikan bahwa sisaan berdistribusi mengetahui apakah dalam persamaan regresi tersebut residual berdistribusi normal. Uji normalitas dapat dilakukan dengan normal P-P Plot dan uji Kolmogorov-Smirnov. Normal P-P plot, uji normalitasnya dapat dilihat dari penyebaran data (titik) pada sumbu diagonal grafik atau normal.Dasar pengambilan keputusannya, jika data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal atau grafik histogramnya menunjukkan pola distribusi normal, maka model regresi memenuhi asumsi normalitas.
Selain kriteria yang ditampilkan diatas pengujian normalitas mengunakan prosedur hipotesis yang disajikan sebagai berikut:
\(H_0 : F(x)=F_0(x)\) untuk semua nilai x (Residual berdistribusi normal) \(vs\)
\(H_1: F(x)≠F_0(x)\) untuk minimal satu x (Residual tidak berdistribusi normal)
Dengan aturan penolakan apabila \(p-value\) lebih kecil dari α maka \(H_0\) ditolak dan berlaku \(H_1\) dan apabila \(p-value\) lebih besar dari α maka \(H_0\) diterima. Jadi residual berdistribusi normal apabila nilai p-value lebih besar dari α.
Salah satu asumsi klasik adalah homoskedastisitas atau non heteroskedastisitas yaitu asumsi yang menyatakan bahwa varian setiap sisaan masih tetap sama baik untuk nilai-nilai pada variabel independen yang kecil maupun besar. Asumsi ini dapat ditulis sebagai berikut:
\[var(ϵ_i) = σ^2\] i= 1,2,…,n untuk n menunjukkan jumlah observasi. Salah satu cara menguji kesamaan variansi yaitu dengan melihat pola tebaran sisaan terhadap nilai estimasi Y. Jika tebaran sisaan bersifat acak (tidak membentuk pola tertentu), maka dikatakan bahwa variansi sisaan homogen.
Selain kriteria yang ditampilkan diatas pengujian normalitas mengunakan prosedur hipotesis yang disajikan sebagai berikut:
\(H_0 : 𝛽_j=0\) (Ragam galat bersifat homoskedastisitas) \(vs\)
\(H_1 : 𝛽_j≠0\) (Ragam galat tidak bersifat homoskedastisitas)
Dengan aturan penolakan apabila \(p-value\) lebih kecil dari α maka \(H_0\) ditolak dan berlaku \(H_1\) dan apabila \(p-value\) lebih besar dari α maka \(H_0\) diterima.
Autokorelasi digunakan untuk melihat apakah variabel residual terjadi korelasi antara variabel residual satu dengan variabel residual yang lain, dimana asumsi \(least square\) klasik residual bersifat independent (saling bebas). Autokorelasi dalam konsep regresi menurut Setiawan dan Endah dalam (Azizah, 2013) merupakan komponen residual yang berkorelasi berdasarkan urutan waktu, ruang dan pada dirinya sendiri. Apabila tidak terjadi pelanggaran asumsi autokorelasi maka kovarian antara residual satu \((𝜀_i)\) dengan residual yang lain \((𝜀_i)\) bernilai sama dengan nol yang artinya bahwa komponen residual yang berkaitan dengan data pengamatan ke-i tidak dipengaruhi oleh residual yang berkaitan dengan data pengamatan ke-j.
\(H_0 : p=0\) ( Residual tidak terjadi pelangaran Autokorelasi) \(vs\)
\(H_1 : p≠0\) ( Residual terjadi pelangaran Autokorelasi)
Dengan aturan penolakan apabila \(p-value\) lebih kecil dari α maka \(H_0\) ditolak dan berlaku \(H_1\) dan apabila \(p-value\) lebih besar dari α maka \(H_0\) diterima.
Data yang digunakan terdiri dari variabel terikat (X) dan variabel bebas (Y). Data tersebut merupakan data penelitian tentang berat badan 10 mahasiswa yang diprediksi dipengaruhi oleh konsumsi jumlah kalori/hari.
Variabel :
X (Variabel bebas/\(predictor\)) = jumlah kalori/hari
Y (variabel tak bebas/\(response\)) = berat badan
Mengetahui pengertian dan kegunaan analisis regresi linier.
Mengetahui penggunaan analisis regresi sederhana untuk mengetahui pengaruh banyak kalori terhadap berat badan
# library (lmtest) -> untuk uji asumsi homoskedastisitas dan non autokorelasi
# library (tseries) -> untuk uji asumsi normalitas
X <- c(530,300,358,510,302,300,387,527,415,512)
Y <- c(89,48,56,72,54,42,60,85,63,74)
data <- data.frame(X,Y)
data
## X Y
## 1 530 89
## 2 300 48
## 3 358 56
## 4 510 72
## 5 302 54
## 6 300 42
## 7 387 60
## 8 527 85
## 9 415 63
## 10 512 74
reg <- lm(Y~X, data)
print(reg)
##
## Call:
## lm(formula = Y ~ X, data = data)
##
## Coefficients:
## (Intercept) X
## 2.608 0.149
summary(data)
## X Y
## Min. :300.0 Min. :42.0
## 1st Qu.:316.0 1st Qu.:54.5
## Median :401.0 Median :61.5
## Mean :414.1 Mean :64.3
## 3rd Qu.:511.5 3rd Qu.:73.5
## Max. :530.0 Max. :89.0
par(mfrow=c(2,2))
plot(reg)
library(tseries)
## Registered S3 method overwritten by 'quantmod':
## method from
## as.zoo.data.frame zoo
sisa<-residuals(reg)
jarque.bera.test(sisa)
##
## Jarque Bera Test
##
## data: sisa
## X-squared = 0.58574, df = 2, p-value = 0.7461
shapiro.test(sisa)
##
## Shapiro-Wilk normality test
##
## data: sisa
## W = 0.94294, p-value = 0.5862
library(lmtest)
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(reg)
##
## studentized Breusch-Pagan test
##
## data: reg
## BP = 1.3603, df = 1, p-value = 0.2435
library(lmtest)
dwtest(reg)
##
## Durbin-Watson test
##
## data: reg
## DW = 2.2855, p-value = 0.6768
## alternative hypothesis: true autocorrelation is greater than 0
Dari output diperoleh persamaan sebagai berikut:
\(𝑌 = 2.608 + 0.149X\)
Jika nilai X (Jumlah Kalori) bernilai konstan, maka nilai Y (Berat Badan) sebesar 2.608.
Setiap kenaikan 1 satuan X (Jumlah Kalori), meningkatkan Y (Berat Badan) sebesar 0.149 satuan secara rata-rata
Berdasarkan data yang digunakan diperoleh nilai terkecil variabel X adalah 300 dan nilai terbesar 530. Mean variabel X adalah 414.1 .Nilai terkecil variabel Y adalah 42 dan nilai terbesar 89. Mean variabel Y adalah 64.3.
Dari plot Residuals vs Fitted, terdapat sedikit indikasi pola kurva yang bisa menunjukkan non-linearitas, tetapi residual masih menyebar secara normal.
Dari plot Normal Q-Q tidak terlihat adanya pelanggaran normalitas.
Dari plot Scale-Location, terlihat tidak ada pola yang mengindikasikan kemungkinan tidak adanya heteroskedastisitas.
Dari plot Residuals vs Leverage, ada beberapa titik yang berada dekat dengan garis Cook’s distance, menunjukkan beberapa poin yang memiliki pengaruh kuat terhadap model.
Hipotesis :
\(H_0 : F(x)=F_0(x)\) untuk semua nilai x (Residual berdistribusi normal) \(vs\)
\(H_1: F(x)≠F_0(x)\) untuk minimal satu x (Residual tidak berdistribusi normal)
Dari output diperoleh \(p-value\) jarque bera sebesar 0.7461 dan \(p-value\) shapiro wilk sebesar 0.5862. Kedua nilai tersebut lebih besar dari α (0.05) maka terima \(H_0\). Dengan taraf nyata 5% dapat disimpulkan bahwa pada data tersebut tidak terbukti adanya pelanggaran normalitas.
Hipotesis :
\(H_0 : 𝛽_j=0\) (Ragam galat bersifat homoskedastisitas) \(vs\)
\(H_1 : 𝛽_j≠0\) (Ragam galat tidak bersifat homoskedastisitas)
Uji homoskedastisitas menggunakan uji Breusch Pagan. Dari output diperoleh \(p-value\) sebesar 0.2435 > α (0.05), maka terima \(H_0\). Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terbukti adanya pelanggaran asumsi homogenitas ragam galat pada model data tersebut.
Hipotesis :
\(H_0 : p=0\) ( Residual tidak terjadi pelangaran Autokorelasi) \(vs\)
\(H_1 : p≠0\) ( Residual terjadi pelangaran Autokorelasi)
Uji asumsi autokorelasi menggunakan uji Durbin Watson. Dari output diperoleh \(p-value\) sebesar 0.6768 > α (0.05), maka terima \(H_0\). Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat masalah autokorelasi pada model data tersebut.
Kesimpulan yang didapatkan dari hasil analisis regresi linier sederhana yang sudah dilakukan menunjukkan bahwa jumlah kalori berpengaruh terhadap berat badan dengan persamaan regresi yang diperoleh adalah Y = 2.608 + 0.149X yang menunjukkan arah hubunganya positif. Uji asumsi pada taraf signifikansi sebesar 5% menunjukkan bahwa residual model berdistribusi normal dan tidak terjadi heteroskedastisitas dalam data serta tidak ditemukan autokorelasi signifikan pada residual.
M. Nazir, 1983, Metode Statistika Dasar I , Gramedia Pustaka Utama:Jakarta
Sudijono, Anas, 1996, Pengantar Statistik Pendidikan, Jakarta:Rajawali
Spiegel. Murray. R, 2004, Statistika. Jakarta:Erlangga
Supranto. J., 2001, Statistika Teori dan Aplikasi Edisi Ke-6 Jilid 2. Jakarta:Erlangga
Walpole. R.,E., 1995, Ilmu Peluang Dan Statistika Untuk Insinyur dan Ilmuawan. Bandung:ITB