Analisis Regresi Berganda Aktivitas Harian

Latar Belakang

Aktivitas fisik dan pola tidur dapat mempengaruhi jumlah kalori yang terbakar.
Perhitungan ini menganalisis pengaruh jumlah langkah harian dan jam tidur terhadap kalori yang terbakar

Model regresi yang digunakan:

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon \]

Keterangan:

  • \(Y\) = Kalori tubuh yang terbakar
  • \(X_1\) = Jumlah langkah kaki harian
  • \(X_2\) = Jam tidur

Data

# Data Penelitian
data <- data.frame(
  kalori = c(181,197,0,174,223,149,140,38,1,40,
             101,152,150,113,49,86,6,99,143,125,
             129,6,9,10,72,150,141,156,57,72,
             17,181,197,131,154,137,193,19,101,139,
             164,137,22,17,9,145,192,146,234,167),
  langkah = c(5464,6041,25,5461,6915,4545,4340,1230,61,1258,
              3148,4687,4732,3519,1580,2822,181,3158,4383,3881,
              4037,202,292,330,2209,4550,4435,4779,1831,2255,
              539,5464,6041,4068,4683,4033,6314,614,3149,4005,
              4880,4136,705,570,269,4275,5999,4421,6930,5195),
  
  tidur = c(5,8,5,4,5,6,6,7,5,6,
            8,5,6,7,5,6,8,5,4,5,
            6,8,5,6,5,8,5,4,5,4,
            5,4,3,2,9,5,6,4,5,8,
            4,5,6,5,6,5,6,5,6,5)
)
dim(data)
## [1] 50  3
head(data)
##   kalori langkah tidur
## 1    181    5464     5
## 2    197    6041     8
## 3      0      25     5
## 4    174    5461     4
## 5    223    6915     5
## 6    149    4545     6
summary(data)
##      kalori          langkah         tidur     
##  Min.   :  0.00   Min.   :  25   Min.   :2.00  
##  1st Qu.: 42.25   1st Qu.:1338   1st Qu.:5.00  
##  Median :134.00   Median :4035   Median :5.00  
##  Mean   :109.42   Mean   :3373   Mean   :5.52  
##  3rd Qu.:153.50   3rd Qu.:4721   3rd Qu.:6.00  
##  Max.   :234.00   Max.   :6930   Max.   :9.00

Data yang digunakan terdiri dari 50 observasi dengan 3 variabel yaitu kalori sebagai variabel respon, serta langkah dan tidur sebagai variabel penjelas. Berdasarkan statistik deskriptif, nilai kalori memiliki rata-rata 109,42 dengan nilai minimum 0 dan maksimum 234. Variabel langkah memiliki rata-rata 3373 langkah per hari, sedangkan rata-rata waktu tidur adalah 5,52 jam.

Model Persamaan Regresi

model <- lm(kalori ~ langkah + tidur, data = data)
summary(model)
## 
## Call:
## lm(formula = kalori ~ langkah + tidur, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -12.8564  -1.4888  -0.0443   0.9848   8.4340 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.0429421  2.2629204  -0.903    0.371    
## langkah      0.0327597  0.0002416 135.623   <2e-16 ***
## tidur        0.1758174  0.3567561   0.493    0.624    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.485 on 47 degrees of freedom
## Multiple R-squared:  0.9975, Adjusted R-squared:  0.9974 
## F-statistic:  9292 on 2 and 47 DF,  p-value: < 2.2e-16
coef(model)
## (Intercept)     langkah       tidur 
## -2.04294212  0.03275966  0.17581739

\[ Kalori = -2.0429 + 0.0328 × Langkah + 0.1758 × Tidur \] Koefisien langkah bernilai positif yang menunjukkan bahwa semakin banyak langkah yang dilakukan maka kalori yang terbakar cenderung meningkat, sedangkan variabel tidur memiliki pengaruh positif namun sangat kecil terhadap kalori.

Uji Asumsi

Uji Normalitas

shapiro.test(model$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  model$residuals
## W = 0.90595, p-value = 0.00076
qqnorm(model$residuals)
qqline(model$residuals, col="red")

Berdasarkan uji Shapiro–Wilk diperoleh p-value sebesar 0,00076 yang lebih kecil dari 0,05 sehingga dapat disimpulkan bahwa residual tidak berdistribusi normal. Hal ini menunjukkan bahwa asumsi normalitas pada model regresi belum terpenuhi.

Uji Linearitas

plot(data$langkah, data$kalori,
     xlab="Langkah",
     ylab="Kalori",
     main="Hubungan Kalori dan Langkah")

plot(data$tidur, data$kalori,
     xlab="Tidur",
     ylab="Kalori",
     main="Hubungan Kalori dan Tidur")

Berdasarkan scatterplot hubungan antara kalori dengan langkah dan tidur, titik-titik data menunjukkan pola yang cenderung mengikuti garis lurus, khususnya pada variabel langkah yang memiliki tren positif kuat. Dengan demikian, asumsi linearitas pada model regresi dapat dikatakan terpenuhi.

Uji Homoskedastisitas

plot(model$fitted.values, model$residuals,
     xlab="Nilai Prediksi",
     ylab="Residual",
     main="Plot Residual vs Fitted")

abline(h=0, col="red")

library(lmtest)
bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 7.6934, df = 2, p-value = 0.02135

Hasil uji Breusch–Pagan menunjukkan p-value sebesar 0,02135 yang lebih kecil dari 0,05 sehingga dapat disimpulkan bahwa terjadi heteroskedastisitas. Hal ini menunjukkan bahwa varians residual tidak konstan sehingga asumsi homoskedastisitas pada model tidak terpenuhi.

Uji Autokorelasi

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.0837, p-value = 0.6016
## alternative hypothesis: true autocorrelation is greater than 0

Hasil uji Durbin–Watson menghasilkan nilai DW sebesar 2,0837 dengan p-value 0,6016 yang lebih besar dari 0,05. Oleh karena itu dapat disimpulkan bahwa tidak terdapat autokorelasi pada residual model.

Uji Multikolinearitas

library(car)

vif(model)
## langkah   tidur 
## 1.01109 1.01109

Nilai Variance Inflation Factor (VIF) untuk variabel langkah dan tidur masing-masing sebesar sekitar 1,01. Karena nilai VIF lebih kecil dari 10, maka dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel independen dalam model.

Uji Signifikansi

Uji F dan t

summary(model)
## 
## Call:
## lm(formula = kalori ~ langkah + tidur, data = data)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -12.8564  -1.4888  -0.0443   0.9848   8.4340 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -2.0429421  2.2629204  -0.903    0.371    
## langkah      0.0327597  0.0002416 135.623   <2e-16 ***
## tidur        0.1758174  0.3567561   0.493    0.624    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.485 on 47 degrees of freedom
## Multiple R-squared:  0.9975, Adjusted R-squared:  0.9974 
## F-statistic:  9292 on 2 and 47 DF,  p-value: < 2.2e-16

Hasil uji F menunjukkan p-value < 2,2e-16 yang lebih kecil dari 0,05 sehingga secara simultan variabel langkah dan tidur berpengaruh signifikan terhadap kalori. Pada uji t, variabel langkah memiliki p-value < 0,05 sehingga berpengaruh signifikan terhadap kalori, sedangkan variabel tidur memiliki p-value 0,624 sehingga tidak berpengaruh signifikan secara parsial.

Model Akhir

\[ Y = -2.0429 + 0.0328 langkah + 0.1758 tidur \]

Plot Diagnostik Model

par(mfrow=c(2,2))
plot(model)

par(mfrow=c(1,1))

Berdasarkan grafik diagnostik model, sebagian besar asumsi regresi cukup terpenuhi meskipun terdapat penyimpangan pada normalitas residual dan indikasi heteroskedastisitas ringan. Namun tidak ditemukan pengamatan yang memiliki pengaruh ekstrem terhadap model.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda, variabel langkah memiliki pengaruh signifikan terhadap jumlah kalori yang terbakar, sedangkan variabel tidur tidak berpengaruh signifikan. Secara simultan kedua variabel mampu menjelaskan variasi kalori dengan sangat baik, meskipun terdapat beberapa asumsi klasik yang belum sepenuhnya terpenuhi.