Konsumsi energi rumah tangga merupakan salah satu aspek penting dalam kehidupan sehari-hari. Penggunaan energi dipengaruhi oleh berbagai faktor, diantaranya ukuran rumah dan jumlah penghuni. Rumah dengan luas yang lebih besar cenderung menggunakan energi lebih banyak untuk kebutuhan listrik seperti pencahayaan, pendingin ruangan, dan peralatan elektronik.
Selain itu, jumlah penghuni dalam rumah tangga juga dapat mempengaruhi tingkat konsumsi energi. Semakin banyak penghuni, maka semakin besar pula aktivitas yang menggunakan energi.
Untuk mengetahui hubungan antara faktor-faktor tersebut dengan konsumsi energi, digunakan metode regresi linear berganda yang mampu menganalisis pengaruh beberapa variabel independen terhadap satu variabel dependen.
Tujuan dari analisis ini adalah:
Data yang digunakan dalam analisis ini merupakan Energy Consumption Dataset yang diperoleh dari platform Kaggle. Dataset ini berisi informasi mengenai karakteristik bangunan serta faktor-faktor yang mempengaruhi konsumsi energi rumah tangga.
Variabel yang digunakan dalam analisis ini yaitu:
Sumber data dapat diakses melalui link berikut: https://www.kaggle.com/datasets/govindaramsriram/energy-consumption-dataset-linear-regression
data <- read.csv("C:/Users/HP/Downloads/test_energy_data.csv")
head(data)
## Building.Type Square.Footage Number.of.Occupants Appliances.Used
## 1 Residential 24563 15 4
## 2 Commercial 27583 56 23
## 3 Commercial 45313 4 44
## 4 Residential 41625 84 17
## 5 Residential 36720 58 47
## 6 Industrial 31207 47 28
## Average.Temperature Day.of.Week Energy.Consumption
## 1 28.52 Weekday 2865.57
## 2 23.07 Weekend 4283.80
## 3 33.56 Weekday 5067.83
## 4 27.39 Weekend 4624.30
## 5 17.08 Weekday 4820.59
## 6 22.82 Weekday 5026.23
Dataset yang digunakan dalam penelitian ini terdiri dari 100 observasi dengan beberapa variabel yang berkaitan dengan karakteristik bangunan dan konsumsi energi.
summary(data)
## Building.Type Square.Footage Number.of.Occupants Appliances.Used
## Length:100 Min. : 1161 Min. : 2.00 Min. : 1.00
## Class :character 1st Qu.:14161 1st Qu.:21.00 1st Qu.:16.75
## Mode :character Median :27583 Median :47.00 Median :27.50
## Mean :25882 Mean :47.23 Mean :26.97
## 3rd Qu.:38110 3rd Qu.:73.00 3rd Qu.:39.25
## Max. :49354 Max. :99.00 Max. :49.00
## Average.Temperature Day.of.Week Energy.Consumption
## Min. :10.40 Length:100 Min. :2352
## 1st Qu.:15.68 Class :character 1st Qu.:3622
## Median :21.97 Mode :character Median :4249
## Mean :22.04 Mean :4188
## 3rd Qu.:27.49 3rd Qu.:4797
## Max. :34.71 Max. :6043
Berdasarkan hasil statistik deskriptif, variabel Square Footage memiliki nilai minimum sebesar 1161 dan maksimum sebesar 49354, dengan nilai rata-rata sebesar 25882. Hal ini menunjukkan bahwa luas bangunan pada data memiliki variasi yang cukup besar.
Variabel Number of Occupants memiliki nilai minimum sebesar 2 dan maksimum sebesar 99, dengan rata-rata sebesar 47.23 penghuni.
Sementara itu, variabel Energy Consumption memiliki nilai minimum sebesar 2352 dan maksimum sebesar 6043, dengan nilai rata-rata sebesar 4188.
Variasi nilai pada masing-masing variabel menunjukkan bahwa karakteristik bangunan dan jumlah penghuni berbeda pada setiap observasi sehingga memungkinkan dilakukan analisis regresi linear berganda untuk melihat pengaruhnya terhadap konsumsi energi.
Model regresi linear berganda yang digunakan adalah: \[ y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon \]
Dimana:
model = lm(Energy.Consumption ~ Square.Footage + Number.of.Occupants, data = data)
summary(model)
##
## Call:
## lm(formula = Energy.Consumption ~ Square.Footage + Number.of.Occupants,
## data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -951.19 -312.04 18.46 400.32 895.85
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.517e+03 1.357e+02 18.555 < 2e-16 ***
## Square.Footage 4.577e-02 3.608e-03 12.684 < 2e-16 ***
## Number.of.Occupants 1.028e+01 1.654e+00 6.214 1.3e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 490.7 on 97 degrees of freedom
## Multiple R-squared: 0.6597, Adjusted R-squared: 0.6527
## F-statistic: 94.02 on 2 and 97 DF, p-value: < 2.2e-16
Model Akhir: \[ EnergyConsumption = 2517.49 + 0.05SquareFootage + 10.28Occupants \] Interpretasi Model:
Koefisien Square Footage sebesar 0.05 menunjukkan bahwa setiap kenaikan 1 unit luas bangunan akan meningkatkan konsumsi energi sebesar 0.05 unit, dengan asumsi variabel lain konstan.
Koefisien Number of Occupants sebesar 10.28 menunjukkan bahwa setiap penambahan satu penghuni akan meningkatkan konsumsi energi sebesar 10.28 unit, dengan asumsi luas bangunan tetap.
Nilai R-squared sebesar 0.6597 menunjukkan bahwa sekitar 65.97% variasi konsumsi energi dapat dijelaskan oleh kedua variabel tersebut, sedangkan sisanya dijelaskan oleh faktor lain di luar model.
error = model$residuals
ks.test(error,"pnorm",mean(error),sqrt(var(error)))
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: error
## D = 0.058222, p-value = 0.8869
## alternative hypothesis: two-sided
Berdasarkan hasil uji Kolmogorov-Smirnov diperoleh nilai p-value = 0.886. Karena p-value > 0.05, sehingga dapat disimpulkan bahwa residual berdistribusi normal.
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Warning: package 'zoo' was built under R version 4.3.3
dwtest(model)
##
## Durbin-Watson test
##
## data: model
## DW = 1.9002, p-value = 0.3098
## alternative hypothesis: true autocorrelation is greater than 0
Berdasarkan hasil uji Durbin-Watson diperoleh nilai DW sebesar 1.9002 dengan p-value sebesar 0.3098 > 0.05 sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada model regresi.
library(car)
## Warning: package 'car' was built under R version 4.3.3
## Loading required package: carData
vif(model)
## Square.Footage Number.of.Occupants
## 1.006516 1.006516
Nilai VIF untuk masing-masing variabel independen sebesar 1.006 < 10, sehingga dapat disimpulkan bahwa tidak terdapat multikolinearitas pada model.
library(lmtest)
bptest(model)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 4.2795, df = 2, p-value = 0.1177
Berdasarkan hasil uji Breusch-Pagan diperoleh nilai p-value = 0.1177 > 0.05, sehingga dapat disimpulkan bahwa tidak terjadi heteroskedastisitas pada model.
par(mfrow=c(2,2))
plot(model)
Berdasarkan plot model regresi yang dihasilkan, terlihat bahwa pada grafik Residuals vs Fitted titik-titik residual menyebar secara acak di sekitar garis horizontal sehingga tidak menunjukkan adanya pola tertentu. Hal ini menunjukkan bahwa model regresi yang digunakan sudah cukup baik. Pada grafik Normal Q-Q, titik-titik residual cenderung mengikuti garis diagonal sehingga dapat disimpulkan bahwa residual berdistribusi normal. Grafik Scale-Location menunjukkan bahwa sebaran residual relatif merata yang menandakan tidak adanya masalah heteroskedastisitas. Selain itu, pada grafik Residuals vs Leverage tidak terlihat adanya pengamatan yang memiliki pengaruh sangat besar terhadap model. Secara keseluruhan, plot menunjukkan bahwa model regresi telah memenuhi asumsi dasar regresi dan layak digunakan untuk analisis.
Berdasarkan hasil analisis regresi linear berganda diperoleh model regresi sebagai berikut: \[ EnergyConsumption = 2517.49 + 0.05SquareFootage + 10.28Occupants \] Hasil analisis menunjukkan bahwa variabel Square Footage dan Number of Occupants berpengaruh signifikan terhadap Energy Consumption. Hal ini menunjukkan bahwa semakin besar luas bangunan dan semakin banyak jumlah penghuni, maka konsumsi energi rumah tangga cenderung meningkat.
Selain itu, hasil pengujian asumsi klasik menunjukkan bahwa model regresi telah memenuhi asumsi normalitas, tidak terdapat autokorelasi, tidak terdapat multikolinearitas, serta tidak terjadi heteroskedastisitas. Dengan demikian, model regresi yang diperoleh layak digunakan untuk menjelaskan hubungan antara luas bangunan, jumlah penghuni, dan konsumsi energi rumah tangga.