1. Pendahuluan

1.1 Latar Belakang

Konsumsi energi rumah tangga merupakan salah satu aspek penting dalam kehidupan sehari-hari. Penggunaan energi dipengaruhi oleh berbagai faktor, diantaranya ukuran rumah dan jumlah penghuni. Rumah dengan luas yang lebih besar cenderung menggunakan energi lebih banyak untuk kebutuhan listrik seperti pencahayaan, pendingin ruangan, dan peralatan elektronik.

Selain itu, jumlah penghuni dalam rumah tangga juga dapat mempengaruhi tingkat konsumsi energi. Semakin banyak penghuni, maka semakin besar pula aktivitas yang menggunakan energi.

Untuk mengetahui hubungan antara faktor-faktor tersebut dengan konsumsi energi, digunakan metode regresi linear berganda yang mampu menganalisis pengaruh beberapa variabel independen terhadap satu variabel dependen.

1.2 Tujuan Analisis

Tujuan dari analisis ini adalah:

  1. Mengetahui pengaruh luas bangunan (Square Footage) terhadap konsumsi energi.
  2. Mengetahui pengaruh jumlah penghuni rumah (Number of Occupants) terhadap konsumsi energi.
  3. Membentuk model regresi linear berganda yang menjelaskan hubungan antara variabel-variabel tersebut.
  4. Melakukan pengujian asumsi klasik pada model regresi.

2. Data

2.1 Sumber Data

Data yang digunakan dalam analisis ini merupakan Energy Consumption Dataset yang diperoleh dari platform Kaggle. Dataset ini berisi informasi mengenai karakteristik bangunan serta faktor-faktor yang mempengaruhi konsumsi energi rumah tangga.

Variabel yang digunakan dalam analisis ini yaitu:

  • Energy Consumption (Y) : konsumsi energi rumah tangga
  • Square Footage (X1) : luas bangunan rumah
  • Number of Occupants (X2) : jumlah penghuni rumah

Sumber data dapat diakses melalui link berikut: https://www.kaggle.com/datasets/govindaramsriram/energy-consumption-dataset-linear-regression

2.2 Import Data

data <- read.csv("C:/Users/HP/Downloads/test_energy_data.csv")
head(data)
##   Building.Type Square.Footage Number.of.Occupants Appliances.Used
## 1   Residential          24563                  15               4
## 2    Commercial          27583                  56              23
## 3    Commercial          45313                   4              44
## 4   Residential          41625                  84              17
## 5   Residential          36720                  58              47
## 6    Industrial          31207                  47              28
##   Average.Temperature Day.of.Week Energy.Consumption
## 1               28.52     Weekday            2865.57
## 2               23.07     Weekend            4283.80
## 3               33.56     Weekday            5067.83
## 4               27.39     Weekend            4624.30
## 5               17.08     Weekday            4820.59
## 6               22.82     Weekday            5026.23

3. Analisis Data

3.1 Statistik Deskriptif

Dataset yang digunakan dalam penelitian ini terdiri dari 100 observasi dengan beberapa variabel yang berkaitan dengan karakteristik bangunan dan konsumsi energi.

summary(data)
##  Building.Type      Square.Footage  Number.of.Occupants Appliances.Used
##  Length:100         Min.   : 1161   Min.   : 2.00       Min.   : 1.00  
##  Class :character   1st Qu.:14161   1st Qu.:21.00       1st Qu.:16.75  
##  Mode  :character   Median :27583   Median :47.00       Median :27.50  
##                     Mean   :25882   Mean   :47.23       Mean   :26.97  
##                     3rd Qu.:38110   3rd Qu.:73.00       3rd Qu.:39.25  
##                     Max.   :49354   Max.   :99.00       Max.   :49.00  
##  Average.Temperature Day.of.Week        Energy.Consumption
##  Min.   :10.40       Length:100         Min.   :2352      
##  1st Qu.:15.68       Class :character   1st Qu.:3622      
##  Median :21.97       Mode  :character   Median :4249      
##  Mean   :22.04                          Mean   :4188      
##  3rd Qu.:27.49                          3rd Qu.:4797      
##  Max.   :34.71                          Max.   :6043

Berdasarkan hasil statistik deskriptif, variabel Square Footage memiliki nilai minimum sebesar 1161 dan maksimum sebesar 49354, dengan nilai rata-rata sebesar 25882. Hal ini menunjukkan bahwa luas bangunan pada data memiliki variasi yang cukup besar.

Variabel Number of Occupants memiliki nilai minimum sebesar 2 dan maksimum sebesar 99, dengan rata-rata sebesar 47.23 penghuni.

Sementara itu, variabel Energy Consumption memiliki nilai minimum sebesar 2352 dan maksimum sebesar 6043, dengan nilai rata-rata sebesar 4188.

Variasi nilai pada masing-masing variabel menunjukkan bahwa karakteristik bangunan dan jumlah penghuni berbeda pada setiap observasi sehingga memungkinkan dilakukan analisis regresi linear berganda untuk melihat pengaruhnya terhadap konsumsi energi.

3.2 Model Regresi Linear Berganda

Model regresi linear berganda yang digunakan adalah: \[ y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \epsilon \]

Dimana:

  • Y = Energy Consumption
  • X1 = Square Footage
  • X2 = Number of Occupants
model = lm(Energy.Consumption ~ Square.Footage + Number.of.Occupants, data = data)

summary(model)
## 
## Call:
## lm(formula = Energy.Consumption ~ Square.Footage + Number.of.Occupants, 
##     data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -951.19 -312.04   18.46  400.32  895.85 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         2.517e+03  1.357e+02  18.555  < 2e-16 ***
## Square.Footage      4.577e-02  3.608e-03  12.684  < 2e-16 ***
## Number.of.Occupants 1.028e+01  1.654e+00   6.214  1.3e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 490.7 on 97 degrees of freedom
## Multiple R-squared:  0.6597, Adjusted R-squared:  0.6527 
## F-statistic: 94.02 on 2 and 97 DF,  p-value: < 2.2e-16

Model Akhir: \[ EnergyConsumption = 2517.49 + 0.05SquareFootage + 10.28Occupants \] Interpretasi Model:

Koefisien Square Footage sebesar 0.05 menunjukkan bahwa setiap kenaikan 1 unit luas bangunan akan meningkatkan konsumsi energi sebesar 0.05 unit, dengan asumsi variabel lain konstan.

Koefisien Number of Occupants sebesar 10.28 menunjukkan bahwa setiap penambahan satu penghuni akan meningkatkan konsumsi energi sebesar 10.28 unit, dengan asumsi luas bangunan tetap.

Nilai R-squared sebesar 0.6597 menunjukkan bahwa sekitar 65.97% variasi konsumsi energi dapat dijelaskan oleh kedua variabel tersebut, sedangkan sisanya dijelaskan oleh faktor lain di luar model.

4 Uji Asumsi Klasik

4.1 Uji Normalitas Residual

error = model$residuals
ks.test(error,"pnorm",mean(error),sqrt(var(error)))
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  error
## D = 0.058222, p-value = 0.8869
## alternative hypothesis: two-sided

Berdasarkan hasil uji Kolmogorov-Smirnov diperoleh nilai p-value = 0.886. Karena p-value > 0.05, sehingga dapat disimpulkan bahwa residual berdistribusi normal.

4.2 Uji Autokorelasi

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.3.3
## Warning: package 'zoo' was built under R version 4.3.3
dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 1.9002, p-value = 0.3098
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan hasil uji Durbin-Watson diperoleh nilai DW sebesar 1.9002 dengan p-value sebesar 0.3098 > 0.05 sehingga dapat disimpulkan bahwa tidak terdapat autokorelasi pada model regresi.

4.3 Uji Multikolinearitas

library(car)
## Warning: package 'car' was built under R version 4.3.3
## Loading required package: carData
vif(model)
##      Square.Footage Number.of.Occupants 
##            1.006516            1.006516

Nilai VIF untuk masing-masing variabel independen sebesar 1.006 < 10, sehingga dapat disimpulkan bahwa tidak terdapat multikolinearitas pada model.

4.4 Uji Heteroskedastisitas

library(lmtest)

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 4.2795, df = 2, p-value = 0.1177

Berdasarkan hasil uji Breusch-Pagan diperoleh nilai p-value = 0.1177 > 0.05, sehingga dapat disimpulkan bahwa tidak terjadi heteroskedastisitas pada model.

5. Visualisasi Model

par(mfrow=c(2,2))
plot(model)

Berdasarkan plot model regresi yang dihasilkan, terlihat bahwa pada grafik Residuals vs Fitted titik-titik residual menyebar secara acak di sekitar garis horizontal sehingga tidak menunjukkan adanya pola tertentu. Hal ini menunjukkan bahwa model regresi yang digunakan sudah cukup baik. Pada grafik Normal Q-Q, titik-titik residual cenderung mengikuti garis diagonal sehingga dapat disimpulkan bahwa residual berdistribusi normal. Grafik Scale-Location menunjukkan bahwa sebaran residual relatif merata yang menandakan tidak adanya masalah heteroskedastisitas. Selain itu, pada grafik Residuals vs Leverage tidak terlihat adanya pengamatan yang memiliki pengaruh sangat besar terhadap model. Secara keseluruhan, plot menunjukkan bahwa model regresi telah memenuhi asumsi dasar regresi dan layak digunakan untuk analisis.

6. Kesimpulan

Berdasarkan hasil analisis regresi linear berganda diperoleh model regresi sebagai berikut: \[ EnergyConsumption = 2517.49 + 0.05SquareFootage + 10.28Occupants \] Hasil analisis menunjukkan bahwa variabel Square Footage dan Number of Occupants berpengaruh signifikan terhadap Energy Consumption. Hal ini menunjukkan bahwa semakin besar luas bangunan dan semakin banyak jumlah penghuni, maka konsumsi energi rumah tangga cenderung meningkat.

Selain itu, hasil pengujian asumsi klasik menunjukkan bahwa model regresi telah memenuhi asumsi normalitas, tidak terdapat autokorelasi, tidak terdapat multikolinearitas, serta tidak terjadi heteroskedastisitas. Dengan demikian, model regresi yang diperoleh layak digunakan untuk menjelaskan hubungan antara luas bangunan, jumlah penghuni, dan konsumsi energi rumah tangga.