Team Based Project
FAKTOR-FAKTOR YANG BERPENGARUH TERHADAP KAPASITAS PARU-PARU MENGGUNAKAN VARIABEL DUMMY
Abdullah Faqih - M0722001
Lutfiya Eka Rahmawati - M0722047
Silvera Novitasari - M0722073
Syafina Anindiyasari - M0722075
A. Pendahuluan Regresi Dummy
Regresi Linear Berganda adalah model regresi linear dengan melibatkan lebih dari satu variable bebas atau predictor. Sementara, regresi dummy digunakan untuk model regresi yang variabel independennya merupakan variabel dummy. Variabel dummy adalah variabel yang digunakan untuk membuat kategori data yang bersifat kualitatif. Tujuan dari adanya variabel dummy untuk mengkuantitatifkan variabel kualitatif karena tidak bisa dilakukan regresi secara langsung. Dalam kasus ini, Smoke dan Gender bersifat kualitatif maka akan diberikan nilai 0 untuk tidak merokok, nilai 1 untuk merokok, nilai 0 untuk wanita, dan 1 untuk pria. Maka akan dianalisis faktor-faktor yang berpengaruh terhadap kapasitas paru-paru menggunakan regresi dummy. Analisis ini bertujuan untuk mengetahui apakah umur, tinggi badan, keadaan merokok, dan gender berpengaruh terhadap kapasitas paru-paru. Variabel dependen dalam analisis ini adalah LungCap (kapasitas paru-paru). Sedangkan variabel independen dalam analisis ini terdiri dari Age (umur), Height (tinggi badan dalam inchi), Smoke (keadaan merokok), dan Gender (jenis kelamin) dimana variabel independen ini terdiri dari dua variabel dummy.
B. Landasan Teori
a. Langkah-Langkah Regresi Dummy
Langkah-langkah dalam analisis Metode Regresi Dummy yaitu:
- Mengubah tipe data pada variabel dummy dari data berupa huruf menjadi data berupa angka dengan memberikan kode tertentu:
0 = No(Tidak merokok)
1 = Yes(Merokok)
0 = Female(Wanita)
1 = Male(Pria)
- Meregresikan semua variabel independen, termasuk variabel dummy
terhadap variabel dependen.
- Interpretasikan Hasil: Menarik kesimpulan dari hasil analisis regresi.
b. Uji Asumsi
Uji asumsi dalam analisis regresi menggunakan variabel dummy melibatkan pengecekan apakah model regresi yang melibatkan variabel dummy memenuhi asumsi-asumsi dasar regresi linear. Melakukan uji asumsi dalam analisis regresi yang melibatkan variabel dummy penting untuk memastikan validitas dan reliabilitas model. Dengan memenuhi asumsi-asumsi dasar, peneliti dapat memastikan bahwa model regresi memberikan hasil yang akurat dan dapat di interpretasikan dengan benar, serta menghindari kesimpulan yang salah dari analisis data.
C. Deskripsi dan Sumber Data
Deskripisi Data
Analisis ini bertujuan untuk mengetahui apakah umur, tinggi badan, keadaan merokok, dan gender mempengaruhi kapasitas paru-paru. Menganalisis faktor-faktor yang mempengaruhi kapasitas paru-paru menggunakan regresi dummy. Variabel dependen dalam analisis ini adalah LungCap (kapasitas paru-paru). Sedangkan variabel independen dalam analisis ini terdiri dari Age (umur), Height (tinggi badan dalam inchi), Smoke (keadaan merokok), dan Gender (jenis kelamin) yang mana variabel independen ini terdiri dari dua variabel dummy. Contoh variabel yang dianggap dummy dalam analisis ini adalah keadaan merokok yang terdiri dari merokok dan tidak merokok serta gender yang terdiri dari pria dan wanita.
Input Data
library(DT)## Warning: package 'DT' was built under R version 4.2.3
library(readxl)## Warning: package 'readxl' was built under R version 4.2.3
DATA_DUMMY <- read_excel("D:/SEMESTER 4/SIM/DATA DUMMY.xlsx",
col_types = c("numeric", "numeric", "numeric",
"text", "text"))
View(DATA_DUMMY)
DATA_DUMMY## # A tibble: 725 × 5
## LungCap Age Height Smoke Gender
## <dbl> <dbl> <dbl> <chr> <chr>
## 1 6.48 6 62.1 0 1
## 2 10.1 18 74.7 1 0
## 3 9.55 16 69.7 0 0
## 4 11.1 14 71 0 1
## 5 4.8 5 56.9 0 1
## 6 6.22 11 58.7 0 0
## 7 4.95 8 63.3 0 1
## 8 7.32 11 70.4 0 1
## 9 8.88 15 70.5 0 1
## 10 6.8 11 59.2 0 1
## # … with 715 more rows
datatable(DATA_DUMMY, class = 'display')summary(DATA_DUMMY)## LungCap Age Height Smoke
## Min. : 0.507 Min. : 3.00 Min. :45.30 Length:725
## 1st Qu.: 6.150 1st Qu.: 9.00 1st Qu.:59.90 Class :character
## Median : 8.000 Median :13.00 Median :65.40 Mode :character
## Mean : 7.863 Mean :12.33 Mean :64.84
## 3rd Qu.: 9.800 3rd Qu.:15.00 3rd Qu.:70.30
## Max. :14.675 Max. :19.00 Max. :81.80
## Gender
## Length:725
## Class :character
## Mode :character
##
##
##
D. Pembahasan Regresi Dummy
Regresi Dummy
dummy<- lm(LungCap ~ Age + Height + Smoke + Gender, data = DATA_DUMMY)
dummy##
## Call:
## lm(formula = LungCap ~ Age + Height + Smoke + Gender, data = DATA_DUMMY)
##
## Coefficients:
## (Intercept) Age Height Smoke1 Gender1
## -11.3328 0.1601 0.2636 -0.6177 0.3853
Maka didapatkan model regersi linier berganda untuk variabel dummy yaitu: \[LungCap = -11.33282 + 0.16012X1 + 0.26363X2 - 0.61774X3 + 0.38528X4\]
Uji Simultan (F) dan Uji Parsial(T)
hasil = summary(dummy)
hasil##
## Call:
## lm(formula = LungCap ~ Age + Height + Smoke + Gender, data = DATA_DUMMY)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.2915 -0.7360 0.0184 0.7125 3.0599
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -11.33282 0.47245 -23.987 < 2e-16 ***
## Age 0.16012 0.01806 8.864 < 2e-16 ***
## Height 0.26363 0.01009 26.123 < 2e-16 ***
## Smoke1 -0.61774 0.12633 -4.890 1.24e-06 ***
## Gender1 0.38528 0.07991 4.822 1.74e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.023 on 720 degrees of freedom
## Multiple R-squared: 0.8531, Adjusted R-squared: 0.8523
## F-statistic: 1045 on 4 and 720 DF, p-value: < 2.2e-16
Kesimpulan Uji Simultan (F):
- Variabel umur (Age), tinggi badan (Height), keadaan merokok (Smoke), dan jenis kelamin (Gender) berpengaruh signifikan terhadap kapasitas paru-paru seseorang.
Kesimpulan Uji Parsial (t):
Variabel umur (Age) mempengaruhi kapasitas paru-paru seseorang.
Variabel tinggi badan (Height) mempengaruhi kapasitas paru-paru seseorang.
Variabel keadaan merokok (Smoke) mempengaruhi kapasitas paru-paru seseorang.
Variabel jenis kelamin (Gender) mempengaruhi kapasitas paru-paru seseorang.
Uji Asumsi
Dalam analisis regresi linear berganda ada asumsi yang harus dipenuhi, diantaranya adalah kenormalan sisaan, kehomogenan ragam sisaan, autokorelasi, dan multikolinearitas. Uji normalitas dilakukan untuk memastikan apakah nilai residual pada persamaan regresi sudah mengikuti distribusi normal. Kehomogenan ragam sisaan adalah kesaamaan varians residual pada setiap pengamatan. Autokorelasi adalah terjadinya korelasi residual antar pengamatan. Multikolinearitas adalah adanya korelasi antar variabel bebas dalam satu pengamatan. Uji asumsi analisis regresi menggunakan variabel dummy melibatkan pengecekan apakah memenuhi asumsi-asumsi dasar regresi linear. Dengan memenuhi asumsi-asumsi dasar dapat dipastikan bahwa model regresi memberikan hasil yang akurat dan dapat diinterpretasikan dengan benar, serta menghindari kesimpulan yang salah dari analisis data.
UJI NORMALITAS
ks.test(hasil$residuals, "pnorm")##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: hasil$residuals
## D = 0.026716, p-value = 0.6788
## alternative hypothesis: two-sided
Karena p-value lebih kecil dibandingkan alpha (0.05) maka dapat diartikan bahwa residual data tersebut berdistribusi normal.
UJI HOMOGENITAS
library(lmtest)## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.3
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
bptest(hasil, studentize = FALSE, data = dummy)##
## Breusch-Pagan test
##
## data: hasil
## BP = 2.4752, df = 4, p-value = 0.6491
Karena p-value lebih besar dibandingkan alpha (0.05) maka dapat diartikan bahwa sisaan bersifat homogen.
UJI AUTOKORELASI
library(lmtest)
dwtest(hasil)##
## Durbin-Watson test
##
## data: hasil
## DW = 1.8843, p-value = 0.05942
## alternative hypothesis: true autocorrelation is greater than 0
Karena p-value lebih besar dibandingkan alpha (0.05) maka dapat diartikan bahwa tidak terjadi autokorelasi antar sisaan.
UJI MULTIKOLINEARITAS
library(car)## Warning: package 'car' was built under R version 4.2.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.3
library(carData)
vif(dummy)## Age Height Smoke Gender
## 3.619935 3.654436 1.049393 1.105559
Karena VIF keempat variabel independen kurang dari 10 maka dapat diartikan bahwa tidak terjadi gejala multikolinearitas.
E. Kesimpulan
Persamaan Model Regresi:
\[LungCap = -11.33282 + 0.16012X1 + 0.26363X2 - 0.61774X3 + 0.38528X4\]
Model persamaan regresi tersebut berdistribusi normal, bersifat homogen, tidak terjadi autokorelasi, dan tidak terjadi multikolinearitas.
Interpretasi:
Setiap kenaikan satu tahun usia (X1) akan meningkatkan kapasitas paru-paru sebesar 0.16012
Setiap kenaikan satu inchi tinggi badan (X2) akan meningkatkan kapasitas paru-paru sebesar 0.26363
Setiap perbedaan keadaan merokok (X3) akan mengurangi kapasitas paru-paru sebesar 0.61774
Setiap perbedaan jenis kelamin (X4) akan meningkatkan kapasitas paru-paru sebesar 0.38528
Jika usia (X1), tinggi badan (X2), keadaan merokok (X3), dan jenis kelamin (X4) bernilai tetap, maka kapasitas paru-parunya sebesar -11.33282
F. SUMBER REFERENSI
- LungCap Dataset (Practice R Dataset). statslectures.com.https://statslectures.com/r-scripts-datasets
- Kadek Yama Rinaldi: Regresi Dummy. Academia.edu. https://www.academia.edu/30239169/REGRESI_DUMMY
- Dr. Agr. Sc. Ernoiz Antriyandarti, S.P., M.P., M.Ec: Model Regresi Dengan Variabel Dummy. Spada UNS. https://spada.uns.ac.id/pluginfile.php/826694/mod_resource/content/1/15.%20%20Regresi%20dengan%20Variabel%20Dummy.pdf
- Wahyu Widhiarso: Prosedur Analisis Regresi dengan Variabel Dummy. https://widhiarso.staff.ugm.ac.id/files/widhiarso_2010_-_prosedur_analisis_regresi_dengan_variabel_dummy.pdf
- Trisnadi Wijaya: Regresi dengan Variabel Dummy, Mediasi, dan Moderasi. Slide Share. https://www.slideshare.net/slideshow/regresi-dengan-variabel-dummy-mediasi-dan-moderasi/239386412
- Nuzwan Sudariana: ANALISIS STATISTIK REGRESI LINIER BERGANDA. https://seniman.nusaputra.ac.id/index.php/seniman/article/download/40/18