Team Based Project

FAKTOR-FAKTOR YANG BERPENGARUH TERHADAP KAPASITAS PARU-PARU MENGGUNAKAN VARIABEL DUMMY

Abdullah Faqih - M0722001

Lutfiya Eka Rahmawati - M0722047

Silvera Novitasari - M0722073

Syafina Anindiyasari - M0722075

A. Pendahuluan Regresi Dummy

Regresi Linear Berganda adalah model regresi linear dengan melibatkan lebih dari satu variable bebas atau predictor. Sementara, regresi dummy digunakan untuk model regresi yang variabel independennya merupakan variabel dummy. Variabel dummy adalah variabel yang digunakan untuk membuat kategori data yang bersifat kualitatif. Tujuan dari adanya variabel dummy untuk mengkuantitatifkan variabel kualitatif karena tidak bisa dilakukan regresi secara langsung. Dalam kasus ini, Smoke dan Gender bersifat kualitatif maka akan diberikan nilai 0 untuk tidak merokok, nilai 1 untuk merokok, nilai 0 untuk wanita, dan 1 untuk pria. Maka akan dianalisis faktor-faktor yang berpengaruh terhadap kapasitas paru-paru menggunakan regresi dummy. Analisis ini bertujuan untuk mengetahui apakah umur, tinggi badan, keadaan merokok, dan gender berpengaruh terhadap kapasitas paru-paru. Variabel dependen dalam analisis ini adalah LungCap (kapasitas paru-paru). Sedangkan variabel independen dalam analisis ini terdiri dari Age (umur), Height (tinggi badan dalam inchi), Smoke (keadaan merokok), dan Gender (jenis kelamin) dimana variabel independen ini terdiri dari dua variabel dummy.

B. Landasan Teori

a. Langkah-Langkah Regresi Dummy

Langkah-langkah dalam analisis Metode Regresi Dummy yaitu:

  1. Mengubah tipe data pada variabel dummy dari data berupa huruf menjadi data berupa angka dengan memberikan kode tertentu:
  • 0 = No(Tidak merokok)

  • 1 = Yes(Merokok)

  • 0 = Female(Wanita)

  • 1 = Male(Pria)

  1. Meregresikan semua variabel independen, termasuk variabel dummy terhadap variabel dependen.

  2. Interpretasikan Hasil: Menarik kesimpulan dari hasil analisis regresi.

b. Uji Asumsi

Uji asumsi dalam analisis regresi menggunakan variabel dummy melibatkan pengecekan apakah model regresi yang melibatkan variabel dummy memenuhi asumsi-asumsi dasar regresi linear. Melakukan uji asumsi dalam analisis regresi yang melibatkan variabel dummy penting untuk memastikan validitas dan reliabilitas model. Dengan memenuhi asumsi-asumsi dasar, peneliti dapat memastikan bahwa model regresi memberikan hasil yang akurat dan dapat di interpretasikan dengan benar, serta menghindari kesimpulan yang salah dari analisis data.

C. Deskripsi dan Sumber Data

Deskripisi Data

Analisis ini bertujuan untuk mengetahui apakah umur, tinggi badan, keadaan merokok, dan gender mempengaruhi kapasitas paru-paru. Menganalisis faktor-faktor yang mempengaruhi kapasitas paru-paru menggunakan regresi dummy. Variabel dependen dalam analisis ini adalah LungCap (kapasitas paru-paru). Sedangkan variabel independen dalam analisis ini terdiri dari Age (umur), Height (tinggi badan dalam inchi), Smoke (keadaan merokok), dan Gender (jenis kelamin) yang mana variabel independen ini terdiri dari dua variabel dummy. Contoh variabel yang dianggap dummy dalam analisis ini adalah keadaan merokok yang terdiri dari merokok dan tidak merokok serta gender yang terdiri dari pria dan wanita.

Input Data

library(DT)
## Warning: package 'DT' was built under R version 4.2.3
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
DATA_DUMMY <- read_excel("D:/SEMESTER 4/SIM/DATA DUMMY.xlsx", 
    col_types = c("numeric", "numeric", "numeric", 
        "text", "text"))
View(DATA_DUMMY)
DATA_DUMMY
## # A tibble: 725 × 5
##    LungCap   Age Height Smoke Gender
##      <dbl> <dbl>  <dbl> <chr> <chr> 
##  1    6.48     6   62.1 0     1     
##  2   10.1     18   74.7 1     0     
##  3    9.55    16   69.7 0     0     
##  4   11.1     14   71   0     1     
##  5    4.8      5   56.9 0     1     
##  6    6.22    11   58.7 0     0     
##  7    4.95     8   63.3 0     1     
##  8    7.32    11   70.4 0     1     
##  9    8.88    15   70.5 0     1     
## 10    6.8     11   59.2 0     1     
## # … with 715 more rows
datatable(DATA_DUMMY, class = 'display')
summary(DATA_DUMMY)
##     LungCap            Age            Height         Smoke          
##  Min.   : 0.507   Min.   : 3.00   Min.   :45.30   Length:725        
##  1st Qu.: 6.150   1st Qu.: 9.00   1st Qu.:59.90   Class :character  
##  Median : 8.000   Median :13.00   Median :65.40   Mode  :character  
##  Mean   : 7.863   Mean   :12.33   Mean   :64.84                     
##  3rd Qu.: 9.800   3rd Qu.:15.00   3rd Qu.:70.30                     
##  Max.   :14.675   Max.   :19.00   Max.   :81.80                     
##     Gender         
##  Length:725        
##  Class :character  
##  Mode  :character  
##                    
##                    
## 

D. Pembahasan Regresi Dummy

Regresi Dummy

dummy<- lm(LungCap ~ Age + Height + Smoke + Gender, data = DATA_DUMMY)
dummy
## 
## Call:
## lm(formula = LungCap ~ Age + Height + Smoke + Gender, data = DATA_DUMMY)
## 
## Coefficients:
## (Intercept)          Age       Height       Smoke1      Gender1  
##    -11.3328       0.1601       0.2636      -0.6177       0.3853

Maka didapatkan model regersi linier berganda untuk variabel dummy yaitu: \[LungCap = -11.33282 + 0.16012X1 + 0.26363X2 - 0.61774X3 + 0.38528X4\]

Uji Simultan (F) dan Uji Parsial(T)

hasil = summary(dummy)
hasil
## 
## Call:
## lm(formula = LungCap ~ Age + Height + Smoke + Gender, data = DATA_DUMMY)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.2915 -0.7360  0.0184  0.7125  3.0599 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -11.33282    0.47245 -23.987  < 2e-16 ***
## Age           0.16012    0.01806   8.864  < 2e-16 ***
## Height        0.26363    0.01009  26.123  < 2e-16 ***
## Smoke1       -0.61774    0.12633  -4.890 1.24e-06 ***
## Gender1       0.38528    0.07991   4.822 1.74e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.023 on 720 degrees of freedom
## Multiple R-squared:  0.8531, Adjusted R-squared:  0.8523 
## F-statistic:  1045 on 4 and 720 DF,  p-value: < 2.2e-16

Kesimpulan Uji Simultan (F):

  • Variabel umur (Age), tinggi badan (Height), keadaan merokok (Smoke), dan jenis kelamin (Gender) berpengaruh signifikan terhadap kapasitas paru-paru seseorang.

Kesimpulan Uji Parsial (t):

  • Variabel umur (Age) mempengaruhi kapasitas paru-paru seseorang.

  • Variabel tinggi badan (Height) mempengaruhi kapasitas paru-paru seseorang.

  • Variabel keadaan merokok (Smoke) mempengaruhi kapasitas paru-paru seseorang.

  • Variabel jenis kelamin (Gender) mempengaruhi kapasitas paru-paru seseorang.

Uji Asumsi

Dalam analisis regresi linear berganda ada asumsi yang harus dipenuhi, diantaranya adalah kenormalan sisaan, kehomogenan ragam sisaan, autokorelasi, dan multikolinearitas. Uji normalitas dilakukan untuk memastikan apakah nilai residual pada persamaan regresi sudah mengikuti distribusi normal. Kehomogenan ragam sisaan adalah kesaamaan varians residual pada setiap pengamatan. Autokorelasi adalah terjadinya korelasi residual antar pengamatan. Multikolinearitas adalah adanya korelasi antar variabel bebas dalam satu pengamatan. Uji asumsi analisis regresi menggunakan variabel dummy melibatkan pengecekan apakah memenuhi asumsi-asumsi dasar regresi linear. Dengan memenuhi asumsi-asumsi dasar dapat dipastikan bahwa model regresi memberikan hasil yang akurat dan dapat diinterpretasikan dengan benar, serta menghindari kesimpulan yang salah dari analisis data.

UJI NORMALITAS

ks.test(hasil$residuals, "pnorm")
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  hasil$residuals
## D = 0.026716, p-value = 0.6788
## alternative hypothesis: two-sided

Karena p-value lebih kecil dibandingkan alpha (0.05) maka dapat diartikan bahwa residual data tersebut berdistribusi normal.

UJI HOMOGENITAS

library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
## Warning: package 'zoo' was built under R version 4.2.3
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
bptest(hasil, studentize = FALSE, data = dummy)
## 
##  Breusch-Pagan test
## 
## data:  hasil
## BP = 2.4752, df = 4, p-value = 0.6491

Karena p-value lebih besar dibandingkan alpha (0.05) maka dapat diartikan bahwa sisaan bersifat homogen.

UJI AUTOKORELASI

library(lmtest)
dwtest(hasil)
## 
##  Durbin-Watson test
## 
## data:  hasil
## DW = 1.8843, p-value = 0.05942
## alternative hypothesis: true autocorrelation is greater than 0

Karena p-value lebih besar dibandingkan alpha (0.05) maka dapat diartikan bahwa tidak terjadi autokorelasi antar sisaan.

UJI MULTIKOLINEARITAS

library(car)
## Warning: package 'car' was built under R version 4.2.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.3
library(carData)
vif(dummy)
##      Age   Height    Smoke   Gender 
## 3.619935 3.654436 1.049393 1.105559

Karena VIF keempat variabel independen kurang dari 10 maka dapat diartikan bahwa tidak terjadi gejala multikolinearitas.

E. Kesimpulan

Persamaan Model Regresi:

\[LungCap = -11.33282 + 0.16012X1 + 0.26363X2 - 0.61774X3 + 0.38528X4\]

Model persamaan regresi tersebut berdistribusi normal, bersifat homogen, tidak terjadi autokorelasi, dan tidak terjadi multikolinearitas.

Interpretasi:

  • Setiap kenaikan satu tahun usia (X1) akan meningkatkan kapasitas paru-paru sebesar 0.16012

  • Setiap kenaikan satu inchi tinggi badan (X2) akan meningkatkan kapasitas paru-paru sebesar 0.26363

  • Setiap perbedaan keadaan merokok (X3) akan mengurangi kapasitas paru-paru sebesar 0.61774

  • Setiap perbedaan jenis kelamin (X4) akan meningkatkan kapasitas paru-paru sebesar 0.38528

  • Jika usia (X1), tinggi badan (X2), keadaan merokok (X3), dan jenis kelamin (X4) bernilai tetap, maka kapasitas paru-parunya sebesar -11.33282

Maka dari uji F dan uji t menyatakan Variabel umur (Age), tinggi badan (Height), keadaan merokok (Smoke), dan jenis kelamin (Gender) mempengaruhi kapasitas paru-paru seseorang.

F. SUMBER REFERENSI