PML - Analisis Peragam (Analysis Of Covarians(ANCOVA))

Video Pembelajaran - P13

Video Pembelajaran dapat diakses melalui link berikut : https://ipb.link/materipml

Analisis Kovarian (ANCOVA)

Analisis Kovarian (ANCOVA) adalah metode yang menggabungkan ANOVA dan regresi untuk mengurangi galat dalam percobaan. Dengan menambahkan variabel tambahan, atau covariate, ANCOVA memungkinkan untuk mengendalikan variabel-variabel yang bisa memengaruhi hasil. Dengan demikian, kita dapat lebih akurat mengukur pengaruh perlakuan yang diujikan.

Sebagai contoh, jika kita ingin menilai efek dari tiga jenis obat terhadap respons psikologis, kita dapat memasukkan berat badan sebagai covariate untuk memperhitungkan pengaruhnya terhadap hasil.

Model linier ANCOVA dengan satu faktor perlakuan dan satu covariate dapat dirumuskan sebagai berikut:

\[ y_{ij} = \mu + \tau_i + \beta x_{ij} + \epsilon_{ij} \]

dengan:

  • \(y_{ij}\): nilai respons dari perlakuan ke-\(i\) pada subjek ke-\(j\),

  • \(\mu\): rata-rata keseluruhan,

  • \(\tau_i\): efek perlakuan ke-\(i\),

  • \(\beta\): koefisien dari covariate,

  • \(x_{ij}\): nilai covariate untuk perlakuan ke-\(i\) pada subjek ke-\(j\),

  • \(\epsilon_{ij}\): galat acak dengan asumsi \(\epsilon_{ij} \sim N(0, \sigma^2)\).

Model ini secara efektif mengkombinasikan analisis varians dengan regresi linier, di mana efek dari perlakuan dan covariate dipertimbangkan dalam model.

Syntax R:

# Simulasi data
data <- data.frame(
  response = c(10, 12, 15, 14, 18, 16, 22, 20),
  treatment = factor(rep(1:2, each=4)),
  covariate = c(5, 6, 7, 8, 5, 6, 7, 8)
)

# Membuat model ANCOVA
model <- lm(response ~ treatment + covariate, data=data)
summary(model)
## 
## Call:
## lm(formula = response ~ treatment + covariate, data = data)
## 
## Residuals:
##      1      2      3      4      5      6      7      8 
## -0.725 -0.075  1.575 -0.775  1.025 -2.325  2.325 -1.025 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)   3.9750     3.8458   1.034  0.34870   
## treatment2    6.2500     1.2855   4.862  0.00463 **
## covariate     1.3500     0.5749   2.348  0.06570 . 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.818 on 5 degrees of freedom
## Multiple R-squared:  0.8536, Adjusted R-squared:  0.795 
## F-statistic: 14.58 on 2 and 5 DF,  p-value: 0.008201

Model Linier dalam Matriks

Model linier ANCOVA dapat direpresentasikan dalam bentuk matriks sebagai berikut:

\[ y = X\beta + \epsilon \]

dengan:

  • \(y\): vektor respons (observasi),

  • \(X\): matriks desain yang berisi kolom-kolom dari variabel independen, termasuk efek perlakuan dan covariate,

  • \(\beta\): vektor parameter (yang mengandung \(\mu\), \(\tau\), dan \(\beta\)),

  • \(\epsilon\): vektor galat acak yang mengikuti distribusi normal \(N(0, \sigma^2I)\).

Syntax R untuk melihat Matriks Desain:

# Melihat matriks desain dari model
model.matrix(model)
##   (Intercept) treatment2 covariate
## 1           1          0         5
## 2           1          0         6
## 3           1          0         7
## 4           1          0         8
## 5           1          1         5
## 6           1          1         6
## 7           1          1         7
## 8           1          1         8
## attr(,"assign")
## [1] 0 1 2
## attr(,"contrasts")
## attr(,"contrasts")$treatment
## [1] "contr.treatment"

Inferensia Pengaruh Perlakuan

Pengujian hipotesis untuk pengaruh perlakuan dilakukan untuk melihat apakah ada perbedaan signifikan antara kelompok perlakuan. Hipotesis untuk pengujian ini adalah:

\[ H_0: \tau_1 = \tau_2 = \dots = \tau_t \]

Jika hipotesis nol (\(H_0\)) ditolak, ini menunjukkan bahwa ada perbedaan signifikan di antara perlakuan.

Syntax R untuk Uji ANOVA pada Model ANCOVA:

# Melakukan uji ANOVA pada model ANCOVA
anova(model)
## Analysis of Variance Table
## 
## Response: response
##           Df Sum Sq Mean Sq F value   Pr(>F)   
## treatment  1 78.125  78.125 23.6384 0.004625 **
## covariate  1 18.225  18.225  5.5144 0.065701 . 
## Residuals  5 16.525   3.305                    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Pengujian Hipotesis Pengaruh Perlakuan pada Model ANCOVA

Untuk menguji pengaruh perlakuan pada model ANCOVA, kita dapat membandingkan model penuh (dengan perlakuan dan covariate) dengan model yang direduksi (tanpa perlakuan) ketika hipotesis nol diterima. Model tanpa perlakuan (direduksi) dapat dituliskan sebagai:

\[ y_{ij} = \mu + \beta x_{ij} + \epsilon_{ij} \]

Jumlah kuadrat regresi dari model penuh dan model yang direduksi dibandingkan, sehingga pengaruh perlakuan dapat diuji.

Syntax R untuk Membandingkan Model Penuh dan Model yang Direduksi:

# Model direduksi tanpa perlakuan
reduced_model <- lm(response ~ covariate, data=data)

# Membandingkan model penuh dengan model direduksi
anova(reduced_model, model)
## Analysis of Variance Table
## 
## Model 1: response ~ covariate
## Model 2: response ~ treatment + covariate
##   Res.Df    RSS Df Sum of Sq      F   Pr(>F)   
## 1      6 94.650                                
## 2      5 16.525  1    78.125 23.638 0.004625 **
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Inferensia Koefisien Covariate

Untuk menguji pengaruh dari covariate, dilakukan pengujian hipotesis sebagai berikut:

\[ H_0: \beta = 0 \]

Jika \(H_0\) ditolak, ini menunjukkan bahwa covariate memiliki pengaruh yang signifikan terhadap respons.

Syntax R untuk Melihat Koefisien Covariate:

# Koefisien covariate dapat dilihat dalam output summary model
summary(model)
## 
## Call:
## lm(formula = response ~ treatment + covariate, data = data)
## 
## Residuals:
##      1      2      3      4      5      6      7      8 
## -0.725 -0.075  1.575 -0.775  1.025 -2.325  2.325 -1.025 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)   3.9750     3.8458   1.034  0.34870   
## treatment2    6.2500     1.2855   4.862  0.00463 **
## covariate     1.3500     0.5749   2.348  0.06570 . 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.818 on 5 degrees of freedom
## Multiple R-squared:  0.8536, Adjusted R-squared:  0.795 
## F-statistic: 14.58 on 2 and 5 DF,  p-value: 0.008201

Mengestimasi Rata-rata Perlakuan yang Disesuaikan dengan Covariate

Rata-rata perlakuan dapat dihitung dengan menyesuaikan pengaruh dari covariate menggunakan persamaan:

\[ \hat{\mu}_i = \bar{y}_{i.} - \hat{\beta}(x_i - \bar{x}) \]

dengan:

  • \(\hat{\mu}_i\): rata-rata perlakuan yang disesuaikan untuk perlakuan ke-\(i\),

  • \(\bar{y}_{i.}\): rata-rata observasi pada perlakuan ke-\(i\),

  • \(\hat{\beta}\): koefisien dari covariate,

  • \(x_i\): rata-rata covariate untuk perlakuan ke-\(i\),

  • \(\bar{x}\): rata-rata keseluruhan dari covariate.

Syntax R untuk Menghitung Rata-rata Perlakuan yang Disesuaikan:

# Menghitung rata-rata perlakuan yang disesuaikan
library(dplyr)
adjusted_means <- data %>%
  group_by(treatment) %>%
  summarise(adjusted_mean = mean(response) - coef(model)["covariate"] * (mean(covariate) - mean(data$covariate)))
adjusted_means
## # A tibble: 2 × 2
##   treatment adjusted_mean
##   <fct>             <dbl>
## 1 1                  12.8
## 2 2                  19

Contoh Soal

Latihan Soal

Soal 1: Pengaruh Pupuk terhadap Pertumbuhan Tanaman

Sejumlah tanaman ditanam menggunakan 3 jenis pupuk. Yang menjadi pokok permasalahan dalam hal ini adalah tinggi tanaman, apakah terdapat perbedaan yang signifikan antara hasil pertumbuhan dengan ketiga jenis pupuk?

Berdasarkan berbagai karakteristik tanah, diperoleh keterangan bahwa kemungkinan adanya perbedaan tinggi tanaman adalah karena perbedaan jenis tanah tempat tanaman ditanam. Ini menandakan adanya kemungkinan hubungan/korelasi antara jenis tanah dan tinggi tanaman. Misalkan X = pH tanah dan Y = tinggi tanaman. Eksperimen dari ke-3 jenis pupuk dilakukan pada 4 tanaman per jenis (n = 4) dengan hasil sebagai berikut:

Pupuk A B C
X Y X Y X Y
6.5 30 7.0 35 5.5 25
6.7 28 7.2 33 5.7 24
6.8 32 7.1 36 5.8 23
6.6 31 6.9 34 5.6 26

Soal 2: Kinerja Mesin dengan Jenis Pelumas

Tiga jenis pelumas digunakan pada mesin untuk mengukur efisiensi kerja. Yang menjadi pokok permasalahan dalam hal ini adalah suhu mesin, apakah terdapat perbedaan yang signifikan antara penggunaan ketiga pelumas?

Berdasarkan berbagai karakteristik mesin, diperoleh keterangan bahwa kemungkinan adanya perbedaan suhu mesin adalah karena perbedaan beban yang diberikan pada mesin. Ini menandakan adanya kemungkinan hubungan/korelasi antara beban kerja dan suhu mesin. Misalkan X = beban kerja (kg) dan Y = suhu mesin (°C). Eksperimen dari ke-3 jenis pelumas dilakukan pada 4 mesin per jenis (n = 4) dengan hasil sebagai berikut:

Pelumas A B C
X Y X Y X Y
50 60 45 55 55 70
52 62 47 57 57 72
48 58 46 56 54 68
49 59 44 54 53 69

Soal 3: Kekerasan Beton dengan Tiga Campuran Material

Tiga campuran material beton diuji untuk mengetahui tingkat kekerasannya. Yang menjadi pokok permasalahan dalam hal ini adalah kekerasan beton, apakah terdapat perbedaan yang signifikan antara hasil uji dari ketiga campuran?

Berdasarkan berbagai karakteristik bahan, diperoleh keterangan bahwa kemungkinan adanya perbedaan kekerasan beton adalah karena kadar air yang digunakan dalam campuran. Ini menandakan adanya kemungkinan hubungan/korelasi antara kadar air dan kekerasan beton. Misalkan X = kadar air (%) dan Y = kekerasan beton (MPa). Eksperimen dari ke-3 campuran dilakukan pada 4 beton per campuran (n = 4) dengan hasil sebagai berikut:

Campuran A B C
X Y X Y X Y
10 30 12 28 15 25
11 32 13 29 14 24
12 31 14 27 13 26
10.5 29 12.5 28.5 15.5 24.5

Soal 4: Pengaruh Tiga Jenis Ban terhadap Jarak Pengereman

Sejumlah kendaraan diuji menggunakan 3 jenis ban untuk mengukur jarak pengereman. Yang menjadi pokok permasalahan dalam hal ini adalah jarak pengereman, apakah terdapat perbedaan yang signifikan antara ketiga jenis ban?

Berdasarkan berbagai karakteristik kendaraan, diperoleh keterangan bahwa kemungkinan adanya perbedaan jarak pengereman adalah karena kecepatan kendaraan sebelum pengereman. Ini menandakan adanya kemungkinan hubungan/korelasi antara kecepatan kendaraan dan jarak pengereman. Misalkan X = kecepatan (km/jam) dan Y = jarak pengereman (m). Eksperimen dari ke-3 jenis ban dilakukan pada 4 kendaraan per jenis (n = 4) dengan hasil sebagai berikut:

Jenis Ban A B C
X Y X Y X Y
80 35 90 40 100 50
85 38 95 42 105 53
75 33 85 38 95 48
90 37 100 45 110 55

Berikut kelanjutan soal nomor 5 hingga 10 dengan format yang seragam:


Soal 5: Pengaruh Bahan Bakar terhadap Emisi Kendaraan

Sejumlah kendaraan diuji menggunakan 3 jenis bahan bakar untuk mengukur tingkat emisi gas buang. Yang menjadi pokok permasalahan dalam hal ini adalah kadar emisi, apakah terdapat perbedaan yang signifikan antara penggunaan ketiga jenis bahan bakar?

Berdasarkan berbagai karakteristik kendaraan, diperoleh keterangan bahwa kemungkinan adanya perbedaan kadar emisi adalah karena kapasitas mesin kendaraan. Ini menandakan adanya kemungkinan hubungan/korelasi antara kapasitas mesin dan kadar emisi. Misalkan X = kapasitas mesin (cc) dan Y = kadar emisi (ppm). Eksperimen dari ke-3 jenis bahan bakar dilakukan pada 4 kendaraan per jenis (n = 4) dengan hasil sebagai berikut:

Jenis Bahan Bakar A B C
X Y X Y X Y
1000 120 1500 140 2000 180
1100 130 1600 150 2100 190
1200 125 1400 145 1900 170
1050 118 1550 138 2050 185

Soal 6: Efisiensi Tiga Jenis Lampu LED

Sejumlah lampu LED diuji untuk mengukur efisiensinya dengan 3 merek berbeda. Yang menjadi pokok permasalahan dalam hal ini adalah konsumsi daya, apakah terdapat perbedaan yang signifikan antara ketiga merek?

Berdasarkan berbagai karakteristik pemasangan, diperoleh keterangan bahwa kemungkinan adanya perbedaan konsumsi daya adalah karena perbedaan intensitas cahaya yang dihasilkan. Ini menandakan adanya kemungkinan hubungan/korelasi antara intensitas cahaya dan konsumsi daya. Misalkan X = intensitas cahaya (lux) dan Y = konsumsi daya (watt). Eksperimen dari ke-3 merek dilakukan pada 4 lampu per merek (n = 4) dengan hasil sebagai berikut:

Merek Lampu A B C
X Y X Y X Y
500 10 600 12 700 15
550 11 650 13 750 16
520 10.5 620 12.5 720 15.5
530 10.8 610 12.2 710 15.2

Soal 7: Kualitas Tiga Jenis Kertas Cetak

Sejumlah kertas diuji untuk mengetahui kualitas hasil cetak dengan 3 jenis kertas. Yang menjadi pokok permasalahan dalam hal ini adalah ketajaman cetakan, apakah terdapat perbedaan yang signifikan antara ketiga jenis kertas?

Berdasarkan berbagai karakteristik printer, diperoleh keterangan bahwa kemungkinan adanya perbedaan ketajaman cetakan adalah karena perbedaan resolusi printer. Ini menandakan adanya kemungkinan hubungan/korelasi antara resolusi printer dan ketajaman cetakan. Misalkan X = resolusi printer (dpi) dan Y = nilai ketajaman cetakan. Eksperimen dari ke-3 jenis kertas dilakukan pada 4 printer per jenis (n = 4) dengan hasil sebagai berikut:

Jenis Kertas A B C
X Y X Y X Y
300 8.5 600 9.5 1200 10
350 8.8 650 9.8 1250 10.2
400 9.0 700 10 1300 10.5
320 8.6 620 9.6 1210 10.1

Soal 8: Pengaruh Jenis Cat terhadap Daya Tahan Pengecatan

Sejumlah permukaan diuji menggunakan 3 jenis cat untuk mengukur daya tahannya. Yang menjadi pokok permasalahan dalam hal ini adalah daya tahan pengecatan, apakah terdapat perbedaan yang signifikan antara ketiga jenis cat?

Berdasarkan berbagai karakteristik bahan dasar permukaan, diperoleh keterangan bahwa kemungkinan adanya perbedaan daya tahan pengecatan adalah karena perbedaan kekasaran permukaan. Ini menandakan adanya kemungkinan hubungan/korelasi antara kekasaran permukaan dan daya tahan pengecatan. Misalkan X = kekasaran permukaan (micron) dan Y = daya tahan pengecatan (bulan). Eksperimen dari ke-3 jenis cat dilakukan pada 4 permukaan per jenis (n = 4) dengan hasil sebagai berikut:

Jenis Cat A B C
X Y X Y X Y
50 24 40 18 30 12
48 22 38 16 32 14
52 26 42 20 28 10
49 25 39 19 31 13

Soal 9: Pengaruh Tiga Jenis Helm terhadap Temperatur Kepala

Sejumlah helm diuji untuk mengukur perubahan temperatur kepala pengguna setelah dipakai. Yang menjadi pokok permasalahan dalam hal ini adalah perubahan temperatur, apakah terdapat perbedaan yang signifikan antara ketiga jenis helm?

Berdasarkan berbagai karakteristik pengguna, diperoleh keterangan bahwa kemungkinan adanya perbedaan perubahan temperatur adalah karena durasi penggunaan helm. Ini menandakan adanya kemungkinan hubungan/korelasi antara durasi penggunaan dan perubahan temperatur. Misalkan X = durasi penggunaan (jam) dan Y = perubahan temperatur (°C). Eksperimen dari ke-3 jenis helm dilakukan pada 4 pengguna per jenis (n = 4) dengan hasil sebagai berikut:

Jenis Helm A B C
X Y X Y X Y
1 1.5 1.2 2 1.4 3
1.5 2 1.3 2.5 1.5 3.5
1.2 1.8 1.4 2.2 1.6 3.2
1.3 1.9 1.1 1.8 1.7 3.1

Soal 10: Efektivitas Tiga Jenis Pestisida terhadap Hama

Sejumlah tanaman diuji menggunakan 3 jenis pestisida untuk mengukur efektivitasnya dalam mengendalikan hama. Yang menjadi pokok permasalahan dalam hal ini adalah jumlah hama yang tersisa, apakah terdapat perbedaan yang signifikan antara penggunaan ketiga jenis pestisida?

Berdasarkan berbagai karakteristik tanaman, diperoleh keterangan bahwa kemungkinan adanya perbedaan jumlah hama adalah karena tingkat serangan hama awal. Ini menandakan adanya kemungkinan hubungan/korelasi antara tingkat serangan hama awal dan jumlah hama tersisa. Misalkan **

X = tingkat serangan awal (ekor)** dan Y = jumlah hama tersisa (ekor). Eksperimen dari ke-3 jenis pestisida dilakukan pada 4 tanaman per jenis (n = 4) dengan hasil sebagai berikut:

Jenis Pestisida A B C
X Y X Y X Y
100 10 120 15 150 25
110 12 115 14 140 22
105 11 125 16 145 24
115 13 110 13 135 20