Analisis T^2 Hotelling untuk Mengevaluasi Perbedaan Kualitas Air antara Dua Danau (Danau A dan Danau B) dalam Beberapa Parameter Kualitas Air: Suhu, pH, Konsentrasi Oksigen Terlarut, dan Kadar Logam Berat.

Elsa Fadhillah

20 Oktober 2023

1 PENDAHULUAN
2 ANALISIS YANG DIGUNAKAN
3 VARIABEL YANG DIGUNAKAN
4 SOURCE CODE
5 Hasil dan Pembahasan
6 Kesimpulan

1 PENDAHULUAN

1.1 Latar Belakang

  Dalam era perkembangan yang terus berlanjut, peran statistika semakin penting dalam kehidupan sehari-hari. Statistika memainkan peran vital dalam membantu kita meramalkan atau memprediksi berbagai kejadian yang mempengaruhi masyarakat. Ketika kita dihadapkan pada kebutuhan untuk membandingkan dua percobaan atau kondisi, statistika memberikan landasan yang kuat untuk mengevaluasi apakah terdapat perbedaan yang signifikan antara keduanya. Dengan bantuan alat statistik, kita dapat mengidentifikasi perbedaan ini, yang selanjutnya dapat membantu dalam mengatasi tantangan yang dihadapi oleh masyarakat.

Analisis multivariat adalah cabang statistik yang menggabungkan beberapa variabel untuk mengungkap hubungan kompleks dalam sebuah sistem atau situasi. Ini memungkinkan pengambilan keputusan yang lebih baik dan identifikasi pola yang mendalam dalam data melalui penggunaan teknik statistik seperti analisis faktor, analisis komponen utama, uji T2 Hotelling, dan lainnya. Diterapkan dalam beragam disiplin ilmu, analisis multivariat memberikan wawasan yang mendalam terhadap data dengan banyak variabel, seperti dalam ilmu sosial, ekonomi, dan ilmu lingkungan. Saat ini, peningkatan pemahaman tentang kualitas air menjadi semakin penting seiring dengan pertumbuhan perkotaan dan penggunaan sumber daya air yang semakin intensif. Dalam konteks ini, perbandingan kualitas air antara dua lingkungan perairan, seperti Danau A dan Danau B, dapat memberikan wawasan yang berharga tentang dampak aktivitas manusia dan perubahan lingkungan pada ekosistem perairan. Untuk memahami perbedaan dalam kualitas air antara dua danau tersebut, diperlukan analisis statistik yang komprehensif. Salah satu alat statistik yang sangat berguna untuk tujuan ini adalah analisis T^2 Hotelling, yang memungkinkan kita untuk secara efisien mengevaluasi perbedaan dalam beberapa parameter kualitas air sekaligus. Oleh karena itu, studi ini menggunakan analisis T^2 Hotelling untuk menganalisis data kualitas air di Danau A dan Danau B, dengan mempertimbangkan parameter-parameter kunci seperti suhu, pH, konsentrasi oksigen terlarut, dan kadar logam berat. Hasil analisis ini dapat memberikan pemahaman yang lebih dalam tentang perbedaan kualitas air antara dua danau tersebut dan dapat digunakan sebagai dasar untuk pengelolaan sumber daya air dan perlindungan lingkungan yang lebih baik.

1.2 Rumusan Masalah

Rumusan masalah dalam penelitian ini adalah: “Apakah terdapat perbedaan yang signifikan dalam parameter kualitas air antara Danau A dan Danau B?”

1.3 Tujuan Penelitian

Penelitian ini bertujuan untuk melakukan analisis perbandingan kualitas air antara Danau A dan Danau B menggunakan uji T2 Hotelling untuk mengevaluasi apakah perbedaan-perbedaan tersebut signifikan.

1.4 Manfaat

Hasil penelitian ini diharapkan dapat memberikan wawasan yang berharga dalam pemantauan kualitas air dan perlindungan lingkungan. Informasi ini dapat digunakan oleh pemangku kepentingan, seperti lembaga lingkungan, pemerintah, dan masyarakat umum, untuk pengambilan keputusan yang lebih baik terkait perlindungan dan pemulihan kualitas air di danau-danau.

2 ANALISIS YANG DIGUNAKAN

Dalam penelitian ini, analisis yang digunakan adalah uji T2 Hotelling, yang digunakan untuk membandingkan kelompok sampel multivariat. Uji ini memungkinkan kita untuk mengevaluasi perbedaan dalam beberapa parameter kualitas air secara bersamaan antara kedua danau. Alur pengujian T^2 Hotelling dimulai dengan merumuskan hipotesis nol (H0) yang menyatakan bahwa tidak ada perbedaan antara kelompok-kelompok tersebut. Kemudian, dilanjutkan dengan pengumpulan data dari setiap kelompok yang mencakup variabel-variabel yang diukur. Selanjutnya, kita menghitung vektor rata-rata dari masing-masing kelompok dan matriks kovariansi dari data. Setelah itu, kita menghitung statistik uji T^2 Hotelling yang akan memberikan kita informasi tentang sejauh mana kelompok-kelompok tersebut berbeda dari satu sama lain. Hasil uji ini kemudian dibandingkan dengan distribusi F dengan derajat kebebasan tertentu untuk menentukan apakah kita dapat menolak hipotesis nol. Jika statistik uji T^2 Hotelling kita melebihi ambang batas yang signifikan, maka kita dapat menyimpulkan bahwa ada perbedaan yang signifikan antara kelompok-kelompok tersebut dalam variabel dependen yang diuji.

3 VARIABEL YANG DIGUNAKAN

Variabel yang digunakan dalam penelitian ini mencakup parameter-parameter kualitas air, seperti suhu, pH, oksigen terlarut, dan kadar logam berat.

4 SOURCE CODE4.1 Library# Library (Hotelling)
# Library (mvnormtest)
# Library (car)
# Library(knitr)
# Library(dplyr)
4.2 Data# membuat data frame
data_air <- data.frame(
  Danau = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B"),
  Suhu = c(12, 14, 11, 13, 12, 15, 16, 15, 14, 16),
  pH = c(7.5, 7.0, 7.2, 7.4, 7.6, 7.1, 7.2, 7.3, 7.0, 7.2),
  Oksigen = c(8.5, 9.0, 8.8, 8.7, 8.6, 9.2, 9.1, 9.3, 9.0, 9.2),
  KadarLogam = c(25, 28, 30, 27, 23, 30, 32, 29, 31, 28)
)

data_air
##    Danau Suhu  pH Oksigen KadarLogam
## 1      A   12 7.5     8.5         25
## 2      A   14 7.0     9.0         28
## 3      A   11 7.2     8.8         30
## 4      A   13 7.4     8.7         27
## 5      A   12 7.6     8.6         23
## 6      B   15 7.1     9.2         30
## 7      B   16 7.2     9.1         32
## 8      B   15 7.3     9.3         29
## 9      B   14 7.0     9.0         31
## 10     B   16 7.2     9.2         28# Mengubah variabel "Danau" menjadi faktor
data_air$Danau <- as.factor(data_air$Danau)

# pemisahan data
danau_a <- data_air[data_air$Danau == "A", 2:5]  # mengecualikan kolom "Danau"
danau_a
##   Suhu  pH Oksigen KadarLogam
## 1   12 7.5     8.5         25
## 2   14 7.0     9.0         28
## 3   11 7.2     8.8         30
## 4   13 7.4     8.7         27
## 5   12 7.6     8.6         23danau_b <- data_air[data_air$Danau == "B", 2:5]
danau_b
##    Suhu  pH Oksigen KadarLogam
## 6    15 7.1     9.2         30
## 7    16 7.2     9.1         32
## 8    15 7.3     9.3         29
## 9    14 7.0     9.0         31
## 10   16 7.2     9.2         28
4.3 Uji Asumsi
Normalitas# Uji asumsi normalitas untuk Danau A
shapiro_test_a <- lapply(danau_a, shapiro.test)
shapiro_test_a
## $Suhu
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.96086, p-value = 0.814
## 
## 
## $pH
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.95699, p-value = 0.7869
## 
## 
## $Oksigen
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.97872, p-value = 0.9276
## 
## 
## $KadarLogam
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.98998, p-value = 0.9796# Uji asumsi normalitas untuk Danau B
shapiro_test_b <- lapply(danau_b, shapiro.test)
shapiro_test_b
## $Suhu
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.88104, p-value = 0.314
## 
## 
## $pH
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.96086, p-value = 0.814
## 
## 
## $Oksigen
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.96086, p-value = 0.814
## 
## 
## $KadarLogam
## 
##  Shapiro-Wilk normality test
## 
## data:  X[[i]]
## W = 0.98676, p-value = 0.9672
4.4 Uji Homogenitaslibrary(car)
## Warning: package 'car' was built under R version 4.2.3## Loading required package: carData## Warning: package 'carData' was built under R version 4.2.3# Melakukan uji Levene untuk homogenitas varians pada setiap variabel
levene_test_suhu <- leveneTest(Suhu ~ Danau, data = data_air)
levene_test_suhu
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1     0.2 0.6666
##        8levene_test_pH <- leveneTest(pH ~ Danau, data = data_air)
levene_test_pH
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  1.7241 0.2256
##        8levene_test_oksigen <- leveneTest(Oksigen ~ Danau, data = data_air)
levene_test_oksigen
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1     0.9 0.3706
##        8levene_test_kadar_logam <- leveneTest(KadarLogam ~ Danau, data = data_air)
levene_test_kadar_logam
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1       1 0.3466
##        8
4.5 Uji T^2
Hotellinglibrary(Hotelling)
## Loading required package: corpcor# Uji Hotelling T^2
hotelling_test <- hotelling.test(danau_a, danau_b)
hotelling_test
## Test stat:  36.987 
## Numerator df:  4 
## Denominator df:  5 
## P-value:  0.04075

5 Hasil dan Pembahasan

5.1 Data

library(knitr)

## Warning: package 'knitr' was built under R version 4.2.3

kable(data_air)

Danau	Suhu	pH	Oksigen	KadarLogam
A	12	7.5	8.5	25
A	14	7.0	9.0	28
A	11	7.2	8.8	30
A	13	7.4	8.7	27
A	12	7.6	8.6	23
B	15	7.1	9.2	30
B	16	7.2	9.1	32
B	15	7.3	9.3	29
B	14	7.0	9.0	31
B	16	7.2	9.2	28

5.2 Uji Asumsi Normalitas

\(H_0\) : Data berdistribusi normal multivariat \(H_1\) : Data berdistribusi normal multivariat

\[ \alpha = 0.05 \] Statistik Uji:

# Simpan hasil p-value dalam data frame
shapiro_results <- data.frame(
  Danau_A_Pvalue = sapply(shapiro_test_a, function(x) x$p.value),
  Danau_B_Pvalue = sapply(shapiro_test_b, function(x) x$p.value)
)

# Tampilkan tabel
kable(shapiro_results)

	Danau_A_Pvalue	Danau_B_Pvalue
Suhu	0.8139521	0.3140396
pH	0.7868776	0.8139521
Oksigen	0.9276364	0.8139521
KadarLogam	0.9796155	0.9671739

Keputusan: Danau A:

Suhu: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

pH: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

Oksigen: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

Kadar Logam: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

Danau B:

Suhu:p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

pH: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

Oksigen: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

Kadar Logam: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa semua variabel kualitas air pada kedua danau (Danau A dan Danau B) berdistribusi secara normal multivariat.

5.3 Uji Homogenitas

\(H_0\) : Varians Variabel (\(Xi\)) antara Danau A dan Danau B adalah sama \(H_1\) : Varians (\(Xi\)) antara Danau A dan Danau B berbeda

\[ \alpha = 0.05 \] Statistik Uji:

library(dplyr)

## Warning: package 'dplyr' was built under R version 4.2.3

## 
## Attaching package: 'dplyr'

## The following object is masked from 'package:Hotelling':
## 
##     summarise

## The following object is masked from 'package:car':
## 
##     recode

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

result <- bind_rows(
  Suhu = levene_test_suhu,
  pH = levene_test_pH,
  Oksigen = levene_test_oksigen,
  KadarLogam = levene_test_kadar_logam
)
result

## Levene's Test for Homogeneity of Variance (center = median)
##           Df F value Pr(>F)
## group...1  1  0.2000 0.6666
##  ...2      8               
## group...3  1  1.7241 0.2256
##  ...4      8               
## group...5  1  0.9000 0.3706
##  ...6      8               
## group...7  1  1.0000 0.3466
##  ...8      8

Keputusan: Suhu: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)

pH: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)

Oksigen: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)

Kadar Logam: P-value untuk variabel Kadar Logam tidak valid (NaN), sehingga tidak dapat dibandingkan dengan alpha. Hal ini menunjukkan adanya masalah pada data Kadar Logam yang perlu diperbaiki

Kesimpulan: Terdapat perbedaan yang signifikan dalam homogenitas varians antara Danau A dan Danau B untuk variabel Suhu, pH, dan Oksigen. Sedangkan untuk Variabel Kadar Logam tidak dapat diketahui ada perbedaan atau tidak

5.4 Uji T^2 Hotelling

\(H_0\) : Tidak ada perbedaan yang signifikan dalam vektor rata-rata antara Danau A dan Danau B untuk parameter kualitas air (Suhu, pH, Oksigen, dan Kadar Logam) \(H_0\) : terdapat perbedaan yang signifikan dalam vektor rata-rata antara Danau A dan Danau B untuk parameter kualitas air (Suhu, pH, Oksigen, dan Kadar Logam)

\[ \alpha = 0.05 \] Statistik Uji:

p-value=0.04075

Keputusan: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa terdapat perbedaan yang signifikan dalam vektor rata-rata antara Danau A dan Danau B untuk parameter kualitas air (Suhu, pH, Oksigen, dan Kadar Logam)

6 Kesimpulan

Pada penelitian ini dapat disimpulkan bahwa terdapat perbedaan yang signifikan dalam kualitas air antara dua danau, yaitu Danau A dan Danau B, dalam beberapa parameter penting, termasuk suhu, pH, oksigen, dan kadar logam. Uji statistik menunjukkan bahwa perbedaan tersebut signifikan, bahkan setelah mempertimbangkan asumsi-asumsi statistik seperti normalitas dan homogenitas varian. Hasil ini mengindikasikan adanya pengaruh dari faktor-faktor yang berbeda di lingkungan kedua danau, yang dapat melibatkan aktivitas manusia atau faktor alamiah. Oleh karena itu, pemantauan dan pengelolaan kualitas air kedua danau sangat penting untuk menjaga ekosistem air yang sehat dan mendukung kehidupan di sekitarnya. Studi lebih lanjut dan tindakan perlindungan mungkin diperlukan untuk mengidentifikasi penyebab perbedaan ini dan menjaga kualitas air sesuai dengan standar yang diharapkan.

Danau	Suhu	pH	Oksigen	KadarLogam
A	12	7.5	8.5	25
A	14	7.0	9.0	28
A	11	7.2	8.8	30
A	13	7.4	8.7	27
A	12	7.6	8.6	23
B	15	7.1	9.2	30
B	16	7.2	9.1	32
B	15	7.3	9.3	29
B	14	7.0	9.0	31
B	16	7.2	9.2	28

Danau	Suhu	pH	Oksigen	KadarLogam
A	12	7.5	8.5	25
A	14	7.0	9.0	28
A	11	7.2	8.8	30
A	13	7.4	8.7	27
A	12	7.6	8.6	23
B	15	7.1	9.2	30
B	16	7.2	9.1	32
B	15	7.3	9.3	29
B	14	7.0	9.0	31
B	16	7.2	9.2	28

1 PENDAHULUAN

1.1 Latar Belakang

1.2 Rumusan Masalah

1.3 Tujuan Penelitian

1.4 Manfaat

2 ANALISIS YANG DIGUNAKAN

3 VARIABEL YANG DIGUNAKAN

4 SOURCE CODE

4.1 Library

4.2 Data

4.3 Uji Asumsi Normalitas

4.4 Uji Homogenitas

4.5 Uji T^2 Hotelling

5 Hasil dan Pembahasan

5.1 Data

5.2 Uji Asumsi Normalitas

5.3 Uji Homogenitas

5.4 Uji T^2 Hotelling

6 Kesimpulan

Danau	Suhu	pH	Oksigen	KadarLogam
A	12	7.5	8.5	25
A	14	7.0	9.0	28
A	11	7.2	8.8	30
A	13	7.4	8.7	27
A	12	7.6	8.6	23
B	15	7.1	9.2	30
B	16	7.2	9.1	32
B	15	7.3	9.3	29
B	14	7.0	9.0	31
B	16	7.2	9.2	28