Dalam era perkembangan yang terus berlanjut, peran statistika semakin penting dalam kehidupan sehari-hari. Statistika memainkan peran vital dalam membantu kita meramalkan atau memprediksi berbagai kejadian yang mempengaruhi masyarakat. Ketika kita dihadapkan pada kebutuhan untuk membandingkan dua percobaan atau kondisi, statistika memberikan landasan yang kuat untuk mengevaluasi apakah terdapat perbedaan yang signifikan antara keduanya. Dengan bantuan alat statistik, kita dapat mengidentifikasi perbedaan ini, yang selanjutnya dapat membantu dalam mengatasi tantangan yang dihadapi oleh masyarakat.
Analisis multivariat adalah cabang statistik yang menggabungkan beberapa variabel untuk mengungkap hubungan kompleks dalam sebuah sistem atau situasi. Ini memungkinkan pengambilan keputusan yang lebih baik dan identifikasi pola yang mendalam dalam data melalui penggunaan teknik statistik seperti analisis faktor, analisis komponen utama, uji T2 Hotelling, dan lainnya. Diterapkan dalam beragam disiplin ilmu, analisis multivariat memberikan wawasan yang mendalam terhadap data dengan banyak variabel, seperti dalam ilmu sosial, ekonomi, dan ilmu lingkungan. Saat ini, peningkatan pemahaman tentang kualitas air menjadi semakin penting seiring dengan pertumbuhan perkotaan dan penggunaan sumber daya air yang semakin intensif. Dalam konteks ini, perbandingan kualitas air antara dua lingkungan perairan, seperti Danau A dan Danau B, dapat memberikan wawasan yang berharga tentang dampak aktivitas manusia dan perubahan lingkungan pada ekosistem perairan. Untuk memahami perbedaan dalam kualitas air antara dua danau tersebut, diperlukan analisis statistik yang komprehensif. Salah satu alat statistik yang sangat berguna untuk tujuan ini adalah analisis T^2 Hotelling, yang memungkinkan kita untuk secara efisien mengevaluasi perbedaan dalam beberapa parameter kualitas air sekaligus. Oleh karena itu, studi ini menggunakan analisis T^2 Hotelling untuk menganalisis data kualitas air di Danau A dan Danau B, dengan mempertimbangkan parameter-parameter kunci seperti suhu, pH, konsentrasi oksigen terlarut, dan kadar logam berat. Hasil analisis ini dapat memberikan pemahaman yang lebih dalam tentang perbedaan kualitas air antara dua danau tersebut dan dapat digunakan sebagai dasar untuk pengelolaan sumber daya air dan perlindungan lingkungan yang lebih baik.
Rumusan masalah dalam penelitian ini adalah: “Apakah terdapat perbedaan yang signifikan dalam parameter kualitas air antara Danau A dan Danau B?”
Penelitian ini bertujuan untuk melakukan analisis perbandingan kualitas air antara Danau A dan Danau B menggunakan uji T2 Hotelling untuk mengevaluasi apakah perbedaan-perbedaan tersebut signifikan.
Hasil penelitian ini diharapkan dapat memberikan wawasan yang berharga dalam pemantauan kualitas air dan perlindungan lingkungan. Informasi ini dapat digunakan oleh pemangku kepentingan, seperti lembaga lingkungan, pemerintah, dan masyarakat umum, untuk pengambilan keputusan yang lebih baik terkait perlindungan dan pemulihan kualitas air di danau-danau.
Dalam penelitian ini, analisis yang digunakan adalah uji T2 Hotelling, yang digunakan untuk membandingkan kelompok sampel multivariat. Uji ini memungkinkan kita untuk mengevaluasi perbedaan dalam beberapa parameter kualitas air secara bersamaan antara kedua danau. Alur pengujian T^2 Hotelling dimulai dengan merumuskan hipotesis nol (H0) yang menyatakan bahwa tidak ada perbedaan antara kelompok-kelompok tersebut. Kemudian, dilanjutkan dengan pengumpulan data dari setiap kelompok yang mencakup variabel-variabel yang diukur. Selanjutnya, kita menghitung vektor rata-rata dari masing-masing kelompok dan matriks kovariansi dari data. Setelah itu, kita menghitung statistik uji T^2 Hotelling yang akan memberikan kita informasi tentang sejauh mana kelompok-kelompok tersebut berbeda dari satu sama lain. Hasil uji ini kemudian dibandingkan dengan distribusi F dengan derajat kebebasan tertentu untuk menentukan apakah kita dapat menolak hipotesis nol. Jika statistik uji T^2 Hotelling kita melebihi ambang batas yang signifikan, maka kita dapat menyimpulkan bahwa ada perbedaan yang signifikan antara kelompok-kelompok tersebut dalam variabel dependen yang diuji.
Variabel yang digunakan dalam penelitian ini mencakup parameter-parameter kualitas air, seperti suhu, pH, oksigen terlarut, dan kadar logam berat.
# Library (Hotelling)
# Library (mvnormtest)
# Library (car)
# Library(knitr)
# Library(dplyr)# membuat data frame
data_air <- data.frame(
Danau = c("A", "A", "A", "A", "A", "B", "B", "B", "B", "B"),
Suhu = c(12, 14, 11, 13, 12, 15, 16, 15, 14, 16),
pH = c(7.5, 7.0, 7.2, 7.4, 7.6, 7.1, 7.2, 7.3, 7.0, 7.2),
Oksigen = c(8.5, 9.0, 8.8, 8.7, 8.6, 9.2, 9.1, 9.3, 9.0, 9.2),
KadarLogam = c(25, 28, 30, 27, 23, 30, 32, 29, 31, 28)
)
data_air## Danau Suhu pH Oksigen KadarLogam
## 1 A 12 7.5 8.5 25
## 2 A 14 7.0 9.0 28
## 3 A 11 7.2 8.8 30
## 4 A 13 7.4 8.7 27
## 5 A 12 7.6 8.6 23
## 6 B 15 7.1 9.2 30
## 7 B 16 7.2 9.1 32
## 8 B 15 7.3 9.3 29
## 9 B 14 7.0 9.0 31
## 10 B 16 7.2 9.2 28
# Mengubah variabel "Danau" menjadi faktor
data_air$Danau <- as.factor(data_air$Danau)
# pemisahan data
danau_a <- data_air[data_air$Danau == "A", 2:5] # mengecualikan kolom "Danau"
danau_a## Suhu pH Oksigen KadarLogam
## 1 12 7.5 8.5 25
## 2 14 7.0 9.0 28
## 3 11 7.2 8.8 30
## 4 13 7.4 8.7 27
## 5 12 7.6 8.6 23
danau_b <- data_air[data_air$Danau == "B", 2:5]
danau_b## Suhu pH Oksigen KadarLogam
## 6 15 7.1 9.2 30
## 7 16 7.2 9.1 32
## 8 15 7.3 9.3 29
## 9 14 7.0 9.0 31
## 10 16 7.2 9.2 28
# Uji asumsi normalitas untuk Danau A
shapiro_test_a <- lapply(danau_a, shapiro.test)
shapiro_test_a## $Suhu
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.96086, p-value = 0.814
##
##
## $pH
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.95699, p-value = 0.7869
##
##
## $Oksigen
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.97872, p-value = 0.9276
##
##
## $KadarLogam
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.98998, p-value = 0.9796
# Uji asumsi normalitas untuk Danau B
shapiro_test_b <- lapply(danau_b, shapiro.test)
shapiro_test_b## $Suhu
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.88104, p-value = 0.314
##
##
## $pH
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.96086, p-value = 0.814
##
##
## $Oksigen
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.96086, p-value = 0.814
##
##
## $KadarLogam
##
## Shapiro-Wilk normality test
##
## data: X[[i]]
## W = 0.98676, p-value = 0.9672
library(car)## Warning: package 'car' was built under R version 4.2.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.3
# Melakukan uji Levene untuk homogenitas varians pada setiap variabel
levene_test_suhu <- leveneTest(Suhu ~ Danau, data = data_air)
levene_test_suhu## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.2 0.6666
## 8
levene_test_pH <- leveneTest(pH ~ Danau, data = data_air)
levene_test_pH## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1.7241 0.2256
## 8
levene_test_oksigen <- leveneTest(Oksigen ~ Danau, data = data_air)
levene_test_oksigen## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.9 0.3706
## 8
levene_test_kadar_logam <- leveneTest(KadarLogam ~ Danau, data = data_air)
levene_test_kadar_logam## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 1 0.3466
## 8
library(Hotelling)## Loading required package: corpcor
# Uji Hotelling T^2
hotelling_test <- hotelling.test(danau_a, danau_b)
hotelling_test## Test stat: 36.987
## Numerator df: 4
## Denominator df: 5
## P-value: 0.04075
library(knitr)## Warning: package 'knitr' was built under R version 4.2.3
kable(data_air)| Danau | Suhu | pH | Oksigen | KadarLogam |
|---|---|---|---|---|
| A | 12 | 7.5 | 8.5 | 25 |
| A | 14 | 7.0 | 9.0 | 28 |
| A | 11 | 7.2 | 8.8 | 30 |
| A | 13 | 7.4 | 8.7 | 27 |
| A | 12 | 7.6 | 8.6 | 23 |
| B | 15 | 7.1 | 9.2 | 30 |
| B | 16 | 7.2 | 9.1 | 32 |
| B | 15 | 7.3 | 9.3 | 29 |
| B | 14 | 7.0 | 9.0 | 31 |
| B | 16 | 7.2 | 9.2 | 28 |
\(H_0\) : Data berdistribusi normal multivariat \(H_1\) : Data berdistribusi normal multivariat
\[ \alpha = 0.05 \] Statistik Uji:
# Simpan hasil p-value dalam data frame
shapiro_results <- data.frame(
Danau_A_Pvalue = sapply(shapiro_test_a, function(x) x$p.value),
Danau_B_Pvalue = sapply(shapiro_test_b, function(x) x$p.value)
)
# Tampilkan tabel
kable(shapiro_results)| Danau_A_Pvalue | Danau_B_Pvalue | |
|---|---|---|
| Suhu | 0.8139521 | 0.3140396 |
| pH | 0.7868776 | 0.8139521 |
| Oksigen | 0.9276364 | 0.8139521 |
| KadarLogam | 0.9796155 | 0.9671739 |
Keputusan: Danau A:
Suhu: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
pH: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
Oksigen: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
Kadar Logam: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
Danau B:
Suhu:p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
pH: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
Oksigen: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
Kadar Logam: p-value > α, Terima \(H_0\) (tidak ada cukup bukti untuk menolak hipotesis nol)
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa semua variabel kualitas air pada kedua danau (Danau A dan Danau B) berdistribusi secara normal multivariat.
\(H_0\) : Varians Variabel (\(Xi\)) antara Danau A dan Danau B adalah sama \(H_1\) : Varians (\(Xi\)) antara Danau A dan Danau B berbeda
\[ \alpha = 0.05 \] Statistik Uji:
library(dplyr)## Warning: package 'dplyr' was built under R version 4.2.3
##
## Attaching package: 'dplyr'
## The following object is masked from 'package:Hotelling':
##
## summarise
## The following object is masked from 'package:car':
##
## recode
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
result <- bind_rows(
Suhu = levene_test_suhu,
pH = levene_test_pH,
Oksigen = levene_test_oksigen,
KadarLogam = levene_test_kadar_logam
)
result## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group...1 1 0.2000 0.6666
## ...2 8
## group...3 1 1.7241 0.2256
## ...4 8
## group...5 1 0.9000 0.3706
## ...6 8
## group...7 1 1.0000 0.3466
## ...8 8
Keputusan: Suhu: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)
pH: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)
Oksigen: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)
Kadar Logam: P-value untuk variabel Kadar Logam tidak valid (NaN), sehingga tidak dapat dibandingkan dengan alpha. Hal ini menunjukkan adanya masalah pada data Kadar Logam yang perlu diperbaiki
Kesimpulan: Terdapat perbedaan yang signifikan dalam homogenitas varians antara Danau A dan Danau B untuk variabel Suhu, pH, dan Oksigen. Sedangkan untuk Variabel Kadar Logam tidak dapat diketahui ada perbedaan atau tidak
\(H_0\) : Tidak ada perbedaan yang signifikan dalam vektor rata-rata antara Danau A dan Danau B untuk parameter kualitas air (Suhu, pH, Oksigen, dan Kadar Logam) \(H_0\) : terdapat perbedaan yang signifikan dalam vektor rata-rata antara Danau A dan Danau B untuk parameter kualitas air (Suhu, pH, Oksigen, dan Kadar Logam)
\[ \alpha = 0.05 \] Statistik Uji:
p-value=0.04075
Keputusan: p-value < α, Tolak \(H_0\) (sudah cukup bukti untuk menolak hipotesis nol)
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa terdapat perbedaan yang signifikan dalam vektor rata-rata antara Danau A dan Danau B untuk parameter kualitas air (Suhu, pH, Oksigen, dan Kadar Logam)
Pada penelitian ini dapat disimpulkan bahwa terdapat perbedaan yang signifikan dalam kualitas air antara dua danau, yaitu Danau A dan Danau B, dalam beberapa parameter penting, termasuk suhu, pH, oksigen, dan kadar logam. Uji statistik menunjukkan bahwa perbedaan tersebut signifikan, bahkan setelah mempertimbangkan asumsi-asumsi statistik seperti normalitas dan homogenitas varian. Hasil ini mengindikasikan adanya pengaruh dari faktor-faktor yang berbeda di lingkungan kedua danau, yang dapat melibatkan aktivitas manusia atau faktor alamiah. Oleh karena itu, pemantauan dan pengelolaan kualitas air kedua danau sangat penting untuk menjaga ekosistem air yang sehat dan mendukung kehidupan di sekitarnya. Studi lebih lanjut dan tindakan perlindungan mungkin diperlukan untuk mengidentifikasi penyebab perbedaan ini dan menjaga kualitas air sesuai dengan standar yang diharapkan.