LATIHAN TPG Prak 2
Input Data
x<-c(8.8, 8.5, 7.7, 4.9, 9.6, 10, 11.5, 11.6, 11.2, 10.7, 10, 6.8, 2589, 1186, 291, 1276,6633, 12125, 36717,43319, 10530, 3931, 1536, 61400)
data<-matrix(x, nrow=12, ncol=2)
data
## [,1] [,2]
## [1,] 8.8 2589
## [2,] 8.5 1186
## [3,] 7.7 291
## [4,] 4.9 1276
## [5,] 9.6 6633
## [6,] 10.0 12125
## [7,] 11.5 36717
## [8,] 11.6 43319
## [9,] 11.2 10530
## [10,] 10.7 3931
## [11,] 10.0 1536
## [12,] 6.8 61400
# Install and load the ggplot2 package if you haven't already
library(ggplot2)
# Create the matrix data
x<-c(8.8, 8.5, 7.7, 4.9, 9.6, 10, 11.5, 11.6, 11.2, 10.7, 10, 6.8, 2589, 1186, 291, 1276,6633, 12125, 36717,43319, 10530, 3931, 1536, 61400)
data<-matrix(x, nrow=12, ncol=2)
data <- as.data.frame(data) # Convert matrix to data frame for ggplot
# Rename the columns for easier reference
colnames(data) <- c("Value1", "Value2")
# Create a dense plot
ggplot(data, aes(x = Value1, y = Value2)) +
geom_point() + # Scatter plot
geom_density2d() + # Add 2D density contour
theme_minimal() + # Apply a minimal theme
labs(title = "Dense Plot", x = "Value 1", y = "Value 2")
Beberapa area memiliki perubahan kepadatan yang cepat, yang mengindikasikan adanya konsentrasi data di wilayah tertentu, sementara area lain mungkin lebih jarang atau memiliki outlier. Pola ini bisa memberikan wawasan tentang struktur data, seperti adanya subkelompok atau hubungan antara variabel yang perlu dieksplorasi lebih lanjut.
Menggunakan Uji normalitas ganda menggunakan Mardia’s Skewness
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 11.1215382968049 0.0252315192005968 NO
## 2 Mardia Kurtosis 0.590006258740303 0.555186453489953 YES
## 3 MVN <NA> <NA> NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Value1 0.3122 0.5053 YES
## 2 Anderson-Darling Value2 1.3825 0.0008 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Value1 12 9.275 2.041 9.8 4.9 11.6 8.3 10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000 1.1413585
## Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875
Dari hasil R diatas akan dilakukan pengujian hipotesis terhadap mardia skewness test sebagai berikut :
Ho : Peubah ganda mengikuti distribusi normal
H1 : Peubah ganda tidak mengikuti distribusi normal
Terdapat dua kesimpulan pada mardia skewness p-value = 0.0243 < 0.05 yaitu Tolak H0. Sementara pada mardia kurtosis p-value = 0.5555 > 0.05 yaitu Tak Tolak Ho.
Data mungkin tidak normal secara multivariat karena terdapat skewness yang signifikan. Meski kurtosis tidak signifikan, skewness yang signifikan cukup untuk menyatakan bahwa data mungkin tidak memenuhi asumsi normalitas multivariat.
Berdasarkan grafik ini, mayoritas titik berada di dekat garis referensi, yang mengindikasikan bahwa data cukup mengikuti distribusi Chi-Square.Namun, beberapa titik yang menyimpang dari garis dapat menunjukkan bahwa terdapat beberapa data yang mungkin tidak sepenuhnya konsisten dengan distribusi Chi-Square.
Uji normalitas ganda menggunakan Henze-Zikler Test
## $multivariateNormality
## Test HZ p value MVN
## 1 Henze-Zirkler 0.9995781 0.004125476 NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Value1 0.3122 0.5053 YES
## 2 Anderson-Darling Value2 1.3825 0.0008 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Value1 12 9.275 2.041 9.8 4.9 11.6 8.3 10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000 1.1413585
## Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875
Dari Henze-Zirkler’s Multivariate Normality Test menghasilkan nilai p-value = 0.00412 < α = 0.05. Hal ini berarti data mendukung untuk Tolak Ho, dengan demikian dapat dikatakan bahwa peubah-peubah tersebut tidak mengikuti distribusi normal ganda.
Uji Normalitas ganda menggunakan Royston
## $multivariateNormality
## Test H p value MVN
## 1 Royston 10.10069 0.006407917 NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Value1 0.3122 0.5053 YES
## 2 Anderson-Darling Value2 1.3825 0.0008 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Value1 12 9.275 2.041 9.8 4.9 11.6 8.3 10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000 1.1413585
## Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875
Dari Royston Test menghasilkan nilai p-value = 0.0064079 < α = 0.05. Hasil uji ini juga menunjukkan data mendukung untuk Tolak Ho, dengan demikian dapat dikatakan bahwa peubah-peubah tersebut tidak mengikuti distribusi normal ganda.
## $multivariateNormality
## Test H p value MVN
## 1 Royston 10.10069 0.006407917 NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling Value1 0.3122 0.5053 YES
## 2 Anderson-Darling Value2 1.3825 0.0008 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th 75th Skew
## Value1 12 9.275 2.041 9.8 4.9 11.6 8.3 10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000 1.1413585
## Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875
Berdasarkan beberapa uji normalitas ganda di atas, dapat disimpulkan bahwa data tidak menyebar multivariat normal. Sehingga tidak perlu dilakukan penangan lanjutan terhadap data tersebut.