LATIHAN TPG Prak 2

Input Data

x<-c(8.8, 8.5, 7.7, 4.9, 9.6, 10, 11.5, 11.6, 11.2, 10.7, 10, 6.8, 2589, 1186, 291, 1276,6633, 12125, 36717,43319, 10530, 3931, 1536, 61400)
data<-matrix(x, nrow=12, ncol=2)
data
##       [,1]  [,2]
##  [1,]  8.8  2589
##  [2,]  8.5  1186
##  [3,]  7.7   291
##  [4,]  4.9  1276
##  [5,]  9.6  6633
##  [6,] 10.0 12125
##  [7,] 11.5 36717
##  [8,] 11.6 43319
##  [9,] 11.2 10530
## [10,] 10.7  3931
## [11,] 10.0  1536
## [12,]  6.8 61400
# Install and load the ggplot2 package if you haven't already

library(ggplot2)
# Create the matrix data
x<-c(8.8, 8.5, 7.7, 4.9, 9.6, 10, 11.5, 11.6, 11.2, 10.7, 10, 6.8, 2589, 1186, 291, 1276,6633, 12125, 36717,43319, 10530, 3931, 1536, 61400)
data<-matrix(x, nrow=12, ncol=2)
data <- as.data.frame(data)  # Convert matrix to data frame for ggplot

# Rename the columns for easier reference
colnames(data) <- c("Value1", "Value2")

# Create a dense plot
ggplot(data, aes(x = Value1, y = Value2)) +
  geom_point() +     # Scatter plot
  geom_density2d() + # Add 2D density contour
  theme_minimal() +  # Apply a minimal theme
  labs(title = "Dense Plot", x = "Value 1", y = "Value 2")

Beberapa area memiliki perubahan kepadatan yang cepat, yang mengindikasikan adanya konsentrasi data di wilayah tertentu, sementara area lain mungkin lebih jarang atau memiliki outlier. Pola ini bisa memberikan wawasan tentang struktur data, seperti adanya subkelompok atau hubungan antara variabel yang perlu dieksplorasi lebih lanjut.

library(MVN)

Menggunakan Uji normalitas ganda menggunakan Mardia’s Skewness

mardia <- mvn(data, mvnTest = c("mardia"), covariance = TRUE, multivariatePlot = "qq")

mardia
## $multivariateNormality
##              Test         Statistic            p value Result
## 1 Mardia Skewness  11.1215382968049 0.0252315192005968     NO
## 2 Mardia Kurtosis 0.590006258740303  0.555186453489953    YES
## 3             MVN              <NA>               <NA>     NO
## 
## $univariateNormality
##               Test  Variable Statistic   p value Normality
## 1 Anderson-Darling  Value1      0.3122    0.5053    YES   
## 2 Anderson-Darling  Value2      1.3825    0.0008    NO    
## 
## $Descriptives
##         n      Mean   Std.Dev Median   Min     Max   25th      75th       Skew
## Value1 12     9.275     2.041    9.8   4.9    11.6    8.3    10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000  1.1413585
##          Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875

Dari hasil R diatas akan dilakukan pengujian hipotesis terhadap mardia skewness test sebagai berikut :

Ho : Peubah ganda mengikuti distribusi normal

H1 : Peubah ganda tidak mengikuti distribusi normal

Terdapat dua kesimpulan pada mardia skewness p-value = 0.0243 < 0.05 yaitu Tolak H0. Sementara pada mardia kurtosis p-value = 0.5555 > 0.05 yaitu Tak Tolak Ho.

Data mungkin tidak normal secara multivariat karena terdapat skewness yang signifikan. Meski kurtosis tidak signifikan, skewness yang signifikan cukup untuk menyatakan bahwa data mungkin tidak memenuhi asumsi normalitas multivariat.

Berdasarkan grafik ini, mayoritas titik berada di dekat garis referensi, yang mengindikasikan bahwa data cukup mengikuti distribusi Chi-Square.Namun, beberapa titik yang menyimpang dari garis dapat menunjukkan bahwa terdapat beberapa data yang mungkin tidak sepenuhnya konsisten dengan distribusi Chi-Square.

Uji normalitas ganda menggunakan Henze-Zikler Test

henze<-mvn(data, mvnTest = c("hz"), covariance = TRUE, multivariatePlot = "none")
henze
## $multivariateNormality
##            Test        HZ     p value MVN
## 1 Henze-Zirkler 0.9995781 0.004125476  NO
## 
## $univariateNormality
##               Test  Variable Statistic   p value Normality
## 1 Anderson-Darling  Value1      0.3122    0.5053    YES   
## 2 Anderson-Darling  Value2      1.3825    0.0008    NO    
## 
## $Descriptives
##         n      Mean   Std.Dev Median   Min     Max   25th      75th       Skew
## Value1 12     9.275     2.041    9.8   4.9    11.6    8.3    10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000  1.1413585
##          Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875

Dari Henze-Zirkler’s Multivariate Normality Test menghasilkan nilai p-value = 0.00412 < α = 0.05. Hal ini berarti data mendukung untuk Tolak Ho, dengan demikian dapat dikatakan bahwa peubah-peubah tersebut tidak mengikuti distribusi normal ganda.

Uji Normalitas ganda menggunakan Royston

royston<-mvn(data, mvnTest = c("royston"), covariance = TRUE, multivariatePlot = "persp")

royston
## $multivariateNormality
##      Test        H     p value MVN
## 1 Royston 10.10069 0.006407917  NO
## 
## $univariateNormality
##               Test  Variable Statistic   p value Normality
## 1 Anderson-Darling  Value1      0.3122    0.5053    YES   
## 2 Anderson-Darling  Value2      1.3825    0.0008    NO    
## 
## $Descriptives
##         n      Mean   Std.Dev Median   Min     Max   25th      75th       Skew
## Value1 12     9.275     2.041    9.8   4.9    11.6    8.3    10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000  1.1413585
##          Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875

Dari Royston Test menghasilkan nilai p-value = 0.0064079 < α = 0.05. Hasil uji ini juga menunjukkan data mendukung untuk Tolak Ho, dengan demikian dapat dikatakan bahwa peubah-peubah tersebut tidak mengikuti distribusi normal ganda.

royston<-mvn(data, mvnTest = c("royston"), covariance = TRUE, multivariatePlot = "contour")

royston
## $multivariateNormality
##      Test        H     p value MVN
## 1 Royston 10.10069 0.006407917  NO
## 
## $univariateNormality
##               Test  Variable Statistic   p value Normality
## 1 Anderson-Darling  Value1      0.3122    0.5053    YES   
## 2 Anderson-Darling  Value2      1.3825    0.0008    NO    
## 
## $Descriptives
##         n      Mean   Std.Dev Median   Min     Max   25th      75th       Skew
## Value1 12     9.275     2.041    9.8   4.9    11.6    8.3    10.825 -0.6760453
## Value2 12 15127.750 20400.481 5282.0 291.0 61400.0 1471.0 18273.000  1.1413585
##          Kurtosis
## Value1 -0.6824234
## Value2 -0.2880875

Berdasarkan beberapa uji normalitas ganda di atas, dapat disimpulkan bahwa data tidak menyebar multivariat normal. Sehingga tidak perlu dilakukan penangan lanjutan terhadap data tersebut.