1 PENDAHULUAN
Statistika adalah cabang ilmu yang berperan penting dalam mengorganisasi, menganalisis, dan menginterpretasi data. Salah satu metode analisis yang menjadi inti dalam ilmu statistika adalah Analisis Faktor. Analisis Faktor adalah teknik statistika yang digunakan untuk mengungkap struktur yang tersembunyi dalam data, dengan cara mengidentifikasi hubungan antara berbagai variabel yang diamati. Pendekatan ini membantu kita memahami bagaimana variabel-variabel saling berhubungan dan bagaimana mereka berkontribusi terhadap pola yang muncul dalam data.
Dalam analisis faktor, variabel-variabel yang diamati dikelompokkan menjadi faktor-faktor yang lebih kecil dan lebih terkendali, sehingga kita dapat mereduksi kompleksitas data sambil mempertahankan informasi yang relevan. Tujuan utama dari analisis faktor adalah untuk menggambarkan potensi hubungan kovariat yang ada di antara berbagai variabel dalam kuantitas acak yang mendasar, yang disebut faktor. Analisis faktor sering dilihat sebagai perluasan dari analisis komponen utama, dengan keduanya bertujuan untuk mengestimasi matriks kovariansi kedua.
Analisis faktor memiliki banyak aplikasi yang luas, termasuk dalam bidang psikologi, ekonomi, ilmu sosial, dan lainnya. Dalam psikologi, misalnya, analisis faktor digunakan untuk mengidentifikasi faktor-faktor yang mendasari perilaku manusia, seperti faktor-faktor yang memengaruhi kepribadian atau preferensi. Di bidang ekonomi, analisis faktor dapat membantu dalam memahami faktor-faktor yang memengaruhi pertumbuhan ekonomi atau pola konsumsi.
2 ANALISIS YANG DIGUNAKAN
Analisis yang digunakan dalam penelitian ini adalah Analisis Faktor (FA) karena untuk mengetahui hubungan kovariat antar variabel. Pada data diketahui terdapat 7 variabel yang akan direduksi. Untuk pengujian Analisis Faktor, dilakukan input data kemudian menghapus data yang kosong. Selanjutnya, menghitung nilai korelasi. Setelah itu, dilakukan uji KMO dan uji bartlett untuk mengetahui korelasi antar variabel. Selanjutnya, mencari nilai eigen, analisis faktor, dan plot.
3 VARIABEL YANG DIGUNAKAN
3.1 Data
library(readxl)
datacar2 <- read_excel("D:/Tugas Kuliah/Semester 5/Analisis Multivariat I/datacar2.xlsx")
head(datacar2)## # A tibble: 6 × 7
## X1 X2 X3 X4 X5 X6 X7
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 18 8 307 130 3504 12 70
## 2 15 8 350 165 3693 11.5 70
## 3 18 8 318 150 3436 11 70
## 4 16 8 304 150 3433 12 70
## 5 17 8 302 140 3449 10.5 70
## 6 15 8 429 198 4341 10 70
3.2 Variabel
x1 = Konsumsi Bahan Bakar Mobil (miles/L)
x2 = Jumlah cylinder
x3 = Volume Ruang Bakar Mesin (cc)
x4 = Tenaga Mesin (HP)
x5 = Berat Kendaraan (lbs)
x6 = Akselerasi Kendaraan (miles/h)
x7 = Tahun Pembuatan
4 SOURCE KODE
4.2 Menghapus data yang kosong
## [1] "tbl_df" "tbl" "data.frame"
4.3 Menghitung Nilai Korelasi
## X1 X2 X3 X4 X5 X6
## X1 1.0000000 -0.89122751 -0.88700826 -0.834373540 -0.9268130 0.5938996
## X2 -0.8912275 1.00000000 0.95073750 0.859432138 0.9148844 -0.7060312
## X3 -0.8870083 0.95073750 1.00000000 0.918742859 0.9253786 -0.7668621
## X4 -0.8343735 0.85943214 0.91874286 1.000000000 0.8846208 -0.7674706
## X5 -0.9268130 0.91488439 0.92537857 0.884620758 1.0000000 -0.6276906
## X6 0.5938996 -0.70603121 -0.76686212 -0.767470618 -0.6276906 1.0000000
## X7 -0.1662831 0.06286599 0.06002543 -0.005604312 0.1696951 0.1137476
## X7
## X1 -0.166283113
## X2 0.062865989
## X3 0.060025430
## X4 -0.005604312
## X5 0.169695099
## X6 0.113747570
## X7 1.000000000
4.4 Uji KMO
kmo <- function(x){
x <- subset(x, complete.cases(x))
r <- cor(x)
r2 <- r^2
i <- solve(r)
d <- diag(i)
p2 <- (-i/sqrt(outer(d, d)))^2
diag(r2) <- diag(p2) <- 0
KMO <- sum(r2)/(sum(r2)+sum(p2))
MSA <- colSums(r2)/(colSums(r2)+colSums(p2))
return(list(KMO=KMO, MSA=MSA))
}
kmo(datacar2baru)## $KMO
## [1] 0.8790139
##
## $MSA
## X1 X2 X3 X4 X5 X6 X7
## 0.9284184 0.8795429 0.8619074 0.8835584 0.8724083 0.8852466 0.3473328
4.5 Uji Bartlett
uji_bart<-function(x){
method<-"Bartlett's test of sphericity"
data.name<-deparse(substitute(x))
x<-subset(x, complete.cases(x))
n<-nrow(x)
p<-ncol(x)
chisq<-(1-n+(2*p+5)/6)*log(det(cor(x)))
df<-p*(p-1)/2
p.value<-pchisq(chisq, df, lower.tail=FALSE)
names(chisq)<-"Khi-kuadrat"
names(df)<-"df"
return(structure(list(statistic=chisq,parameter=df, p.value=p.value,
method=method,data.name=data.name),class="htest"))
}
uji_bart(datacar2baru)##
## Bartlett's test of sphericity
##
## data: datacar2baru
## Khi-kuadrat = 922.36, df = 21, p-value < 2.2e-16
4.6 Menghitung Nilai Eigen
## [1] 5.17871248 1.08386539 0.41141422 0.13627379 0.10107375 0.05371478 0.03494558
4.7 Analisis Faktor
## Principal Components Analysis
## Call: principal(r = datacar2baru, nfactors = 2, rotate = "varimax",
## scores = T)
## Standardized loadings (pattern matrix) based upon correlation matrix
## RC1 RC2 h2 u2 com
## X1 -0.92 -0.19 0.88 0.116 1.1
## X2 0.96 0.05 0.92 0.080 1.0
## X3 0.98 0.02 0.96 0.038 1.0
## X4 0.95 -0.06 0.90 0.097 1.0
## X5 0.95 0.18 0.93 0.070 1.1
## X6 -0.80 0.27 0.71 0.287 1.2
## X7 0.04 0.97 0.95 0.050 1.0
##
## RC1 RC2
## SS loadings 5.17 1.09
## Proportion Var 0.74 0.16
## Cumulative Var 0.74 0.89
## Proportion Explained 0.83 0.17
## Cumulative Proportion 0.83 1.00
##
## Mean item complexity = 1.1
## Test of the hypothesis that 2 components are sufficient.
##
## The root mean square of the residuals (RMSR) is 0.04
## with the empirical chi square 8.1 with prob < 0.42
##
## Fit based upon off diagonal values = 1
5 HASIL DAN PEMBAHASAN
5.1 Hasil Uji KMO
Output:
## $KMO
## [1] 0.8790139
##
## $MSA
## X1 X2 X3 X4 X5 X6 X7
## 0.9284184 0.8795429 0.8619074 0.8835584 0.8724083 0.8852466 0.3473328
Berdasarkan uji KMO didapatkan nilai pada variabel X1, X2, X3, X4, X5, dan X6 yaitu lebih dari 0,5. Maka, variabel-variabel tersebut layak untuk dianalisis ke tahapan selanjutnya, sedangkan untuk X7 yang nilainya dibawah 0,5 tidak dilakukan analisis lanjut.
5.2 Hasil Uji Bartlett
Output:
##
## Bartlett's test of sphericity
##
## data: datacar2baru
## Khi-kuadrat = 922.36, df = 21, p-value < 2.2e-16
Berdasarkan output diatas, dengan uji Bartlett didapat nilai p dibawah 0.05 maka dapat dikatakan bahwa ada minimal 1 variabel yang berkorelasi.
5.3 Hasil Analisis Faktor
Output:
## Principal Components Analysis
## Call: principal(r = datacar2baru, nfactors = 2, rotate = "varimax",
## scores = T)
## Standardized loadings (pattern matrix) based upon correlation matrix
## RC1 RC2 h2 u2 com
## X1 -0.92 -0.19 0.88 0.116 1.1
## X2 0.96 0.05 0.92 0.080 1.0
## X3 0.98 0.02 0.96 0.038 1.0
## X4 0.95 -0.06 0.90 0.097 1.0
## X5 0.95 0.18 0.93 0.070 1.1
## X6 -0.80 0.27 0.71 0.287 1.2
## X7 0.04 0.97 0.95 0.050 1.0
##
## RC1 RC2
## SS loadings 5.17 1.09
## Proportion Var 0.74 0.16
## Cumulative Var 0.74 0.89
## Proportion Explained 0.83 0.17
## Cumulative Proportion 0.83 1.00
##
## Mean item complexity = 1.1
## Test of the hypothesis that 2 components are sufficient.
##
## The root mean square of the residuals (RMSR) is 0.04
## with the empirical chi square 8.1 with prob < 0.42
##
## Fit based upon off diagonal values = 1
Berdasarkan output diatas, komponen yang terbentuk ada dua. Proportion variance untuk RC1 sebesar 0.74, artinya factor pertama mampu menjelaskan variansi dari 7 variabel sebesar 74%. Kemudian, factor kedua (PC2) mampu menjelaskan variansi dari keseluruhan variabel yang diamati sebesar 16%.
6 KESIMPULAN
Dengan Analisis Faktor, dari 7 variabel Konsumsi Bahan Bakar Mobil, Jumlah cylinder, Volume Ruang Bakar Mesin, Tenaga Mesin, Berat Kendaraan, Akselerasi Kendaraan, dan Tahun Pembuatan, didapat 2 komponen yang terbentuk. Hasil tersebut juga dapat dilihat dari plot yang terbentuk dimana terdapat 2 komponen yang terbentuk karena titik mulai melandai ditunjukkan pada komponen ke 2.