Pada kesempatan kali dilakukan pengolahan data menggunakan metode analisis faktor dipergunakan untuk mereduksi data atau meringkas, dari variabel lama yang banyak diubah menjadi sedikit variabel baru yang disebut faktor, dan masih memuat sebagian besar informasi yang terkandung dalam variabel asli (Supranto, 2004). EFA mengasumsikan bahwa korelasi (kovariansi) antara variabel yang diamati dapat dijelaskan oleh sejumlah kecil variabel atau faktor.
library(readxl)
library(pastecs)
library(psych)
library(PerformanceAnalytics)
library(QuantPsyc)
library(faoutlier)
library(FactoMineR)
library(factoextra)
library(scatterplot3d)
Data yang digunakan dalam penelitian ini adalah data ordinal hasil survey penilaian fasilitas di Institut Teknologi Bandung oleh mahasiswa Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) tahun 2019 yang diperoleh dari Tracer Study ITB. Total data yang diolah adalah sebanyak 273 buah.
data <- read_excel("D:/SEMESTER 8/Analisis Multivariat/DataFix.xlsx")
data$`Program Studi`=NULL
#Hilangkan kolom program studi karena tidak digunakan
head(data)
Data terdiri dari 10 variabel yang masing-masing variabel secara berurutan menyatakan perpustakaan, teknologi informasi dan komunikasi, pusat bahasa, fasilitas olahraga, laboratorium/studio/workshop, kondisi dan sistem keamanan serta keselamatan, kondisi serta fasilitas toilet dan sanitari lainnya; kantin, koperasi, dan saran perbelanjaan; pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi, dan fasilitas layanan kesehatan. Penilaian berupa sekala satu sampai lima. Skala satu menyatakan fasilitas sangat buruk. Sedangkan skala lima menyatakan fasilitas sangat bagus. Masing-masing variabel berjumlah 2382 buah.
#Menampilkan sari data
stat.desc(data)
Perpustakaan memiliki penilaian yang paling tinggi dibandingkan fasilitas lainnya. Sedangkan, kondisi serta fasilitas toilet dan sanitari lainnya memiliki penilaian yang paling rendah dibandingkan fasilitas lainnya dan bersama pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi serta fasilitas layanan kesehatan memiliki nilai tengah di skala tiga yang artinya penilaian skala 1-3 pada sarana dan prasarana tersebut cukup banyak. Masing-masing variabel memiliki sebaran data yang hampir sama. Selain itu, distribusi tiap variabel memiliki skewness negatif dan kurtosis yang berada disekitar nol sehingga tiap variabel dapat dikatakan tidak berdistribusi normal.
Korelasi yang digunakan adalah korelasi Kendall.
pairs.panels(data,
smooth = FALSE,
density = FALSE,
ellipses = FALSE,
method = "kendall",
pch = 21,
lm = FALSE,
cor = TRUE,
jiggle = FALSE,
factor = 2,
hist.col = 4,
stars = TRUE,
ci = TRUE)
Perpustakaan dan teknologi informasi dan komunikasi memiliki korelasi yang paling besar. Sedangkan korelasi antara perpustakaan dengan toilet dan sanitari kainnya memiliki korelasi yang paling kecil.
Perhatikan antara variabel 1 dan 2 memiliki korelasi yang cukup besar. Karena variabel 1 dan 7 memiliki korelasi yang paling rendah maka variabel 1 dihilangkan dan dipilih variabel 2 yaitu teknologi informasi dan komunikasi yang dapat mewakilkan variabel 1 yaitu perpustakaan karena korelasi keduanya yang cukup besar.
Maka dilakukan reduksi variabel dengan menghilangkan variabel perpustakaan.
data$Perpustakaan=NULL
pairs.panels(data,
smooth = FALSE,
density = FALSE,
ellipses = FALSE,
method = "kendall",
pch = 21,
lm = FALSE,
cor = TRUE,
jiggle = FALSE,
factor = 2,
hist.col = 4,
stars = TRUE,
ci = TRUE)
Setelah menyeleksi 10 variabel menjadi 9 variabel, kemudian dilakukan hal yang sama yaitu dilihat korelasi terendah. Diperoleh variabel 7 yaitu fasilitas toilet dan sanitari lainnya memiliki korelasi yang rendah dengan variabel lainnya. Namun, antara variabel 7 dan 8 memiliki korelasi yang cukup besar sehingga variabel 7 bisa dihilangkan dan variabel 8 dapat mewakilkan variabel 7 karena korelasi keduanya yang cukup besar.
Sehingga dilakukan reduksi variabel dengan menghilangkan variabel toilet dan sanitari lainnya.
data$`Kondisi serta fasilitas toilet dan sanitari lainnya`=NULL
pairs.panels(data,
smooth = FALSE,
density = FALSE,
ellipses = FALSE,
method = "kendall",
pch = 21,
lm = FALSE,
cor = TRUE,
jiggle = FALSE,
factor = 2,
hist.col = 4,
stars = TRUE,
ci = TRUE)
Dilakukan hal yang sama, diperoleh variabel 8 yaitu kantin, koperasi, dan saran perbelanjaan memiliki memiliki korelasi yang rendah dengan variabel lainnya. Namun, antara variabel 8 dan 9 memiliki korelasi yang cukup besar dibanding dengan variabel lainnya sehingga variabel 8 dihilangkan dan variabel 9 dapat mewakilkan variabel 8 karena korelasi keduanya yang cukup besar.
Sehingga dilakukan reduksi variabel dengan menghilangkan variabel kantin, koperasi, sarana belanja. Gambarkan lagi plot seperti di atas.
data$`Kantin, koperasi dan sarana perbelanjaan di dalam kampus`=NULL
#pairs.panels(data, smooth = FALSE, density = FALSE, ellipses = FALSE, method = "kendall", pch = 21, lm = FALSE, cor = TRUE, jiggle = FALSE, factor = 2, hist.col = 4, stars = TRUE, ci = TRUE)
Dengan demikian, tersisa 7 variabel yang antara variabel tersebut memiliki korelasi yang cukup untuk selanjutnya dianalisis menggunakan analisis faktor.
Membuat matriks korelasi dan membuatnya dalam bentuk data frame
res <- cor(data)
data.frame(round(res, 3))
Uji KMO untuk melihat apakah matriks korelasi yang dibuat memperhitungkan kecukupan sampel. Nilai KMO berada pada rentang 0 sampai 1. Rekomendasi minimum untuk nilai KMO adalah 0.6.
KMO(data)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = data)
## Overall MSA = 0.87
## MSA for each item =
## Teknologi informasi dan komunikasi
## 0.84
## Pusat bahasa
## 0.83
## Fasilitas olahraga
## 0.90
## Laboratorium/studio/workshop
## 0.90
## Kondisi dan sistem keamanan serta keselamatan
## 0.90
## Pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi
## 0.88
## Fasilitas layanan kesehatan
## 0.89
prin=princomp(data)
summary(prin)
## Importance of components:
## Comp.1 Comp.2 Comp.3 Comp.4 Comp.5
## Standard deviation 1.8061308 0.8242277 0.77571924 0.69263168 0.68024051
## Proportion of Variance 0.5269638 0.1097430 0.09720565 0.07749739 0.07474934
## Cumulative Proportion 0.5269638 0.6367068 0.73391248 0.81140987 0.88615921
## Comp.6 Comp.7
## Standard deviation 0.65462798 0.52552871
## Proportion of Variance 0.06922636 0.04461442
## Cumulative Proportion 0.95538558 1.00000000
pca = PCA(data)
fviz_eig(pca,addlabels = TRUE)
Perhatikan bahwa variabilitas dari data yang dapat dijelaskan oleh faktor pertama adalah sebesar 52,7%, oleh faktor kedua adalah sebesar 10,9% dan oleh faktor ketiga adalah sebesar 9,4%. Dari proporsi variansi tersebut, dipilih banyaknya faktor adalah 3. Dengan mengekstraksi variabel-variabel awal menjadi 3 faktor telah menghasilkan variansi total kumulatif yang cukup besar yaitu sekitar 73%. Artinya dari 3 faktor yang terbentuk sudah dapat mewakili 7 variabel fasilitas di kampus ITB yang menjelaskan kira-kira sebesar 73% kenyamanan mahasiswa.
fa_1 <- factanal(data, factors = 3)
fa_1
##
## Call:
## factanal(x = data, factors = 3)
##
## Uniquenesses:
## Teknologi informasi dan komunikasi
## 0.479
## Pusat bahasa
## 0.062
## Fasilitas olahraga
## 0.599
## Laboratorium/studio/workshop
## 0.281
## Kondisi dan sistem keamanan serta keselamatan
## 0.597
## Pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi
## 0.466
## Fasilitas layanan kesehatan
## 0.488
##
## Loadings:
## Factor1
## Teknologi informasi dan komunikasi 0.538
## Pusat bahasa 0.911
## Fasilitas olahraga 0.400
## Laboratorium/studio/workshop 0.247
## Kondisi dan sistem keamanan serta keselamatan 0.241
## Pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi 0.205
## Fasilitas layanan kesehatan 0.273
## Factor2
## Teknologi informasi dan komunikasi 0.343
## Pusat bahasa 0.265
## Fasilitas olahraga 0.388
## Laboratorium/studio/workshop 0.287
## Kondisi dan sistem keamanan serta keselamatan 0.456
## Pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi 0.646
## Fasilitas layanan kesehatan 0.641
## Factor3
## Teknologi informasi dan komunikasi 0.337
## Pusat bahasa 0.196
## Fasilitas olahraga 0.301
## Laboratorium/studio/workshop 0.759
## Kondisi dan sistem keamanan serta keselamatan 0.370
## Pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi 0.273
## Fasilitas layanan kesehatan 0.165
##
## Factor1 Factor2 Factor3
## SS loadings 1.514 1.457 1.057
## Proportion Var 0.216 0.208 0.151
## Cumulative Var 0.216 0.424 0.575
##
## Test of the hypothesis that 3 factors are sufficient.
## The chi square statistic is 4.88 on 3 degrees of freedom.
## The p-value is 0.181
Uniqueness ini bernilai antara 0 hingga 1. Uniqueness terkadang dianggap sebagai noise atau keacakan. Nilai uniqueness yang tinggi berarti faktor β faktor yang dibentuk tidak dapat menjelaskan variabilitasnya dengan baik.
Kemudian untuk taksiran loadings setiap factor tersebut sudah dengan hasil rotasinya. Proses perotasian bertujuan untuk mendapatkan faktor-faktor dengan factor loading yang cukup jelas untuk diinterpretasi. Loadings inilah yang menunjukkan besar korelasi antara suatu variabel dengan faktor 1, faktor 2, dan faktor 3. Proses penentuan variabel yang akan dimasukkan ke faktor yang mana, dilakukan dengan melakukan perbandingan besar korelasi setiap baris.
Kolom SS Loadings memberikan nilai jumlah kuadrat dari loadings. Nilai SS Loadings ini dapat menentukan apakah faktor layak dipertahankan atau tidak. Suatu faktor dikatakan layak dipertahankan apabila nilai SS Loadings lebih dari satu (Kaiser Ruleβs).
Selanjutnya diperoleh nilai πβπ£πππ’π yang diperoleh dari statistik tersebut adalah 0.181. Hipotesis nol dari uji ini adalah Data cukup dimodelkan dengan 3 faktor. Karena πβπ£πππ’π>πΌ=0.05, maka π»0 tidak ditolak. Artinya, 3 faktor cukup untuk menggambarkan data.
z=data.frame(factor1=fa_1$loadings[,1],
factor2=fa_1$loadings[,2],
factor3=fa_1$loadings[,3],
helper=c("Y2","Y3","Y4","Y5","Y6","Y9","Y10"))
zz=scatterplot3d(z$factor1,z$factor2,z$factor3, main="Plot Loadings Faktor",pch = 16, color="steelblue",xlab = "Faktor 1",
ylab = "Faktor 2",
zlab = "Faktor 3")
zz.coords <- zz$xyz.convert(z$factor1,z$factor2,z$factor3)
text(zz.coords$x,
zz.coords$y,
labels = z$helper,
cex = .5,
pos = 4)
Terlihat bahwa variabel Y2, Y3, dan Y4, yaitu teknologi informasi dan komunikasi, pusat bahasa, dan fasilitas olahraga berada dalam satu faktor yang sama. Variabel Y6, Y9, Y10 yaitu kondisi dan sistem keamanan serta keselamatan, pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi, dan fasilitas layanan kesehatan berada dalam satu faktor lain yang sama. Di sisi lain, variabel Y5, yaitu laboratorium/ studio/ workshop berada di dalam faktor yang berbeda dengan variabel lainnya.
Hasil penilaian sarana dan prasarana kampus ITB oleh alumni mahasiswa Fakultas Matematika dan Ilmu Pengetahuan Alam (FMIPA) yang diperoleh dari Tracer Study ITB Tahun 2019 tergolong cukup baik. Hal ini dapat dilihat dari 10 pertanyaan memiliki rataan penilaian sekitar 3-4 yang artinya kenyamanan mahasiswa ITB terhadap sarana dan prasarana, sudah cukup baik. Perpustakaan memiliki penilaian yang paling tinggi dibandingkan fasilitas lainnya. Sedangkan, untuk kondisi serta fasilitas toilet dan sanitari lainnya memiliki penilaian yang paling rendah dibandingkan fasilitas lainnya.
Hasil dari analisis menggunakan analisis faktor diperoleh tiga faktor yang mempengaruhi kenyamanan mahasiswa terhadap sarana dan prasarana di Kampus ITB. Faktor-faktor tersebut adalah: a. Faktor Kebutuhan Primer : Anggota faktor kebutuhan primer adalah variabel laboratorium/studio/workshop. b. Faktor Kebutuhan Sekunder : Perpustakaan, teknologi informasi dan komunikasi, pusat bahasa, dan fasilitas olahraga. c.Β Faktor Kebutuhan Tersier : Sistem keamanan serta keselamatan, kondisi serta fasilitas toilet dan sanitari lainnya; kantin, koperasi, dan saran perbelanjaan; pusat kegiatan mahasiswa beserta fasilitasnya dan ruang rekreasi, dan fasilitas layanan kesehatan.