Kesehatan sebagai indikator kualitas hidup penduduk. Indikator-indikator kesehatan dan morbiditas merujuk pada kelompok mental orang sehat dan sakit. Hal ini mewajibkan kita untuk mendekati karakterisasi gaya hidup seseorang tidak hanya dari posisi biologis, tetapi juga dari posisi medis dan sosial. Faktor-faktor sosial ditentukan oleh struktur sosial-ekonomi masyarakat, peningkatan pendidikan, budaya, produksi kualitas personal antar individu, tradisi, adat istiadat, hubungan keluarga, dan karakteristik. Sebagian besar faktor, bersama dengan kualitas vital higienis, termasuk dalam konsep umum “gaya hidup”, bagian dari penelitian yang membentuk lebih dari 50% dari semua faktor. Karakteristik biologis seseorang (jenis kelamin, usia, keturunan, konstitusi, temperamen, kemampuan adaptasi, dll.) ditemukan dalam total dampak terhadap kesehatan tidak lebih dari 20%. Baik faktor sosial maupun biologis memengaruhi seseorang dalam kondisi lingkungan tertentu, tingkat cakupannya berkisar dari 18 hingga 22%. Hanya sebagian kecil (8-10%) dari indikator kesehatan. Oleh karena itu, kesehatan manusia adalah kesatuan harmonis dari karakteristik biologis dan sosial yang disebabkan oleh sifat biologis bawaan dan yang diperoleh, dan mencakup penyakit, pelanggaran terhadap harmoni ini.
Kesehatan sebagai indikator sintetis kualitas dan standar hidup. Pada saat yang sama, sesuai dengan penyajian Organisasi Kesehatan Dunia, kategori kesehatan mencakup kategori kesehatan fisik, mental, spiritual, dan kesehatan masyarakat. Kualitas penting dari kesehatan sebagai elemen kualitas adalah tingkat penentuan diri perilaku, yaitu, sikap bertanggung jawab terhadap pemeliharaan dan terjadinya kesehatan seseorang. Dalam arti ini, kesehatan sebagai sumber daya manusia yang nyata, dapat dikelola dengan berbagai cara oleh individu dengan hasil yang berbeda.
Berdasarkan penjelasan latar belakang, dapat dirumuskan pertanyaan masalah sebagai berikut :
Mengidentifikasi faktor-faktor yang memiliki dampak signifikan terhadap gaya hidup sehat di lingkungan perkotaan.
Menganalisis faktor mana yang memiliki pengaruh paling besar dalam membentuk gaya hidup sehat di lingkungan tersebut.
Analisis faktor adalah pendekatan yang digunakan untuk mengenali faktor-faktor yang dapat menjelaskan hubungan atau korelasi antara berbagai indikator independen yang diamati. Dalam konteks ini, analisis faktor dapat dianggap sebagai pengembangan dari analisis komponen utama. Metode ini juga bermanfaat untuk mengidentifikasi sejumlah faktor yang relatif kecil namun dapat menjelaskan sejumlah besar variabel yang saling terhubung.
Selain itu, Analisis Faktor juga berperan sebagai alat analisis statistik yang berguna untuk mereduksi faktor-faktor yang memengaruhi suatu variabel menjadi serangkaian indikator, tanpa kehilangan informasi yang signifikan. Analisis faktor digunakan untuk menyederhanakan data dengan mereduksi variabel yang banyak menjadi sedikit faktor baru. Faktor-faktor ini tetap memuat sebagian besar informasi yang terkandung dalam variabel asli (Supranto, 2004).
Analisis faktor dapat dibagi menjadi dua kategori utama, yaitu analisis faktor eksplorasi dan analisis faktor konfirmatori.
Analisis faktor eksplorasi digunakan ketika kita tidak memiliki pengetahuan awal tentang struktur data penelitian atau jumlah dimensi yang terlibat dalam satu set variabel. Sebaliknya, analisis faktor konfirmatori digunakan untuk verifikasi ketika kita telah memiliki pemahaman khusus tentang struktur data atau jumlah dimensi dalam variabel yang diamati.
Dari penjelasan tersebut, dapat disadari bahwa analisis faktor pada umumnya bertujuan untuk eksplorasi dan deskripsi, melibatkan banyak penilaian subjektif. Alat ini sangat umum digunakan, tetapi seringkali kontroversial karena fleksibilitas model, metode, dan subjektivitasnya, yang dapat menyebabkan perdebatan interpretatif.
Meskipun mirip dengan Principal Component Analysis (PCA), analisis faktor dianggap lebih kompleks. Sebaliknya dengan PCA, dalam analisis faktor, variabel yang diamati dimodelkan sebagai fungsi linier dari “faktor”. Sebaliknya, dalam PCA, variabel baru dibuat sebagai kombinasi linier dari variabel yang diamati.
Tujuan dari analisis data adalah untuk mengurangi jumlah variabel awal yang cukup banyak menjadi sejumlah variabel baru yang lebih sedikit, yang sering disebut sebagai faktor, variabel laten, konstruk, atau variabel bentukan. Selain itu, tujuan lainnya adalah mengidentifikasi hubungan antara variabel penyusun faktor atau dimensi dengan faktor yang terbentuk, menggunakan uji koefisien korelasi antar faktor dan komponen pembentuknya, yang dikenal sebagai analisis faktor konfirmatori.
Analisis faktor juga bertujuan untuk menguji validitas dan reliabilitas instrumen melalui analisis faktor konfirmatori. Selain itu, analisis faktor digunakan untuk melakukan validasi data guna menentukan apakah hasil analisis faktor dapat diterapkan secara umum ke dalam populasi, sehingga setelah terbentuk faktor, peneliti dapat menyusun hipotesis baru berdasarkan hasil analisis tersebut.
Analisis Komponen Utama (Principal Component Analysis) adalah analisis multivariate yang mentransformasi variabel-variabel asal yang saling berkorelasi menjadi variabel-variabel baru yang tidak saling berkorelasi dengan mereduksi sejumlah variabel tersebut sehingga mempunyai dimensi yang lebih kecil namun dapat menerangkan sebagian besar keragaman variabel aslinya.
Banyaknya komponen utama yang terbentuk sama dengan banyaknya variabel asli. Pereduksian (penyederhanaan) dimensi dilakukan dengan kriteria persentase keragaman data yang diterangkan oleh beberapa komponen utama pertama. Apabila beberapa komponen utama pertama telah menerangkan lebih dari 75% keragaman data asli, maka analisis cukup dilakukan sampai dengan komponen utama tersebut.
Keunggulan dari algoritma PCA dapat diuraikan sebagai berikut:
Pengurangan Dimensi: PCA merupakan teknik yang sering digunakan untuk mengurangi dimensi, suatu proses untuk mengurangi jumlah variabel dalam suatu dataset. Dengan melakukan pengurangan variabel, PCA menyederhanakan analisis data, meningkatkan kinerja, dan mempermudah visualisasi data.
Seleksi Fitur: PCA dapat dimanfaatkan untuk seleksi fitur, suatu proses pemilihan variabel yang paling signifikan dalam suatu dataset. Ini bermanfaat terutama dalam machine learning di mana jumlah variabel bisa sangat besar dan sulit untuk mengidentifikasi variabel yang paling penting.
Visualisasi Data: PCA dapat digunakan untuk visualisasi data dengan mengurangi jumlah variabel. Ini memungkinkan pemetaan data berdimensi tinggi menjadi dua atau tiga dimensi, mempermudah interpretasi dan pemahaman pola dalam data.
Penanganan Multikolinearitas: PCA dapat diaplikasikan untuk mengatasi masalah multikolinearitas, sebuah masalah umum dalam analisis regresi di mana dua atau lebih variabel independen memiliki korelasi tinggi. PCA membantu mengidentifikasi struktur dasar dalam data dan menciptakan variabel baru yang tidak saling berkorelasi untuk digunakan dalam model regresi.
Pengurangan Noise: PCA dapat digunakan untuk mengurangi noise dalam data dengan menghapus komponen utama yang memiliki varian rendah, diasumsikan sebagai noise. Dengan demikian, PCA dapat meningkatkan rasio sinyal-ke-noise dan memfasilitasi identifikasi struktur mendasar dalam data.
Kompresi Data: PCA dapat digunakan untuk kompresi data dengan merepresentasikan data menggunakan jumlah komponen utama yang lebih sedikit namun tetap mencakup sebagian besar variasi dalam data. Hal ini dapat mengurangi kebutuhan penyimpanan data dan mempercepat proses pemrosesan.
Secara sederhana, prinsip kerja analisis komponen utama melibatkan lima langkah utama. Tahap awal adalah standarisasi di mana semua variabel disetarakan secara standar, memastikan kontribusi yang setara dari setiap variabel dalam analisis.
Langkah berikutnya melibatkan perhitungan matriks kovarians, yang memberikan wawasan tentang hubungan antar variabel dalam kumpulan data input. Selanjutnya, dilakukan perhitungan nilai dan vektor eigen dari matriks kovarians. Langkah ini bertujuan untuk membantu peneliti mengidentifikasi komponen utama.
Proses analisis dilanjutkan dengan mengevaluasi vektor fitur. Dengan menghitung nilai dan vektor eigen, peneliti dapat menentukan komponen mana yang kurang signifikan dan dapat dihapus (komponen dengan nilai eigen rendah). Matriks vektor yang tersisa disebut vektor fitur. Analisis kemudian diakhiri dengan transformasi di sepanjang sumbu komponen utama.
library(PerformanceAnalytics)
## Warning: package 'PerformanceAnalytics' was built under R version 4.2.3
## Loading required package: xts
## Warning: package 'xts' was built under R version 4.2.3
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Attaching package: 'PerformanceAnalytics'
## The following object is masked from 'package:graphics':
##
## legend
Paket “PerformanceAnalytics” dalam R adalah salah satu alat yang berguna untuk melakukan analisis kinerja keuangan dan portofolio.
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
Paket “readxl” dalam R adalah suatu library yang digunakan untuk membaca data dari file Excel (XLSX dan XLS) ke dalam R.
library(MVN)
## Warning: package 'MVN' was built under R version 4.2.3
paket MVN digunakan untuk sarana untuk melakukan uji normalitas dan homogenitas pada data multivariat.
library(sandwich)
## Warning: package 'sandwich' was built under R version 4.2.3
Paket ini digunakan untuk mendapatkan estimasi standar yang lebih konsisten dalam konteks model regresi dengan asumsi yang tidak terpenuhi sepenuhnya.
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.3
## corrplot 0.92 loaded
Paket ini digunakan untuk membuat matriks plot korelasi dengan berbagai opsi untuk menyesuaikan penampilan grafik.
library(psych)
## Warning: package 'psych' was built under R version 4.2.3
Paket ini menyediakan alat-alat untuk analisis psikometri dan eksplorasi data psikologis.
Data
Informasi mengenai data yang digunakan diperoleh dari 44 responden dan melibatkan 10 variabel. Variabel-variabel ini mencerminkan indikator-indikator terkait gaya hidup sehat di lingkungan perkotaan. Sumber data ini berasal dari Kaggle.com, yang merupakan platform penyedia data dan dalam konteks ini memberikan data untuk keperluan mengidentifikasi faktor-faktor yang memengaruhi gaya hidup sehat dalam kehidupan di kota. Berikut adalah penjelasan mengenai masing-masing variabel yang terlibat.
X1 : Lama hari yang mendapat sinar matahari ditentukan oleh posisi lintang, bujur harian, dan jumlah awan pada suatu kota. (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota)
X2 : Informasi tentang biaya atau harga satu botol air di suatu kota. (Dalam satuan Euro)
X3 : Informasi yang disediakan berkaitan dengan tingkat lemak tubuh yang berlebihan, yang memiliki potensi merugikan kesehatan individu. (Tingkat obesitas di suatu negara dalam satuan persen)
X4 : Perkiraan mengenai rata-rata umur hidup yang diharapkan, berdasarkan asumsi bahwa tingkat kematian pada setiap kelompok usia akan tetap konsisten dengan tingkat yang ada pada tahun tertentu yang sedang dijadikan pertimbangan(Harapan hidup di suatu negara, diukur dalam tahun)
X5 : Skor indeks polusi memberikan gambaran umum tentang tingkat polusi udara di kota, dan peningkatannya bisa dipicu oleh berbagai faktor, termasuk aktivitas lalu lintas dan kebakaran.(Skor indeks polusi di suatu kota)
X6 : Durasi kerja di berbagai negara dipengaruhi oleh kondisi ekonomi, sosial, dan masyarakat yang beragam. Tingkat signifikansi pekerjaan paruh waktu juga menjadi faktor kunci, terutama dengan kecenderungan frekuensi yang lebih rendah di negara-negara berkembang. (Rata-rata jam kerja tahunan, dengan “Aug.” sebagai singkatan dari Agustus.)
X7 : Indeks yang mencerminkan kesejahteraan masyarakat dan kondisi lingkungan di berbagai negara di dunia. (Tingkat kebahagiaan di suatu negara)
X8 : Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Jumlah ini dapat mempengaruhi preferensi makanan dan gaya hidup penduduk kota dalam hal mengonsumsi makanan di luar rumah.
X9 : Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro)
X10 : Kesejahteraan masyarakat dan keadaan lingkungan di berbagai negara di dunia. (Tingkat kebahagiaan di suatu negara)
data_anmul<-read_excel("C:/Users/ACER/Downloads/ANMUL/data_anmul.xlsx")
datamul<-data.frame(data_anmul)
datamul
## X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
## 1 1858 1.92 0.204 81.2 30.93 1434 422 1048 34.90 7.44
## 2 2636 1.48 0.290 82.1 26.86 1712 406 1103 41.66 7.22
## 3 1884 1.94 0.201 81.0 17.33 1501 132 1008 25.74 7.29
## 4 1821 1.72 0.206 81.8 19.63 1452 129 598 37.31 7.35
## 5 1630 2.19 0.197 79.8 21.24 1380 154 523 32.53 7.64
## 6 1662 1.60 0.222 80.4 13.08 1540 113 309 35.23 7.80
## 7 2769 0.78 0.043 83.2 0.00 1644 35 539 55.87 5.87
## 8 1626 1.55 0.223 80.6 39.41 1386 254 1729 26.11 7.07
## 9 2591 1.19 0.238 82.2 65.19 1686 585 2344 37.80 6.40
## 10 1938 1.08 0.294 81.7 24.26 1670 218 788 31.04 7.23
## 11 2363 1.57 0.290 82.1 25.90 1712 243 813 36.89 7.22
## 12 2671 0.26 0.062 75.4 85.43 0 223 261 38.62 5.12
## 13 2624 0.22 0.100 74.1 76.64 0 377 1796 50.03 5.99
## 14 2525 0.57 0.283 75.9 52.64 0 246 1435 22.45 5.97
## 15 2066 1.09 0.294 81.7 37.83 1670 174 1656 32.64 7.23
## 16 2769 1.30 0.238 82.2 52.68 1686 216 2491 34.54 6.40
## 17 2983 0.21 0.069 68.5 84.39 0 114 833 29.94 5.28
## 18 2066 0.59 0.047 81.3 57.82 1967 144 389 43.03 5.87
## 19 1662 1.95 0.223 80.6 37.78 1386 23 551 39.01 7.07
## 20 0 2.62 0.195 82.6 27.25 1557 44 444 70.00 7.56
## 21 3311 1.63 0.261 81.9 47.28 1898 139 420 58.31 7.12
## 22 2218 0.15 0.321 74.7 69.49 1832 419 934 16.97 5.13
## 23 3542 0.16 0.320 70.7 91.74 0 323 250 23.25 4.15
## 24 1405 0.57 0.062 75.4 49.32 0 134 717 34.76 5.12
## 25 3254 1.52 0.362 78.8 66.07 1779 223 1439 32.00 6.94
## 26 2584 0.15 0.039 67.3 82.84 0 187 1183 19.54 3.57
## 27 2634 1.39 0.362 78.8 27.03 1779 88 588 46.27 6.94
## 28 1453 1.40 0.253 80.5 40.07 1772 159 659 37.35 7.09
## 29 1877 0.76 0.043 83.2 42.84 1644 387 5802 70.82 5.87
## 30 2508 1.20 0.362 78.8 43.33 1779 171 1320 41.14 6.94
## 31 1836 0.75 0.062 75.4 67.46 0 277 1257 57.95 5.51
## 32 1776 0.29 0.062 75.4 77.40 0 108 346 44.68 5.12
## 33 1546 2.11 0.221 80.4 62.67 1583 55 988 25.34 6.86
## 34 3062 1.60 0.362 78.8 47.36 1779 242 1031 65.13 6.94
## 35 1662 1.95 0.216 81.8 65.10 1505 331 4363 35.93 6.66
## 36 2003 0.44 0.221 73.9 79.78 0 158 3355 16.07 6.37
## 37 1566 3.20 0.195 82.6 17.31 1557 69 538 73.11 7.56
## 38 1633 1.16 0.278 80.4 58.91 1538 433 6417 42.71 7.16
## 39 3124 0.59 0.283 56.3 61.83 0 194 492 24.28 4.81
## 40 1915 1.15 0.199 82.7 67.19 1718 110 2396 53.49 6.38
## 41 2528 1.45 0.362 78.8 39.18 1779 83 744 65.99 6.94
## 42 2535 1.32 0.362 78.8 57.36 1779 359 3081 64.66 6.94
## 43 1901 0.41 0.231 69.5 57.63 1965 322 3206 31.40 5.54
## 44 2555 0.45 0.289 76.4 82.78 2137 192 1313 41.99 6.46
View(datamul)
summary(datamul)
## X1 X2 X3 X4
## Min. : 0 Min. :0.150 Min. :0.0390 Min. :56.30
## 1st Qu.:1748 1st Qu.:0.570 1st Qu.:0.1950 1st Qu.:75.40
## Median :2066 Median :1.195 Median :0.2230 Median :80.40
## Mean :2195 Mean :1.173 Mean :0.2192 Mean :78.17
## 3rd Qu.:2626 3rd Qu.:1.600 3rd Qu.:0.2900 3rd Qu.:81.80
## Max. :3542 Max. :3.200 Max. :0.3620 Max. :83.20
## X5 X6 X7 X8 X9
## Min. : 0.00 Min. : 0 Min. : 23.0 Min. : 250 Min. :16.07
## 1st Qu.:30.01 1st Qu.:1035 1st Qu.:125.2 1st Qu.: 548 1st Qu.:31.31
## Median :50.98 Median :1570 Median :189.5 Median : 998 Median :37.33
## Mean :49.96 Mean :1255 Mean :214.0 Mean :1443 Mean :40.42
## 3rd Qu.:66.35 3rd Qu.:1774 3rd Qu.:288.2 3rd Qu.:1674 3rd Qu.:47.21
## Max. :91.74 Max. :2137 Max. :585.0 Max. :6417 Max. :73.11
## X10
## Min. :3.570
## 1st Qu.:5.870
## Median :6.900
## Mean :6.435
## 3rd Qu.:7.175
## Max. :7.800
Berdasarkan analisis pemusatan dan penyebaran data, dapat disimpulkan bahwa variabel X10, yang mencerminkan Kesejahteraan Masyarakat dan Keadaan Lingkungan di berbagai negara di dunia (tingkat kebahagiaan suatu negara), memperoleh penilaian tertinggi dibandingkan dengan variabel lainnya. Sebaliknya, variabel X3, yang menggambarkan Informasi yang disediakan tentang tingkat lemak tubuh yang berlebihan dan berpotensi merugikan kesehatan individu (tingkat obesitas di suatu negara dalam persentase), menunjukkan nilai terendah dibandingkan dengan variabel lainnya. Setiap variabel menunjukkan sebaran data yang hampir seragam, dan masing-masing distribusi variabel memiliki skewness yang berbeda, terlihat dari arah kemiringan data, baik positif maupun negatif.
xdatamul<-data.frame(scale(datamul[,1:10]))
xdatamul
## X1 X2 X3 X4 X5 X6
## 1 -0.51418507 1.03889136 -0.14957330 0.5702845 -0.82978188 0.2394195
## 2 0.67350612 0.42662540 0.69392203 0.7399560 -1.00724544 0.6105955
## 3 -0.47449359 1.06672163 -0.17899756 0.5325798 -1.42278052 0.3288756
## 4 -0.57066910 0.76058865 -0.12995713 0.6833988 -1.32249398 0.2634524
## 5 -0.86224881 1.41460002 -0.21822990 0.3063512 -1.25229341 0.1673205
## 6 -0.81339776 0.59360703 0.02697223 0.4194655 -1.60809259 0.3809470
## 7 0.87654330 -0.54743408 -1.72867502 0.9473322 -2.17841775 0.5198042
## 8 -0.86835520 0.52403135 0.03678032 0.4571703 -0.46002979 0.1753315
## 9 0.60480932 0.02308647 0.18390160 0.7588084 0.66405145 0.5758812
## 10 -0.39205744 -0.12998001 0.73315437 0.6645464 -1.12061283 0.5545185
## 11 0.25674558 0.55186162 0.69392203 0.7399560 -1.04910417 0.6105955
## 12 0.72693695 -1.27102112 -1.54232140 -0.5231536 1.54657295 -1.6752079
## 13 0.65518697 -1.32668166 -1.16961416 -0.7682345 1.16330397 -1.6752079
## 14 0.50405403 -0.83965192 0.62526543 -0.4288917 0.11683579 -1.6752079
## 15 -0.19665324 -0.11606488 0.73315437 0.6645464 -0.52892228 0.5545185
## 16 0.87654330 0.17615296 0.18390160 0.7588084 0.11857991 0.5758812
## 17 1.20323470 -1.34059680 -1.47366481 -1.8239679 1.50122599 -1.6752079
## 18 -0.19665324 -0.81182165 -1.68944268 0.5891369 0.34269851 0.9510627
## 19 -0.81339776 1.08063677 0.03678032 0.4571703 -0.53110242 0.1753315
## 20 -3.35059925 2.01295084 -0.23784607 0.8342179 -0.99024033 0.4036448
## 21 1.70395798 0.63535243 0.40948756 0.7022512 -0.11687543 0.8589363
## 22 0.03538926 -1.42408761 0.99797267 -0.6551203 0.85154366 0.7708153
## 23 2.05660151 -1.41017247 0.98816459 -1.4092155 1.82170687 -1.6752079
## 24 -1.20573277 -0.83965192 -1.54232140 -0.5231536 -0.02792564 -1.6752079
## 25 1.61694205 0.48228594 1.40010417 0.1178274 0.70242195 0.7000516
## 26 0.59412316 -1.42408761 -1.76790736 -2.0501965 1.43364159 -1.6752079
## 27 0.67045292 0.30138918 1.40010417 0.1178274 -0.99983296 0.7000516
## 28 -1.13245619 0.31530432 0.33102288 0.4383179 -0.43125192 0.6907054
## 29 -0.48517976 -0.57526435 -1.72867502 0.9473322 -0.31047205 0.5198042
## 30 0.47810191 0.03700161 1.40010417 0.1178274 -0.28910665 0.7000516
## 31 -0.54777017 -0.58917948 -1.54232140 -0.5231536 0.76302990 -1.6752079
## 32 -0.63936589 -1.22927571 -1.54232140 -0.5231536 1.19644213 -1.6752079
## 33 -0.99048282 1.30327893 0.01716415 0.4194655 0.55417229 0.4383591
## 34 1.32383574 0.59360703 1.40010417 0.1178274 -0.11338721 0.7000516
## 35 -0.81339776 1.08063677 -0.03187628 0.6833988 0.66012719 0.3342162
## 36 -0.29282875 -1.02054868 0.01716415 -0.8059393 1.30021689 -1.6752079
## 37 -0.95995092 2.82002869 -0.23784607 0.8342179 -1.42365257 0.4036448
## 38 -0.85766903 -0.01865893 0.57622501 0.4194655 0.39022561 0.3782767
## 39 1.41848465 -0.81182165 0.62526543 -4.1239585 0.51754590 -1.6752079
## 40 -0.42716914 -0.03257407 -0.19861373 0.8530703 0.75125713 0.6186065
## 41 0.50863382 0.38488000 1.40010417 0.1178274 -0.47005844 0.7000516
## 42 0.51931998 0.20398324 1.40010417 0.1178274 0.32264120 0.7000516
## 43 -0.44854147 -1.06229409 0.11524500 -1.6354441 0.33441397 0.9483924
## 44 0.54985189 -1.00663355 0.68411394 -0.3346298 1.43102542 1.1780408
## X7 X8 X9 X10
## 1 1.63552356 -0.284499356 -0.36784165 1.01392048
## 2 1.50972780 -0.244896915 0.08263110 0.79196774
## 3 -0.64452458 -0.313301132 -0.97824555 0.86258906
## 4 -0.66811129 -0.608519331 -0.20724412 0.92312163
## 5 -0.47155541 -0.662522660 -0.52577366 1.21569570
## 6 -0.79390705 -0.816612159 -0.34585112 1.37711587
## 7 -1.40716137 -0.651001950 1.02955680 -0.57001499
## 8 0.31466809 0.205850872 -0.95358950 0.64063632
## 9 2.91706787 0.648678170 -0.17459151 -0.03531066
## 10 0.03162763 -0.471710897 -0.62506426 0.80205650
## 11 0.22818350 -0.453709788 -0.23523207 0.79196774
## 12 0.07093880 -0.851174290 -0.11994836 -1.32667207
## 13 1.28172299 0.254093846 0.64039099 -0.44894986
## 14 0.25177021 -0.005842178 -1.19748451 -0.46912738
## 15 -0.31431071 0.153287631 -0.51844349 0.80205650
## 16 0.01590316 0.754524695 -0.39183132 -0.03531066
## 17 -0.78604481 -0.439308900 -0.69836603 -1.16525189
## 18 -0.55017776 -0.759008608 0.17392513 -0.57001499
## 19 -1.50150819 -0.642361417 -0.09395955 0.64063632
## 20 -1.33640126 -0.719406167 1.97115146 1.13498561
## 21 -0.58948894 -0.736687232 1.19215347 0.69108013
## 22 1.61193686 -0.366584417 -1.56266064 -1.31658331
## 23 0.85716230 -0.859094778 -1.14417412 -2.30528188
## 24 -0.62880011 -0.522834049 -0.37717097 -1.32667207
## 25 0.07093880 -0.002962001 -0.56109179 0.50948243
## 26 -0.21210166 -0.187293364 -1.39140103 -2.89043002
## 27 -0.99046292 -0.615719775 0.38983218 0.50948243
## 28 -0.43224424 -0.564596623 -0.20457860 0.66081384
## 29 1.36034534 3.138591663 2.02579460 -0.57001499
## 30 -0.33789742 -0.088647283 0.04797935 0.50948243
## 31 0.49549949 -0.134010079 1.16816379 -0.93321039
## 32 -0.83321822 -0.789970517 0.28387780 -1.32667207
## 33 -1.24991668 -0.327702020 -1.00490074 0.42877234
## 34 0.22032127 -0.296740111 1.64662449 0.50948243
## 35 0.92006018 2.102447789 -0.29920453 0.22699712
## 36 -0.44010647 1.376643046 -1.62263482 -0.06557695
## 37 -1.13984539 -0.651721994 2.17839558 1.13498561
## 38 1.72200815 3.581418962 0.15260097 0.73143517
## 39 -0.15706601 -0.684844036 -1.07553700 -1.63942366
## 40 -0.81749375 0.686120478 0.87095840 -0.05548819
## 41 -1.02977410 -0.503392850 1.70393316 0.50948243
## 42 1.14020276 1.179350884 1.61530464 0.50948243
## 43 0.84930007 1.269356432 -0.60107458 -0.90294411
## 44 -0.17279048 -0.093687594 0.10462163 0.02522190
Data disesuaikan atau diubah menjadi distribusi normal standar karena setiap variabel memiliki satuan yang berbeda.
Uji Asumsi Kenormalan Data menggunakan Saphiro Wilk Normality Test
Hipotesis \(H_0\) : Data berdistribusi secara normal \(H_1\) : Data tidak berdistribusi secara normal
shapiro.test(xdatamul$X1)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X1
## W = 0.94153, p-value = 0.02686
Keputusan X1
p-value (0.02686) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X1
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X1 atau Lama hari yang mendapat sinar matahari ditentukan oleh posisi lintang, bujur harian, dan jumlah awan pada suatu kota. (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota) tidak berdistribusi secara normal.
shapiro.test(xdatamul$X2)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X2
## W = 0.95336, p-value = 0.07345
Keputusan X2
p-value (0.07345) > \(\alpha\) (0.05), Maka Terima \(H_0\).
Kesimpulan X2
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X2 atau Informasi tentang biaya atau harga satu botol air di suatu kota (Dalam satuan Euro) berdistribusi secara normal.
shapiro.test(xdatamul$X3)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X3
## W = 0.90354, p-value = 0.001401
Keputusan X3
p-value (0.001401) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X3
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X3 atau Informasi yang disediakan berkaitan dengan tingkat lemak tubuh yang berlebihan, yang memiliki potensi merugikan kesehatan individu (Tingkat obesitas di suatu negara dalam satuan persen) tidak berdistribusi secara normal.
shapiro.test(xdatamul$X4)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X4
## W = 0.78503, p-value = 1.401e-06
Keputusan X4
p-value (1.401e-06) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X4
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X4 atau Perkiraan mengenai rata-rata umur hidup yang diharapkan, berdasarkan asumsi bahwa tingkat kematian pada setiap kelompok usia akan tetap konsisten dengan tingkat yang ada pada tahun tertentu yang sedang dijadikan pertimbangan (Harapan hidup di suatu negara, diukur dalam tahun) tidak berdistribusi secara normal.
shapiro.test(xdatamul$X5)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X5
## W = 0.9751, p-value = 0.4512
Keputusan X5
p-value (0.4512) > \(\alpha\) (0.05), Maka Terima \(H_0\).
Kesimpulan X5
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X5 atau Skor indeks polusi memberikan gambaran umum tentang tingkat polusi udara di kota, dan peningkatannya bisa dipicu oleh berbagai faktor, termasuk aktivitas lalu lintas dan kebakaran.(Skor indeks polusi di suatu kota) berdistribusi secara normal.
shapiro.test(xdatamul$X6)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X6
## W = 0.71741, p-value = 7.058e-08
Keputusan X6
p-value (7.058e-08) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X6
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X6 atau Durasi kerja di berbagai negara dipengaruhi oleh kondisi ekonomi, sosial, dan masyarakat yang beragam. Tingkat signifikansi pekerjaan paruh waktu juga menjadi faktor kunci, terutama dengan kecenderungan frekuensi yang lebih rendah di negara-negara berkembang (Rata-rata jam kerja tahunan, dengan “Aug.” sebagai singkatan dari Agustus.) tidak berdistribusi secara normal.
shapiro.test(xdatamul$X7)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X7
## W = 0.94438, p-value = 0.03411
Keputusan X7
p-value (0.03411) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X7
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X7 atau Indeks yang mencerminkan kesejahteraan masyarakat dan kondisi lingku tidak berdistribusi secara normal.
shapiro.test(xdatamul$X8)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X8
## W = 0.74493, p-value = 2.245e-07
Keputusan X8
p-value (2.245e-07) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X8
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Jumlah ini dapat mempengaruhi preferensi makanan dan gaya hidup penduduk kota dalam hal mengonsumsi makanan di luar rumah tidak berdistribusi secara normal.
shapiro.test(xdatamul$X9)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X9
## W = 0.94157, p-value = 0.02694
Keputusan X9
p-value (0.02694) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X9
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X9 atau Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro) tidak berdistribusi secara normal.
shapiro.test(xdatamul$X10)
##
## Shapiro-Wilk normality test
##
## data: xdatamul$X10
## W = 0.90923, p-value = 0.002118
Keputusan X10
p-value (0.002118) < \(\alpha\) (0.05), Maka Tolak \(H_0\).
Kesimpulan X10
Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X10 atau Kesejahteraan masyarakat dan keadaan lingkungan di berbagai negara di dunia (Tingkat kebahagiaan di suatu negara) tidak berdistribusi secara normal.
Kesimpulan Keseluruhan
Berdasarkan *Saphiro Wilk Normality Test diatas dapat disimpulkan bahwa dengan taraf signifikansi 5% data pada variabel X2 dan X5 berdistribusi secara normal, sedangkan data pada variabel X1,X3,X4,X6,X7,X8,X9,X10 tidak berdistribusi secara normal.
hist(xdatamul[,1], prob=TRUE, main="X1", xlab="X1",col="orange")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel Lama hari yang mendapat sinar matahari ditentukan oleh posisi lintang, bujur harian, dan jumlah awan pada suatu kota (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota) cenderung condong ke tengah sehingga dapat dianggap simetris dan memiliki kecenderungan untuk tersebar secara merata di sepanjang distribusi.
hist(xdatamul[,2], prob=TRUE, main="X2", xlab="X1",col="blue")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel yang menunjukkan informasi tentang biaya atau harga satu botol air di suatu kota (dalam satuan Euro) memiliki distribusi yang cenderung ke kiri, yang disebut sebagai negatively skewed atau “miring ke kiri”.
hist(xdatamul[,3], prob=TRUE, main="X3", xlab="X1",col="green")
lines(density(xdatamul[,1]))
parafrasekan Dapat diamati bahwa variabel Informasi yang disediakan berkaitan dengan tingkat lemak tubuh yang berlebihan, yang memiliki potensi merugikan kesehatan individu (Tingkat obesitas di suatu negara dalam satuan persen). Distribusi ini cenderung condong ke tengah sehingga dapat dianggap simetris dan memiliki kecenderungan untuk tersebar secara merata di sepanjang distribusi.
hist(xdatamul[,4], prob=TRUE, main="X4", xlab="X1",col="red")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel Perkiraan mengenai rata-rata umur hidup yang diharapkan, berdasarkan asumsi bahwa tingkat kematian pada setiap kelompok usia akan tetap konsisten dengan tingkat yang ada pada tahun tertentu yang sedang dijadikan pertimbangan (Harapan hidup di suatu negara, diukur dalam tahun), memiliki distribusi yang cenderung ke kanan disebut positively skewed atau “miring ke kanan”.
hist(xdatamul[,5], prob=TRUE, main="X5", xlab="X1",col="pink")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel Skor Indeks Polusi memberikan gambaran umum tentang tingkat polusi udara di kota, yang peningkatannya dapat dipicu oleh berbagai faktor termasuk aktivitas lalu lintas dan kebakaran (Skor Indeks Polusi di suatu kota). Distribusi variabel ini cenderung ke tengah, sehingga dapat dianggap simetris dan menunjukkan kecenderungan tersebar merata di sepanjang distribusi.
hist(xdatamul[,6], prob=TRUE, main="X6", xlab="X1",col="purple")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel Durasi kerja di berbagai negara dipengaruhi oleh kondisi ekonomi, sosial, dan masyarakat yang beragam. Tingkat signifikansi pekerjaan paruh waktu juga menjadi faktor kunci, terutama dengan kecenderungan frekuensi yang lebih rendah di negara-negara berkembang. (Rata-rata jam kerja tahunan, dengan “Aug.” sebagai singkatan dari Agustus.), memiliki distribusi yang cenderung ke tengah. Oleh karena itu, distribusi ini dapat dianggap simetris dan menunjukkan kecenderungan untuk tersebar secara merata di sepanjang distribusi.
hist(xdatamul[,7], prob=TRUE, main="X7", xlab="X1",col="magenta")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel Indeks yang mencerminkan kesejahteraan masyarakat dan kondisi lingkungan di berbagai negara di dunia (Tingkat Kebahagiaan di suatu negara), menunjukkan distribusi yang cenderung ke tengah. Oleh karena itu, distribusi ini dapat dianggap simetris dan menunjukkan kecenderungan untuk tersebar secara merata di sepanjang distribusi.
hist(xdatamul[,8], prob=TRUE, main="X8", xlab="X1",col="grey")
lines(density(xdatamul[,1]))
parafrasekan Dapat diamati bahwa variabel Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Jumlah ini dapat mempengaruhi preferensi makanan dan gaya hidup penduduk kota dalam hal mengonsumsi makanan di luar rumah. Distribusi ini cenderung condong ke distribusi yang cenderung ke kiri disebut negatively skewed atau “miring ke kiri”.
hist(xdatamul[,9], prob=TRUE, main="X9", xlab="X1",col="brown")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro), memiliki distribusi yang cenderung ke tengah. Oleh karena itu, distribusi ini dapat dianggap simetris dan menunjukkan kecenderungan untuk tersebar secara merata di sepanjang distribusi.
hist(xdatamul[,10], prob=TRUE, main="X10", xlab="X1",col="navy")
lines(density(xdatamul[,1]))
Terlihat bahwa variabel Kesejahteraan masyarakat dan keadaan lingkungan di berbagai negara di dunia (Tingkat Kebahagiaan di suatu negara) menunjukkan distribusi yang cenderung ke kanan, yang disebut sebagai positively skewed atau “miring ke kanan”.
mvn(data = xdatamul, mvnTest = "mardia")
## $multivariateNormality
## Test Statistic p value Result
## 1 Mardia Skewness 344.812997036712 1.49029681276977e-07 NO
## 2 Mardia Kurtosis 1.99327456051111 0.0462313904840519 NO
## 3 MVN <NA> <NA> NO
##
## $univariateNormality
## Test Variable Statistic p value Normality
## 1 Anderson-Darling X1 0.7490 0.0474 NO
## 2 Anderson-Darling X2 0.5275 0.1689 YES
## 3 Anderson-Darling X3 1.4126 0.001 NO
## 4 Anderson-Darling X4 2.6789 <0.001 NO
## 5 Anderson-Darling X5 0.3323 0.5032 YES
## 6 Anderson-Darling X6 5.7454 <0.001 NO
## 7 Anderson-Darling X7 0.7748 0.0408 NO
## 8 Anderson-Darling X8 3.6501 <0.001 NO
## 9 Anderson-Darling X9 0.9219 0.0174 NO
## 10 Anderson-Darling X10 1.4277 9e-04 NO
##
## $Descriptives
## n Mean Std.Dev Median Min Max 25th
## X1 44 -2.529592e-16 1 -0.19665324 -3.3505992 2.0566015 -0.6828739
## X2 44 6.168125e-17 1 0.03004404 -1.4240876 2.8200287 -0.8396519
## X3 44 -5.702903e-17 1 0.03678032 -1.7679074 1.4001042 -0.2378461
## X4 44 6.212700e-16 1 0.41946549 -4.1239585 0.9473322 -0.5231536
## X5 44 -5.392181e-17 1 0.04445508 -2.1784177 1.8217069 -0.8698965
## X6 44 -8.450863e-17 1 0.42100197 -1.6752079 1.1780408 -0.2933116
## X7 44 5.014681e-17 1 -0.19244607 -1.5015082 2.9170679 -0.6975947
## X8 44 8.592703e-17 1 -0.32050158 -0.8590948 3.5814190 -0.6445216
## X9 44 -1.516583e-16 1 -0.20591136 -1.6226348 2.1783956 -0.6070720
## X10 44 -4.167041e-16 1 0.46912738 -2.8904300 1.3771159 -0.5700150
## 75th Skew Kurtosis
## X1 0.6590035 -0.43007960 1.09684218
## X2 0.5936070 0.42950954 -0.23291436
## X3 0.6939220 -0.43656623 -0.91522790
## X4 0.6833988 -1.95744684 4.64427219
## X5 0.7146307 -0.08897587 -0.98877275
## X6 0.6930420 -0.97144624 -0.86602431
## X7 0.5839496 0.73954476 -0.02323566
## X8 0.1664284 1.98153755 3.69088399
## X9 0.4524719 0.58498547 -0.54086692
## X10 0.7465683 -0.90284946 0.08565789
Uji Asumsi Normal Multivariate yang digunakan yaitu Mardia test
Hipotesis
\(H_0\) : Data Berdistribusi Normal Multivariate \(H_1\) : Data Tidak Berdistribusi Normal Multivariate
Keputusan
Pada Mardia Skewness didapatkan p-value sebesar 1.49029681276977e-07 yang mana nilainya kurang dari \(\alpha\) (0.05) dan didapatkan juga p-value pada Mardia Kurtosis sebesar 0.0462313904840519 yang mana hasilnya juga kurang dari \(\alpha\) (0.05). Karena nilai dari keduanya sama-sama kurang dari \(\alpha\) sebesar 0,05, maka Tolak \(H_0\).
Kesimpulan
Dengan menggunakan taraf signifikansi sebesar 5%, maka dapat disimpulkan bahwa data tidak berdistribusi secara normal multivariate. Sehingga variabel tersebut tidak memenuhi asumsi normal multivariate.
corxdata<-cor(xdatamul)
round(corxdata,2)
## X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
## X1 1.00 -0.44 0.26 -0.37 0.35 -0.14 0.22 -0.12 -0.13 -0.37
## X2 -0.44 1.00 0.29 0.61 -0.66 0.53 -0.26 -0.09 0.36 0.81
## X3 0.26 0.29 1.00 0.09 -0.14 0.47 0.15 0.02 -0.07 0.45
## X4 -0.37 0.61 0.09 1.00 -0.57 0.66 -0.04 0.13 0.42 0.72
## X5 0.35 -0.66 -0.14 -0.57 1.00 -0.51 0.30 0.21 -0.28 -0.69
## X6 -0.14 0.53 0.47 0.66 -0.51 1.00 0.02 0.14 0.31 0.66
## X7 0.22 -0.26 0.15 -0.04 0.30 0.02 1.00 0.53 -0.12 -0.14
## X8 -0.12 -0.09 0.02 0.13 0.21 0.14 0.53 1.00 0.09 0.03
## X9 -0.13 0.36 -0.07 0.42 -0.28 0.31 -0.12 0.09 1.00 0.30
## X10 -0.37 0.81 0.45 0.72 -0.69 0.66 -0.14 0.03 0.30 1.00
Syntax tersebut digunakan untuk menghitung matriks korelasi
dari dataset xdatamul dalam lingkungan pemrograman R.
Korelasi mengukur hubungan linier antara dua variabel. Setelah
menghitung korelasi, fungsi round digunakan untuk
membulatkan nilai-nilai korelasi menjadi dua angka desimal.
Jadi, secara keseluruhan, sintaks tersebut bertujuan untuk
menghasilkan dan menampilkan matriks korelasi dari dataset
xdatamul dengan nilai-nilai korelasi yang dibulatkan hingga
dua angka desimal.
xdatamutrix<-cor(xdatamul)
corrplot(xdatamutrix, method = "number")
Dari hasil keluaran yang telah ditampilkan di atas, dapat teridentifikasi nilai korelasi antar variabel dalam dataset. Ditemukan korelasi positif yang bersifat moderat, dengan nilai korelasi berkisar antara -0.69 hingga 0.81, seperti yang tampak pada hubungan antara variabel X1 dan X3, X5 dan X6, serta X7, dan lainnya. Selain itu, terdapat korelasi positif yang lebih lemah, berkisar antara 0.12 hingga 0.40, seperti pada korelasi antara variabel X3 dan X6, X8 dan X9, dan lainnya. Adapun korelasi positif yang sangat lemah, dengan nilai berkisar antara 0 hingga 0.12, juga terlihat dalam data. Selain itu, ditemukan pula korelasi negatif yang sangat lemah, dengan nilai korelasi berkisar antara -0.69 hingga 0.
chart.Correlation(xdatamul[,1:10])
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
## Warning in par(usr): argument 1 does not name a graphical parameter
Dari output tersebut, dapat disimpulkan bahwa terdapat nilai korelasi yang signifikan antara variabel independen. Hasil analisis menunjukkan bahwa beberapa variabel memiliki nilai korelasi yang melebihi 0.5 atau lebih kecil dari -0.5, mengindikasikan adanya multikolinearitas di antara variabel independen. Oleh karena itu, asumsi dari analisis deskriminan tidak dapat dipenuhi untuk uji korelasi. Salah satu contoh yang menonjol adalah hubungan antara variabel Limbah dan Sampah, yang memiliki nilai korelasi sebesar 0.61 dan menunjukkan adanya hubungan korelasi positif.
Uji Korelasi yang digunakan yaitu Bartlett Test of Sphericity
Hipotesis
\(H_0\) : Tidak terdapat korelasi antar variabel
\(H_1\) : Paling sedikit terdapat satu korelasi antar variabel
bartlett.test(xdatamul)
##
## Bartlett test of homogeneity of variances
##
## data: xdatamul
## Bartlett's K-squared = 1.4201e-14, df = 9, p-value = 1
Keputusan
Berdasarkan Bartlett Test of Sphericity didapatkan p-value < 1.4201e-14.
Hal ini berarti bahwa p-value (1.4201e-14) < \(\alpha\) (0.05). Maka, Tolak \(H_0\).
Kesimpulan
Dengan menggunakan taraf signifikansi sebesar 5%, maka dapat disimpulkan bahwa terdapat paling sedikit satu korelasi antar variabel.
Uji KMO-Test (Kaiser-Meyer-Olkin-Test) digunakan untuk menguji kecukupan untuk setiap variabel.
Skala Uji
kMO-Test memiliki skala uji antara 0 sampai 1.
a. Jika nilai KMO-Test < 0.05, maka terdapat indikasi jumlah sampel yang digunakan kurang atau analisis faktor tidak layak digunakan.
b. Jika nilai KMO-Test > 0.05, maka terdapat indikasi jumlah sampel yang digunakan cukup atau analisis faktor layak digunakan.
KMO(dataxdatamul)
## Kaiser-Meyer-Olkin Statistics
##
## Call: KMOS(x = xdatamul)
##
## Measures of Sampling Adequacy (MSA):
## X1 X2 X3 X4 X5 X6 X7 X8
## 0.6480171 0.8534482 0.4049814 0.7556016 0.8643706 0.7878116 0.6027650 0.4459567
## X9 X10
## 0.7495903 0.7588975
##
## KMO-Criterion: 0.7275449
Keputusan
Berdasarkan Kaiser-Meyer-Olkin-Test, nilai KMO-Test yang didapat adalah sebesar 0.7275449. Sehingga KMO-Test (0.7275449) > \(\alpha\) (0.05)
Kesimpulan
Dengan menggunakan taraf signifikansi sebesar 5%, maka dapat disimpulkan bahwa terdapat indikasi jumlah sampel yang digunakan adalah cukup atau layak untuk dilakukannya analisis faktor.
R=cov(xdatamul)
eigendata=eigen(R)
eigendata
## eigen() decomposition
## $values
## [1] 4.1096518 1.7449816 1.3825427 0.8858347 0.5210820 0.4282023 0.3301736
## [8] 0.2987418 0.1913885 0.1074009
##
## $vectors
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] 0.229109703 0.22674628 0.49339727 -0.51103600 -0.26421237 0.01423834
## [2,] -0.430956359 -0.08520046 0.04299610 0.11245513 0.27452943 0.34958495
## [3,] -0.163189751 0.38104576 0.59461805 0.09935655 0.42239887 0.02218282
## [4,] -0.407021253 0.08744041 -0.19484496 -0.08774756 -0.42670160 -0.22496294
## [5,] 0.393574219 0.18419476 -0.07771313 -0.05371361 0.39506134 -0.28605674
## [6,] -0.377924984 0.27274904 0.13053563 -0.10429768 -0.18173887 -0.55372637
## [7,] 0.113863582 0.61830857 -0.15462787 0.07649978 -0.34514418 0.57594759
## [8,] 0.002753991 0.53936746 -0.47600298 0.10812599 0.27699820 -0.22333872
## [9,] -0.231212697 -0.01950288 -0.28353235 -0.80907016 0.32019709 0.20429977
## [10,] -0.453131764 0.08100905 0.09600620 0.15074337 0.08275985 0.12129171
## [,7] [,8] [,9] [,10]
## [1,] -0.121685247 0.50168533 -0.22377243 0.07011228
## [2,] 0.182626151 0.22007629 -0.67369149 -0.24351698
## [3,] 0.006152871 -0.14053359 0.37726583 -0.35171146
## [4,] 0.439590658 0.32667845 0.30105857 -0.39717261
## [5,] 0.715782648 0.06796761 -0.12469046 0.17841837
## [6,] -0.044226963 -0.47643065 -0.39428824 0.17554428
## [7,] 0.190907706 -0.28518545 -0.05287712 0.05962381
## [8,] -0.448833109 0.36329786 -0.05697981 -0.08668167
## [9,] -0.013786360 -0.20580827 0.15434921 0.02323449
## [10,] 0.078579810 0.29348060 0.24944461 0.76162934
nilaieigen<-eigen(xdatamutrix)$values
nilaieigen
## [1] 4.1096518 1.7449816 1.3825427 0.8858347 0.5210820 0.4282023 0.3301736
## [8] 0.2987418 0.1913885 0.1074009
Diperoleh nilai eigen dan vektor eigen dari 10 variabel. Dari hasil tersebut, terbentuk 3 faktor yang memiliki nilai eigen > 1, sementara faktor lainnya memiliki nilai eigen < 1. Sebagai contoh, nilai eigen tertinggi pada komponen 1 mencapai 4.1096518, menunjukkan bahwa nilai tersebut lebih besar dari 1.
Selain itu, terdapat sebuah grafik yang menggambarkan hasil penentuan jumlah faktor, yaitu Scree Plot pada Gambar 1. Grafik ini memberikan visualisasi yang memperlihatkan nilai eigen untuk setiap faktor, membantu dalam menentukan jumlah faktor yang signifikan dalam analisis.
facdatamul<-factanal(factors = 2, covmat = R)
facdatamul
##
## Call:
## factanal(factors = 2, covmat = R)
##
## Uniquenesses:
## X1 X2 X3 X4 X5 X6 X7 X8 X9 X10
## 0.613 0.270 0.005 0.351 0.429 0.461 0.912 1.000 0.815 0.089
##
## Loadings:
## Factor1 Factor2
## X1 -0.600 0.162
## X2 0.742 0.424
## X3 -0.167 0.983
## X4 0.773 0.225
## X5 -0.708 -0.266
## X6 0.474 0.561
## X7 -0.277 0.106
## X8
## X9 0.431
## X10 0.756 0.582
##
## Factor1 Factor2
## SS loadings 3.096 1.959
## Proportion Var 0.310 0.196
## Cumulative Var 0.310 0.506
##
## The degrees of freedom for the model is 26 and the fit was 1.122
xdatamul_cor<-cor(xdatamul[,-1])
xdatamul_eigen<-eigen(xdatamul_cor)
scree_xdatamul<-data.frame(eigen_value=eigen(xdatamul_cor)$values,PC=2:10)
plot(x=scree_xdatamul$PC, y=scree_xdatamul$eigen_value, type='b',
xlab='komponen utama ke-', ylab='varians(nilai eigen)',
main='Scree Plot')
Dari hasil Scree Plot di atas, jumlah komponen utama yang dipilih adalah 5. Keputusan ini didasarkan pada observasi bahwa garis kurva mulai menurun secara signifikan pada komponen ke-5. Informasi ini memberikan panduan untuk memilih jumlah komponen dengan menggunakan metode proporsi kumulatif varians, dan dengan metode Scree Plot, jumlah tersebut adalah 5 komponen utama.
nfactors <- 5 # Scree Plot
pcfac = principal(r, nfactors, rotate = "varimax")
pcfac$communality
Principal Components Analysis
Call: principal(r = r, nfactors = nfactors, rotate = "varimax")
Standardized loadings (pattern matrix) based upon correlation matrix
RC1 RC2 RC5 RC3 RC4 h2 u2 com
X1 -0.27 -0.01 0.21 0.89 0.01 0.91 0.090 1.3
X2 0.66 -0.21 0.34 -0.44 0.21 0.83 0.171 2.9
X3 0.21 0.07 0.93 0.18 -0.09 0.95 0.047 1.2
X4 0.87 0.13 -0.08 -0.14 0.22 0.85 0.152 1.3
X5 -0.81 0.32 -0.01 0.16 -0.02 0.79 0.212 1.4
X6 0.77 0.16 0.35 0.06 0.17 0.77 0.233 1.6
X7 -0.01 0.84 0.02 0.29 -0.18 0.82 0.179 1.3
X8 -0.05 0.88 0.05 -0.24 0.16 0.87 0.129 1.2
X9 0.27 -0.01 -0.06 -0.02 0.94 0.96 0.035 1.2
X10 0.79 -0.05 0.40 -0.31 0.11 0.89 0.108 1.9
RC1 RC2 RC5 RC3 RC4
SS loadings 3.24 1.68 1.32 1.31 1.09
Proportion Var 0.32 0.17 0.13 0.13 0.11
Cumulative Var 0.32 0.49 0.62 0.76 0.86
Proportion Explained 0.38 0.19 0.15 0.15 0.13
Cumulative Proportion 0.38 0.57 0.72 0.87 1.00
Mean item complexity = 1.5
Test of the hypothesis that 5 components are sufficient.
The root mean square of the residuals (RMSR) is 0.05
with the empirical chi square 9.08 with prob < 0.11
Fit based upon off diagonal values = 0.98
Besarnya loadings sebesar 0.81 menjelaskan bahwa besarnya korelasi antara variabel X1 dengan faktor umum 1 adalah sebesar 0.81. Hasil tersebut jika dikuadratkan akan menunjukkan proporsi total varians X1 yang dapat dijelaskan oleh faktor 1. Nilai communities yang dihasilkan adalah > 0.5 sehingga dapat diidentifikasi variabel memiliki keeratan yang kuat dengan faktor yang terbentuk.
SS Loadings PA1 memiliki nilai sebesar 3.24 yang berarti total varians keseluruhan variabel asal yang dapat dijelaskan oleh faktor 1 adalah sebesar 3.24. Selain itu, didapatkan proportion var PA1 sebesar 0.32 hal ini menjelaskan bahwa proporsi total varians variabel asal yang dapat dijelaskan oleh faktor adalah sebesar 32%. Jumlah faktor yang dapat digunakan untuk analisis lanjutan adalah sebanyak satu, karena nilai eigen dari PA1 lebih dari 1 dan cumulative var yang dapat dijelaskan oleh satu faktor tersebut adalah 56%.
Variabel dianggap mampu dengan baik menjelaskan faktor apabila memiliki komunalitas yang melebihi 0.5. Oleh karena itu, dapat disarikan bahwa semua variabel mampu memberikan penjelasan yang baik terhadap faktor. Hasil ini menunjukkan bahwa penggunaan metode PCA untuk ekstraksi tidak sepenuhnya sesuai dengan kondisi ini. Nilai komunalitas mencerminkan sejauh mana suatu variabel dapat dijelaskan oleh komponen-komponen utama, dan variabel-varibel tersebut dianggap penting dalam menjelaskan struktur data.
datacomp<-prcomp(x=scale(xdatamul),scale. = TRUE,center = TRUE)
datacomp
## Standard deviations (1, .., p=10):
## [1] 2.0272276 1.3209775 1.1758158 0.9411879 0.7218601 0.6543717 0.5746073
## [8] 0.5465728 0.4374797 0.3277207
##
## Rotation (n x k) = (10 x 10):
## PC1 PC2 PC3 PC4 PC5 PC6
## X1 0.229109703 0.22674628 -0.49339727 0.51103600 -0.26421237 0.01423834
## X2 -0.430956359 -0.08520046 -0.04299610 -0.11245513 0.27452943 0.34958495
## X3 -0.163189751 0.38104576 -0.59461805 -0.09935655 0.42239887 0.02218282
## X4 -0.407021253 0.08744041 0.19484496 0.08774756 -0.42670160 -0.22496294
## X5 0.393574219 0.18419476 0.07771313 0.05371361 0.39506134 -0.28605674
## X6 -0.377924984 0.27274904 -0.13053563 0.10429768 -0.18173887 -0.55372637
## X7 0.113863582 0.61830857 0.15462787 -0.07649978 -0.34514418 0.57594759
## X8 0.002753991 0.53936746 0.47600298 -0.10812599 0.27699820 -0.22333872
## X9 -0.231212697 -0.01950288 0.28353235 0.80907016 0.32019709 0.20429977
## X10 -0.453131764 0.08100905 -0.09600620 -0.15074337 0.08275985 0.12129171
## PC7 PC8 PC9 PC10
## X1 -0.121685247 0.50168533 0.22377243 0.07011228
## X2 0.182626151 0.22007629 0.67369149 -0.24351698
## X3 0.006152871 -0.14053359 -0.37726583 -0.35171146
## X4 0.439590658 0.32667845 -0.30105857 -0.39717261
## X5 0.715782648 0.06796761 0.12469046 0.17841837
## X6 -0.044226963 -0.47643065 0.39428824 0.17554428
## X7 0.190907706 -0.28518545 0.05287712 0.05962381
## X8 -0.448833109 0.36329786 0.05697981 -0.08668167
## X9 -0.013786360 -0.20580827 -0.15434921 0.02323449
## X10 0.078579810 0.29348060 -0.24944461 0.76162934
names(datacomp)
## [1] "sdev" "rotation" "center" "scale" "x"
Berdasarkan informasi tersebut, jumlah komponen utama yang dapat dipilih adalah lima. Hal ini dikarenakan lima komponen utama telah mampu menangkap minimal 80% varians dari data. Kelima komponen utama ini berhasil menangkap lebih dari 80% total keragaman data.
Selain itu, salah satu metode pendekatan untuk menentukan jumlah komponen utama adalah melalui Scree Plot. Scree Plot merupakan sebuah grafik yang menampilkan komponen utama dan varians nilai eigen. Pemilihan jumlah komponen utama dilakukan pada titik ekstrim di mana garis kurva mulai melandai. Dengan kata lain, penambahan komponen utama setelah titik tersebut tidak memberikan peningkatan signifikan dalam total keragaman data yang dapat diambil.
#Menentukan Jumlah Komponen Utama
summary(datacomp)
## Importance of components:
## PC1 PC2 PC3 PC4 PC5 PC6 PC7
## Standard deviation 2.027 1.3210 1.1758 0.94119 0.72186 0.65437 0.57461
## Proportion of Variance 0.411 0.1745 0.1383 0.08858 0.05211 0.04282 0.03302
## Cumulative Proportion 0.411 0.5855 0.7237 0.81230 0.86441 0.90723 0.94025
## PC8 PC9 PC10
## Standard deviation 0.54657 0.43748 0.32772
## Proportion of Variance 0.02987 0.01914 0.01074
## Cumulative Proportion 0.97012 0.98926 1.00000
Didapatkan informasi mengenai jumlah komponen utama untuk setiap variabel, yang mencakup sepuluh variabel.
#Persamaan Komponen Utama
datacomp$rotation
## PC1 PC2 PC3 PC4 PC5 PC6
## X1 0.229109703 0.22674628 -0.49339727 0.51103600 -0.26421237 0.01423834
## X2 -0.430956359 -0.08520046 -0.04299610 -0.11245513 0.27452943 0.34958495
## X3 -0.163189751 0.38104576 -0.59461805 -0.09935655 0.42239887 0.02218282
## X4 -0.407021253 0.08744041 0.19484496 0.08774756 -0.42670160 -0.22496294
## X5 0.393574219 0.18419476 0.07771313 0.05371361 0.39506134 -0.28605674
## X6 -0.377924984 0.27274904 -0.13053563 0.10429768 -0.18173887 -0.55372637
## X7 0.113863582 0.61830857 0.15462787 -0.07649978 -0.34514418 0.57594759
## X8 0.002753991 0.53936746 0.47600298 -0.10812599 0.27699820 -0.22333872
## X9 -0.231212697 -0.01950288 0.28353235 0.80907016 0.32019709 0.20429977
## X10 -0.453131764 0.08100905 -0.09600620 -0.15074337 0.08275985 0.12129171
## PC7 PC8 PC9 PC10
## X1 -0.121685247 0.50168533 0.22377243 0.07011228
## X2 0.182626151 0.22007629 0.67369149 -0.24351698
## X3 0.006152871 -0.14053359 -0.37726583 -0.35171146
## X4 0.439590658 0.32667845 -0.30105857 -0.39717261
## X5 0.715782648 0.06796761 0.12469046 0.17841837
## X6 -0.044226963 -0.47643065 0.39428824 0.17554428
## X7 0.190907706 -0.28518545 0.05287712 0.05962381
## X8 -0.448833109 0.36329786 0.05697981 -0.08668167
## X9 -0.013786360 -0.20580827 -0.15434921 0.02323449
## X10 0.078579810 0.29348060 -0.24944461 0.76162934
Didapatkan informasi mengenai persamaan komponen utama untuk setiap variabel, yang mencakup sepuluh variabel.
#Restorasi Data
head(datacomp$x[,10])
## [1] 0.31690925 0.04920496 -0.01474868 0.07051673 0.29909236 0.46655631
Didapatkan informasi mengenai restorasi data persamaan komponen utama untuk setiap variabel, yang mencakup sepuluh variabel. Pada syntax kali ini hanya ditampilkan 1 data karena menggunakan head().
#Mencari Faktor dengan PFA
r <- xdatamul
nfactors <- 3
PFA <- fa(r, nfactors, rotate = "varimax", fm = "pa")
## maximum iteration exceeded
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect. Try a
## different factor score estimation method.
## Warning in fac(r = r, nfactors = nfactors, n.obs = n.obs, rotate = rotate, : An
## ultra-Heywood case was detected. Examine the results carefully
PFA
## Factor Analysis using method = pa
## Call: fa(r = r, nfactors = nfactors, rotate = "varimax", fm = "pa")
## Standardized loadings (pattern matrix) based upon correlation matrix
## PA1 PA2 PA3 h2 u2 com
## X1 -0.48 0.32 0.05 0.33 0.67 1.8
## X2 0.82 0.14 -0.22 0.74 0.26 1.2
## X3 0.16 1.05 0.06 1.14 -0.14 1.0
## X4 0.83 -0.02 0.11 0.71 0.29 1.0
## X5 -0.73 -0.06 0.31 0.63 0.37 1.4
## X6 0.69 0.34 0.13 0.60 0.40 1.6
## X7 -0.17 0.15 0.66 0.49 0.51 1.2
## X8 0.11 -0.07 0.83 0.70 0.30 1.0
## X9 0.43 -0.10 0.03 0.20 0.80 1.1
## X10 0.89 0.29 -0.06 0.87 0.13 1.2
##
## PA1 PA2 PA3
## SS loadings 3.63 1.47 1.31
## Proportion Var 0.36 0.15 0.13
## Cumulative Var 0.36 0.51 0.64
## Proportion Explained 0.57 0.23 0.20
## Cumulative Proportion 0.57 0.80 1.00
##
## Mean item complexity = 1.3
## Test of the hypothesis that 3 factors are sufficient.
##
## df null model = 45 with the objective function = 5.53 with Chi Square = 214.68
## df of the model are 18 and the objective function was 0.47
##
## The root mean square of the residuals (RMSR) is 0.04
## The df corrected root mean square of the residuals is 0.06
##
## The harmonic n.obs is 44 with the empirical chi square 6.31 with prob < 0.99
## The total n.obs was 44 with Likelihood Chi Square = 17.18 with prob < 0.51
##
## Tucker Lewis Index of factoring reliability = 1.013
## RMSEA index = 0 and the 90 % confidence intervals are 0 0.13
## BIC = -50.94
## Fit based upon off diagonal values = 0.99
Koefisien masing-masing variabel terhadap setiap komponen utama yang terbentuk menjadi alat bantu untuk menginterpretasikan setiap komponen utama. Selain itu, nilai-nilai ini juga dapat digunakan untuk memberikan label pada komponen utama. Dengan demikian, penamaan komponen utama didasarkan pada nilai koefisien variabel terbesar, yang tidak lagi dipengaruhi oleh variasi dari variabel tersebut. Persamaan yang dihasilkan merupakan representasi dari data yang telah distandarisasi.
Interpretasi Komponen Utama
Komponen Utama 1 : KU1
KU1 : 0.229109703\(X_1\) - 0.430956359\(X_2\) - 0.163189751\(X_3\) - 0.407021253\(X_4\) - 0.393574219\(X_5\) - 0.377924984\(X_6\) + 0.113863582\(X_7\) + 0.002753991\(X_8\) - 0.231212697\(X_9\) - 0.453131764\(X_10\)
KU1 menggambarkan Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU1 yakni X1 atau Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota dan X3 atau Tingkat obesitas di suatu negara dalam satuan persen. Berdasarkan informasi tersebut, maka KU1 dapat dinamakan dengan Perilaku Pencegahan Obesitas.
Komponen Utama 2 : KU2
KU2 : 0.22674628\(X_1\) - 0.08520046\(X_2\) + 0.38104576\(X_3\) + 0.08744041\(X_4\) + 0.18419476\(X_5\) + 0.27274904\(X_6\) + 0.61830857\(X_7\) + 0.53936746\(X_8\) - 0.01950288\(X_9\) + 0.08100905\(X_10\)
KU1 menggambarkan Informasi tentang biaya atau harga satu botol air di suatu kota (Dalam satuan Euro). Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU2 yakni X7 atau Tingkat kebahagiaan di suatu negaradan X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Berdasarkan informasi tersebut, maka KU2 dapat dinamakan dengan Indikator Kesejahteraan.
Komponen Utama 3 : KU3
KU3 : -0.49339727\(X_1\) - 0.04299610\(X_2\) - 0.59461805\(X_3\) + 0.19484496\(X_4\) + 0.07771313\(X_5\) - 0.13053563\(X_6\) + 0.15462787\(X_7\) + 0.47600298\(X_8\) + 0.28353235\(X_9\) - 0.09600620\(X_10\)
KU3 menggambarkan Tingkat obesitas di suatu negara (dalam satuan persen). Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU3 yakni X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota dan X9 atau Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro). Berdasarkan informasi tersebut, maka KU3 dapat dinamakan dengan Tingkat Kesehatan Kota.
Komponen Utama 4 : KU4
KU4 : 0.51103600\(X_1\) - 0.11245513\(X_2\) - 0.09935655\(X_3\) + 0.08774756\(X_4\) + 0.05371361\(X_5\) + 0.10429768\(X_6\) - 0.07649978\(X_7\) - 0.10812599\(X_8\) + 0.80907016\(X_9\) - 0.15074337\(X_10\)
KU4 menggambarkan Harapan hidup di suatu negara (Diukur dalam tahun). Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU4 yakni X1 atau Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota dan X9 atau Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota. Berdasarkan informasi tersebut, maka KU4 dapat dinamakan dengan Kombinasi Perilaku Kebugaran Hidup.
Komponen Utama 5 : KU5
KU5 : -0.26421237\(X_1\) + 0.27452943\(X_2\) + 0.42239887\(X_3\) - 0.42670160\(X_4\) + 0.39506134\(X_5\) - 0.18173887\(X_6\) - 0.34514418\(X_7\) + 0.27699820\(X_8\) + 0.32019709\(X_9\) + 0.08275985\(X_10\)
KU5 menggambarkan skor indeks polusi di suatu kota.Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU5 yakni X3 atau Tingkat obesitas di suatu negara dan X5 atau Skor indeks polusi di suatu kot. Berdasarkan informasi tersebut, maka KU5 dapat dinamakan dengan Tingkat Polutif.
Komponen Utama 6 : KU6
KU6 : 0.01423834\(X_1\) + 0.34958495\(X_2\) + 0.02218282\(X_3\) - 0.22496294\(X_4\) - 0.28605674\(X_5\) - 0.55372637\(X_6\) + 0.57594759\(X_7\) - 0.22333872\(X_8\) + 0.20429977\(X_9\) + 0.12129171\(X_10\)
KU6 menggambarkan Rata-rata jam kerja tahunan.Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU6 yakni X2 atau Informasi tentang biaya atau harga satu botol air di suatu kota dan X7 atau Tingkat kebahagiaan di suatu negara. Berdasarkan informasi tersebut, maka KU6 dapat dinamakan dengan Ekonomi Kesejahteraan.
Komponen Utama 7 : KU7
KU7 : -0.121685247\(X_1\) + 0.182626151\(X_2\) + 0.006152871\(X_3\) + 0.439590658\(X_4\) + 0.715782648\(X_5\) - 0.044226963\(X_6\) + 0.190907706\(X_7\) - 0.448833109\(X_8\) - 0.013786360\(X_9\) + 0.078579810\(X_10\)
KU7 menggambarkan Tingkat kebahagiaan di suatu negara. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU7 yakni X4 atau Harapan hidup di suatu negara dan X5 atau Skor indeks polusi di suatu kota. Berdasarkan informasi tersebut, maka KU7 dapat dinamakan dengan Indeks Pola Hidup.
Komponen Utama 8 : KU8
KU8 : 0.50168533\(X_1\) + 0.22007629\(X_2\) - 0.14053359\(X_3\) + 0.32667845\(X_4\) + 0.06796761\(X_5\) - 0.47643065\(X_6\) - 0.28518545\(X_7\) + 0.36329786\(X_8\) - 0.20580827\(X_9\) + 0.29348060\(X_10\)
KU8 menggambarkan Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU8 yakni X1 atau Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota dan X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Berdasarkan informasi tersebut, maka KU8 dapat dinamakan dengan Kondisi Kota.
Komponen Utama 9 : KU9
KU9 : 0.22377243\(X_1\) + 0.67369149\(X_2\) - 0.37726583\(X_3\) - 0.30105857\(X_4\) + 0.12469046\(X_5\) + 0.39428824\(X_6\) + 0.05287712\(X_7\) + 0.05697981\(X_8\) - 0.15434921\(X_9\) - 0.24944461\(X_10\)
KU9 menggambarkan Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU9 yakni X2 atau Informasi tentang biaya atau harga satu botol air di suatu kota dan X6 atau Rata-rata jam kerja tahunan. Berdasarkan informasi tersebut, maka KU9 dapat dinamakan dengan Gaya Hidup Kesehatan.
Komponen Utama 10 : KU10
KU10 : 0.07011228\(X_1\) - 0.24351698\(X_2\) - 0.35171146\(X_3\) - 0.39717261\(X_4\) + 0.17841837\(X_5\) + 0.17554428\(X_6\) + 0.05962381\(X_7\) - 0.08668167\(X_8\) + 0.02323449\(X_9\) + 0.76162934\(X_10\)
KU10 menggambarkan Tingkat kebahagiaan di suatu negara. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU10 yakni X5 atau Skor indeks polusi di suatu kota dan X10 atau Tingkat kebahagiaan di suatu negara. Berdasarkan informasi tersebut, maka KU10 dapat dinamakan dengan Pola Hidup Sehat.
## Interpretasi Analisis Faktor
fa.diagram(PFA,rsize=1)
a Pada faktor 1 (PA1) diketahui bahwa faktor tersebut berkorelasi signifikan dengan variabel X1 (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota), X2 (Informasi tentang biaya atau harga satu botol air di suatu kota), X4 (Harapan hidup di suatu negara),X5 (skor indeks polusi di suatu kota), X6 (Rata-rata jam kerja tahunan), X9 (Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota), dan X10 ( Tingkat kebahagiaan di suatu negara). Ketujuh variabel jika digabungkan menjadi suatu faktor, akan bernama Variabel kesejahteraan Kota.
b Pada faktor 2 (PA2) diketahui bahwa faktor tersebut hanya memiliki 1 variabel oleh karena itu faktor 2 (PA2) berkorelasi signifikan dengan variabel X3 atau Tingkat obesitas di suatu negara.
c Pada faktor 3 (PA3) diketahui bahwa faktor tersebut berkorelasi signifikan dengan variabel X7 (Tingkat kebahagiaan di suatu negara) dan variabel X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Kedua variabel jika digabungkan menjadi suatu faktor, akan bernama Indeks Kesejahteraan Kuliner.
Dengan informasi yang sudah disampaikan, diharapkan pengetahuan masyarakat terkait faktor-faktor yang berpengaruh pada gaya hidup sehat di kota akan meningkat. Tujuannya adalah agar masyarakat memiliki kesadaran akan pentingnya faktor-faktor tersebut dan mengetahui cara untuk mengadopsi perilaku hidup sehat sesuai dengan pengetahuan yang telah diperoleh sebelumnya.
Dengan metode analisis komponen utama (PCA), dapat diketahui bahwa data Pengaruh Gaya Hidup di Kota yang terdiri dari 10 variabel dapat direduksi menjadi 3 variabel namun tetap menggambarkan keragaman dari data awal. Ketiga variable tersebut adalah faktor Tingkat obesitas di suatu negara, Variabel kesejahteraan Kota, dan Indeks Kesejahteraan Kuliner.
Statmat.net. (n.d.). Metode Analisis Faktor dan Rumus Pengujiannya [Lengkap]. Diakses dari https://www.statmat.net/metode-analisis-faktor/
Kantinit.com. (n.d.). Principal Component Analysis (PCA): Konsep dan Cara Kerja. Diakses dari https://kantinit.com/kecerdasan-buatan/principal-component-analysis-pca-konsep-dan-cara-kerja/
Muhajir, M. (2020). Modul Praktikum Statistika Multivariat Terapan. Yogyakarta: Universitas Islam Indonesia
Urwatul, W. D., Listyani, E., Subekti, R., Kusumawati, R., Susanti, M., & Kismiantini. (2018). Analisis Data Multivariat Dengan Program R . Jurnal Pengabdian Masyarakat MIPA dan Pendidikan MIPA, 67-80.