1. Pendahuluan

1.1. Latar Belakang

Kesehatan sebagai indikator kualitas hidup penduduk. Indikator-indikator kesehatan dan morbiditas merujuk pada kelompok mental orang sehat dan sakit. Hal ini mewajibkan kita untuk mendekati karakterisasi gaya hidup seseorang tidak hanya dari posisi biologis, tetapi juga dari posisi medis dan sosial. Faktor-faktor sosial ditentukan oleh struktur sosial-ekonomi masyarakat, peningkatan pendidikan, budaya, produksi kualitas personal antar individu, tradisi, adat istiadat, hubungan keluarga, dan karakteristik. Sebagian besar faktor, bersama dengan kualitas vital higienis, termasuk dalam konsep umum “gaya hidup”, bagian dari penelitian yang membentuk lebih dari 50% dari semua faktor. Karakteristik biologis seseorang (jenis kelamin, usia, keturunan, konstitusi, temperamen, kemampuan adaptasi, dll.) ditemukan dalam total dampak terhadap kesehatan tidak lebih dari 20%. Baik faktor sosial maupun biologis memengaruhi seseorang dalam kondisi lingkungan tertentu, tingkat cakupannya berkisar dari 18 hingga 22%. Hanya sebagian kecil (8-10%) dari indikator kesehatan. Oleh karena itu, kesehatan manusia adalah kesatuan harmonis dari karakteristik biologis dan sosial yang disebabkan oleh sifat biologis bawaan dan yang diperoleh, dan mencakup penyakit, pelanggaran terhadap harmoni ini.

Kesehatan sebagai indikator sintetis kualitas dan standar hidup. Pada saat yang sama, sesuai dengan penyajian Organisasi Kesehatan Dunia, kategori kesehatan mencakup kategori kesehatan fisik, mental, spiritual, dan kesehatan masyarakat. Kualitas penting dari kesehatan sebagai elemen kualitas adalah tingkat penentuan diri perilaku, yaitu, sikap bertanggung jawab terhadap pemeliharaan dan terjadinya kesehatan seseorang. Dalam arti ini, kesehatan sebagai sumber daya manusia yang nyata, dapat dikelola dengan berbagai cara oleh individu dengan hasil yang berbeda.

1.2. Rumusan masalah

Berdasarkan penjelasan latar belakang, dapat dirumuskan pertanyaan masalah sebagai berikut :

  1. Apa yang menjadi faktor-faktor yang berpengaruh terhadap Gaya Hidup Sehat di lingkungan perkotaan dan faktor manakah yang Memiliki pengaruh paling tinggi?

1.3. Tujuan Penelitian

  1. Mengidentifikasi faktor-faktor yang memiliki dampak signifikan terhadap gaya hidup sehat di lingkungan perkotaan.

  2. Menganalisis faktor mana yang memiliki pengaruh paling besar dalam membentuk gaya hidup sehat di lingkungan tersebut.

2. Tinjauan Pustaka

2.1 Analisis Faktor

2.1.1 Definisi Analisis Faktor

Analisis faktor adalah pendekatan yang digunakan untuk mengenali faktor-faktor yang dapat menjelaskan hubungan atau korelasi antara berbagai indikator independen yang diamati. Dalam konteks ini, analisis faktor dapat dianggap sebagai pengembangan dari analisis komponen utama. Metode ini juga bermanfaat untuk mengidentifikasi sejumlah faktor yang relatif kecil namun dapat menjelaskan sejumlah besar variabel yang saling terhubung.

Selain itu, Analisis Faktor juga berperan sebagai alat analisis statistik yang berguna untuk mereduksi faktor-faktor yang memengaruhi suatu variabel menjadi serangkaian indikator, tanpa kehilangan informasi yang signifikan. Analisis faktor digunakan untuk menyederhanakan data dengan mereduksi variabel yang banyak menjadi sedikit faktor baru. Faktor-faktor ini tetap memuat sebagian besar informasi yang terkandung dalam variabel asli (Supranto, 2004).

2.2.1 Jenis Analisis Faktor

Analisis faktor dapat dibagi menjadi dua kategori utama, yaitu analisis faktor eksplorasi dan analisis faktor konfirmatori.

Analisis faktor eksplorasi digunakan ketika kita tidak memiliki pengetahuan awal tentang struktur data penelitian atau jumlah dimensi yang terlibat dalam satu set variabel. Sebaliknya, analisis faktor konfirmatori digunakan untuk verifikasi ketika kita telah memiliki pemahaman khusus tentang struktur data atau jumlah dimensi dalam variabel yang diamati.

Dari penjelasan tersebut, dapat disadari bahwa analisis faktor pada umumnya bertujuan untuk eksplorasi dan deskripsi, melibatkan banyak penilaian subjektif. Alat ini sangat umum digunakan, tetapi seringkali kontroversial karena fleksibilitas model, metode, dan subjektivitasnya, yang dapat menyebabkan perdebatan interpretatif.

Meskipun mirip dengan Principal Component Analysis (PCA), analisis faktor dianggap lebih kompleks. Sebaliknya dengan PCA, dalam analisis faktor, variabel yang diamati dimodelkan sebagai fungsi linier dari “faktor”. Sebaliknya, dalam PCA, variabel baru dibuat sebagai kombinasi linier dari variabel yang diamati.

2.3.1 Tujuan Analisis Faktor

Tujuan dari analisis data adalah untuk mengurangi jumlah variabel awal yang cukup banyak menjadi sejumlah variabel baru yang lebih sedikit, yang sering disebut sebagai faktor, variabel laten, konstruk, atau variabel bentukan. Selain itu, tujuan lainnya adalah mengidentifikasi hubungan antara variabel penyusun faktor atau dimensi dengan faktor yang terbentuk, menggunakan uji koefisien korelasi antar faktor dan komponen pembentuknya, yang dikenal sebagai analisis faktor konfirmatori.

Analisis faktor juga bertujuan untuk menguji validitas dan reliabilitas instrumen melalui analisis faktor konfirmatori. Selain itu, analisis faktor digunakan untuk melakukan validasi data guna menentukan apakah hasil analisis faktor dapat diterapkan secara umum ke dalam populasi, sehingga setelah terbentuk faktor, peneliti dapat menyusun hipotesis baru berdasarkan hasil analisis tersebut.

3.1 Principal Component Analysis (PCA)

3.1.1 Definisi

Analisis Komponen Utama (Principal Component Analysis) adalah analisis multivariate yang mentransformasi variabel-variabel asal yang saling berkorelasi menjadi variabel-variabel baru yang tidak saling berkorelasi dengan mereduksi sejumlah variabel tersebut sehingga mempunyai dimensi yang lebih kecil namun dapat menerangkan sebagian besar keragaman variabel aslinya.

Banyaknya komponen utama yang terbentuk sama dengan banyaknya variabel asli. Pereduksian (penyederhanaan) dimensi dilakukan dengan kriteria persentase keragaman data yang diterangkan oleh beberapa komponen utama pertama. Apabila beberapa komponen utama pertama telah menerangkan lebih dari 75% keragaman data asli, maka analisis cukup dilakukan sampai dengan komponen utama tersebut.

3.2.1 Keunggulan

Keunggulan dari algoritma PCA dapat diuraikan sebagai berikut:

  1. Pengurangan Dimensi: PCA merupakan teknik yang sering digunakan untuk mengurangi dimensi, suatu proses untuk mengurangi jumlah variabel dalam suatu dataset. Dengan melakukan pengurangan variabel, PCA menyederhanakan analisis data, meningkatkan kinerja, dan mempermudah visualisasi data.

  2. Seleksi Fitur: PCA dapat dimanfaatkan untuk seleksi fitur, suatu proses pemilihan variabel yang paling signifikan dalam suatu dataset. Ini bermanfaat terutama dalam machine learning di mana jumlah variabel bisa sangat besar dan sulit untuk mengidentifikasi variabel yang paling penting.

  3. Visualisasi Data: PCA dapat digunakan untuk visualisasi data dengan mengurangi jumlah variabel. Ini memungkinkan pemetaan data berdimensi tinggi menjadi dua atau tiga dimensi, mempermudah interpretasi dan pemahaman pola dalam data.

  4. Penanganan Multikolinearitas: PCA dapat diaplikasikan untuk mengatasi masalah multikolinearitas, sebuah masalah umum dalam analisis regresi di mana dua atau lebih variabel independen memiliki korelasi tinggi. PCA membantu mengidentifikasi struktur dasar dalam data dan menciptakan variabel baru yang tidak saling berkorelasi untuk digunakan dalam model regresi.

  5. Pengurangan Noise: PCA dapat digunakan untuk mengurangi noise dalam data dengan menghapus komponen utama yang memiliki varian rendah, diasumsikan sebagai noise. Dengan demikian, PCA dapat meningkatkan rasio sinyal-ke-noise dan memfasilitasi identifikasi struktur mendasar dalam data.

  6. Kompresi Data: PCA dapat digunakan untuk kompresi data dengan merepresentasikan data menggunakan jumlah komponen utama yang lebih sedikit namun tetap mencakup sebagian besar variasi dalam data. Hal ini dapat mengurangi kebutuhan penyimpanan data dan mempercepat proses pemrosesan.

3.3.1 Cara Kerja

Secara sederhana, prinsip kerja analisis komponen utama melibatkan lima langkah utama. Tahap awal adalah standarisasi di mana semua variabel disetarakan secara standar, memastikan kontribusi yang setara dari setiap variabel dalam analisis.

Langkah berikutnya melibatkan perhitungan matriks kovarians, yang memberikan wawasan tentang hubungan antar variabel dalam kumpulan data input. Selanjutnya, dilakukan perhitungan nilai dan vektor eigen dari matriks kovarians. Langkah ini bertujuan untuk membantu peneliti mengidentifikasi komponen utama.

Proses analisis dilanjutkan dengan mengevaluasi vektor fitur. Dengan menghitung nilai dan vektor eigen, peneliti dapat menentukan komponen mana yang kurang signifikan dan dapat dihapus (komponen dengan nilai eigen rendah). Matriks vektor yang tersisa disebut vektor fitur. Analisis kemudian diakhiri dengan transformasi di sepanjang sumbu komponen utama.

3. Source Code

3.1 Library yang Digunakan

library(PerformanceAnalytics)
## Warning: package 'PerformanceAnalytics' was built under R version 4.2.3
## Loading required package: xts
## Warning: package 'xts' was built under R version 4.2.3
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
## Attaching package: 'PerformanceAnalytics'
## The following object is masked from 'package:graphics':
## 
##     legend

Paket “PerformanceAnalytics” dalam R adalah salah satu alat yang berguna untuk melakukan analisis kinerja keuangan dan portofolio.

library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3

Paket “readxl” dalam R adalah suatu library yang digunakan untuk membaca data dari file Excel (XLSX dan XLS) ke dalam R.

library(MVN)
## Warning: package 'MVN' was built under R version 4.2.3

paket MVN digunakan untuk sarana untuk melakukan uji normalitas dan homogenitas pada data multivariat.

library(sandwich)
## Warning: package 'sandwich' was built under R version 4.2.3

Paket ini digunakan untuk mendapatkan estimasi standar yang lebih konsisten dalam konteks model regresi dengan asumsi yang tidak terpenuhi sepenuhnya.

library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.3
## corrplot 0.92 loaded

Paket ini digunakan untuk membuat matriks plot korelasi dengan berbagai opsi untuk menyesuaikan penampilan grafik.

library(psych)
## Warning: package 'psych' was built under R version 4.2.3

Paket ini menyediakan alat-alat untuk analisis psikometri dan eksplorasi data psikologis.

3.2 Input Data

Data

Informasi mengenai data yang digunakan diperoleh dari 44 responden dan melibatkan 10 variabel. Variabel-variabel ini mencerminkan indikator-indikator terkait gaya hidup sehat di lingkungan perkotaan. Sumber data ini berasal dari Kaggle.com, yang merupakan platform penyedia data dan dalam konteks ini memberikan data untuk keperluan mengidentifikasi faktor-faktor yang memengaruhi gaya hidup sehat dalam kehidupan di kota. Berikut adalah penjelasan mengenai masing-masing variabel yang terlibat.

X1 : Lama hari yang mendapat sinar matahari ditentukan oleh posisi lintang, bujur harian, dan jumlah awan pada suatu kota. (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota)

X2 : Informasi tentang biaya atau harga satu botol air di suatu kota. (Dalam satuan Euro)

X3 : Informasi yang disediakan berkaitan dengan tingkat lemak tubuh yang berlebihan, yang memiliki potensi merugikan kesehatan individu. (Tingkat obesitas di suatu negara dalam satuan persen)

X4 : Perkiraan mengenai rata-rata umur hidup yang diharapkan, berdasarkan asumsi bahwa tingkat kematian pada setiap kelompok usia akan tetap konsisten dengan tingkat yang ada pada tahun tertentu yang sedang dijadikan pertimbangan(Harapan hidup di suatu negara, diukur dalam tahun)

X5 : Skor indeks polusi memberikan gambaran umum tentang tingkat polusi udara di kota, dan peningkatannya bisa dipicu oleh berbagai faktor, termasuk aktivitas lalu lintas dan kebakaran.(Skor indeks polusi di suatu kota)

X6 : Durasi kerja di berbagai negara dipengaruhi oleh kondisi ekonomi, sosial, dan masyarakat yang beragam. Tingkat signifikansi pekerjaan paruh waktu juga menjadi faktor kunci, terutama dengan kecenderungan frekuensi yang lebih rendah di negara-negara berkembang. (Rata-rata jam kerja tahunan, dengan “Aug.” sebagai singkatan dari Agustus.)

X7 : Indeks yang mencerminkan kesejahteraan masyarakat dan kondisi lingkungan di berbagai negara di dunia. (Tingkat kebahagiaan di suatu negara)

X8 : Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Jumlah ini dapat mempengaruhi preferensi makanan dan gaya hidup penduduk kota dalam hal mengonsumsi makanan di luar rumah.

X9 : Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro)

X10 : Kesejahteraan masyarakat dan keadaan lingkungan di berbagai negara di dunia. (Tingkat kebahagiaan di suatu negara)

data_anmul<-read_excel("C:/Users/ACER/Downloads/ANMUL/data_anmul.xlsx")
datamul<-data.frame(data_anmul)
datamul
##      X1   X2    X3   X4    X5   X6  X7   X8    X9  X10
## 1  1858 1.92 0.204 81.2 30.93 1434 422 1048 34.90 7.44
## 2  2636 1.48 0.290 82.1 26.86 1712 406 1103 41.66 7.22
## 3  1884 1.94 0.201 81.0 17.33 1501 132 1008 25.74 7.29
## 4  1821 1.72 0.206 81.8 19.63 1452 129  598 37.31 7.35
## 5  1630 2.19 0.197 79.8 21.24 1380 154  523 32.53 7.64
## 6  1662 1.60 0.222 80.4 13.08 1540 113  309 35.23 7.80
## 7  2769 0.78 0.043 83.2  0.00 1644  35  539 55.87 5.87
## 8  1626 1.55 0.223 80.6 39.41 1386 254 1729 26.11 7.07
## 9  2591 1.19 0.238 82.2 65.19 1686 585 2344 37.80 6.40
## 10 1938 1.08 0.294 81.7 24.26 1670 218  788 31.04 7.23
## 11 2363 1.57 0.290 82.1 25.90 1712 243  813 36.89 7.22
## 12 2671 0.26 0.062 75.4 85.43    0 223  261 38.62 5.12
## 13 2624 0.22 0.100 74.1 76.64    0 377 1796 50.03 5.99
## 14 2525 0.57 0.283 75.9 52.64    0 246 1435 22.45 5.97
## 15 2066 1.09 0.294 81.7 37.83 1670 174 1656 32.64 7.23
## 16 2769 1.30 0.238 82.2 52.68 1686 216 2491 34.54 6.40
## 17 2983 0.21 0.069 68.5 84.39    0 114  833 29.94 5.28
## 18 2066 0.59 0.047 81.3 57.82 1967 144  389 43.03 5.87
## 19 1662 1.95 0.223 80.6 37.78 1386  23  551 39.01 7.07
## 20    0 2.62 0.195 82.6 27.25 1557  44  444 70.00 7.56
## 21 3311 1.63 0.261 81.9 47.28 1898 139  420 58.31 7.12
## 22 2218 0.15 0.321 74.7 69.49 1832 419  934 16.97 5.13
## 23 3542 0.16 0.320 70.7 91.74    0 323  250 23.25 4.15
## 24 1405 0.57 0.062 75.4 49.32    0 134  717 34.76 5.12
## 25 3254 1.52 0.362 78.8 66.07 1779 223 1439 32.00 6.94
## 26 2584 0.15 0.039 67.3 82.84    0 187 1183 19.54 3.57
## 27 2634 1.39 0.362 78.8 27.03 1779  88  588 46.27 6.94
## 28 1453 1.40 0.253 80.5 40.07 1772 159  659 37.35 7.09
## 29 1877 0.76 0.043 83.2 42.84 1644 387 5802 70.82 5.87
## 30 2508 1.20 0.362 78.8 43.33 1779 171 1320 41.14 6.94
## 31 1836 0.75 0.062 75.4 67.46    0 277 1257 57.95 5.51
## 32 1776 0.29 0.062 75.4 77.40    0 108  346 44.68 5.12
## 33 1546 2.11 0.221 80.4 62.67 1583  55  988 25.34 6.86
## 34 3062 1.60 0.362 78.8 47.36 1779 242 1031 65.13 6.94
## 35 1662 1.95 0.216 81.8 65.10 1505 331 4363 35.93 6.66
## 36 2003 0.44 0.221 73.9 79.78    0 158 3355 16.07 6.37
## 37 1566 3.20 0.195 82.6 17.31 1557  69  538 73.11 7.56
## 38 1633 1.16 0.278 80.4 58.91 1538 433 6417 42.71 7.16
## 39 3124 0.59 0.283 56.3 61.83    0 194  492 24.28 4.81
## 40 1915 1.15 0.199 82.7 67.19 1718 110 2396 53.49 6.38
## 41 2528 1.45 0.362 78.8 39.18 1779  83  744 65.99 6.94
## 42 2535 1.32 0.362 78.8 57.36 1779 359 3081 64.66 6.94
## 43 1901 0.41 0.231 69.5 57.63 1965 322 3206 31.40 5.54
## 44 2555 0.45 0.289 76.4 82.78 2137 192 1313 41.99 6.46
View(datamul)

3.3 Statistika Deskriptif

summary(datamul)
##        X1             X2              X3               X4       
##  Min.   :   0   Min.   :0.150   Min.   :0.0390   Min.   :56.30  
##  1st Qu.:1748   1st Qu.:0.570   1st Qu.:0.1950   1st Qu.:75.40  
##  Median :2066   Median :1.195   Median :0.2230   Median :80.40  
##  Mean   :2195   Mean   :1.173   Mean   :0.2192   Mean   :78.17  
##  3rd Qu.:2626   3rd Qu.:1.600   3rd Qu.:0.2900   3rd Qu.:81.80  
##  Max.   :3542   Max.   :3.200   Max.   :0.3620   Max.   :83.20  
##        X5              X6             X7              X8             X9       
##  Min.   : 0.00   Min.   :   0   Min.   : 23.0   Min.   : 250   Min.   :16.07  
##  1st Qu.:30.01   1st Qu.:1035   1st Qu.:125.2   1st Qu.: 548   1st Qu.:31.31  
##  Median :50.98   Median :1570   Median :189.5   Median : 998   Median :37.33  
##  Mean   :49.96   Mean   :1255   Mean   :214.0   Mean   :1443   Mean   :40.42  
##  3rd Qu.:66.35   3rd Qu.:1774   3rd Qu.:288.2   3rd Qu.:1674   3rd Qu.:47.21  
##  Max.   :91.74   Max.   :2137   Max.   :585.0   Max.   :6417   Max.   :73.11  
##       X10       
##  Min.   :3.570  
##  1st Qu.:5.870  
##  Median :6.900  
##  Mean   :6.435  
##  3rd Qu.:7.175  
##  Max.   :7.800

Berdasarkan analisis pemusatan dan penyebaran data, dapat disimpulkan bahwa variabel X10, yang mencerminkan Kesejahteraan Masyarakat dan Keadaan Lingkungan di berbagai negara di dunia (tingkat kebahagiaan suatu negara), memperoleh penilaian tertinggi dibandingkan dengan variabel lainnya. Sebaliknya, variabel X3, yang menggambarkan Informasi yang disediakan tentang tingkat lemak tubuh yang berlebihan dan berpotensi merugikan kesehatan individu (tingkat obesitas di suatu negara dalam persentase), menunjukkan nilai terendah dibandingkan dengan variabel lainnya. Setiap variabel menunjukkan sebaran data yang hampir seragam, dan masing-masing distribusi variabel memiliki skewness yang berbeda, terlihat dari arah kemiringan data, baik positif maupun negatif.

3.4 Transformasi Normal Baku

xdatamul<-data.frame(scale(datamul[,1:10]))
xdatamul
##             X1          X2          X3         X4          X5         X6
## 1  -0.51418507  1.03889136 -0.14957330  0.5702845 -0.82978188  0.2394195
## 2   0.67350612  0.42662540  0.69392203  0.7399560 -1.00724544  0.6105955
## 3  -0.47449359  1.06672163 -0.17899756  0.5325798 -1.42278052  0.3288756
## 4  -0.57066910  0.76058865 -0.12995713  0.6833988 -1.32249398  0.2634524
## 5  -0.86224881  1.41460002 -0.21822990  0.3063512 -1.25229341  0.1673205
## 6  -0.81339776  0.59360703  0.02697223  0.4194655 -1.60809259  0.3809470
## 7   0.87654330 -0.54743408 -1.72867502  0.9473322 -2.17841775  0.5198042
## 8  -0.86835520  0.52403135  0.03678032  0.4571703 -0.46002979  0.1753315
## 9   0.60480932  0.02308647  0.18390160  0.7588084  0.66405145  0.5758812
## 10 -0.39205744 -0.12998001  0.73315437  0.6645464 -1.12061283  0.5545185
## 11  0.25674558  0.55186162  0.69392203  0.7399560 -1.04910417  0.6105955
## 12  0.72693695 -1.27102112 -1.54232140 -0.5231536  1.54657295 -1.6752079
## 13  0.65518697 -1.32668166 -1.16961416 -0.7682345  1.16330397 -1.6752079
## 14  0.50405403 -0.83965192  0.62526543 -0.4288917  0.11683579 -1.6752079
## 15 -0.19665324 -0.11606488  0.73315437  0.6645464 -0.52892228  0.5545185
## 16  0.87654330  0.17615296  0.18390160  0.7588084  0.11857991  0.5758812
## 17  1.20323470 -1.34059680 -1.47366481 -1.8239679  1.50122599 -1.6752079
## 18 -0.19665324 -0.81182165 -1.68944268  0.5891369  0.34269851  0.9510627
## 19 -0.81339776  1.08063677  0.03678032  0.4571703 -0.53110242  0.1753315
## 20 -3.35059925  2.01295084 -0.23784607  0.8342179 -0.99024033  0.4036448
## 21  1.70395798  0.63535243  0.40948756  0.7022512 -0.11687543  0.8589363
## 22  0.03538926 -1.42408761  0.99797267 -0.6551203  0.85154366  0.7708153
## 23  2.05660151 -1.41017247  0.98816459 -1.4092155  1.82170687 -1.6752079
## 24 -1.20573277 -0.83965192 -1.54232140 -0.5231536 -0.02792564 -1.6752079
## 25  1.61694205  0.48228594  1.40010417  0.1178274  0.70242195  0.7000516
## 26  0.59412316 -1.42408761 -1.76790736 -2.0501965  1.43364159 -1.6752079
## 27  0.67045292  0.30138918  1.40010417  0.1178274 -0.99983296  0.7000516
## 28 -1.13245619  0.31530432  0.33102288  0.4383179 -0.43125192  0.6907054
## 29 -0.48517976 -0.57526435 -1.72867502  0.9473322 -0.31047205  0.5198042
## 30  0.47810191  0.03700161  1.40010417  0.1178274 -0.28910665  0.7000516
## 31 -0.54777017 -0.58917948 -1.54232140 -0.5231536  0.76302990 -1.6752079
## 32 -0.63936589 -1.22927571 -1.54232140 -0.5231536  1.19644213 -1.6752079
## 33 -0.99048282  1.30327893  0.01716415  0.4194655  0.55417229  0.4383591
## 34  1.32383574  0.59360703  1.40010417  0.1178274 -0.11338721  0.7000516
## 35 -0.81339776  1.08063677 -0.03187628  0.6833988  0.66012719  0.3342162
## 36 -0.29282875 -1.02054868  0.01716415 -0.8059393  1.30021689 -1.6752079
## 37 -0.95995092  2.82002869 -0.23784607  0.8342179 -1.42365257  0.4036448
## 38 -0.85766903 -0.01865893  0.57622501  0.4194655  0.39022561  0.3782767
## 39  1.41848465 -0.81182165  0.62526543 -4.1239585  0.51754590 -1.6752079
## 40 -0.42716914 -0.03257407 -0.19861373  0.8530703  0.75125713  0.6186065
## 41  0.50863382  0.38488000  1.40010417  0.1178274 -0.47005844  0.7000516
## 42  0.51931998  0.20398324  1.40010417  0.1178274  0.32264120  0.7000516
## 43 -0.44854147 -1.06229409  0.11524500 -1.6354441  0.33441397  0.9483924
## 44  0.54985189 -1.00663355  0.68411394 -0.3346298  1.43102542  1.1780408
##             X7           X8          X9         X10
## 1   1.63552356 -0.284499356 -0.36784165  1.01392048
## 2   1.50972780 -0.244896915  0.08263110  0.79196774
## 3  -0.64452458 -0.313301132 -0.97824555  0.86258906
## 4  -0.66811129 -0.608519331 -0.20724412  0.92312163
## 5  -0.47155541 -0.662522660 -0.52577366  1.21569570
## 6  -0.79390705 -0.816612159 -0.34585112  1.37711587
## 7  -1.40716137 -0.651001950  1.02955680 -0.57001499
## 8   0.31466809  0.205850872 -0.95358950  0.64063632
## 9   2.91706787  0.648678170 -0.17459151 -0.03531066
## 10  0.03162763 -0.471710897 -0.62506426  0.80205650
## 11  0.22818350 -0.453709788 -0.23523207  0.79196774
## 12  0.07093880 -0.851174290 -0.11994836 -1.32667207
## 13  1.28172299  0.254093846  0.64039099 -0.44894986
## 14  0.25177021 -0.005842178 -1.19748451 -0.46912738
## 15 -0.31431071  0.153287631 -0.51844349  0.80205650
## 16  0.01590316  0.754524695 -0.39183132 -0.03531066
## 17 -0.78604481 -0.439308900 -0.69836603 -1.16525189
## 18 -0.55017776 -0.759008608  0.17392513 -0.57001499
## 19 -1.50150819 -0.642361417 -0.09395955  0.64063632
## 20 -1.33640126 -0.719406167  1.97115146  1.13498561
## 21 -0.58948894 -0.736687232  1.19215347  0.69108013
## 22  1.61193686 -0.366584417 -1.56266064 -1.31658331
## 23  0.85716230 -0.859094778 -1.14417412 -2.30528188
## 24 -0.62880011 -0.522834049 -0.37717097 -1.32667207
## 25  0.07093880 -0.002962001 -0.56109179  0.50948243
## 26 -0.21210166 -0.187293364 -1.39140103 -2.89043002
## 27 -0.99046292 -0.615719775  0.38983218  0.50948243
## 28 -0.43224424 -0.564596623 -0.20457860  0.66081384
## 29  1.36034534  3.138591663  2.02579460 -0.57001499
## 30 -0.33789742 -0.088647283  0.04797935  0.50948243
## 31  0.49549949 -0.134010079  1.16816379 -0.93321039
## 32 -0.83321822 -0.789970517  0.28387780 -1.32667207
## 33 -1.24991668 -0.327702020 -1.00490074  0.42877234
## 34  0.22032127 -0.296740111  1.64662449  0.50948243
## 35  0.92006018  2.102447789 -0.29920453  0.22699712
## 36 -0.44010647  1.376643046 -1.62263482 -0.06557695
## 37 -1.13984539 -0.651721994  2.17839558  1.13498561
## 38  1.72200815  3.581418962  0.15260097  0.73143517
## 39 -0.15706601 -0.684844036 -1.07553700 -1.63942366
## 40 -0.81749375  0.686120478  0.87095840 -0.05548819
## 41 -1.02977410 -0.503392850  1.70393316  0.50948243
## 42  1.14020276  1.179350884  1.61530464  0.50948243
## 43  0.84930007  1.269356432 -0.60107458 -0.90294411
## 44 -0.17279048 -0.093687594  0.10462163  0.02522190

Data disesuaikan atau diubah menjadi distribusi normal standar karena setiap variabel memiliki satuan yang berbeda.

3.5 Uji Asumsi Normalitas

Uji Asumsi Kenormalan Data menggunakan Saphiro Wilk Normality Test

Hipotesis \(H_0\) : Data berdistribusi secara normal \(H_1\) : Data tidak berdistribusi secara normal

shapiro.test(xdatamul$X1)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X1
## W = 0.94153, p-value = 0.02686

Keputusan X1

p-value (0.02686) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X1

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X1 atau Lama hari yang mendapat sinar matahari ditentukan oleh posisi lintang, bujur harian, dan jumlah awan pada suatu kota. (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota) tidak berdistribusi secara normal.

shapiro.test(xdatamul$X2)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X2
## W = 0.95336, p-value = 0.07345

Keputusan X2

p-value (0.07345) > \(\alpha\) (0.05), Maka Terima \(H_0\).

Kesimpulan X2

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X2 atau Informasi tentang biaya atau harga satu botol air di suatu kota (Dalam satuan Euro) berdistribusi secara normal.

shapiro.test(xdatamul$X3)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X3
## W = 0.90354, p-value = 0.001401

Keputusan X3

p-value (0.001401) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X3

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X3 atau Informasi yang disediakan berkaitan dengan tingkat lemak tubuh yang berlebihan, yang memiliki potensi merugikan kesehatan individu (Tingkat obesitas di suatu negara dalam satuan persen) tidak berdistribusi secara normal.

shapiro.test(xdatamul$X4)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X4
## W = 0.78503, p-value = 1.401e-06

Keputusan X4

p-value (1.401e-06) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X4

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X4 atau Perkiraan mengenai rata-rata umur hidup yang diharapkan, berdasarkan asumsi bahwa tingkat kematian pada setiap kelompok usia akan tetap konsisten dengan tingkat yang ada pada tahun tertentu yang sedang dijadikan pertimbangan (Harapan hidup di suatu negara, diukur dalam tahun) tidak berdistribusi secara normal.

shapiro.test(xdatamul$X5)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X5
## W = 0.9751, p-value = 0.4512

Keputusan X5

p-value (0.4512) > \(\alpha\) (0.05), Maka Terima \(H_0\).

Kesimpulan X5

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X5 atau Skor indeks polusi memberikan gambaran umum tentang tingkat polusi udara di kota, dan peningkatannya bisa dipicu oleh berbagai faktor, termasuk aktivitas lalu lintas dan kebakaran.(Skor indeks polusi di suatu kota) berdistribusi secara normal.

shapiro.test(xdatamul$X6)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X6
## W = 0.71741, p-value = 7.058e-08

Keputusan X6

p-value (7.058e-08) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X6

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X6 atau Durasi kerja di berbagai negara dipengaruhi oleh kondisi ekonomi, sosial, dan masyarakat yang beragam. Tingkat signifikansi pekerjaan paruh waktu juga menjadi faktor kunci, terutama dengan kecenderungan frekuensi yang lebih rendah di negara-negara berkembang (Rata-rata jam kerja tahunan, dengan “Aug.” sebagai singkatan dari Agustus.) tidak berdistribusi secara normal.

shapiro.test(xdatamul$X7)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X7
## W = 0.94438, p-value = 0.03411

Keputusan X7

p-value (0.03411) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X7

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X7 atau Indeks yang mencerminkan kesejahteraan masyarakat dan kondisi lingku tidak berdistribusi secara normal.

shapiro.test(xdatamul$X8)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X8
## W = 0.74493, p-value = 2.245e-07

Keputusan X8

p-value (2.245e-07) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X8

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Jumlah ini dapat mempengaruhi preferensi makanan dan gaya hidup penduduk kota dalam hal mengonsumsi makanan di luar rumah tidak berdistribusi secara normal.

shapiro.test(xdatamul$X9)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X9
## W = 0.94157, p-value = 0.02694

Keputusan X9

p-value (0.02694) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X9

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X9 atau Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro) tidak berdistribusi secara normal.

shapiro.test(xdatamul$X10)
## 
##  Shapiro-Wilk normality test
## 
## data:  xdatamul$X10
## W = 0.90923, p-value = 0.002118

Keputusan X10

p-value (0.002118) < \(\alpha\) (0.05), Maka Tolak \(H_0\).

Kesimpulan X10

Dengan menggunakan taraf sebesar 5%, maka dapat disimpulkan bahwa data pada variabel X10 atau Kesejahteraan masyarakat dan keadaan lingkungan di berbagai negara di dunia (Tingkat kebahagiaan di suatu negara) tidak berdistribusi secara normal.

Kesimpulan Keseluruhan

Berdasarkan *Saphiro Wilk Normality Test diatas dapat disimpulkan bahwa dengan taraf signifikansi 5% data pada variabel X2 dan X5 berdistribusi secara normal, sedangkan data pada variabel X1,X3,X4,X6,X7,X8,X9,X10 tidak berdistribusi secara normal.

3.6 Eksplorasi Data

hist(xdatamul[,1], prob=TRUE, main="X1", xlab="X1",col="orange")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel Lama hari yang mendapat sinar matahari ditentukan oleh posisi lintang, bujur harian, dan jumlah awan pada suatu kota (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota) cenderung condong ke tengah sehingga dapat dianggap simetris dan memiliki kecenderungan untuk tersebar secara merata di sepanjang distribusi.

hist(xdatamul[,2], prob=TRUE, main="X2", xlab="X1",col="blue")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel yang menunjukkan informasi tentang biaya atau harga satu botol air di suatu kota (dalam satuan Euro) memiliki distribusi yang cenderung ke kiri, yang disebut sebagai negatively skewed atau “miring ke kiri”.

hist(xdatamul[,3], prob=TRUE, main="X3", xlab="X1",col="green")
lines(density(xdatamul[,1]))

parafrasekan Dapat diamati bahwa variabel Informasi yang disediakan berkaitan dengan tingkat lemak tubuh yang berlebihan, yang memiliki potensi merugikan kesehatan individu (Tingkat obesitas di suatu negara dalam satuan persen). Distribusi ini cenderung condong ke tengah sehingga dapat dianggap simetris dan memiliki kecenderungan untuk tersebar secara merata di sepanjang distribusi.

hist(xdatamul[,4], prob=TRUE, main="X4", xlab="X1",col="red")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel Perkiraan mengenai rata-rata umur hidup yang diharapkan, berdasarkan asumsi bahwa tingkat kematian pada setiap kelompok usia akan tetap konsisten dengan tingkat yang ada pada tahun tertentu yang sedang dijadikan pertimbangan (Harapan hidup di suatu negara, diukur dalam tahun), memiliki distribusi yang cenderung ke kanan disebut positively skewed atau “miring ke kanan”.

hist(xdatamul[,5], prob=TRUE, main="X5", xlab="X1",col="pink")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel Skor Indeks Polusi memberikan gambaran umum tentang tingkat polusi udara di kota, yang peningkatannya dapat dipicu oleh berbagai faktor termasuk aktivitas lalu lintas dan kebakaran (Skor Indeks Polusi di suatu kota). Distribusi variabel ini cenderung ke tengah, sehingga dapat dianggap simetris dan menunjukkan kecenderungan tersebar merata di sepanjang distribusi.

hist(xdatamul[,6], prob=TRUE, main="X6", xlab="X1",col="purple")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel Durasi kerja di berbagai negara dipengaruhi oleh kondisi ekonomi, sosial, dan masyarakat yang beragam. Tingkat signifikansi pekerjaan paruh waktu juga menjadi faktor kunci, terutama dengan kecenderungan frekuensi yang lebih rendah di negara-negara berkembang. (Rata-rata jam kerja tahunan, dengan “Aug.” sebagai singkatan dari Agustus.), memiliki distribusi yang cenderung ke tengah. Oleh karena itu, distribusi ini dapat dianggap simetris dan menunjukkan kecenderungan untuk tersebar secara merata di sepanjang distribusi.

hist(xdatamul[,7], prob=TRUE, main="X7", xlab="X1",col="magenta")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel Indeks yang mencerminkan kesejahteraan masyarakat dan kondisi lingkungan di berbagai negara di dunia (Tingkat Kebahagiaan di suatu negara), menunjukkan distribusi yang cenderung ke tengah. Oleh karena itu, distribusi ini dapat dianggap simetris dan menunjukkan kecenderungan untuk tersebar secara merata di sepanjang distribusi.

hist(xdatamul[,8], prob=TRUE, main="X8", xlab="X1",col="grey")
lines(density(xdatamul[,1]))

parafrasekan Dapat diamati bahwa variabel Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Jumlah ini dapat mempengaruhi preferensi makanan dan gaya hidup penduduk kota dalam hal mengonsumsi makanan di luar rumah. Distribusi ini cenderung condong ke distribusi yang cenderung ke kiri disebut negatively skewed atau “miring ke kiri”.

hist(xdatamul[,9], prob=TRUE, main="X9", xlab="X1",col="brown")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro), memiliki distribusi yang cenderung ke tengah. Oleh karena itu, distribusi ini dapat dianggap simetris dan menunjukkan kecenderungan untuk tersebar secara merata di sepanjang distribusi.

hist(xdatamul[,10], prob=TRUE, main="X10", xlab="X1",col="navy")
lines(density(xdatamul[,1]))

Terlihat bahwa variabel Kesejahteraan masyarakat dan keadaan lingkungan di berbagai negara di dunia (Tingkat Kebahagiaan di suatu negara) menunjukkan distribusi yang cenderung ke kanan, yang disebut sebagai positively skewed atau “miring ke kanan”.

3.7 Uji Multivariate Normal

mvn(data = xdatamul, mvnTest = "mardia")
## $multivariateNormality
##              Test        Statistic              p value Result
## 1 Mardia Skewness 344.812997036712 1.49029681276977e-07     NO
## 2 Mardia Kurtosis 1.99327456051111   0.0462313904840519     NO
## 3             MVN             <NA>                 <NA>     NO
## 
## $univariateNormality
##                Test  Variable Statistic   p value Normality
## 1  Anderson-Darling    X1        0.7490  0.0474      NO    
## 2  Anderson-Darling    X2        0.5275  0.1689      YES   
## 3  Anderson-Darling    X3        1.4126   0.001      NO    
## 4  Anderson-Darling    X4        2.6789  <0.001      NO    
## 5  Anderson-Darling    X5        0.3323  0.5032      YES   
## 6  Anderson-Darling    X6        5.7454  <0.001      NO    
## 7  Anderson-Darling    X7        0.7748  0.0408      NO    
## 8  Anderson-Darling    X8        3.6501  <0.001      NO    
## 9  Anderson-Darling    X9        0.9219  0.0174      NO    
## 10 Anderson-Darling    X10       1.4277   9e-04      NO    
## 
## $Descriptives
##      n          Mean Std.Dev      Median        Min       Max       25th
## X1  44 -2.529592e-16       1 -0.19665324 -3.3505992 2.0566015 -0.6828739
## X2  44  6.168125e-17       1  0.03004404 -1.4240876 2.8200287 -0.8396519
## X3  44 -5.702903e-17       1  0.03678032 -1.7679074 1.4001042 -0.2378461
## X4  44  6.212700e-16       1  0.41946549 -4.1239585 0.9473322 -0.5231536
## X5  44 -5.392181e-17       1  0.04445508 -2.1784177 1.8217069 -0.8698965
## X6  44 -8.450863e-17       1  0.42100197 -1.6752079 1.1780408 -0.2933116
## X7  44  5.014681e-17       1 -0.19244607 -1.5015082 2.9170679 -0.6975947
## X8  44  8.592703e-17       1 -0.32050158 -0.8590948 3.5814190 -0.6445216
## X9  44 -1.516583e-16       1 -0.20591136 -1.6226348 2.1783956 -0.6070720
## X10 44 -4.167041e-16       1  0.46912738 -2.8904300 1.3771159 -0.5700150
##          75th        Skew    Kurtosis
## X1  0.6590035 -0.43007960  1.09684218
## X2  0.5936070  0.42950954 -0.23291436
## X3  0.6939220 -0.43656623 -0.91522790
## X4  0.6833988 -1.95744684  4.64427219
## X5  0.7146307 -0.08897587 -0.98877275
## X6  0.6930420 -0.97144624 -0.86602431
## X7  0.5839496  0.73954476 -0.02323566
## X8  0.1664284  1.98153755  3.69088399
## X9  0.4524719  0.58498547 -0.54086692
## X10 0.7465683 -0.90284946  0.08565789

Uji Asumsi Normal Multivariate yang digunakan yaitu Mardia test

Hipotesis

\(H_0\) : Data Berdistribusi Normal Multivariate \(H_1\) : Data Tidak Berdistribusi Normal Multivariate

Keputusan

Pada Mardia Skewness didapatkan p-value sebesar 1.49029681276977e-07 yang mana nilainya kurang dari \(\alpha\) (0.05) dan didapatkan juga p-value pada Mardia Kurtosis sebesar 0.0462313904840519 yang mana hasilnya juga kurang dari \(\alpha\) (0.05). Karena nilai dari keduanya sama-sama kurang dari \(\alpha\) sebesar 0,05, maka Tolak \(H_0\).

Kesimpulan

Dengan menggunakan taraf signifikansi sebesar 5%, maka dapat disimpulkan bahwa data tidak berdistribusi secara normal multivariate. Sehingga variabel tersebut tidak memenuhi asumsi normal multivariate.

3.8 Uji Korelasi

corxdata<-cor(xdatamul)
round(corxdata,2)
##        X1    X2    X3    X4    X5    X6    X7    X8    X9   X10
## X1   1.00 -0.44  0.26 -0.37  0.35 -0.14  0.22 -0.12 -0.13 -0.37
## X2  -0.44  1.00  0.29  0.61 -0.66  0.53 -0.26 -0.09  0.36  0.81
## X3   0.26  0.29  1.00  0.09 -0.14  0.47  0.15  0.02 -0.07  0.45
## X4  -0.37  0.61  0.09  1.00 -0.57  0.66 -0.04  0.13  0.42  0.72
## X5   0.35 -0.66 -0.14 -0.57  1.00 -0.51  0.30  0.21 -0.28 -0.69
## X6  -0.14  0.53  0.47  0.66 -0.51  1.00  0.02  0.14  0.31  0.66
## X7   0.22 -0.26  0.15 -0.04  0.30  0.02  1.00  0.53 -0.12 -0.14
## X8  -0.12 -0.09  0.02  0.13  0.21  0.14  0.53  1.00  0.09  0.03
## X9  -0.13  0.36 -0.07  0.42 -0.28  0.31 -0.12  0.09  1.00  0.30
## X10 -0.37  0.81  0.45  0.72 -0.69  0.66 -0.14  0.03  0.30  1.00

Syntax tersebut digunakan untuk menghitung matriks korelasi dari dataset xdatamul dalam lingkungan pemrograman R. Korelasi mengukur hubungan linier antara dua variabel. Setelah menghitung korelasi, fungsi round digunakan untuk membulatkan nilai-nilai korelasi menjadi dua angka desimal.

Jadi, secara keseluruhan, sintaks tersebut bertujuan untuk menghasilkan dan menampilkan matriks korelasi dari dataset xdatamul dengan nilai-nilai korelasi yang dibulatkan hingga dua angka desimal.

3.9 Matriks Korelasi

xdatamutrix<-cor(xdatamul)
corrplot(xdatamutrix, method = "number")

Dari hasil keluaran yang telah ditampilkan di atas, dapat teridentifikasi nilai korelasi antar variabel dalam dataset. Ditemukan korelasi positif yang bersifat moderat, dengan nilai korelasi berkisar antara -0.69 hingga 0.81, seperti yang tampak pada hubungan antara variabel X1 dan X3, X5 dan X6, serta X7, dan lainnya. Selain itu, terdapat korelasi positif yang lebih lemah, berkisar antara 0.12 hingga 0.40, seperti pada korelasi antara variabel X3 dan X6, X8 dan X9, dan lainnya. Adapun korelasi positif yang sangat lemah, dengan nilai berkisar antara 0 hingga 0.12, juga terlihat dalam data. Selain itu, ditemukan pula korelasi negatif yang sangat lemah, dengan nilai korelasi berkisar antara -0.69 hingga 0.

3,10 Uji Multikolinearitas

chart.Correlation(xdatamul[,1:10])
## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

## Warning in par(usr): argument 1 does not name a graphical parameter

Dari output tersebut, dapat disimpulkan bahwa terdapat nilai korelasi yang signifikan antara variabel independen. Hasil analisis menunjukkan bahwa beberapa variabel memiliki nilai korelasi yang melebihi 0.5 atau lebih kecil dari -0.5, mengindikasikan adanya multikolinearitas di antara variabel independen. Oleh karena itu, asumsi dari analisis deskriminan tidak dapat dipenuhi untuk uji korelasi. Salah satu contoh yang menonjol adalah hubungan antara variabel Limbah dan Sampah, yang memiliki nilai korelasi sebesar 0.61 dan menunjukkan adanya hubungan korelasi positif.

3.11. Uji Bartlett

Uji Korelasi yang digunakan yaitu Bartlett Test of Sphericity

Hipotesis

\(H_0\) : Tidak terdapat korelasi antar variabel

\(H_1\) : Paling sedikit terdapat satu korelasi antar variabel

bartlett.test(xdatamul)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  xdatamul
## Bartlett's K-squared = 1.4201e-14, df = 9, p-value = 1

Keputusan

Berdasarkan Bartlett Test of Sphericity didapatkan p-value < 1.4201e-14.

Hal ini berarti bahwa p-value (1.4201e-14) < \(\alpha\) (0.05). Maka, Tolak \(H_0\).

Kesimpulan

Dengan menggunakan taraf signifikansi sebesar 5%, maka dapat disimpulkan bahwa terdapat paling sedikit satu korelasi antar variabel.

3.12 Uji KMO-Test

Uji KMO-Test (Kaiser-Meyer-Olkin-Test) digunakan untuk menguji kecukupan untuk setiap variabel.

Skala Uji

kMO-Test memiliki skala uji antara 0 sampai 1.

a. Jika nilai KMO-Test < 0.05, maka terdapat indikasi jumlah sampel yang digunakan kurang atau analisis faktor tidak layak digunakan.

b. Jika nilai KMO-Test > 0.05, maka terdapat indikasi jumlah sampel yang digunakan cukup atau analisis faktor layak digunakan.

KMO(dataxdatamul)
## Kaiser-Meyer-Olkin Statistics
## 
## Call: KMOS(x = xdatamul)
## 
## Measures of Sampling Adequacy (MSA):
##        X1        X2        X3        X4        X5        X6        X7        X8 
## 0.6480171 0.8534482 0.4049814 0.7556016 0.8643706 0.7878116 0.6027650 0.4459567 
##        X9       X10 
## 0.7495903 0.7588975 
## 
## KMO-Criterion: 0.7275449

Keputusan

Berdasarkan Kaiser-Meyer-Olkin-Test, nilai KMO-Test yang didapat adalah sebesar 0.7275449. Sehingga KMO-Test (0.7275449) > \(\alpha\) (0.05)

Kesimpulan

Dengan menggunakan taraf signifikansi sebesar 5%, maka dapat disimpulkan bahwa terdapat indikasi jumlah sampel yang digunakan adalah cukup atau layak untuk dilakukannya analisis faktor.

3.13 Penentuan Jumlah Faktor menggunakan Nilai Eigen

R=cov(xdatamul)
eigendata=eigen(R)
eigendata
## eigen() decomposition
## $values
##  [1] 4.1096518 1.7449816 1.3825427 0.8858347 0.5210820 0.4282023 0.3301736
##  [8] 0.2987418 0.1913885 0.1074009
## 
## $vectors
##               [,1]        [,2]        [,3]        [,4]        [,5]        [,6]
##  [1,]  0.229109703  0.22674628  0.49339727 -0.51103600 -0.26421237  0.01423834
##  [2,] -0.430956359 -0.08520046  0.04299610  0.11245513  0.27452943  0.34958495
##  [3,] -0.163189751  0.38104576  0.59461805  0.09935655  0.42239887  0.02218282
##  [4,] -0.407021253  0.08744041 -0.19484496 -0.08774756 -0.42670160 -0.22496294
##  [5,]  0.393574219  0.18419476 -0.07771313 -0.05371361  0.39506134 -0.28605674
##  [6,] -0.377924984  0.27274904  0.13053563 -0.10429768 -0.18173887 -0.55372637
##  [7,]  0.113863582  0.61830857 -0.15462787  0.07649978 -0.34514418  0.57594759
##  [8,]  0.002753991  0.53936746 -0.47600298  0.10812599  0.27699820 -0.22333872
##  [9,] -0.231212697 -0.01950288 -0.28353235 -0.80907016  0.32019709  0.20429977
## [10,] -0.453131764  0.08100905  0.09600620  0.15074337  0.08275985  0.12129171
##               [,7]        [,8]        [,9]       [,10]
##  [1,] -0.121685247  0.50168533 -0.22377243  0.07011228
##  [2,]  0.182626151  0.22007629 -0.67369149 -0.24351698
##  [3,]  0.006152871 -0.14053359  0.37726583 -0.35171146
##  [4,]  0.439590658  0.32667845  0.30105857 -0.39717261
##  [5,]  0.715782648  0.06796761 -0.12469046  0.17841837
##  [6,] -0.044226963 -0.47643065 -0.39428824  0.17554428
##  [7,]  0.190907706 -0.28518545 -0.05287712  0.05962381
##  [8,] -0.448833109  0.36329786 -0.05697981 -0.08668167
##  [9,] -0.013786360 -0.20580827  0.15434921  0.02323449
## [10,]  0.078579810  0.29348060  0.24944461  0.76162934
nilaieigen<-eigen(xdatamutrix)$values
nilaieigen
##  [1] 4.1096518 1.7449816 1.3825427 0.8858347 0.5210820 0.4282023 0.3301736
##  [8] 0.2987418 0.1913885 0.1074009

Diperoleh nilai eigen dan vektor eigen dari 10 variabel. Dari hasil tersebut, terbentuk 3 faktor yang memiliki nilai eigen > 1, sementara faktor lainnya memiliki nilai eigen < 1. Sebagai contoh, nilai eigen tertinggi pada komponen 1 mencapai 4.1096518, menunjukkan bahwa nilai tersebut lebih besar dari 1.

Selain itu, terdapat sebuah grafik yang menggambarkan hasil penentuan jumlah faktor, yaitu Scree Plot pada Gambar 1. Grafik ini memberikan visualisasi yang memperlihatkan nilai eigen untuk setiap faktor, membantu dalam menentukan jumlah faktor yang signifikan dalam analisis.

facdatamul<-factanal(factors = 2, covmat = R)
facdatamul
## 
## Call:
## factanal(factors = 2, covmat = R)
## 
## Uniquenesses:
##    X1    X2    X3    X4    X5    X6    X7    X8    X9   X10 
## 0.613 0.270 0.005 0.351 0.429 0.461 0.912 1.000 0.815 0.089 
## 
## Loadings:
##     Factor1 Factor2
## X1  -0.600   0.162 
## X2   0.742   0.424 
## X3  -0.167   0.983 
## X4   0.773   0.225 
## X5  -0.708  -0.266 
## X6   0.474   0.561 
## X7  -0.277   0.106 
## X8                 
## X9   0.431         
## X10  0.756   0.582 
## 
##                Factor1 Factor2
## SS loadings      3.096   1.959
## Proportion Var   0.310   0.196
## Cumulative Var   0.310   0.506
## 
## The degrees of freedom for the model is 26 and the fit was 1.122

3. 14 Scree Plot

xdatamul_cor<-cor(xdatamul[,-1])
xdatamul_eigen<-eigen(xdatamul_cor)
scree_xdatamul<-data.frame(eigen_value=eigen(xdatamul_cor)$values,PC=2:10)
plot(x=scree_xdatamul$PC, y=scree_xdatamul$eigen_value, type='b',
     xlab='komponen utama ke-', ylab='varians(nilai eigen)', 
     main='Scree Plot')

Dari hasil Scree Plot di atas, jumlah komponen utama yang dipilih adalah 5. Keputusan ini didasarkan pada observasi bahwa garis kurva mulai menurun secara signifikan pada komponen ke-5. Informasi ini memberikan panduan untuk memilih jumlah komponen dengan menggunakan metode proporsi kumulatif varians, dan dengan metode Scree Plot, jumlah tersebut adalah 5 komponen utama.

3. 15 Ekstraksi dan Rotasi Vektor

nfactors <- 5 # Scree Plot
pcfac = principal(r, nfactors, rotate = "varimax")
pcfac$communality

Principal Components Analysis
Call: principal(r = r, nfactors = nfactors, rotate = "varimax")
Standardized loadings (pattern matrix) based upon correlation matrix

      RC1   RC2   RC5   RC3   RC4   h2    u2 com
X1  -0.27 -0.01  0.21  0.89  0.01 0.91 0.090 1.3
X2   0.66 -0.21  0.34 -0.44  0.21 0.83 0.171 2.9
X3   0.21  0.07  0.93  0.18 -0.09 0.95 0.047 1.2
X4   0.87  0.13 -0.08 -0.14  0.22 0.85 0.152 1.3
X5  -0.81  0.32 -0.01  0.16 -0.02 0.79 0.212 1.4
X6   0.77  0.16  0.35  0.06  0.17 0.77 0.233 1.6
X7  -0.01  0.84  0.02  0.29 -0.18 0.82 0.179 1.3
X8  -0.05  0.88  0.05 -0.24  0.16 0.87 0.129 1.2
X9   0.27 -0.01 -0.06 -0.02  0.94 0.96 0.035 1.2
X10  0.79 -0.05  0.40 -0.31  0.11 0.89 0.108 1.9

                       RC1  RC2  RC5  RC3  RC4
SS loadings           3.24 1.68 1.32 1.31 1.09
Proportion Var        0.32 0.17 0.13 0.13 0.11
Cumulative Var        0.32 0.49 0.62 0.76 0.86
Proportion Explained  0.38 0.19 0.15 0.15 0.13
Cumulative Proportion 0.38 0.57 0.72 0.87 1.00

Mean item complexity =  1.5
Test of the hypothesis that 5 components are sufficient.

The root mean square of the residuals (RMSR) is  0.05 
 with the empirical chi square  9.08  with prob <  0.11 

Fit based upon off diagonal values = 0.98

Besarnya loadings sebesar 0.81 menjelaskan bahwa besarnya korelasi antara variabel X1 dengan faktor umum 1 adalah sebesar 0.81. Hasil tersebut jika dikuadratkan akan menunjukkan proporsi total varians X1 yang dapat dijelaskan oleh faktor 1. Nilai communities yang dihasilkan adalah > 0.5 sehingga dapat diidentifikasi variabel memiliki keeratan yang kuat dengan faktor yang terbentuk.

SS Loadings PA1 memiliki nilai sebesar 3.24 yang berarti total varians keseluruhan variabel asal yang dapat dijelaskan oleh faktor 1 adalah sebesar 3.24. Selain itu, didapatkan proportion var PA1 sebesar 0.32 hal ini menjelaskan bahwa proporsi total varians variabel asal yang dapat dijelaskan oleh faktor adalah sebesar 32%. Jumlah faktor yang dapat digunakan untuk analisis lanjutan adalah sebanyak satu, karena nilai eigen dari PA1 lebih dari 1 dan cumulative var yang dapat dijelaskan oleh satu faktor tersebut adalah 56%.

Variabel dianggap mampu dengan baik menjelaskan faktor apabila memiliki komunalitas yang melebihi 0.5. Oleh karena itu, dapat disarikan bahwa semua variabel mampu memberikan penjelasan yang baik terhadap faktor. Hasil ini menunjukkan bahwa penggunaan metode PCA untuk ekstraksi tidak sepenuhnya sesuai dengan kondisi ini. Nilai komunalitas mencerminkan sejauh mana suatu variabel dapat dijelaskan oleh komponen-komponen utama, dan variabel-varibel tersebut dianggap penting dalam menjelaskan struktur data.

3.16 Diagram Faktor

3.17 PCA Menggunakan PRComp

datacomp<-prcomp(x=scale(xdatamul),scale. = TRUE,center = TRUE)
datacomp
## Standard deviations (1, .., p=10):
##  [1] 2.0272276 1.3209775 1.1758158 0.9411879 0.7218601 0.6543717 0.5746073
##  [8] 0.5465728 0.4374797 0.3277207
## 
## Rotation (n x k) = (10 x 10):
##              PC1         PC2         PC3         PC4         PC5         PC6
## X1   0.229109703  0.22674628 -0.49339727  0.51103600 -0.26421237  0.01423834
## X2  -0.430956359 -0.08520046 -0.04299610 -0.11245513  0.27452943  0.34958495
## X3  -0.163189751  0.38104576 -0.59461805 -0.09935655  0.42239887  0.02218282
## X4  -0.407021253  0.08744041  0.19484496  0.08774756 -0.42670160 -0.22496294
## X5   0.393574219  0.18419476  0.07771313  0.05371361  0.39506134 -0.28605674
## X6  -0.377924984  0.27274904 -0.13053563  0.10429768 -0.18173887 -0.55372637
## X7   0.113863582  0.61830857  0.15462787 -0.07649978 -0.34514418  0.57594759
## X8   0.002753991  0.53936746  0.47600298 -0.10812599  0.27699820 -0.22333872
## X9  -0.231212697 -0.01950288  0.28353235  0.80907016  0.32019709  0.20429977
## X10 -0.453131764  0.08100905 -0.09600620 -0.15074337  0.08275985  0.12129171
##              PC7         PC8         PC9        PC10
## X1  -0.121685247  0.50168533  0.22377243  0.07011228
## X2   0.182626151  0.22007629  0.67369149 -0.24351698
## X3   0.006152871 -0.14053359 -0.37726583 -0.35171146
## X4   0.439590658  0.32667845 -0.30105857 -0.39717261
## X5   0.715782648  0.06796761  0.12469046  0.17841837
## X6  -0.044226963 -0.47643065  0.39428824  0.17554428
## X7   0.190907706 -0.28518545  0.05287712  0.05962381
## X8  -0.448833109  0.36329786  0.05697981 -0.08668167
## X9  -0.013786360 -0.20580827 -0.15434921  0.02323449
## X10  0.078579810  0.29348060 -0.24944461  0.76162934
names(datacomp)
## [1] "sdev"     "rotation" "center"   "scale"    "x"

Berdasarkan informasi tersebut, jumlah komponen utama yang dapat dipilih adalah lima. Hal ini dikarenakan lima komponen utama telah mampu menangkap minimal 80% varians dari data. Kelima komponen utama ini berhasil menangkap lebih dari 80% total keragaman data.

Selain itu, salah satu metode pendekatan untuk menentukan jumlah komponen utama adalah melalui Scree Plot. Scree Plot merupakan sebuah grafik yang menampilkan komponen utama dan varians nilai eigen. Pemilihan jumlah komponen utama dilakukan pada titik ekstrim di mana garis kurva mulai melandai. Dengan kata lain, penambahan komponen utama setelah titik tersebut tidak memberikan peningkatan signifikan dalam total keragaman data yang dapat diambil.

#Menentukan Jumlah Komponen Utama
summary(datacomp)
## Importance of components:
##                          PC1    PC2    PC3     PC4     PC5     PC6     PC7
## Standard deviation     2.027 1.3210 1.1758 0.94119 0.72186 0.65437 0.57461
## Proportion of Variance 0.411 0.1745 0.1383 0.08858 0.05211 0.04282 0.03302
## Cumulative Proportion  0.411 0.5855 0.7237 0.81230 0.86441 0.90723 0.94025
##                            PC8     PC9    PC10
## Standard deviation     0.54657 0.43748 0.32772
## Proportion of Variance 0.02987 0.01914 0.01074
## Cumulative Proportion  0.97012 0.98926 1.00000

Didapatkan informasi mengenai jumlah komponen utama untuk setiap variabel, yang mencakup sepuluh variabel.

#Persamaan Komponen Utama
datacomp$rotation
##              PC1         PC2         PC3         PC4         PC5         PC6
## X1   0.229109703  0.22674628 -0.49339727  0.51103600 -0.26421237  0.01423834
## X2  -0.430956359 -0.08520046 -0.04299610 -0.11245513  0.27452943  0.34958495
## X3  -0.163189751  0.38104576 -0.59461805 -0.09935655  0.42239887  0.02218282
## X4  -0.407021253  0.08744041  0.19484496  0.08774756 -0.42670160 -0.22496294
## X5   0.393574219  0.18419476  0.07771313  0.05371361  0.39506134 -0.28605674
## X6  -0.377924984  0.27274904 -0.13053563  0.10429768 -0.18173887 -0.55372637
## X7   0.113863582  0.61830857  0.15462787 -0.07649978 -0.34514418  0.57594759
## X8   0.002753991  0.53936746  0.47600298 -0.10812599  0.27699820 -0.22333872
## X9  -0.231212697 -0.01950288  0.28353235  0.80907016  0.32019709  0.20429977
## X10 -0.453131764  0.08100905 -0.09600620 -0.15074337  0.08275985  0.12129171
##              PC7         PC8         PC9        PC10
## X1  -0.121685247  0.50168533  0.22377243  0.07011228
## X2   0.182626151  0.22007629  0.67369149 -0.24351698
## X3   0.006152871 -0.14053359 -0.37726583 -0.35171146
## X4   0.439590658  0.32667845 -0.30105857 -0.39717261
## X5   0.715782648  0.06796761  0.12469046  0.17841837
## X6  -0.044226963 -0.47643065  0.39428824  0.17554428
## X7   0.190907706 -0.28518545  0.05287712  0.05962381
## X8  -0.448833109  0.36329786  0.05697981 -0.08668167
## X9  -0.013786360 -0.20580827 -0.15434921  0.02323449
## X10  0.078579810  0.29348060 -0.24944461  0.76162934

Didapatkan informasi mengenai persamaan komponen utama untuk setiap variabel, yang mencakup sepuluh variabel.

#Restorasi Data
head(datacomp$x[,10])
## [1]  0.31690925  0.04920496 -0.01474868  0.07051673  0.29909236  0.46655631

Didapatkan informasi mengenai restorasi data persamaan komponen utama untuk setiap variabel, yang mencakup sepuluh variabel. Pada syntax kali ini hanya ditampilkan 1 data karena menggunakan head().

#Mencari Faktor dengan PFA
r <- xdatamul
nfactors <- 3 
PFA <- fa(r, nfactors, rotate = "varimax", fm = "pa")
## maximum iteration exceeded
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect.  Try a
## different factor score estimation method.
## Warning in fac(r = r, nfactors = nfactors, n.obs = n.obs, rotate = rotate, : An
## ultra-Heywood case was detected.  Examine the results carefully
PFA
## Factor Analysis using method =  pa
## Call: fa(r = r, nfactors = nfactors, rotate = "varimax", fm = "pa")
## Standardized loadings (pattern matrix) based upon correlation matrix
##       PA1   PA2   PA3   h2    u2 com
## X1  -0.48  0.32  0.05 0.33  0.67 1.8
## X2   0.82  0.14 -0.22 0.74  0.26 1.2
## X3   0.16  1.05  0.06 1.14 -0.14 1.0
## X4   0.83 -0.02  0.11 0.71  0.29 1.0
## X5  -0.73 -0.06  0.31 0.63  0.37 1.4
## X6   0.69  0.34  0.13 0.60  0.40 1.6
## X7  -0.17  0.15  0.66 0.49  0.51 1.2
## X8   0.11 -0.07  0.83 0.70  0.30 1.0
## X9   0.43 -0.10  0.03 0.20  0.80 1.1
## X10  0.89  0.29 -0.06 0.87  0.13 1.2
## 
##                        PA1  PA2  PA3
## SS loadings           3.63 1.47 1.31
## Proportion Var        0.36 0.15 0.13
## Cumulative Var        0.36 0.51 0.64
## Proportion Explained  0.57 0.23 0.20
## Cumulative Proportion 0.57 0.80 1.00
## 
## Mean item complexity =  1.3
## Test of the hypothesis that 3 factors are sufficient.
## 
## df null model =  45  with the objective function =  5.53 with Chi Square =  214.68
## df of  the model are 18  and the objective function was  0.47 
## 
## The root mean square of the residuals (RMSR) is  0.04 
## The df corrected root mean square of the residuals is  0.06 
## 
## The harmonic n.obs is  44 with the empirical chi square  6.31  with prob <  0.99 
## The total n.obs was  44  with Likelihood Chi Square =  17.18  with prob <  0.51 
## 
## Tucker Lewis Index of factoring reliability =  1.013
## RMSEA index =  0  and the 90 % confidence intervals are  0 0.13
## BIC =  -50.94
## Fit based upon off diagonal values = 0.99

Koefisien masing-masing variabel terhadap setiap komponen utama yang terbentuk menjadi alat bantu untuk menginterpretasikan setiap komponen utama. Selain itu, nilai-nilai ini juga dapat digunakan untuk memberikan label pada komponen utama. Dengan demikian, penamaan komponen utama didasarkan pada nilai koefisien variabel terbesar, yang tidak lagi dipengaruhi oleh variasi dari variabel tersebut. Persamaan yang dihasilkan merupakan representasi dari data yang telah distandarisasi.

Interpretasi Komponen Utama

Komponen Utama 1 : KU1

KU1 : 0.229109703\(X_1\) - 0.430956359\(X_2\) - 0.163189751\(X_3\) - 0.407021253\(X_4\) - 0.393574219\(X_5\) - 0.377924984\(X_6\) + 0.113863582\(X_7\) + 0.002753991\(X_8\) - 0.231212697\(X_9\) - 0.453131764\(X_10\)

KU1 menggambarkan Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU1 yakni X1 atau Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota dan X3 atau Tingkat obesitas di suatu negara dalam satuan persen. Berdasarkan informasi tersebut, maka KU1 dapat dinamakan dengan Perilaku Pencegahan Obesitas.

Komponen Utama 2 : KU2

KU2 : 0.22674628\(X_1\) - 0.08520046\(X_2\) + 0.38104576\(X_3\) + 0.08744041\(X_4\) + 0.18419476\(X_5\) + 0.27274904\(X_6\) + 0.61830857\(X_7\) + 0.53936746\(X_8\) - 0.01950288\(X_9\) + 0.08100905\(X_10\)

KU1 menggambarkan Informasi tentang biaya atau harga satu botol air di suatu kota (Dalam satuan Euro). Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU2 yakni X7 atau Tingkat kebahagiaan di suatu negaradan X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Berdasarkan informasi tersebut, maka KU2 dapat dinamakan dengan Indikator Kesejahteraan.

Komponen Utama 3 : KU3

KU3 : -0.49339727\(X_1\) - 0.04299610\(X_2\) - 0.59461805\(X_3\) + 0.19484496\(X_4\) + 0.07771313\(X_5\) - 0.13053563\(X_6\) + 0.15462787\(X_7\) + 0.47600298\(X_8\) + 0.28353235\(X_9\) - 0.09600620\(X_10\)

KU3 menggambarkan Tingkat obesitas di suatu negara (dalam satuan persen). Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU3 yakni X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota dan X9 atau Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota (Dalam satuan Euro). Berdasarkan informasi tersebut, maka KU3 dapat dinamakan dengan Tingkat Kesehatan Kota.

Komponen Utama 4 : KU4

KU4 : 0.51103600\(X_1\) - 0.11245513\(X_2\) - 0.09935655\(X_3\) + 0.08774756\(X_4\) + 0.05371361\(X_5\) + 0.10429768\(X_6\) - 0.07649978\(X_7\) - 0.10812599\(X_8\) + 0.80907016\(X_9\) - 0.15074337\(X_10\)

KU4 menggambarkan Harapan hidup di suatu negara (Diukur dalam tahun). Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU4 yakni X1 atau Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota dan X9 atau Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota. Berdasarkan informasi tersebut, maka KU4 dapat dinamakan dengan Kombinasi Perilaku Kebugaran Hidup.

Komponen Utama 5 : KU5

KU5 : -0.26421237\(X_1\) + 0.27452943\(X_2\) + 0.42239887\(X_3\) - 0.42670160\(X_4\) + 0.39506134\(X_5\) - 0.18173887\(X_6\) - 0.34514418\(X_7\) + 0.27699820\(X_8\) + 0.32019709\(X_9\) + 0.08275985\(X_10\)

KU5 menggambarkan skor indeks polusi di suatu kota.Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU5 yakni X3 atau Tingkat obesitas di suatu negara dan X5 atau Skor indeks polusi di suatu kot. Berdasarkan informasi tersebut, maka KU5 dapat dinamakan dengan Tingkat Polutif.

Komponen Utama 6 : KU6

KU6 : 0.01423834\(X_1\) + 0.34958495\(X_2\) + 0.02218282\(X_3\) - 0.22496294\(X_4\) - 0.28605674\(X_5\) - 0.55372637\(X_6\) + 0.57594759\(X_7\) - 0.22333872\(X_8\) + 0.20429977\(X_9\) + 0.12129171\(X_10\)

KU6 menggambarkan Rata-rata jam kerja tahunan.Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU6 yakni X2 atau Informasi tentang biaya atau harga satu botol air di suatu kota dan X7 atau Tingkat kebahagiaan di suatu negara. Berdasarkan informasi tersebut, maka KU6 dapat dinamakan dengan Ekonomi Kesejahteraan.

Komponen Utama 7 : KU7

KU7 : -0.121685247\(X_1\) + 0.182626151\(X_2\) + 0.006152871\(X_3\) + 0.439590658\(X_4\) + 0.715782648\(X_5\) - 0.044226963\(X_6\) + 0.190907706\(X_7\) - 0.448833109\(X_8\) - 0.013786360\(X_9\) + 0.078579810\(X_10\)

KU7 menggambarkan Tingkat kebahagiaan di suatu negara. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU7 yakni X4 atau Harapan hidup di suatu negara dan X5 atau Skor indeks polusi di suatu kota. Berdasarkan informasi tersebut, maka KU7 dapat dinamakan dengan Indeks Pola Hidup.

Komponen Utama 8 : KU8

KU8 : 0.50168533\(X_1\) + 0.22007629\(X_2\) - 0.14053359\(X_3\) + 0.32667845\(X_4\) + 0.06796761\(X_5\) - 0.47643065\(X_6\) - 0.28518545\(X_7\) + 0.36329786\(X_8\) - 0.20580827\(X_9\) + 0.29348060\(X_10\)

KU8 menggambarkan Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU8 yakni X1 atau Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota dan X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Berdasarkan informasi tersebut, maka KU8 dapat dinamakan dengan Kondisi Kota.

Komponen Utama 9 : KU9

KU9 : 0.22377243\(X_1\) + 0.67369149\(X_2\) - 0.37726583\(X_3\) - 0.30105857\(X_4\) + 0.12469046\(X_5\) + 0.39428824\(X_6\) + 0.05287712\(X_7\) + 0.05697981\(X_8\) - 0.15434921\(X_9\) - 0.24944461\(X_10\)

KU9 menggambarkan Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU9 yakni X2 atau Informasi tentang biaya atau harga satu botol air di suatu kota dan X6 atau Rata-rata jam kerja tahunan. Berdasarkan informasi tersebut, maka KU9 dapat dinamakan dengan Gaya Hidup Kesehatan.

Komponen Utama 10 : KU10

KU10 : 0.07011228\(X_1\) - 0.24351698\(X_2\) - 0.35171146\(X_3\) - 0.39717261\(X_4\) + 0.17841837\(X_5\) + 0.17554428\(X_6\) + 0.05962381\(X_7\) - 0.08668167\(X_8\) + 0.02323449\(X_9\) + 0.76162934\(X_10\)

KU10 menggambarkan Tingkat kebahagiaan di suatu negara. Terdapat 2 variabel dengan nilai tertinggi yang merupakan variabel terkuat dalam KU10 yakni X5 atau Skor indeks polusi di suatu kota dan X10 atau Tingkat kebahagiaan di suatu negara. Berdasarkan informasi tersebut, maka KU10 dapat dinamakan dengan Pola Hidup Sehat.

## Interpretasi Analisis Faktor
fa.diagram(PFA,rsize=1)

a Pada faktor 1 (PA1) diketahui bahwa faktor tersebut berkorelasi signifikan dengan variabel X1 (Durasi atau lamanya paparan sinar matahari dalam waktu tertentu di kota), X2 (Informasi tentang biaya atau harga satu botol air di suatu kota), X4 (Harapan hidup di suatu negara),X5 (skor indeks polusi di suatu kota), X6 (Rata-rata jam kerja tahunan), X9 (Biaya keanggotaan bulanan di pusat kebugaran atau gym di suatu kota), dan X10 ( Tingkat kebahagiaan di suatu negara). Ketujuh variabel jika digabungkan menjadi suatu faktor, akan bernama Variabel kesejahteraan Kota.

b Pada faktor 2 (PA2) diketahui bahwa faktor tersebut hanya memiliki 1 variabel oleh karena itu faktor 2 (PA2) berkorelasi signifikan dengan variabel X3 atau Tingkat obesitas di suatu negara.

c Pada faktor 3 (PA3) diketahui bahwa faktor tersebut berkorelasi signifikan dengan variabel X7 (Tingkat kebahagiaan di suatu negara) dan variabel X8 atau Jumlah restoran atau tempat yang menyediakan layanan take-out atau take-away di suatu kota. Kedua variabel jika digabungkan menjadi suatu faktor, akan bernama Indeks Kesejahteraan Kuliner.

4. Penutup

4.1 Saran

  1. Menambahkan uji tambahan yang dapat merepresentasikan data sehingga memungkinkan perolehan kesimpulan yang sahih.
  2. Melakukan penelitian dengan jumlah sampel yang lebih besar. Ukuran sampel yang lebih besar dapat menghasilkan data penelitian yang lebih tepat dan dapat diterapkan secara umum pada populasi yang lebih besar.

4.2 Kesimpulan

Dengan informasi yang sudah disampaikan, diharapkan pengetahuan masyarakat terkait faktor-faktor yang berpengaruh pada gaya hidup sehat di kota akan meningkat. Tujuannya adalah agar masyarakat memiliki kesadaran akan pentingnya faktor-faktor tersebut dan mengetahui cara untuk mengadopsi perilaku hidup sehat sesuai dengan pengetahuan yang telah diperoleh sebelumnya.

Dengan metode analisis komponen utama (PCA), dapat diketahui bahwa data Pengaruh Gaya Hidup di Kota yang terdiri dari 10 variabel dapat direduksi menjadi 3 variabel namun tetap menggambarkan keragaman dari data awal. Ketiga variable tersebut adalah faktor Tingkat obesitas di suatu negara, Variabel kesejahteraan Kota, dan Indeks Kesejahteraan Kuliner.

4.3 Daftar Pustaka

Statmat.net. (n.d.). Metode Analisis Faktor dan Rumus Pengujiannya [Lengkap]. Diakses dari https://www.statmat.net/metode-analisis-faktor/

Kantinit.com. (n.d.). Principal Component Analysis (PCA): Konsep dan Cara Kerja. Diakses dari https://kantinit.com/kecerdasan-buatan/principal-component-analysis-pca-konsep-dan-cara-kerja/

Muhajir, M. (2020). Modul Praktikum Statistika Multivariat Terapan. Yogyakarta: Universitas Islam Indonesia

Urwatul, W. D., Listyani, E., Subekti, R., Kusumawati, R., Susanti, M., & Kismiantini. (2018). Analisis Data Multivariat Dengan Program R . Jurnal Pengabdian Masyarakat MIPA dan Pendidikan MIPA, 67-80.

http://faculty.petra.ac.id/halim/index_files/Stat2/PCA.pdf