Introduzione
Dettagli attività
La premessa dello studio è analizzare se ci siano fattori che influenzano la percezione della felicità del campione degli intervistati utilizzato per stilare il Rapporto sulla felicità mondiale 2019 e come questi fattori si leghino tra loro. E come creino delle relazioni tra i diversi paesi dell’indice di felicità.
Analisi dei dati
Questo set di dati cerca di riassumere e classificare i paesi del mondo secondo un parametro di felicità chiamato Punteggio; tale Punteggio di felicità è la risposta media di ogni nazione alla domanda sulle valutazioni della qualità della vita al loro interno.
Oltre al Punteggio, che serve a classificare i 156 paesi partecipanti al Rapporto, vengono presi in considerazione altri sei fattori: PIL pro capite (PIL), Sostegno sociale, Aspettativa di vita sana, Libertà di fare scelte di vita, Generosità attesa dagli altri, Percezione della corruzione (PC). Va considerato che il valore di questi fattori, tranne il PIL pro-capite, è una stima del gradimento della popolazione di quel determinato paese rispetto al fattore di riferimento, oppure, semplicemente, la misura in cui questi fattori contribuiscono al punteggio di felicità secondo la popolazione.
Il dataset è stato scelto sulla piattaforma di Kaggle (https://www.kaggle.com/unsdsn/world-happiness) ed è elaborato dal “Sustainable Development Solutions Network” (SDSN), rete lanciata dall’ex Segretario Generale dell’ONU Ban Ki-moon per mobilitare le competenze scientifiche e tecniche del mondo accademico, della società civile e del settore privato con l’obiettivo di proporre soluzioni praticabili per lo sviluppo sostenibile, includendo l’implementazione degli Obiettivi di Sviluppo Sostenibile e delle misure per l’Accordo di Parigi sul clima. Il Rapporto si basa sui dati della Gallup World Poll che registrano come le persone valutano la felicità della loro vita su una scala che va da 0 a 10 riguardo 6 criteri, sottodescritti.
I criteri del “Rapporto sulla Felicità 2019” (https://s3.amazonaws.com/happiness-report/2019/WHR19_Ch2A_Appendix1.pdf) sono:
• Indice di Felicità o benessere soggettivo (Soggettive Well-Being, SWB): laddove non specificato, rappresenta la risposta media nazionale alla domanda sulle aspettative di vita, spiegata con la metafora della scala della vita di Cantril.
• La statistica del PIL Pro-capite non è una risposta ad una domanda ma il valore che quel determinato paese possedeva alla data del 14 novrembre 2019 momento in cui si inizia il lavoro di raccolta dati. Nella nota metodologica del Rapporto sulla felicità mondiale 2019 sono riportati alcuni esempi di adattamento dei dati in quanto non tutti i paesi erano stati in grado di fornire tale dato (si dice ad esempio che per quei paesi a cui mancano i numeri del PIL nella versione WDI ma erano presenti nei precedenti rilasci del medesimo Rapporto, sono stati usati i numeri della versione precedente, dopo aver modificato il loro livello di un fattore di 1,17 per tenere conto delle variazioni dei prezzi, n.d.r.)
• Aspettativa di vita sana. Il fattore si basa sulle aspettative di vita in buona salute alla nascita ed è tratto dai dati dell’Organizzazione mondiale della sanità (OMS) globale Archivio dati dell’Osservatorio sanitario. I dati alla fonte sono disponibili per gli anni 2000, 2005, 2010, 2015 e 2016 (anche in questo caso sono state necessarie delle correzioni per casi in cui i paesi non erano compresi nell’Archiovio dell’OMS, Hong Kong, Swaziland, Taiwan e Kosovo per cui si è dovuto utilizzare un dato ponderato rispetto all’ultimo dato disponibile)
• Social support - Sostegno sociale è il dato medio fornito dai cittadini dei diversi paesi alla domanda del sondaggio GWP : “Se tu fossi nei guai, hai parenti o amici su cui puoi contare per aiutarti ogni volta che ne hai bisogno o no?”. La risposta è di tipo binario 0 o 1.
• Libertà di fare scelte di vita è la media nazionale delle risposte al quesito di GWP: "Sei soddisfatto o insoddisfatto della tua libertà di scegliere cosa fai con la tua vita?
• Generosità è il residuo della regressione della media nazionale di risposta alla domanda GWP: “Hai donato denaro ad un ente di beneficenza nell’ultimo mese?” sul PIL pro capite.
• Percezione della corruzione (PC): La misura è la media nazionale delle risposte dell’indagine a due domande del GWP: “La corruzione è diffusa in tutto il governo o no?” e “La corruzione è diffusa all’interno delle imprese o no?” La percezione complessiva è solo la media delle due risposte 0 o 1. Nel caso in cui manchi la percezione della corruzione del governo, è stata usata la percezione della corruzione aziendale come percezione complessiva.
Introduzione
L’obiettivo di questo studio è di confrontare in Analisi di Componenti Principali i fattori della felicità, in seguito ho provato a verificare se la matrice fosse adatta a un lavoro di Cluster Analysis.
In PCA possiamo verificare se i fattori del Rapporto sulla felicità mondiale 2019 utilizzati come aspetti selettivi per ogni Paese possano invece essere considerati come componenti descrittive e cercheremo di individuare quei casi che rispettano in pieno i principi di variabilità spiegata.
Nella cluster analysis il problema è : avendo a disposizione un numero n di individui ( nel nostro caso 156) caratterizzati da p caratteristiche (nel nostro caso 7), si può determinare una partizione in k gruppi in modo tale che gli individui appartenenti ad un gruppo siano vicini e quelli esterni ed appartenneti a gruppi diversi siano lontani? Cercheremo quindi di porre, per un numero di oggetti elevato, una divisione in gruppi attarverso similiarita e differenza.
ANOVA E ANCOVA…
Capitolo 1 - Rapporto sulla felicità mondiale 2019 in PCA
Preparata la matrice originale Rapporto sulla felicità mondiale 2019 (Indice_felicità_2019.csv) e denominata X,
X
Punteggio PIL Social.support AspettDiVita SceltaDiVita Generosity PC
Finland 7.769 1.340 1.587 0.986 0.596 0.153 0.393
Denmark 7.600 1.383 1.573 0.996 0.592 0.252 0.410
Norway 7.554 1.488 1.582 1.028 0.603 0.271 0.341
Iceland 7.494 1.380 1.624 1.026 0.591 0.354 0.118
Netherlands 7.488 1.396 1.522 0.999 0.557 0.322 0.298
Switzerland 7.480 1.452 1.526 1.052 0.572 0.263 0.343
Sweden 7.343 1.387 1.487 1.009 0.574 0.267 0.373
New Zealand 7.307 1.303 1.557 1.026 0.585 0.330 0.380
Canada 7.278 1.365 1.505 1.039 0.584 0.285 0.308
Austria 7.246 1.376 1.475 1.016 0.532 0.244 0.226
Australia 7.228 1.372 1.548 1.036 0.557 0.332 0.290
Costa Rica 7.167 1.034 1.441 0.963 0.558 0.144 0.093
Israel 7.139 1.276 1.455 1.029 0.371 0.261 0.082
Luxembourg 7.090 1.609 1.479 1.012 0.526 0.194 0.316
United Kingdom 7.054 1.333 1.538 0.996 0.450 0.348 0.278
Ireland 7.021 1.499 1.553 0.999 0.516 0.298 0.310
Germany 6.985 1.373 1.454 0.987 0.495 0.261 0.265
Belgium 6.923 1.356 1.504 0.986 0.473 0.160 0.210
United States 6.892 1.433 1.457 0.874 0.454 0.280 0.128
Czech Republic 6.852 1.269 1.487 0.920 0.457 0.046 0.036
United Arab Emirates 6.825 1.503 1.310 0.825 0.598 0.262 0.182
Malta 6.726 1.300 1.520 0.999 0.564 0.375 0.151
Mexico 6.595 1.070 1.323 0.861 0.433 0.074 0.073
France 6.592 1.324 1.472 1.045 0.436 0.111 0.183
Taiwan 6.446 1.368 1.430 0.914 0.351 0.242 0.097
Chile 6.444 1.159 1.369 0.920 0.357 0.187 0.056
Guatemala 6.436 0.800 1.269 0.746 0.535 0.175 0.078
Saudi Arabia 6.375 1.403 1.357 0.795 0.439 0.080 0.132
Qatar 6.374 1.684 1.313 0.871 0.555 0.220 0.167
Spain 6.354 1.286 1.484 1.062 0.362 0.153 0.079
Panama 6.321 1.149 1.442 0.910 0.516 0.109 0.054
Brazil 6.300 1.004 1.439 0.802 0.390 0.099 0.086
Uruguay 6.293 1.124 1.465 0.891 0.523 0.127 0.150
Singapore 6.262 1.572 1.463 1.141 0.556 0.271 0.453
El Salvador 6.253 0.794 1.242 0.789 0.430 0.093 0.074
Italy 6.223 1.294 1.488 1.039 0.231 0.158 0.030
Bahrain 6.199 1.362 1.368 0.871 0.536 0.255 0.110
Slovakia 6.198 1.246 1.504 0.881 0.334 0.121 0.014
Trinidad & Tobago 6.192 1.231 1.477 0.713 0.489 0.185 0.016
Poland 6.182 1.206 1.438 0.884 0.483 0.117 0.050
Uzbekistan 6.174 0.745 1.529 0.756 0.631 0.322 0.240
Lithuania 6.149 1.238 1.515 0.818 0.291 0.043 0.042
Colombia 6.125 0.985 1.410 0.841 0.470 0.099 0.034
Slovenia 6.118 1.258 1.523 0.953 0.564 0.144 0.057
Nicaragua 6.105 0.694 1.325 0.835 0.435 0.200 0.127
Kosovo 6.100 0.882 1.232 0.758 0.489 0.262 0.006
Argentina 6.086 1.092 1.432 0.881 0.471 0.066 0.050
Romania 6.070 1.162 1.232 0.825 0.462 0.083 0.005
Cyprus 6.046 1.263 1.223 1.042 0.406 0.190 0.041
Ecuador 6.028 0.912 1.312 0.868 0.498 0.126 0.087
Kuwait 6.021 1.500 1.319 0.808 0.493 0.142 0.097
Thailand 6.008 1.050 1.409 0.828 0.557 0.359 0.028
Latvia 5.940 1.187 1.465 0.812 0.264 0.075 0.064
South Korea 5.895 1.301 1.219 1.036 0.159 0.175 0.056
Estonia 5.893 1.237 1.528 0.874 0.495 0.103 0.161
Jamaica 5.890 0.831 1.478 0.831 0.490 0.107 0.028
Mauritius 5.888 1.120 1.402 0.798 0.498 0.215 0.060
Japan 5.886 1.327 1.419 1.088 0.445 0.069 0.140
Honduras 5.860 0.642 1.236 0.828 0.507 0.246 0.078
Kazakhstan 5.809 1.173 1.508 0.729 0.410 0.146 0.096
Bolivia 5.779 0.776 1.209 0.706 0.511 0.137 0.064
Hungary 5.758 1.201 1.410 0.828 0.199 0.081 0.020
Paraguay 5.743 0.855 1.475 0.777 0.514 0.184 0.080
Northern Cyprus 5.718 1.263 1.252 1.042 0.417 0.191 0.162
Peru 5.697 0.960 1.274 0.854 0.455 0.083 0.027
Portugal 5.693 1.221 1.431 0.999 0.508 0.047 0.025
Pakistan 5.653 0.677 0.886 0.535 0.313 0.220 0.098
Russia 5.648 1.183 1.452 0.726 0.334 0.082 0.031
Philippines 5.631 0.807 1.293 0.657 0.558 0.117 0.107
Serbia 5.603 1.004 1.383 0.854 0.282 0.137 0.039
Moldova 5.529 0.685 1.328 0.739 0.245 0.181 0.000
Libya 5.525 1.044 1.303 0.673 0.416 0.133 0.152
Montenegro 5.523 1.051 1.361 0.871 0.197 0.142 0.080
Tajikistan 5.467 0.493 1.098 0.718 0.389 0.230 0.144
Croatia 5.432 1.155 1.266 0.914 0.296 0.119 0.022
Hong Kong 5.430 1.438 1.277 1.122 0.440 0.258 0.287
Dominican Republic 5.425 1.015 1.401 0.779 0.497 0.113 0.101
Bosnia and Herzegovina 5.386 0.945 1.212 0.845 0.212 0.263 0.006
Turkey 5.373 1.183 1.360 0.808 0.195 0.083 0.106
Malaysia 5.339 1.221 1.171 0.828 0.508 0.260 0.024
Belarus 5.323 1.067 1.465 0.789 0.235 0.094 0.142
Greece 5.287 1.181 1.156 0.999 0.067 0.000 0.034
Mongolia 5.285 0.948 1.531 0.667 0.317 0.235 0.038
North Macedonia 5.274 0.983 1.294 0.838 0.345 0.185 0.034
Nigeria 5.265 0.696 1.111 0.245 0.426 0.215 0.041
Kyrgyzstan 5.261 0.551 1.438 0.723 0.508 0.300 0.023
Turkmenistan 5.247 1.052 1.538 0.657 0.394 0.244 0.028
Algeria 5.211 1.002 1.160 0.785 0.086 0.073 0.114
Morocco 5.208 0.801 0.782 0.782 0.418 0.036 0.076
Azerbaijan 5.208 1.043 1.147 0.769 0.351 0.035 0.182
Lebanon 5.197 0.987 1.224 0.815 0.216 0.166 0.027
Indonesia 5.192 0.931 1.203 0.660 0.491 0.498 0.028
China 5.191 1.029 1.125 0.893 0.521 0.058 0.100
Vietnam 5.175 0.741 1.346 0.851 0.543 0.147 0.073
Bhutan 5.082 0.813 1.321 0.604 0.457 0.370 0.167
Cameroon 5.044 0.549 0.910 0.331 0.381 0.187 0.037
Bulgaria 5.011 1.092 1.513 0.815 0.311 0.081 0.004
Ghana 4.996 0.611 0.868 0.486 0.381 0.245 0.040
Ivory Coast 4.944 0.569 0.808 0.232 0.352 0.154 0.090
Nepal 4.913 0.446 1.226 0.677 0.439 0.285 0.089
Jordan 4.906 0.837 1.225 0.815 0.383 0.110 0.130
Benin 4.883 0.393 0.437 0.397 0.349 0.175 0.082
Congo (Brazzaville) 4.812 0.673 0.799 0.508 0.372 0.105 0.093
Gabon 4.799 1.057 1.183 0.571 0.295 0.043 0.055
Laos 4.796 0.764 1.030 0.551 0.547 0.266 0.164
South Africa 4.722 0.960 1.351 0.469 0.389 0.130 0.055
Albania 4.719 0.947 0.848 0.874 0.383 0.178 0.027
Venezuela 4.707 0.960 1.427 0.805 0.154 0.064 0.047
Cambodia 4.700 0.574 1.122 0.637 0.609 0.232 0.062
Palestinian Territories 4.696 0.657 1.247 0.672 0.225 0.103 0.066
Senegal 4.681 0.450 1.134 0.571 0.292 0.153 0.072
Somalia 4.668 0.000 0.698 0.268 0.559 0.243 0.270
Namibia 4.639 0.879 1.313 0.477 0.401 0.070 0.056
Niger 4.628 0.138 0.774 0.366 0.318 0.188 0.102
Burkina Faso 4.587 0.331 1.056 0.380 0.255 0.177 0.113
Armenia 4.559 0.850 1.055 0.815 0.283 0.095 0.064
Iran 4.548 1.100 0.842 0.785 0.305 0.270 0.125
Guinea 4.534 0.380 0.829 0.375 0.332 0.207 0.086
Georgia 4.519 0.886 0.666 0.752 0.346 0.043 0.164
Gambia 4.516 0.308 0.939 0.428 0.382 0.269 0.167
Kenya 4.509 0.512 0.983 0.581 0.431 0.372 0.053
Mauritania 4.490 0.570 1.167 0.489 0.066 0.106 0.088
Mozambique 4.466 0.204 0.986 0.390 0.494 0.197 0.138
Tunisia 4.461 0.921 1.000 0.815 0.167 0.059 0.055
Bangladesh 4.456 0.562 0.928 0.723 0.527 0.166 0.143
Iraq 4.437 1.043 0.980 0.574 0.241 0.148 0.089
Congo (Kinshasa) 4.418 0.094 1.125 0.357 0.269 0.212 0.053
Mali 4.390 0.385 1.105 0.308 0.327 0.153 0.052
Sierra Leone 4.374 0.268 0.841 0.242 0.309 0.252 0.045
Sri Lanka 4.366 0.949 1.265 0.831 0.470 0.244 0.047
Myanmar 4.360 0.710 1.181 0.555 0.525 0.566 0.172
Chad 4.350 0.350 0.766 0.192 0.174 0.198 0.078
Ukraine 4.332 0.820 1.390 0.739 0.178 0.187 0.010
Ethiopia 4.286 0.336 1.033 0.532 0.344 0.209 0.100
Swaziland 4.212 0.811 1.149 0.000 0.313 0.074 0.135
Uganda 4.189 0.332 1.069 0.443 0.356 0.252 0.060
Egypt 4.166 0.913 1.039 0.644 0.241 0.076 0.067
Zambia 4.107 0.578 1.058 0.426 0.431 0.247 0.087
Togo 4.085 0.275 0.572 0.410 0.293 0.177 0.085
India 4.015 0.755 0.765 0.588 0.498 0.200 0.085
Liberia 3.975 0.073 0.922 0.443 0.370 0.233 0.033
Comoros 3.973 0.274 0.757 0.505 0.142 0.275 0.078
[ reached getOption("max.print") -- omitted 14 rows ]
la prima matrice che possiamo estrapolare è la matrice di Codevianza, cioè la matrice che ci mostra le varianze sulla digonale (la differenza tra la i singoli valori e la media della variabile). Lo scostamento della variabile dal suo centro.
Cod
Punteggio PIL Social.support AspettDiVita SceltaDiVita Generosity PC
Punteggio 192.051 54.568 40.112 32.579 14.011 1.246 6.290
PIL 54.568 24.601 13.947 12.491 3.354 -0.469 1.745
Social.support 40.112 13.947 13.875 8.073 2.973 -0.213 0.797
AspettDiVita 32.579 12.491 8.073 9.087 2.099 -0.105 1.048
SceltaDiVita 14.011 3.354 2.973 2.099 3.182 0.571 0.921
Generosity 1.246 -0.469 -0.213 -0.105 0.571 1.406 0.456
PC 6.290 1.745 0.797 1.048 0.921 0.456 1.385
Successivamente otteniamo la matrice di Covarianza rapportando la codevianza con la numerosità campionaria ed ottenendo una valutazione più precisa poichè eliminiamo l’influenza della numerosità delle osservazioni. La Cov assumerà valori positivi o negativi a seconda che ci sia concordanza o discordanza.
Cov
Punteggio PIL Social.support AspettDiVita SceltaDiVita Generosity PC
Punteggio 1.239035842 0.352051508 0.258788134 0.2101886732 0.090394390 0.0080395568 0.040578813
PIL 0.352051508 0.158714165 0.089980763 0.0805883832 0.021639735 -0.0030230546 0.011258182
Social.support 0.258788134 0.089980763 0.089515494 0.0520860649 0.019177610 -0.0013715707 0.005145010
AspettDiVita 0.210188673 0.080588383 0.052086065 0.0586240306 0.013544286 -0.0006806203 0.006758988
SceltaDiVita 0.090394390 0.021639735 0.019177610 0.0135442859 0.020531872 0.0036816948 0.005944693
Generosity 0.008039557 -0.003023055 -0.001371571 -0.0006806203 0.003681695 0.0090734084 0.002940519
PC 0.040578813 0.011258182 0.005145010 0.0067589878 0.005944693 0.0029405191 0.008937402
Una volta calcolata la Deviazione Standard delle colonne della matrice Indice_felicità_2019 possiamo ottenere la matrice di Correlazione (R) tramite la standardizzazione dei dati.
R
Punteggio PIL Social.support AspettDiVita SceltaDiVita Generosity PC
Punteggio 1.000 0.794 0.777 0.780 0.567 0.076 0.386
PIL 0.794 1.000 0.755 0.835 0.379 -0.080 0.299
Social.support 0.777 0.755 1.000 0.719 0.447 -0.048 0.182
AspettDiVita 0.780 0.835 0.719 1.000 0.390 -0.030 0.295
SceltaDiVita 0.567 0.379 0.447 0.390 1.000 0.270 0.439
Generosity 0.076 -0.080 -0.048 -0.030 0.270 1.000 0.327
PC 0.386 0.299 0.182 0.295 0.439 0.327 1.000
Il dataset è composto da 156 individui e 7 variabili, espresse su unità di misura differenti. L’ACP si applica direttamente sul nostro dataset attraverso la funzione “prcomp” presente nel pacchetto “stats”. La funzione prcomp comprende due elementi: il primo è rappresentato dalla matrice dei dati; il secondo argomento, scale=TRUE, ha la funzione di normalizzare le variabili; pertanto la nostra analisi delle componenti principali sarà condotta sulla matrice di correlazione.
Le informazioni rilevanti si ricavano dalla funzione summary dell’output di prcomp. La funzione restituisce una matrice che riporta: nella prima riga le radici quadrate degli autovalori, nella seconda le proporzioni di varianza spiegata da ciascuna componente e nella terza riga le percentuali di varianza cumulata.
acp <- prcomp(INDICE_FELICITA_2019, scale=TRUE)
summary(acp)
Importance of components:
PC1 PC2 PC3 PC4 PC5 PC6 PC7
Standard deviation 1.9526 1.1946 0.78287 0.74586 0.51196 0.41510 0.39587
Proportion of Variance 0.5446 0.2039 0.08756 0.07947 0.03744 0.02462 0.02239
Cumulative Proportion 0.5446 0.7485 0.83608 0.91555 0.95300 0.97761 1.00000
I valori di Proportion of variance descrivono il 74% circa del nostro fenomeno. A questo possiamo unire il grafico successivo:
plot(acp, type="lines")
possiamo notare una grande variazione tra la prima e la seconda CP, dal terzo valore in poi un assottigliamento. Pertanto anche l’analisi dello scree-graph ci suggerisce di tenere in conto le prime due componenti principali.
pairs(INDICE_FELICITA_2019[, c(1,2,3)], main=" scatter-plot delle variabili")
Tre idee che il grafico chiarisce:
il grafico di dispersione nel quale incrociano Punteggio (ordinate) e PIL pro capite (ascisse), riquadro 1,2, evidenzia una tendenza del Punteggio di felicità a incrementare con l’aumentare del PIL pro capite, al contrario da riquadro 2,1 vediamo che con PIL (ascisse) e Punteggio (ordinate) la propensione delle osservazioni cambia. Il chè potrebbe essere una prova che il PIL nn è il fattore determinante nella determinazione del punteggio di Felicità di questo Rapporto. Punteggio e Pil Pro capite sono molto simili e quasi sovrapponibili, nel Pil si può notare una dispersione delle osservazioni, notando anche delle anomalie (con valori di Pil alti si trovi un punteggio basso);
rapportando il fattore Social support e Punteggio di felicità vediamo una polarizzazione di valori nelle aree con Punteggio di felicità alto, soprattutto da 5 a 7 punti; in egual modo vediamo che la maggiore distribuzione di Social support è per valori di Pil elevati.
la presenza di anomalie è costanze nelle tre rappresentazioni della dispersione, paesi come Bootswana che ha un Pil pari a 1,041 e un punteggio di 3.488 si scostano dal gruppo di osservazioni e li vediamo rappresentati come punti isolati dei riquadri 1,2 e 2,1;
pairs(INDICE_FELICITA_2019[, c(1,5,6)], main=" scatter-plot delle variabili")
In questo secondo scatter-plot ho voluto mettere in evidenza il rapporto tra il Punteggio di Felicità, la Libertà di scelta di vita e la Generosità. Con quest’ultimo termine si intende il rapporto di reciproco aiuto e di benevolenza disinteressata che ogni individuo si attende dai suoi concittadini.
Le tre coppie di grafici di dispersione in questo caso si somigliano molto. Punteggio-Generosity e Scelta di vita-Generosity hanno la stessa area di raggruppamento delle osservazioni. Allo stesso modo il grafico Punteggio-Scelta di Vita e il suo trasposto hanno gradi di concentrazione nei valori tra lo 0.4 e 0.6.
Di cui possiamo rappresentare la matrice di correlazione attraverso un corrplot:
corrplot::corrplot(R, is.corr = FALSE, method = "number")
NA
NA
Attraverso la tabella dei gradi di correlazione notiamo che PIL, Supporto Sociale e Aspettativa di Vita in buona salute sono i valori che maggiormente convergono nel Punteggio di felicità, un po meno lo sono la Libertà di fare scelte di vita e la Generosità attesa dagli altri.
Adesso vogliamo capire quanto ogni variabile incide in materia statistica sul punteggio. Diamo un peso ad ogni variabile. Per applicare il metodo di Lagrange dobbiamo determinare il suo moltiplicatore, lambda, cioè l’autovalore di tutta la matrice. Prima procediamo a calcolare le matrici dei vettori Phi e PSi:
eig
eigen() decomposition
$values
[1] 3.8123984 1.4279202 0.6124617 0.5560538 0.2620421 0.1720309 0.1570928
$vectors
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] -0.47595314 -0.02811577 -0.071409755 -0.00790130 0.07831725 0.8530522 0.18353388
[2,] -0.45480265 -0.21346898 0.050287288 0.24215256 -0.20259470 -0.0634354 -0.80084343
[3,] -0.43657683 -0.20705545 -0.259187339 -0.05779229 0.74222881 -0.3645545 0.11048586
[4,] -0.45005928 -0.17827047 -0.000476244 0.27746837 -0.53330056 -0.3232849 0.54749862
[5,] -0.33216727 0.36225249 -0.107714065 -0.80783866 -0.25557688 -0.1486713 -0.08252102
[6,] -0.04823369 0.69371140 -0.576197733 0.42369721 -0.01103284 -0.0344202 -0.06006975
[7,] -0.24659458 0.51626137 0.762618768 0.16984826 0.22818290 -0.0870454 0.05084442
lambda [1] 3.8123984 1.4279202 0.6124617 0.5560538 0.2620421 0.1720309 0.1570928
Una volta ottenuta la somma degli autovalori (7) che è la Variabilità totale (varTOT) possiamo calcolare la Variabilità spiegata di ciascuna componente principale (CP) arrotondata alla terza cifra.
varEXP
[1] 54.463 20.399 8.749 7.944 3.743 2.458 2.244
calcoliamo la variabilità cumulata
var_cum
[1] 54.463 74.862 83.611 91.555 95.298 97.756 100.000
Utilizzando i primi due componenti avremmo il 74.862 della variabilità del fenomeno, con tre valori che contengono l’83.611% della variabilità dei dati. Il risultato è il medesimo di Proportion of Variance del comando prcomp nel quale acevano come prime due compenenti i valori: PC1=0.5446 e PC2=0.2039.
Creiamo il diagramma a barre degli autovalori, per evidenziare che la varianza spiegata è più evidente nella differenza tra il primo e il secondo componente. Essendo il punteggio di felicità un valore di sintesi della nostra matrice, utile a determinare la classifica dell’indice di felicità, la sua incidenza è obbligatoriamente maggiore rispetto alle altre.
barplot(lambda, main = "Scree-Plot degli autovalori", xlab = "n. componenti", ylab = "lambda",col = "red")
lines(x = lambda, y=NULL, type="b", pch=19, col = "blue2")
NA
NA
poichè a ogni autovalore lambda corrisponde uno e un solo autovettore u possiamo estrarre u da lambda
u
[,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,] -0.47595314 -0.02811577 -0.071409755 -0.00790130 0.07831725 0.8530522 0.18353388
[2,] -0.45480265 -0.21346898 0.050287288 0.24215256 -0.20259470 -0.0634354 -0.80084343
[3,] -0.43657683 -0.20705545 -0.259187339 -0.05779229 0.74222881 -0.3645545 0.11048586
[4,] -0.45005928 -0.17827047 -0.000476244 0.27746837 -0.53330056 -0.3232849 0.54749862
[5,] -0.33216727 0.36225249 -0.107714065 -0.80783866 -0.25557688 -0.1486713 -0.08252102
[6,] -0.04823369 0.69371140 -0.576197733 0.42369721 -0.01103284 -0.0344202 -0.06006975
[7,] -0.24659458 0.51626137 0.762618768 0.16984826 0.22818290 -0.0870454 0.05084442
tramite la moltiplicazione della matrice standardizzata Z e u, possiamo ottenere la prima Componente Principale, che deve contenere il più elevato livello di informazioni.
CP
[,1] [,2] [,3] [,4] [,5] [,6]
Finland -0.299998257 0.086597663 1.520492e-01 -0.024728725 0.0507117348 0.0379346196
Denmark -0.304832617 0.149832388 1.174839e-01 0.018239627 0.0463892765 0.0234821654
Norway -0.307077870 0.126096413 6.355051e-02 0.018047815 0.0228427188 0.0186297780
Iceland -0.254157970 0.076950630 -1.242511e-01 0.014880928 -0.0066482319 0.0275049592
Netherlands -0.269513139 0.136871219 1.727394e-02 0.044701865 0.0171818236 0.0302595177
Switzerland -0.292576599 0.119392068 7.451427e-02 0.030878824 0.0133937634 0.0201096568
Sweden -0.277740695 0.143083284 9.465571e-02 0.029283232 0.0206031427 0.0184348973
New Zealand -0.285621469 0.184031864 6.237769e-02 0.044218794 0.0339665710 0.0053562193
Canada -0.269055464 0.125436287 4.204469e-02 0.023250926 0.0052119446 0.0131874409
Austria -0.233484991 0.057545211 1.434143e-02 0.019220676 -0.0053931047 0.0280677397
Australia -0.265685008 0.137138818 6.513135e-03 0.049099028 0.0136836817 0.0083506939
Costa Rica -0.160422482 -0.034105213 -2.550387e-02 -0.068476795 -0.0178477201 0.0471623030
Israel -0.160780879 -0.023502402 -7.657375e-02 0.074106980 -0.0132080524 0.0468972518
Luxembourg -0.265069389 0.056858049 1.002005e-01 0.028095798 0.0044858728 0.0108177790
United Kingdom -0.227202138 0.124459859 -1.372114e-03 0.096206028 0.0322315166 0.0127476814
Ireland -0.260456180 0.114561353 4.047934e-02 0.061239305 0.0249361798 0.0003877479
Germany -0.219428045 0.080623788 3.636571e-02 0.045336246 0.0069041460 0.0169113163
Belgium -0.201723280 -0.008912170 4.779834e-02 0.009614434 0.0108167303 0.0173585601
United States -0.169651507 0.027442515 -5.826163e-02 0.043455251 0.0036540061 0.0352418911
Czech Republic -0.135389689 -0.146431854 -7.911110e-03 -0.058997583 -0.0081224583 0.0403534017
United Arab Emirates -0.186618454 0.078032599 -1.193051e-02 -0.019165872 -0.0302001399 0.0343922960
Malta -0.206966014 0.110605938 -1.010550e-01 0.035032984 -0.0135966285 -0.0064724402
Mexico -0.084707339 -0.097005533 1.463498e-02 -0.045241641 -0.0133360884 0.0479079354
France -0.177940113 -0.056593313 5.994410e-02 0.009520319 -0.0060390225 0.0006997568
Taiwan -0.123962279 -0.026461428 -5.015405e-02 0.073229341 0.0004317061 0.0189514915
Chile -0.088765648 -0.063364641 -4.822419e-02 0.036241526 -0.0125557227 0.0309564853
Guatemala -0.055137652 0.006727021 -3.549952e-02 -0.077463693 -0.0082041682 0.0473902596
Saudi Arabia -0.115539802 -0.078270597 5.174051e-02 -0.027520329 0.0007930678 0.0288198397
Qatar -0.182088073 0.028390814 5.296301e-03 -0.003582461 -0.0440393723 0.0050007803
Spain -0.136366421 -0.092223153 -2.337686e-02 0.042687148 -0.0163999367 -0.0038226121
Panama -0.116701386 -0.080368408 -2.576810e-02 -0.066387340 -0.0189684237 0.0066019739
Brazil -0.069044689 -0.084930798 6.296511e-03 -0.025246202 0.0296931659 0.0274643251
Uruguay -0.135455110 -0.025331259 2.555941e-02 -0.052583024 0.0072801680 -0.0032207653
Singapore -0.288045234 0.164617035 1.547295e-01 0.072579044 -0.0031465737 -0.0668129433
El Salvador -0.027833851 -0.064728667 1.084405e-02 -0.055601095 -0.0069504853 0.0456595980
Italy -0.095180903 -0.136333164 -4.916415e-02 0.095010578 -0.0033793012 0.0044825727
Bahrain -0.138941514 0.031160681 -5.368458e-02 -0.007173599 -0.0295706116 -0.0022529336
Slovakia -0.082527810 -0.133508131 -4.921933e-02 0.015719057 0.0120669878 0.0126098721
Trinidad & Tobago -0.084581876 -0.051624505 -8.659394e-02 -0.047090686 0.0145738835 0.0181692374
Poland -0.106146260 -0.084555560 -2.867770e-02 -0.048631706 -0.0144015690 0.0033104186
Uzbekistan -0.130857538 0.171123276 -2.505293e-02 -0.050688085 0.0588864482 -0.0188004199
Lithuania -0.066681974 -0.172027221 8.833195e-03 0.005031941 0.0377689007 0.0191525990
Colombia -0.067717231 -0.091016122 -2.950601e-02 -0.065765450 -0.0047405498 0.0127693274
Slovenia -0.146627504 -0.060156718 -4.721977e-02 -0.067047408 -0.0226558978 -0.0250648865
Nicaragua -0.046564354 0.019395020 -1.313892e-02 -0.013839798 0.0132616448 0.0173298590
Kosovo -0.028460400 0.015196007 -1.165092e-01 -0.030066565 -0.0311259309 0.0346263427
Argentina -0.086936065 -0.111213249 -3.416919e-03 -0.067112756 -0.0087587648 0.0022483574
Romania -0.050590894 -0.111385906 -2.557321e-02 -0.062082295 -0.0492463000 0.0295325441
Cyprus -0.091838922 -0.061006995 -4.911453e-02 0.031758945 -0.0796849074 0.0032708097
Ecuador -0.067653042 -0.039099614 -3.399733e-03 -0.060653133 -0.0205987723 0.0073908220
Kuwait -0.115006948 -0.048502658 1.127717e-03 -0.028149546 -0.0301400491 0.0044020557
Thailand -0.093118046 0.074372994 -1.636395e-01 -0.011077405 -0.0220022892 -0.0081250018
Latvia -0.048954892 -0.143388103 1.321026e-02 0.029718948 0.0376049928 0.0121710273
South Korea -0.045314250 -0.114110537 -1.575088e-02 0.141866928 -0.0433917978 0.0144355529
Estonia -0.133039676 -0.046779663 4.486412e-02 -0.043688071 0.0223323173 -0.0314142914
Jamaica -0.054794323 -0.080990689 -4.356868e-02 -0.082189975 0.0114377174 -0.0067645428
Mauritius -0.079977806 -0.008412110 -6.755771e-02 -0.030356688 -0.0056308451 -0.0057745861
Japan -0.145134629 -0.096488896 5.929516e-02 -0.010436770 -0.0375547272 -0.0385723032
Honduras -0.026916512 0.047527251 -6.465628e-02 -0.038743154 -0.0227374620 0.0086632409
Kazakhstan -0.072596947 -0.054785766 -1.181371e-02 -0.015327038 0.0453153912 -0.0076154477
Bolivia -0.008420771 -0.018449232 -1.733514e-02 -0.085740469 -0.0147380738 0.0215556167
Hungary -0.018853033 -0.170499404 -9.385448e-03 0.058061007 0.0229407047 0.0129526756
Paraguay -0.062027703 -0.005640757 -4.751877e-02 -0.061712285 0.0245089060 -0.0181159956
Northern Cyprus -0.111412881 -0.006060699 2.780864e-02 0.044333292 -0.0538868632 -0.0296521002
Peru -0.031816147 -0.097756573 -1.394887e-02 -0.063369291 -0.0345968555 0.0008914746
Portugal -0.103646644 -0.137457472 -9.234062e-03 -0.076864603 -0.0472951538 -0.0368332146
Pakistan 0.094740437 0.037393350 -1.529520e-03 0.022992013 -0.0113290222 0.0765942721
Russia -0.030600558 -0.132980554 -1.341727e-02 -0.011984203 0.0322511893 0.0011470834
Philippines -0.025656743 -0.004548833 1.264567e-02 -0.112179945 0.0103551638 0.0025663768
Serbia -0.017895806 -0.103796960 -2.861885e-02 0.036507221 0.0114031424 -0.0041624605
Moldova 0.050783444 -0.078940702 -7.204058e-02 0.038090360 0.0307315236 0.0177691992
Libya -0.030947659 -0.015773334 4.485380e-02 -0.022717586 0.0281564725 -0.0016426100
Montenegro -0.012384105 -0.101791681 3.066575e-03 0.086947973 0.0217196595 -0.0054516092
Tajikistan 0.041635347 0.064542378 3.140770e-03 0.003465324 0.0029400790 0.0170978585
Croatia -0.019427075 -0.122136744 -2.118977e-02 0.036090960 -0.0347936587 -0.0109907938
Hong Kong -0.165639544 0.079562625 7.636542e-02 0.091577910 -0.0515189817 -0.0737506808
Dominican Republic -0.055749605 -0.043659832 1.002086e-02 -0.067025146 0.0082445136 -0.0307847687
Bosnia and Herzegovina 0.031175881 -0.045763795 -9.457403e-02 0.107528579 -0.0174360347 0.0055526570
Turkey -0.012488325 -0.126901652 5.089096e-02 0.071272913 0.0323027645 -0.0095625546
Malaysia -0.043938475 0.011984411 -9.342987e-02 -0.012413283 -0.0730263918 -0.0209469697
Belarus -0.025041998 -0.096172884 5.823550e-02 0.053271622 0.0621886144 -0.0257106014
Greece 0.028335992 -0.232722275 6.688251e-02 0.109889740 -0.0373904264 0.0030518299
Mongolia -0.001559468 -0.033914558 -8.819318e-02 0.033464871 0.0683475947 -0.0231378767
North Macedonia -0.004486032 -0.057654194 -5.130654e-02 0.023476466 -0.0149435848 -0.0199930858
Nigeria 0.114355556 0.037025572 -5.627403e-02 -0.067226502 0.0546486594 0.0564917693
Kyrgyzstan 0.003142195 0.055306515 -1.384656e-01 -0.044740255 0.0251129161 -0.0331365901
Turkmenistan -0.021726371 -0.021596994 -1.029299e-01 0.004438701 0.0539949342 -0.0323584791
Algeria 0.055573611 -0.130779854 8.043435e-02 0.110455665 0.0202572185 0.0136034397
Morocco 0.066507261 -0.071828265 7.802380e-02 -0.062812982 -0.1009265828 0.0295216740
Azerbaijan -0.006214416 -0.069459490 1.282950e-01 -0.012578087 -0.0056227997 -0.0101282231
Lebanon 0.035689004 -0.092798696 -3.350987e-02 0.073302546 -0.0081204188 -0.0036466453
Indonesia 0.001681436 0.170443972 -2.098317e-01 0.050859098 -0.0249165169 -0.0171879845
China -0.035690918 -0.062925579 5.518110e-02 -0.082095361 -0.0719348923 -0.0309117517
Vietnam -0.030423963 -0.015612737 -2.509273e-02 -0.085502953 -0.0180086380 -0.0477578568
Bhutan -0.006775391 0.151688524 -6.435485e-02 0.027899330 0.0457117078 -0.0317240187
Cameroon 0.156498976 0.022616328 -2.892348e-02 -0.053445934 0.0100697714 0.0600754036
Bulgaria -0.010836117 -0.153524268 -3.093591e-02 -0.002656324 0.0268476021 -0.0484723175
Ghana 0.131255607 0.048457056 -5.138623e-02 -0.014317715 -0.0284829821 0.0419098611
Ivory Coast 0.180473050 0.031537865 3.103327e-02 -0.050952059 0.0206146364 0.0737190592
Nepal 0.056067356 0.081200206 -6.875978e-02 -0.015202007 0.0161502234 -0.0262287455
Jordan 0.008922969 -0.039475519 5.026253e-02 -0.014638374 -0.0068744121 -0.0396484530
Benin 0.218935261 0.058267175 4.014647e-02 -0.030859215 -0.0769748015 0.0910612709
Congo (Brazzaville) 0.132958040 -0.011778515 5.789440e-02 -0.046385118 -0.0368295125 0.0350780289
Gabon 0.068601132 -0.121921632 4.527654e-02 -0.020555090 0.0170237277 -0.0039448894
Laos 0.037660427 0.129811548 3.141174e-05 -0.053038738 -0.0150195013 -0.0187982496
South Africa 0.054637365 -0.050917375 -1.493030e-02 -0.048726128 0.0577957194 -0.0233060112
Albania 0.059450431 -0.031764842 -2.121260e-02 0.011549744 -0.1185851620 -0.0163531016
Venezuela 0.044196625 -0.164818717 2.087884e-02 0.062713696 0.0461412903 -0.0456102757
Cambodia 0.045965773 0.075944711 -6.112945e-02 -0.110714379 -0.0330249159 -0.0371413741
Palestinian Territories 0.094525208 -0.088319495 1.948428e-02 0.023001387 0.0392673360 -0.0189860446
Senegal 0.126579054 -0.021640520 8.902898e-04 -0.006250339 0.0340891024 -0.0028494583
Somalia 0.169769260 0.233621561 9.522330e-02 -0.109518861 0.0184215147 0.0377653928
Namibia 0.068171122 -0.077845988 1.639462e-02 -0.078033798 0.0506808455 -0.0238506572
Niger 0.217258983 0.062942147 2.394503e-02 -0.029676701 0.0128331070 0.0496956035
Burkina Faso 0.175701080 0.023812756 2.276452e-02 0.002868959 0.0696935124 0.0203588642
Armenia 0.072631124 -0.087911588 3.457326e-02 0.019232236 -0.0415701910 -0.0308863587
Iran 0.055534317 0.048557353 5.159172e-03 0.093351006 -0.0819329379 -0.0221213231
Guinea 0.190479655 0.056067005 2.610606e-03 -0.019693521 0.0064997558 0.0339313376
Georgia 0.095135683 -0.037792866 1.484774e-01 -0.011427461 -0.0987885112 -0.0001179502
Gambia 0.148092181 0.131903222 1.365126e-02 -0.008828522 0.0298445695 0.0053376005
Kenya 0.112197962 0.131840768 -1.141988e-01 0.012694942 -0.0269078715 -0.0170593993
Mauritania 0.171150661 -0.089770060 4.765671e-02 0.079516042 0.0851080719 0.0084385544
Mozambique 0.147660659 0.104020961 1.901992e-02 -0.098731382 0.0289000053 -0.0020340327
Tunisia 0.100881628 -0.136272889 5.828905e-02 0.061976483 -0.0407746118 -0.0210662739
Bangladesh 0.066326006 0.062924403 4.299345e-02 -0.074993619 -0.0597198938 -0.0394850203
Iraq 0.104322919 -0.044108930 3.539881e-02 0.049267353 -0.0120798978 -0.0075649728
Congo (Kinshasa) 0.207124495 0.028879328 -4.029236e-02 -0.014286659 0.0822735986 0.0109555435
Mali 0.182872230 -0.002752354 -1.128194e-02 -0.051751830 0.0669583546 0.0096754000
Sierra Leone 0.235737785 0.072079469 -4.555549e-02 -0.016922653 0.0310191481 0.0422470775
Sri Lanka 0.005862245 0.013275137 -7.274405e-02 -0.011509820 -0.0391631194 -0.0849530271
Myanmar 0.029509582 0.298920334 -1.480262e-01 0.060898771 0.0160148350 -0.0676186482
Chad 0.265717662 0.031198238 1.639649e-02 0.030258296 0.0476762748 0.0628010077
Ukraine 0.082384249 -0.091478009 -6.120831e-02 0.078328859 0.0422884932 -0.0590374186
Ethiopia 0.150432537 0.047586794 -3.402295e-03 -0.013113204 0.0207452712 -0.0196682455
Swaziland 0.179181464 -0.017605348 8.394967e-02 -0.069792883 0.1306415310 0.0193169770
Uganda 0.167596489 0.061262950 -5.296858e-02 -0.017847411 0.0334054096 -0.0188562439
Egypt 0.115722180 -0.097150563 5.208874e-02 0.019704225 -0.0125244203 -0.0321486432
Zambia 0.132264556 0.076606502 -3.388853e-02 -0.039037638 0.0182455906 -0.0322524067
Togo 0.249115879 0.047806003 3.801979e-02 -0.010556656 -0.0434784465 0.0332295173
India 0.119203492 0.061116401 6.236687e-03 -0.058307020 -0.0860974449 -0.0329490379
Liberia 0.219747379 0.060901050 -5.337141e-02 -0.045113888 0.0064204004 -0.0129482802
Comoros 0.242784255 0.055767818 -1.733450e-02 0.097714297 -0.0046500172 0.0083112888
[,7]
Finland 2.404750e-02
Denmark 1.217217e-02
Norway -3.763649e-03
Iceland 4.798605e-04
Netherlands 8.570479e-04
Switzerland 5.692609e-03
Sweden 6.407443e-03
New Zealand 2.125996e-02
Canada 1.089925e-02
Austria 4.571970e-03
Australia 7.928072e-03
Costa Rica 4.622864e-02
Israel 2.143492e-02
Luxembourg -2.902477e-02
United Kingdom 7.979813e-03
Ireland -1.740834e-02
Germany -1.755108e-03
Belgium 5.227788e-03
United States -3.809346e-02
Czech Republic 4.841168e-03
United Arab Emirates -6.695978e-02
Malta -3.152109e-03
Mexico 1.927857e-02
France 1.880492e-02
Taiwan -2.169062e-02
Chile 1.204636e-02
Guatemala 2.866091e-02
Saudi Arabia -4.641393e-02
Qatar -9.024521e-02
Spain 2.203510e-02
Panama 8.890585e-03
Brazil 2.003737e-02
Uruguay 1.269918e-02
Singapore -1.043092e-02
El Salvador 4.305300e-02
Italy 1.863946e-02
Bahrain -4.229657e-02
Slovakia -5.745371e-03
Trinidad & Tobago -4.504234e-02
Poland -6.046145e-03
Uzbekistan 3.871127e-02
Lithuania -9.069222e-03
Colombia 2.106382e-02
Slovenia -5.048497e-03
Nicaragua 6.469437e-02
Kosovo 6.663828e-03
Argentina 1.350483e-02
Romania -1.650160e-02
Cyprus 4.744490e-03
Ecuador 3.318980e-02
Kuwait -7.268048e-02
Thailand -1.082499e-02
Latvia -5.596911e-03
South Korea 8.234123e-03
Estonia -9.076553e-03
Jamaica 4.142805e-02
Mauritius -1.796750e-02
Japan 1.506194e-02
Honduras 5.815717e-02
Kazakhstan -2.783854e-02
Bolivia 1.722041e-02
Hungary -8.191011e-03
Paraguay 2.294517e-02
Northern Cyprus 5.928314e-03
Peru 1.896123e-02
Portugal 7.044465e-03
Pakistan -2.678600e-03
Russia -2.984187e-02
Philippines 4.543332e-03
Serbia 1.963075e-02
Moldova 4.543714e-02
Libya -2.422257e-02
Montenegro 1.886737e-02
Tajikistan 6.205824e-02
Croatia -5.790955e-05
Hong Kong -9.928114e-03
Dominican Republic -3.642226e-03
Bosnia and Herzegovina 1.500668e-02
Turkey -1.170026e-02
Malaysia -4.724618e-02
Belarus 5.178508e-03
Greece 2.313832e-02
Mongolia -1.173928e-02
North Macedonia 7.556847e-03
Nigeria -6.431903e-02
Kyrgyzstan 4.668074e-02
Turkmenistan -3.509307e-02
Algeria 1.116365e-02
Morocco 1.669619e-02
Azerbaijan -6.183675e-03
Lebanon 6.264785e-03
Indonesia -4.302895e-02
China 5.149674e-03
Vietnam 4.367392e-02
Bhutan -1.804315e-02
Cameroon -3.052574e-02
Bulgaria -5.662600e-03
Ghana -1.707410e-02
Ivory Coast -5.078331e-02
Nepal 5.118525e-02
Jordan 2.622104e-02
Benin -5.480154e-03
Congo (Brazzaville) -1.777525e-02
Gabon -5.205611e-02
Laos -3.120170e-02
South Africa -5.971176e-02
Albania -2.376758e-03
Venezuela 1.723845e-02
Cambodia 1.100162e-02
Palestinian Territories 3.208179e-02
Senegal 3.823730e-02
Somalia 3.440220e-02
Namibia -4.487929e-02
Niger 3.832081e-02
Burkina Faso 2.146929e-02
Armenia 1.701847e-02
Iran -4.250653e-02
Guinea -1.033403e-03
Georgia -8.265124e-03
Gambia 2.128827e-02
Kenya 4.942457e-03
Mauritania 1.594373e-02
Mozambique 2.912393e-02
Tunisia 9.425928e-03
Bangladesh 3.020863e-02
Iraq -6.141810e-02
Congo (Kinshasa) 5.035476e-02
Mali -6.232451e-03
Sierra Leone -1.185550e-02
Sri Lanka -9.319379e-03
Myanmar -3.688416e-02
Chad -2.631366e-02
Ukraine 1.285326e-02
Ethiopia 3.730123e-02
Swaziland -1.237744e-01
Uganda 1.710438e-02
Egypt -2.685638e-02
Zambia -2.916521e-02
Togo 1.198823e-02
India -3.903491e-02
Liberia 5.087744e-02
Comoros 3.512682e-02
[ reached getOption("max.print") -- omitted 14 rows ]
Una volta ottenuta la prima CP possiamo ottenere, arrotondata, la matrice dei pesi (FactorPattern), mettendo in rilievo le prime tre colonne di CP otteniamo
FP3ax
[,1] [,2] [,3]
Punteggio -0.929 -0.034 -0.056
PIL -0.888 -0.255 0.039
Social.support -0.852 -0.247 -0.203
AspettDiVita -0.879 -0.213 0.000
SceltaDiVita -0.649 0.433 -0.084
Generosity -0.094 0.829 -0.451
PC -0.481 0.617 0.597
par(pty="s")
plot(FP[,1:2],xlab="CP1", ylab="CP2",type="n",main = "CERCHIO CORRELAZIONI CP1 E CP2", xlim=c(-1,1),ylim=c(-1,1))
abline(h=0,v=0)
draw.circle(0,0,c(-1,0,1),border="purple")
variabili<-row.names(FP)
text(FP[,1],FP[,2], labels=variabili)
for (j in 1:7)
arrows (0,0,FP[j,1],FP[j,2], length=0.1)
Utlizzo quindi il cerchio delle correlazioni per mostrare una proiezione delle variabili iniziali nello spazio fattoriale (determinato dai primi due assi risultanti dall’analisi in CP). Ricordando che : - Quando due variabili sono lontane dal centro, allora sono significativamente e positivamente correlate se sono vicine tra loro, cioè se gli autovettori corrispondenti formano un angolo piccolo, e non sono correlate se gli autovettori sono ortogonali.
Graficamente il Cerchio della correlazione ci porta a notare:
Innanzi tutto che i valori più vicini alla circonferenza sono il Pil, il Sostegno sociale e l’Aspettativa di vita, che quindi dobbiamo considerare come i valori più affidabili della rilevazione dato che maggiore è la lunghezza della freccia e la vicinanza all’asse, maggiore è la correlazione con il fattore. Allo stesso modo se guardiamo gli angoli punti-variabile possiamo spingerci a interpretare le correlazioni stesse: dove l’angolo è più acuto il legame di influenza reciproca è maggiore.
lasciando da parte i paramentri economici (PIL, Punteggio), da un punto di vista sociologico i fattori Sostegno sociale e Aspettativa di vita sono fortemente correlati, inoltre se prendiamo il Punteggio come fattore di riferimento (anche graficamente esso si sovrappone quasi all’asse CP2) vediamo come Sostegno sociale, Aspettativa di vita e Pil siano tre fattori di vicinanza.
Generosità,Percezione della Corruzione e Libertà nelle scelte di vita sono aspetti che, se aprioristicamente potremmo considerare importanti, non sono così correlati alla valutazione che ne fanno gli intervistati dei 156 paesi.
Sappiamo che quando due fattori hanno un angolo di 90° tra loro non sono correlati, nel nostro caso non abbiamo degli angolo di 90°. Il grafico lascia intuire che le correlazioni tra le variabili sono minime se si prendono i gruppi Scelta di Vita-Percezione della corruzione-Generosità e il gruppo Sostegno sociale-Aspettativa di vita-Pil.
Ho cercato di produrre un analisi in PCA sugli individui ma il nostro dataset contiene 156 individui-paesi per cui la rappresentazione grafica è piuttosto confusa. Trovo utile inserire il grafico degli indvidui sullo spazio delle variabili. è molto interessante osservare come si distruiscono i paesi rispetto alle due componenti principali Dim1 e Dim2.
fviz_pca_ind(res.pca, repel=TRUE, col.ind="contrib") + scale_color_gradient2(low="blue", high="sky blue", midpoint=10)
Attraverso la rappresentazione di queste due Compenenti principali riusciamo a speigare il 74.9% del fenomeno. Indichiamo solo alcuni aspetti come la presenta di United States proprio in sovrapposizione all’asse Dim2, e nel IV quadrante abbiamo il Belgio che è tra i paesi al vertice della classifica sempre in prossimità dell’asse Dim2. Potremo assumere che Dim 2 prende in considerazione la dimensionalità dei fattori Punteggio-Pil-Aspettativa di vita-Sostegno sociale e nel suo percorso lineare dispone i valori secondo l’asse orizzontale in rapporto a questa dimensionalità.
Con il comando summary riportiamo in sintesi le componenti del nostro percorso di studio.
summary(res.pca)
Call:
PCA(X = X, scale.unit = TRUE, graph = T)
Eigenvalues
Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6 Dim.7
Variance 3.813 1.427 0.613 0.556 0.262 0.172 0.157
% of var. 54.465 20.388 8.756 7.947 3.744 2.462 2.239
Cumulative % of var. 54.465 74.853 83.608 91.555 95.300 97.761 100.000
Individuals (the 10 first)
Dist Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr cos2
Finland | 4.430 | 3.747 2.360 0.715 | 1.082 0.525 0.060 | -1.900 3.776 0.184 |
Denmark | 4.544 | 3.807 2.437 0.702 | 1.872 1.573 0.170 | -1.467 2.252 0.104 |
Norway | 4.244 | 3.835 2.473 0.817 | 1.575 1.114 0.138 | -0.793 0.659 0.035 |
Iceland | 3.684 | 3.174 1.694 0.743 | 0.961 0.415 0.068 | 1.552 2.520 0.178 |
Netherlands | 3.847 | 3.366 1.905 0.766 | 1.710 1.313 0.197 | -0.215 0.048 0.003 |
Switzerland | 4.085 | 3.654 2.245 0.800 | 1.491 0.999 0.133 | -0.930 0.905 0.052 |
Sweden | 4.109 | 3.469 2.023 0.713 | 1.787 1.435 0.189 | -1.182 1.461 0.083 |
New Zealand | 4.379 | 3.567 2.140 0.664 | 2.299 2.374 0.276 | -0.778 0.634 0.032 |
Canada | 3.763 | 3.360 1.899 0.798 | 1.567 1.103 0.173 | -0.525 0.288 0.019 |
Austria | 3.040 | 2.916 1.430 0.920 | 0.719 0.232 0.056 | -0.179 0.033 0.003 |
Variables
Dim.1 ctr cos2 Dim.2 ctr cos2 Dim.3 ctr cos2
Punteggio | 0.929 22.644 0.863 | -0.034 0.080 0.001 | 0.056 0.511 0.003 |
PIL | 0.888 20.687 0.789 | -0.255 4.553 0.065 | -0.039 0.246 0.002 |
Social.support | 0.852 19.060 0.727 | -0.247 4.291 0.061 | 0.202 6.690 0.041 |
AspettDiVita | 0.879 20.264 0.773 | -0.212 3.163 0.045 | 0.001 0.000 0.000 |
SceltaDiVita | 0.649 11.036 0.421 | 0.433 13.114 0.187 | 0.083 1.131 0.007 |
Generosity | 0.094 0.233 0.009 | 0.829 48.137 0.687 | 0.452 33.294 0.204 |
PC | 0.481 6.077 0.232 | 0.617 26.661 0.380 | -0.597 58.128 0.356 |
lapply(dimdesc(res.pca),lapply,round,5)
$Dim.1
$Dim.1$quanti
correlation p.value
Punteggio 0.92915 0
PIL 0.88808 0
AspettDiVita 0.87895 0
Social.support 0.85246 0
SceltaDiVita 0.64865 0
PC 0.48133 0
$Dim.2
$Dim.2$quanti
correlation p.value
Generosity 0.82884 0.00000
PC 0.61684 0.00000
SceltaDiVita 0.43261 0.00000
AspettDiVita -0.21247 0.00775
Social.support -0.24747 0.00184
PIL -0.25491 0.00132
$Dim.3
$Dim.3$quanti
correlation p.value
Generosity 0.45172 0.00000
Social.support 0.20249 0.01124
PC -0.59687 0.00000
$call
$call$num.var
[1] 1
$call$proba
[1] 0.05
$call$weights
[1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[53] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
[105] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
$call$X
NANA
CONCLUSIONI
Al termine dell’analisi per componenti principali possiamo dedurre che i fattori che maggiormente sono correlabili ad una percezione positiva del punteggio di felicità soggettiva sono legati tra loro in questo modo: PIL, Supporto sociale e Aspettativa di vita da una parte e Generosità, Libertà di scelta di vita e Percezione della Corruzione dall’altra.
Capitolo 2 - Rapporto sulla felicità mondiale 2019 in Cluster Analysis
Proviamo a delineare un Analisi per Cluster della nostra matrice Indice Felicità 2019. come primo passaggio dopo aver standardizzato il dataset, abbiamo calcolato la matrice di dissimilarità. Abbiamo scelto il metodo di Manhattan dato l’elevato numero di individui e per avere un dato più robusto.
d_m
Finland Denmark Norway Iceland Netherlands Switzerland Sweden New Zealand Canada
Denmark 1.59
Norway 2.59 1.47
Iceland 5.69 4.56 3.79
Netherlands 3.72 2.48 1.92 2.98
Switzerland 2.87 1.63 0.76 4.10 1.58
Sweden 2.49 1.26 1.42 4.41 1.80 0.97
Austria Australia Costa Rica Israel Luxembourg United Kingdom Ireland Germany
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Belgium United States Czech Republic United Arab Emirates Malta Mexico France
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Taiwan Chile Guatemala Saudi Arabia Qatar Spain Panama Brazil Uruguay Singapore
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
El Salvador Italy Bahrain Slovakia Trinidad & Tobago Poland Uzbekistan Lithuania
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Colombia Slovenia Nicaragua Kosovo Argentina Romania Cyprus Ecuador Kuwait Thailand
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Latvia South Korea Estonia Jamaica Mauritius Japan Honduras Kazakhstan Bolivia
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Hungary Paraguay Northern Cyprus Peru Portugal Pakistan Russia Philippines Serbia
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Moldova Libya Montenegro Tajikistan Croatia Hong Kong Dominican Republic
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Bosnia and Herzegovina Turkey Malaysia Belarus Greece Mongolia North Macedonia
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Nigeria Kyrgyzstan Turkmenistan Algeria Morocco Azerbaijan Lebanon Indonesia China
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Vietnam Bhutan Cameroon Bulgaria Ghana Ivory Coast Nepal Jordan Benin
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Congo (Brazzaville) Gabon Laos South Africa Albania Venezuela Cambodia
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Palestinian Territories Senegal Somalia Namibia Niger Burkina Faso Armenia Iran
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Guinea Georgia Gambia Kenya Mauritania Mozambique Tunisia Bangladesh Iraq
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Congo (Kinshasa) Mali Sierra Leone Sri Lanka Myanmar Chad Ukraine Ethiopia
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Swaziland Uganda Egypt Zambia Togo India Liberia Comoros Madagascar Lesotho
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Burundi Zimbabwe Haiti Botswana Syria Malawi Yemen Rwanda Tanzania Afghanistan
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
Central African Republic
Denmark
Norway
Iceland
Netherlands
Switzerland
Sweden
[ reached getOption("max.print") -- omitted 149 rows ]
Una volta ottenuta la matrice di dissimilarità (d) non abbiamo applicato il metodo di legame singolo poichè avevamo una omogenità eccessiva dei dati con gruppi filiformi; non abbiamo applicato il metodo del legame completo poichè correvamo il rischio di avere una scarsa differenziazione tra i gruppi; pertanto abbiamo scelto il metodo del legame medio:
plot(hc_a)
Il dendogramma per l’elevata popolazione campionaria pare poco legibile ad una interpretazione preliminare, ma possiamo utilizzare il cutree, dividendo il dendogramma in 10 gruppi, rappresentati in questo modo:
groups <- cutree(hc_a, k=10)
plot(hc_a)
rect.hclust(hc_a, k=10, border="red")
Per capire dove effettuare il taglio dell’albero riprendiamo la regola per la quale: la distanza di fusione, in termini di distanza riscalata può essere evinta dall’osservazione del dendrogramma: se nel passaggio da K gruppi a K+1 si registra un forte incremento della distanza di fusione si deve “tagliare” a K gruppi. In questo caso di studio il taglio avviene a 0.2.
Anche effettuando uno scree-plot per avere conferma di dove debba avvenire il taglio dell’albero, notiamo che la pendenza della curva declive tra i valori di 0.1 e 0.3, cioè il punto in cui gli autovalori; Poco prima del valore 0.2 abbiamo il “punto di flesso” o “punto di gomito” quindi i valori presenti prima del punto in cui la curva da concava diventa convessa sono da considerarsi significativi.
plot(d_fus_a,n_clus,"b", main="Screeplot Legame medio", xlab="Distanza di Fusione",
ylab="N. di gruppi",cex=0.6, col="red",lwd=2.5)
Utilizziando l’algroritmo kmeans è evidente che lo stacco tra i primi due valori è significativo. Quindi il modo più appropriato di dividere i gruppi è di creare due cluster.
fviz_nbclust(X, kmeans, method="wss") + geom_vline(xintercept = 2, linetype=2)
Andrò allora a arappresentare due cluster sul plot degli individui:
fviz_cluster(km.res2, data = X)
Dalla rappresentazione grafica sembra che la modalità più significativa sia quella di raggruppare i 156 paesi in un numero di cluster superiore, che renda meglio le similarità e dissimilarità tra tutti e i 156 nostri componenti. Al fine di non disperdere le informazioni e le differenziazioni che il Rapporto sulla felicità contiene.
fviz_cluster(km.res10, data = X)
Rendendo graficamente il Cluster plot, vediamo come il Rapporto sulla felicità mondiale 2019 non equivale a una classifica (anche se lo scopo per cui è commissionato è quello) ma esso è nella nostra lavorazione statistica un modo per raggruppare i paesi in base ai fattori presi in esame ed estenderli nelle due dimensioni considerate principali (le Dim1 e Dim2 ottenute grazie a PCA). Decido allora di optare per un numero di cluster pari a 10.
Alla sinistra troviamo che il gruppo chiamato cluster 10, il primo da sinistra nell’immagine, che contiene i paesi delle prime posizioni del Rapporto sulla felicità mondiale 2019 è in posizione di distanza con i gruppi di cluster 6 e 3 nel quale troviamo i maggior numero di paesi. Prendiamo ad esempio lo stato di Singapore che è tra i vertici della classifica ma viene però unito al cluster 6 anche essendo in posizione di vicinanza visiva con numerosi paesi tipo Svizzera, Nuova Zelanda, ecc. I cluster 3, 6 e 1 sono composti da punti molto vicini tra loro eppure vengono divisi in senso orizzontale sull’asse Dim2. Tutta questa varietà di informazioni consente di interpetrare meglio il Rapporto sulla Felicità 2019 vedendo come alcuni paesi siano vicini nei loro modi di valutare la Felicità ma partendo da punti di osservazione e parametri diversi.
CONCLUSIONI
A causa della grossa quantità di dati, la disperisione è molto elevata pertanto diventa utile l’associazione in più cluster, perchè evidenzia meglio le distanze di dissimilarità tra i gruppi di diverse nazioni ed arricchisce la lettura dei dati.
Il significato più chiaro viene dato dai due assi del grafico, le Compenenti Principali: pochissimi paesi si allineano sull’asse Dim1, la distribuzione avviene in senso latitudinale seguendo l’asse Dim2. I paesi primi nel Rapporto sulla felicità mondiale 2019 sono disposti nel III quadrante, i paesi che occupano la pancia della classifica hanno valori positivi per l’asse Dim1 e negativi sull’asse Dim2. I paesi con scarso punteggio nel Rapporto sulla felicità mondiale 2019 si trovano nel I e II quadrante anche in questo caso molto vicini all’asse delle ascisse Dim2. Questo ci dà una applicazione della teoria dell’Analisi in Componenti Principali quando afferma che : i nuovi assi rappresentano le direzioni principali (autovettori), cioè le direzioni di variabilità minima.
Se mettiamo a confronto il Cluster plot qui ottenuto con il plot Individuals-PCA che concludeva il capitolo precedente vediamo come adesso siano speculari l’uno a l’altro.
Pierluigi Mancarella