1 Úvod

Cieľom tohto semestrálneho projektu je analyzovať faktory, ktoré ovplyvňujú index šťastia v jednotlivých krajinách. V projekte pracujem s dátami z databázy World Happiness Report 2019, ktoré obsahujú informácie o úrovni šťastia a vybraných socio-ekonomických ukazovateľoch.

V analýze sa zameriavam najmä na vplyv HDP na obyvateľa, sociálnej opory a zdravej dĺžky života na hodnotu indexu šťastia.

Pri modelovaní postupne overujem základné predpoklady lineárnej regresie, konkrétne prítomnosť heteroskedasticity, nelineárnych vzťahov, autokorelácie rezíduí a multikolinearity medzi vysvetľujúcimi premennými.

2 Moje dáta

V projekte pracujem s dátami z databázy World Happiness Report 2019, ktoré sú verejne dostupné na platforme Kaggle:
https://www.kaggle.com/datasets/unsdsn/world-happiness

Dataset obsahuje údaje za rok 2019 pre viac ako 150 krajín sveta a zachytáva úroveň subjektívne vnímaného šťastia spolu s vybranými socio-ekonomickými ukazovateľmi.

Pre účely analýzy používam tieto premenné:

  • Score – index šťastia (vysvetľovaná premenná),
  • GDP per capita – hrubý domáci produkt na obyvateľa,
  • Social support – sociálna opora,
  • Healthy life expectancy – zdravá dĺžka života.

Dáta sú uložené vo formáte CSV v priečinku udaje a pred samotnou analýzou sú upravené tak, aby boli vhodné na regresné modelovanie.

Table 2.1: Table 2.2: Základný štatistický popis vybraných premenných
Score GDP.per.capita Social.support Healthy.life.expectancy
Min. :2.853 Min. :0.0000 Min. :0.000 Min. :0.0000
1st Qu.:4.545 1st Qu.:0.6028 1st Qu.:1.056 1st Qu.:0.5477
Median :5.380 Median :0.9600 Median :1.272 Median :0.7890
Mean :5.407 Mean :0.9051 Mean :1.209 Mean :0.7252
3rd Qu.:6.184 3rd Qu.:1.2325 3rd Qu.:1.452 3rd Qu.:0.8818
Max. :7.769 Max. :1.6840 Max. :1.624 Max. :1.1410

Tabuľka 2.1 poskytuje základný štatistický prehľad vybraných premenných použitých v analýze. Index šťastia (Score) nadobúda hodnoty od 2.85 do 7.77 bodu, pričom medián na úrovni 5.38 naznačuje, že väčšina krajín sa nachádza v strednom pásme subjektívnej spokojnosti so životom.

HDP na obyvateľa (GDP per capita) vykazuje výraznú variabilitu, čo poukazuje na značné rozdiely v ekonomickej výkonnosti medzi krajinami. Medián nižší ako priemer naznačuje, že väčšina krajín nedosahuje úroveň najbohatších ekonomík.

Premenné sociálna podpora (Social support) a zdravá dĺžka života (Healthy life expectancy) vykazujú relatívne stabilnejšie rozdelenie, avšak aj pri nich existujú výrazné rozdiely medzi krajinami. Celkovo základné štatistiky potvrdzujú existenciu významnej variability v socio-ekonomických a zdravotných podmienkach, čo vytvára vhodný základ pre následnú regresnú analýzu.

2.1 Boxploty

Boxplot indexu šťastia (Score) ukazuje, že väčšina krajín dosahuje hodnoty približne medzi 4,5 a 6 bodmi. Medián sa nachádza okolo hodnoty 5,3, čo naznačuje strednú úroveň subjektívne vnímaného šťastia. Rozsah hodnôt poukazuje na rozdiely medzi krajinami, no extrémne hodnoty sa vyskytujú len zriedkavo.

V prípade HDP na obyvateľa je rozptyl hodnôt výraznejší. Väčšina krajín sa nachádza pod hodnotou 1, pričom niekoľko krajín dosahuje výrazne vyššie hodnoty. To poukazuje na značné rozdiely v ekonomickej výkonnosti medzi krajinami.

Boxplot sociálnej podpory ukazuje, že väčšina krajín má relatívne vysokú úroveň sociálnej podpory. Medián sa nachádza okolo hodnoty 1,2, pričom sa vyskytujú aj niektoré nízke odľahlé hodnoty, ktoré môžu predstavovať krajiny so slabším sociálnym zázemím.

Pri zdravej dĺžke života vidíme, že väčšina krajín dosahuje hodnoty v strednom pásme, približne okolo 0,8. Niektoré nízke odľahlé hodnoty naznačujú existenciu krajín s horšími zdravotnými podmienkami a nižšou kvalitou života.

Celkovo boxploty potvrdzujú, že medzi krajinami existujú výrazné rozdiely v socio-ekonomických a zdravotných ukazovateľoch, ktoré môžu ovplyvňovať úroveň šťastia obyvateľstva.

2.2 Grafy na regresiu

Na grafoch je zobrazený vzťah medzi indexom šťastia a vybranými socio-ekonomickými faktormi. Vo všetkých prípadoch je pozorovaný kladný lineárny vzťah, čo znamená, že so zvyšovaním hodnoty vysvetľujúcej premennej rastie aj index šťastia.

Vzťah medzi indexom šťastia a HDP na obyvateľa ukazuje, že krajiny s vyšším ekonomickým výkonom majú vo všeobecnosti vyššiu úroveň subjektívneho šťastia. Body sú rozptýlené, no rastúci trend naznačuje významný pozitívny vplyv HDP na spokojnosť so životom.

Pri vzťahu medzi indexom šťastia a sociálnou podporou je trend ešte výraznejší. Vyššia dostupnosť sociálnej podpory je spojená s vyššími hodnotami indexu šťastia, čo poukazuje na dôležitú úlohu medziľudských vzťahov a sociálneho zázemia pri formovaní spokojnosti obyvateľov.

Graf index šťastia vs. zdravá dĺžka života taktiež naznačuje pozitívny vzťah. Krajiny, v ktorých sa obyvatelia dožívajú vyššieho počtu rokov v dobrom zdraví, dosahujú spravidla vyšší index šťastia, čo potvrdzuje význam zdravotných podmienok pre kvalitu života.

Celkovo regresné grafy naznačujú, že všetky tri premenné majú pozitívny vplyv na index šťastia, pričom ich vzťah je približne lineárny, čo podporuje použitie lineárnej regresie v ďalšej analýze.

2.3 Heatmap korelačnej matice

Heatmapa korelačnej matice ukazuje, že index šťastia je silne pozitívne korelovaný so všetkými analyzovanými premennými. Najsilnejší vzťah má s HDP na obyvateľa (0.79), sociálnou podporou (0.78) a zdravou dĺžkou života (0.78), čo naznačuje, že vyššie hodnoty týchto faktorov sú spojené s vyššou úrovňou šťastia.

Zároveň je viditeľná aj silná korelácia medzi vysvetľujúcimi premennými navzájom, najmä medzi HDP na obyvateľa a zdravou dĺžkou života (0.84), čo môže naznačovať možnú prítomnosť multikolinearity v regresnom modeli.

3 Regresia

3.1 Prieskum dát

Čiarové grafy jednotlivých premenných ukazujú, že index šťastia má klesajúci trend, čo naznačuje výrazné rozdiely medzi krajinami od najšťastnejších po najmenej šťastné. Podobný vzor je pozorovaný aj pri HDP na obyvateľa, sociálnej opore a zdravej dĺžke života, čo naznačuje, že tieto premenné sa systematicky menia spolu s úrovňou šťastia.

Scatter ploty v matici „Score vs prediktory“ ukazujú jasný pozitívny vzťah medzi indexom šťastia a všetkými troma vysvetľujúcimi premennými. Body sú rozložené približne pozdĺž rastúcej línie, čo naznačuje, že vyššie hodnoty HDP na obyvateľa, sociálnej opory a zdravej dĺžky života sú spojené s vyšším indexom šťastia.

Zároveň je viditeľný aj silný vzťah medzi samotnými vysvetľujúcimi premennými, najmä medzi HDP na obyvateľa a zdravou dĺžkou života, čo môže naznačovať možnú multikolinearitu, ktorá bude ďalej analyzovaná v nasledujúcich kapitolách.

Na základe prieskumu dát možno konštatovať, že lineárny regresný model je vhodným nástrojom na analýzu vzťahu medzi indexom šťastia a vybranými socio-ekonomickými faktormi.

3.2 Odhad lineárneho modelu

V tabuľke 3.1 sú uvedené výsledky odhadu lineárneho regresného modelu, v ktorom je index šťastia (Score) vysvetľovaný pomocou premenných HDP na obyvateľa, sociálna opora a zdravá dĺžka života.

Table 3.1: Table 3.1: Regresný model – Index šťastia ~ prediktory
term estimate std.error statistic p.value
(Intercept) 2.135 0.212 10.088 0.000
GDP.per.capita 0.810 0.236 3.434 0.001
Social.support 1.322 0.248 5.324 0.000
Healthy.life.expectancy 1.298 0.366 3.544 0.001

Výsledky ukazujú, že všetky tri premenné majú pozitívny a štatisticky významný vplyv na index šťastia (p-hodnoty sú menšie ako 0,05).

HDP na obyvateľa má pozitívny vplyv – s rastom ekonomickej úrovne krajiny rastie aj úroveň šťastia obyvateľov.

Sociálna opora má najsilnejší efekt spomedzi vysvetľujúcich premenných, čo naznačuje, že silné sociálne vzťahy a podpora majú významný vplyv na subjektívne vnímanie šťastia.

Zdravá dĺžka života má taktiež pozitívny a štatisticky významný vplyv, čo poukazuje na dôležitosť zdravotných podmienok pre kvalitu života.

Konštanta (Intercept) predstavuje očakávanú hodnotu indexu šťastia v prípade, že všetky vysvetľujúce premenné nadobúdajú nulovú hodnotu.

Celkovo výsledky potvrdzujú, že ekonomické, sociálne aj zdravotné faktory zohrávajú významnú úlohu pri vysvetľovaní rozdielov v úrovni šťastia medzi krajinami.

3.3 Robustné štandardné chyby

Table 3.2: Table 3.3: Koeficienty modelu s Newey-West robustnými štandardnými chybami
term estimate std.error statistic p.value
(Intercept) 2.135 0.296 7.211 0.000
GDP.per.capita 0.810 0.259 3.131 0.002
Social.support 1.322 0.246 5.382 0.000
Healthy.life.expectancy 1.298 0.376 3.452 0.001
Table 3.2: Table 3.4: Koeficienty modelu s HC3 robustnými štandardnými chybami
term estimate std.error statistic p.value
(Intercept) 2.135 0.258 8.291 0.000
GDP.per.capita 0.810 0.227 3.568 0.000
Social.support 1.322 0.259 5.103 0.000
Healthy.life.expectancy 1.298 0.365 3.557 0.001

Po použití robustných štandardných chýb (Newey-West aj HC3) ostávajú všetky vysvetľujúce premenné štatisticky významné. Znamienka a veľkosti koeficientov sa oproti pôvodnému modelu prakticky nemenia, menia sa len štandardné chyby.

3.4 Predikcie a vizualizácia

Figure 3.6: Predikcia

Zelená čiara predstavuje skutočný index šťastia, oranžová prerušovaná čiara predstavuje predikovaný index šťastia.

Na začiatku vzorky sú obe krivky pomerne blízko seba, čo naznačuje, že model dokáže dobre zachytiť vyššie hodnoty indexu šťastia v krajinách s lepšími socio-ekonomickými podmienkami.

V strednej časti grafu obe krivky sledujú klesajúci trend, pričom predikovaná hodnota vo všeobecnosti kopíruje vývoj skutočných hodnôt.

Pri nižších hodnotách indexu šťastia je viditeľná väčšia volatilita predikcií – oranžová čiara vykazuje väčšie výkyvy a miestami sa viac odchyľuje od skutočných hodnôt. Napriek týmto rozdielom model správne zachytáva celkový trend poklesu indexu šťastia.

Celkovo možno konštatovať, že model pomerne presne vystihuje hlavný vývoj indexu šťastia, hoci pri individuálnych pozorovaniach sa objavujú menšie odchýlky medzi predikovanými a skutočnými hodnotami.

3.5 Diagnostika rezíduí

Figure 3.7: Histogram rezíduí

Histogram je približne symetrický a má tvar blízky normálnemu rozdeleniu, rezíduá sú sústredené okolo nuly. To naznačuje, že predpoklad normality je do veľkej miery splnený.

Figure 3.8: Histogram a Q-Q Plot

Normal Q-Q Plot ukazuje, že väčšina bodov leží blízko priamky, mierne odchýlky sú len na krajoch rozdelenia.

4 Heteroskedasticita

4.1 Diagnostika rezíduí

Figure: Diagnostické grafy rezíduí modelu.

Residuals vs Fitted: Reziduá sú rozptýlené okolo nuly bez výrazného systematického vzoru, čo naznačuje, že lineárny model je primeraný. Mierne zakrivenie môže signalizovať slabú nelinearitu, ale nič zásadné.

Q–Q plot rezíduí: Väčšina bodov leží blízko priamky, takže predpoklad normality rezíduí je vo všeobecnosti splnený, menšie odchýlky sú len v krajoch rozdelenia.

Scale–Location: Rozptyl rezíduí je relatívne stabilný naprieč hodnotami, čo znamená, že heteroskedasticita nie je výrazným problémom.

Residuals vs Leverage: Nevidíme extrémne vplyvné pozorovania (Cookova vzdialenosť nie je prekročená), takže žiadne jednotlivé pozorovanie výrazne nedeformuje model.

Na základe grafickej diagnostiky možno predpokladať možnú prítomnosť heteroskedasticity.


4.2 Test heteroskedasticity (Breusch–Pagan)

Na formálne overenie prítomnosti heteroskedasticity bol použitý Breusch–Pagan test.

Table 4.1: Table 4.1: Breusch-Pagan test heteroskedasticity
statistic p.value parameter method
2.07 0.558 3 studentized Breusch-Pagan test

Breusch–Pagan test overuje, či je rozptyl rezíduí konštantný (homoskedasticita). V tomto prípade je p-hodnota = 0.558, čo je vyššie ako 0.05, preto nezamietame nulovú hypotézu.

V modeli nebol preukázaný problém heteroskedasticity – rozptyl rezíduí možno považovať za konštantný. Tento predpoklad lineárnej regresie je teda splnený a klasické odhady modelu sú v tomto smere spoľahlivé..


4.3 Robustné (White) štandardné chyby a koeficienty

Vzhľadom na zistenú heteroskedasticitu boli vypočítané robustné štandardné chyby pomocou Whiteovej metódy (HC0).

Table 4.2: Table 4.2: Koeficienty modelu s White (HC0) robustnými štandardnými chybami
term estimate std.error statistic p.value
(Intercept) 2.135 0.244 8.767 0
GDP.per.capita 0.810 0.219 3.703 0
Social.support 1.322 0.246 5.382 0
Healthy.life.expectancy 1.298 0.351 3.702 0

Po použití Whiteových (HC0) robustných štandardných chýb sa hodnoty koeficientov nemenia, menia sa len ich štandardné chyby a testové štatistiky.Všetky vysvetľujúce premenné (GDP per capita, sociálna opora aj zdravá dĺžka života) zostávajú štatisticky významné aj po zohľadnení heteroskedasticity. To znamená, že výsledky regresného modelu sú stabilné a spoľahlivé a závery o vplyve jednotlivých premenných na index šťastia platia aj po korekcii na porušenie predpokladu konštantného rozptylu rezíduí.

5 Nelineárne špecifikácie

5.1 Ramsey RESET test

Na overenie správnosti špecifikácie lineárneho modelu bol použitý Ramsey RESET test.

Table 5.1: Table 5.1: Ramsey RESET test pre správnosť špecifikácie modelu
df1 df2 statistic p.value method
df1 2 150 18.302 0 RESET test
  • Test hodnotí, či je lineárna forma modelu správne špecifikovaná.
  • Nulová hypotéza predpokladá správnu špecifikáciu modelu.
  • Hodnota p-value = 0 (< 0.05) znamená, že nulovú hypotézu zamietame.

Výsledok naznačuje, že v modeli pravdepodobne chýbajú nelineárne vzťahy alebo ďalšie premenné.

Lineárny model teda nemusí úplne zachytávať skutočnú štruktúru vzťahov v dátach.


5.2 Diagnostické grafy

Figure 5.1: Diagnostické grafy

Graf zobrazuje vzťah medzi rezíduami a odhadnutými (fitted) hodnotami indexu šťastia.

Rezíduá sú rozložené približne okolo nuly, čo je základná požiadavka lineárneho modelu.

Červená vyhladzovacia krivka však naznačuje mierne zakrivenie, čo môže poukazovať na slabú nelinearitu vo vzťahoch.

Rozptyl rezíduí sa mierne mení pri vyšších fitted hodnotách, čo môže signalizovať náznak heteroskedasticity.

Niektoré pozorovania môžu byť potenciálne odľahlé, ale nezdajú sa extrémne problematické.

5.2.1 Component + Residual plots

Figure 5.2: Component + Residual plots

5.2.2 GDP per capita

Pozorovateľná mierna zakrivenosť naznačuje nelineárny vzťah medzi HDP a indexom šťastia.

5.2.3 Social support

Vzťah vykazuje možnú nelinearitu, najmä pri vyšších hodnotách podpory.

5.2.4 Healthy life expectancy

Vzťah je prevažne lineárny, bez výrazných odchýlok.


5.3 Kvadratický model

Na zachytenie nelineárnych vzťahov bol odhadnutý kvadratický model.

Table 5.2: Table 5.2: Koeficienty kvadratického modelu
term estimate std.error statistic p.value
(Intercept) 3.673 0.422 8.700 0.000
GDP.per.capita -0.567 0.557 -1.017 0.311
I(GDP.per.capita^2) 0.671 0.314 2.138 0.034
Social.support -0.203 0.839 -0.241 0.810
I(Social.support^2) 0.859 0.402 2.140 0.034
Healthy.life.expectancy -0.400 0.997 -0.401 0.689
I(Healthy.life.expectancy^2) 1.358 0.783 1.733 0.085

Lineárne členy (HDP, sociálna opora, zdravá dĺžka života) samy o sebe nie sú štatisticky významné.

Kvadratické členy pri HDP na obyvateľa a sociálnej opore sú štatisticky významné (p < 0.05), čo naznačuje nelineárny vzťah.

Pri zdravej dĺžke života je kvadratický člen len slabo významný (p ≈ 0.085).

5.3.1 Porovnanie lineárneho a kvadratického modelu

Table 5.3: Table 5.3: Porovnanie modelov (lineárny vs kvadratický)
term df.residual rss df sumsq statistic p.value
Score ~ GDP.per.capita + Social.support + Healthy.life.expectancy 152 52.559 NA NA NA NA
Score ~ GDP.per.capita + I(GDP.per.capita^2) + Social.support + I(Social.support^2) + Healthy.life.expectancy + I(Healthy.life.expectancy^2) 149 44.663 3 7.896 8.781 0

Kvadratický model má nižší RSS, čo znamená lepšie prispôsobenie dátam.

ANOVA test potvrdzuje, že kvadratický model je štatisticky významne lepší než lineárny (p ≈ 0).

Pridanie kvadratických členov zlepšilo vysvetľovaciu schopnosť modelu.

5.3.2 RESET test pre kvadratický model

Table 5.4: Table 5.4: Ramsey RESET test pre kvadratický model
df1 df2 statistic p.value method
df1 2 147 4.015 0.02 RESET test

RESET test má p-hodnotu 0.02, čo naznačuje možnú nesprávnu špecifikáciu aj kvadratického modelu.

Kvadratický model lepšie zachytáva nelinearity než lineárny, ale špecifikácia nemusí byť úplne ideálna.

6 Zhluková analýza

Nižšie uvedená analýza sa zameriava na zhlukovanie krajín na základe ukazovateľov subjektívneho blahobytu a kvality života, konkrétne indexu šťastia (Score), HDP na obyvateľa, sociálnej podpory a zdravej dĺžky života. Pred samotným zhlukovaním boli premenné štandardizované pomocou Z-skóre, aby sa eliminoval vplyv rozdielnych mierok jednotlivých ukazovateľov.

Takto získaná klasifikácia poskytuje prehľadnú typológiu krajín z hľadiska blahobytu a kvality života a môže slúžiť ako východisko pre ďalšie analýzy, napríklad porovnanie hospodárskych a sociálnych politík alebo identifikáciu faktorov, ktoré najviac prispievajú k vyššej úrovni šťastia v jednotlivých skupinách krajín.

6.1 Škálovanie

6.2 Boxploty škálovaných premenných

6.3 Korelačná matica

Table 6.1: Table 6.2: Table 6.2: Korelačná matica škálovaných premenných
Score GDP.per.capita Social.support Healthy.life.expectancy
Score 1.00 0.79 0.78 0.78
GDP.per.capita 0.79 1.00 0.75 0.84
Social.support 0.78 0.75 1.00 0.72
Healthy.life.expectancy 0.78 0.84 0.72 1.00

6.4 Hierarchické zhlukovanie (Wardova metóda)

(pre čitateľnosť prosím priblížte)

Pomocou hierarchického zhlukovania s využitím Wardovej metódy boli krajiny rozdelené do troch klastrov, ktoré sa odlišujú svojím socio-ekonomickým profilom. Prvý klaster združuje krajiny s vysokým indexom šťastia, nadpriemerným HDP na obyvateľa, silnou sociálnou podporou a vysokou zdravou dĺžkou života, čo je typické pre ekonomicky vyspelé štáty. Druhý klaster predstavuje krajiny so strednými hodnotami sledovaných ukazovateľov, kde je úroveň blahobytu miernejšia. Tretí klaster zahŕňa krajiny s nižším indexom šťastia, slabšou sociálnou podporou, nižším HDP na obyvateľa a kratšou zdravou dĺžkou života.

6.5 Vnútroklastrová a medziklastrová variabilita

Analýza vnútornej a medziklastrovej variability ukazuje, že významná časť celkovej variability je vysvetlená rozdielmi medzi klastrami, najmä pri HDP na obyvateľa a indexe šťastia. To potvrdzuje, že zvolené zhlukovanie efektívne zachytáva rozdiely medzi krajinami.

Table 6.3: Table 6.4: Table 6.3: TSS, WSS, BSS a podiel medziklastrovej variability
Variable TSS WSS BSS Prop_Between
Score Score 155 41.478 113.522 0.732
GDP.per.capita GDP.per.capita 155 32.274 122.726 0.792
Social.support Social.support 155 62.632 92.368 0.596
Healthy.life.expectancy Healthy.life.expectancy 155 47.981 107.019 0.690

6.6 Centroidy klastrov

Tieto rozdiely sú jasne viditeľné aj na centroidoch klastrov, ktoré predstavujú priemerné hodnoty premenných v jednotlivých skupinách. Centroid prvého klastru dosahuje najvyššie hodnoty vo všetkých sledovaných ukazovateľoch, čo potvrdzuje vysokú úroveň kvality života v týchto krajinách. Druhý klaster má centroidy približne v strede rozdelenia, čo naznačuje priemernú úroveň ekonomických a sociálnych podmienok. Naopak, tretí klaster vykazuje najnižšie hodnoty centroidov, najmä v oblasti HDP na obyvateľa a zdravej dĺžky života, čo sa odráža aj v nižšom indexe šťastia.

Table 6.5: Table 6.6: Table 6.4: Centroidy klastrov – priemerné hodnoty premenných
klaster Score GDP Social Health
1 6.504 1.284 1.441 0.935
2 5.099 0.842 1.191 0.698
3 3.977 0.317 0.805 0.383

7 Multikolinearita

7.1 Korelačná analýza

Table 7.1: Table 7.2: Table 7.1: Korelačná matica prediktorov
GDP.per.capita Social.support Healthy.life.expectancy
GDP.per.capita 1.000 0.755 0.835
Social.support 0.755 1.000 0.719
Healthy.life.expectancy 0.835 0.719 1.000

Z korelačnej matice vidíme pomerne silné kladné korelácie medzi vysvetľujúcimi premennými, najmä medzi GDP per capita a Healthy life expectancy. Hodnoty však nepresahujú hranicu 0.9, preto nejde o extrémnu multikolinearitu, ale o miernu závislosť medzi prediktormi.

7.2 VIF – multikolinearita

Table 7.3: Table 7.4: Table 7.4: Variance Inflation Factor (VIF) pre pôvodný model
Predictor VIF
GDP.per.capita 3.956
Social.support 2.473
Healthy.life.expectancy 3.523

Všetky hodnoty VIF sa pohybujú pod hranicou 5, konkrétne medzi približne 2.5 až 4, čo podľa bežne používanej metodiky nenaznačuje závažný problém multikolinearity. Najvyššiu hodnotu dosahuje premenná GDP per capita, čo je v súlade s výsledkami korelačnej analýzy, keďže táto premenná je silnejšie korelovaná s premennou Healthy life expectancy. Napriek tomu však hodnota VIF neprekračuje kritickú hranicu a neohrozuje stabilitu modelu.

Na základe hodnôt VIF možno konštatovať, že multikolinearita v modeli je len mierna a jednotlivé vysvetľujúce premenné stále prinášajú unikátnu informáciu k vysvetleniu variability skóre šťastia. Model je preto z tohto hľadiska akceptovateľný a štatisticky spoľahlivý.

7.3 Condition Number

Table 7.5: Table 7.6: Table 7.6: Súhrn finálneho regresného modelu
term estimate std.error statistic p.value
(Intercept) 2.135 0.212 10.088 0.000
GDP.per.capita 0.810 0.236 3.434 0.001
Social.support 1.322 0.248 5.324 0.000
Healthy.life.expectancy 1.298 0.366 3.544 0.001
## [1] 14.63741

Condition Number modelu je približne 14.64.

Táto hodnota naznačuje nízku až miernu multikolinearitu medzi vysvetľujúcimi premennými.

Multikolinearita teda nepredstavuje vážny problém pre odhad modelu.

Regresné koeficienty sú numericky stabilné a ich interpretácia je spoľahlivá.

Všetky vysvetľujúce premenné (GDP per capita, social support, healthy life expectancy) majú kladný a štatisticky významný vplyv na index šťastia.

Výsledky potvrdzujú, že model je vhodne špecifikovaný a multikolinearita neohrozuje závery analýzy.