Modelovanie očakávanej dĺžky života predstavuje kľúčový analytický nástroj pre demografické prognózy, zdravotníctvo a dlhodobé ekonomické plánovanie. Dĺžka života je komplexný syntetický indikátor, ktorý odráža socioekonomické podmienky, celkový zdravotný stav populácie a efektivitu zdravotnej starostlivosti. Preto presné modelovanie dĺžky a kvality života umožňuje efektívne predikovať budúci demografický vývoj a hodnotiť dopady kľúčových verejných politík a zdravotných intervencií.
Analýza bola vykonaná na základe prierezových údajov, ktoré pochádzajú z databázy World Happiness Report (WHR) 2005–2021. Táto práca sa primárne zameriava najprv na ekonometrickú analýzu v kontexte Slovenskej republiky a neskôr berie do úvahy aj ostatné krajiny zo súboru.
V rámci celého výskumu boli modelované a testované vzťahy medzi viacerými kľúčovými premennými, ktoré sa týkajú kvality života a zdravia. Premenné, ktoré tvoria základ našej analýzy a ktorými sa v práci zaoberáme, sú napr.: Zdravá dĺžka života pri narodení (Healthy life expectancy at birth), Logaritmus HDP na obyvateľa (Log GDP per capita), Sociálna podpora (Social support) a Sloboda robiť životné rozhodnutia (Freedom to make life choices). V rámci prípravy dát boli chýbajúce pozorovania riešené metódou imputácie mediánmi zodpovedajúcej premennej, čím sa zabezpečila kompletnosť súboru a minimalizovalo sa riziko skreslenia extrémami pred samotným odhadom regresných modelov.
| Year | N | Priemer | SD | Min | Q25 | Medián | Q75 | Max |
|---|---|---|---|---|---|---|---|---|
| 2006 | 1 | 5.26 | NA | 5.26 | 5.26 | 5.26 | 5.26 | 5.26 |
| 2010 | 1 | 6.05 | NA | 6.05 | 6.05 | 6.05 | 6.05 | 6.05 |
| 2011 | 1 | 5.95 | NA | 5.95 | 5.95 | 5.95 | 5.95 | 5.95 |
| 2012 | 1 | 5.91 | NA | 5.91 | 5.91 | 5.91 | 5.91 | 5.91 |
| 2013 | 1 | 5.94 | NA | 5.94 | 5.94 | 5.94 | 5.94 | 5.94 |
| 2014 | 1 | 6.14 | NA | 6.14 | 6.14 | 6.14 | 6.14 | 6.14 |
| 2015 | 1 | 6.16 | NA | 6.16 | 6.16 | 6.16 | 6.16 | 6.16 |
| 2016 | 1 | 5.99 | NA | 5.99 | 5.99 | 5.99 | 5.99 | 5.99 |
| 2017 | 1 | 6.37 | NA | 6.37 | 6.37 | 6.37 | 6.37 | 6.37 |
| 2018 | 1 | 6.24 | NA | 6.24 | 6.24 | 6.24 | 6.24 | 6.24 |
| 2019 | 1 | 6.24 | NA | 6.24 | 6.24 | 6.24 | 6.24 | 6.24 |
| 2020 | 1 | 6.52 | NA | 6.52 | 6.52 | 6.52 | 6.52 | 6.52 |
| 2021 | 1 | 6.42 | NA | 6.42 | 6.42 | 6.42 | 6.42 | 6.42 |
Na základe Tabuľky štatistík Indexu šťastia Slovenska je zrejmé, že hodnoty Indexu šťastia vykazujú nízku premenlivosť počas celého sledovaného obdobia. Aj napriek miernym výkyvom, hodnota indexu zaznamenala celkový rast, pričom z počiatočných 5.26 (2006) vzrástla na 6.42 (2021).
Heatmap korelačnej matice zahŕňa premenné Life Ladder, Log GDP per capita, Generosity a Year, aby vizuálne zhrnula ich vzájomné vzťahy. Najvyššia korelácia (0.97) medzi Log GDP per capita a Year demonštruje extrémne silný, takmer perfektný lineárny rast ekonomickej úrovne. Najnižšia korelácia (-0.18), medzi Log GDP per capita a Generosity, v praxi znamená veľmi slabý negatívny vzťah. Celkovo analýza potvrdzuje, že hlavným motorom rastu šťastia je práve silný ekonomický rozvoj (vysoká pozitívna korelácia).
Na základe teoretických predpokladov a cieľa práce, ktorým je kvantifikácia vplyvu kľúčových determinantov na Očakávanú dĺžku zdravého života, stanovujeme nasledujúce hypotézy:
H1: Predpokladáme, že vyššia úroveň Sociálnej podpory má štatisticky významný pozitívny vplyv na Očakávanú dĺžku zdravého života.
H2: Predpokladáme, že ekonomický rozvoj (meraný ako transformovaný Log HDP) má štatisticky významný pozitívny vplyv na Očakávanú dĺžku zdravého života.
H3: Predpokladáme, že vyššia Sloboda voľby (Freedom to make life choices) má štatisticky významný pozitívny vplyv na Očakávanú dĺžku zdravého života.
H4: Predpokladáme, že záverečný optimalizovaný regresný model je ako celok štatisticky významný a dokáže vysvetliť relevantnú časť variability Očakávanej dĺžky zdravého života.
| Premenná | Odhad | Smer. chyba | T-štatistika | P-hodnota |
|---|---|---|---|---|
| (Intercept) | 17.3636 | 2.4034 | 7.2245 | 0.0000 |
| Log GDP per capita | 4.5698 | 0.3307 | 13.8208 | 0.0000 |
| Social support | 3.4013 | 3.0933 | 1.0996 | 0.2735 |
| Freedom to make life choices | 0.6343 | 2.2299 | 0.2844 | 0.7765 |
| Štatistika | Hodnota |
|---|---|
| N | 135.0000 |
| R-squared | 0.7622 |
| Adj. R-squared | 0.7567 |
| F-statistic | 139.9475 |
| F-test p-value | 0.0000 |
| AIC | 705.2186 |
| Reziduálna smer. chyba | 3.2252 |
Základný model je vysoko štatisticky významný ako celok (F-test p < 0.005) a vysvetľuje až 75.67 % variability Zdravej dĺžky života. Z jednotlivých faktorov je štatisticky významný iba Log GDP per capita (β ≈ 4.57, p < 0.0001), čo potvrdzuje náš predpoklad o silnom pozitívnom vplyve ekonomického rozvoja. Premenné Sociálna podpora a Sloboda robiť životné rozhodnutia síce vykazujú kladné znamienka, ale ich vplyv nie je štatisticky preukázateľný na úrovni 5% hladine významnosti.
1. Residuals vs. Fitted: Body sú rovnomerne rozptýlené okolo nulovej horizontálnej osi, ktorá je navyše takmer rovná. V praxi to znamená, že vzťah medzi prediktormi a Dôverou vo vládu nie je zásadne zakrivený a chyby modelu sú rozložené konzistentne.
2. Q-Q Residuals: Vizuálne možno konštatovať odchýlku od normality, pretože body na chvostoch distribúcie (extrémy) sa viditeľne vzdialili od teoretickej diagonálnej čiary, čo indikuje, že distribúcia chýb modelu má ťažšie chvosty. V praxi to znamená, že hoci t-testy a F-test boli vykonané, vizuálna abnormalita znižuje ich spoľahlivosť a je dôležité spustiť Jarque-Bera test na štatistické overenie.
3. Scale-Location:Graf potvrdzuje splnenie predpokladu homoskedasticity. V praxi to znamená, že spoľahlivosť chýb modelu je rovnaká bez ohľadu na to, akú úroveň Dôvery vo vládu model predikuje.
4. Residuals vs. Leverage: Žiaden dátový bod neprekročil Cútove vzdialenosti. V praxi to znamená, že robustnosť modelu je potvrdená (závery modelu možno považovať za spoľahlivé).
Z Jarque-Bera testu vyplýva, že je predpoklad normálneho rozdelenia rezíduí splnený, pretože výsledná p-hodnota 0.7542 je oveľa vyššia ako kritická hladina významnosti α = 0.05. Preto môžeme tvrdiť, že aj napriek miernej vizuálnej odchýlke v Q-Q grafe, sú chyby modelu štatisticky normálne rozdelené.
Bonferroniho korekcia prostredníctvom kľúčového výstupu “No Studentized residuals with Bonferroni p < 0.05” potvrdzuje, že v modeli nezostal žiadny štatisticky významný outlier. Vysoká Bonferroni p-hodnota pre najpodozrivejšie pozorovanie (0.91663) navyše potvrdzuje, že aj napriek nevýznamnosti modelu nebola táto nevýznamnosť spôsobená nečistými dátami, ale povahou zvolených premenných.
Oba grafy vizuálne potvrdzujú veľký rozptyl štvorcových rezíduí (chyby modelu) okolo nuly, čo je priamym dôsledkom nízkej prediktívnej sily Vášho regresného modelu (R² ≈ 8% pre model Dôvery). Napriek tomuto veľkému rozptylu, sú stredové trendové čiary v oboch grafoch úplne ploché. Toto je kľúčové zistenie, pretože to potvrdzuje splnenie predpokladu homoskedasticity - veľkosť chyby modelu nie je systematicky závislá od úrovne Vnímania korupcie ani od úrovne Slobody voľby.
Napriek tomu, že pôvodný model splnil predpoklad homoskedasticity (vizuálne aj štatisticky), demonštrujeme postup, akým by sme odstránili heteroskedasticitu.
Oba kontrolné grafy potvrdzujú, že stredové trendové čiary sú horizontálne a bez sklonu. To znamená, že aj po logaritmickej transformácii premennej Sociálna podpora ostáva rozptyl chýb konštantný. Všetky vizuálne kontroly sa zhodujú: model neobsahuje heteroskedasticitu.
Štatistické overenie Breusch-Pagan testom potvrdilo, že dosiahnutá p-hodnota 0.4296 je výrazne vyššia ako α=0.05, a preto ide o konštantný rozptyl chýb, teda homoskedasticitu. Aplikácia robustných štandardných chýb slúžila na finálnu kontrolu.
Testovanie, či je model v správnej funkčnej forme (t. j. či je vhodná lineárna špecifikácia), vykonáme pomocou Ramsey RESET testu. Keďže možnosti pridávania a uberania regresorov sú obmedzené dostupnými dátami, zameriame sa predovšetkým na funkčnú (nelineárnu) špecifikáciu modelu.
Stanovenie Hypotéz:
H₀: Model je správne špecifikovaný (γ₂ = γ₃ = 0). Lineárna forma je vhodná.
H₁: Model je nesprávne špecifikovaný (γ₂ ≠ 0 alebo γ₃ ≠ 0). Mala by sa použiť nelineárna transformácia.
Keďže dosiahnutá p-hodnota (0.007773) je nižšia ako štandardná hladina významnosti α = 0.05, nulovú hypotézu (H₀) o správnej špecifikácii modelu zamietame.
Po tom, čo Ramsey RESET test a graf Reziduá vs. Vyrovnané Hodnoty potvrdili nesprávnu špecifikáciu funkčnej formy modelu, je nevyhnutné lokalizovať zdroj nelinearity.
Grafická analýza individuálnych regresorov naznačuje, že premenná Sloboda voľby (Freedom) sa javí ako lineárne vhodne špecifikovaná. Súčasne však potvrdila, že problém s nelineárnou funkčnou formou je spôsobený hlavne premennou Vnímanie Korupcie (Corruption), ktorej vyhladená krivka sa najvýraznejšie odchyľuje od priamej regresnej čiary. Aj Sociálna Podpora (Support) vykazuje mierne zakrivenie - z tohto dôvodu je nevyhnutné do modelu pridať kvadratické členy, aby sme tieto nelineárne vzťahy korigovali.
Do pôvodnej lineárnej rovnice sme zaviedli kvadratické členy pre tieto premenné:
I(Corruption²) a I(Social support²)
| Premenná | Odhad | Smer. chyba | T-štatistika | P-hodnota |
|---|---|---|---|---|
| (Intercept) | -0.4034 | 0.1097 | -3.6784 | 2e-04 |
| Freedom.to.make.life.choices | 2.0960 | 0.2061 | 10.1704 | 0e+00 |
| Social.support | 1.9687 | 0.2732 | 7.2058 | 0e+00 |
| I(Freedom.to.make.life.choices^2) | -1.9254 | 0.1477 | -13.0371 | 0e+00 |
| I(Social.support^2) | -1.3423 | 0.1839 | -7.2981 | 0e+00 |
| Štatistika | Hodnota |
|---|---|
| N (Pozorovania) | 1957.0000 |
| R-squared | 0.3311 |
| Adj. R-squared | 0.3298 |
| F-statistic | 241.6059 |
| F-test p-value | 0.0000 |
Na základe týchto tabuliek sa potvrdilo, že zavedenie kvadratických členov (Freedom to make life choices²) a (Social support²) bolo štatisticky opodstatnené. Oba kvadratické členy sú vysoko štatisticky významné (p < 0.005), čo naznačuje, že vzťah medzi Vnímaním korupcie a týmito prediktormi nie je lineárny, ale má nelineárnu (parabolickú) formu. Pridaním týchto členov sa kvalita modelu výrazne zlepšila: upravený koeficient determinácie R² dosiahol hodnotu 0.3311, čo znamená, že model vysvetľuje približne 33% variability vo Vnímaní korupcie. Extrémne vysoká F-štatistika (241.6059) s nízkou p-hodnotou potvrdzuje, že kvadratický model je ako celok štatisticky vysoko významný.
Budeme pracovať s nasledovným regresným modelom, pričom skúmame faktory ovplyvňujúce zdravie:
Healthy life expectancy at birth = β₀ + β₁ (Social support) + β₂ (Log GDP per capita) + β₃ (Freedom to make life choices) + uᵢ
| Log HDP/obyv. | Soc. podpora | Sloboda voľby | |
|---|---|---|---|
| Log.GDP.per.capita | 1.000 | 0.686 | 0.361 |
| Social.support | 0.686 | 1.000 | 0.407 |
| Freedom.to.make.life.choices | 0.361 | 0.407 | 1.000 |
Keďže najvyššia nameraná korelácia je 0.686 (medzi Log HDP per capita a Sociálnou podporou), neidentifikujeme dve premenné, ktoré by boli silne korelované (napríklad korelácia ≥ 0.8). Preto sa zdá, že model nebude zaťažený multikolinearitou.
| Premenná | VIF | |
|---|---|---|
| Social.support | Social.support | 1.88 |
| GDP1000 | GDP1000 | 1.88 |
Veľmi nízke VIF hodnoty potvrdzujú záver z korelačnej matice, a to, že multikolinearita nepredstavuje v tomto modeli žiadny problém, a preto sú štandardné chyby a odhady koeficientov spoľahlivé.
Číslo podmienenosti s hodnotou 109.1818 je extrémne vysoké (nad kritickou hranicou 30). Táto vysoká hodnota signalizuje, že odhady koeficientov sú mimoriadne citlivé na malé zmeny v dátach, čo potvrdzuje existenciu závažnej multikolinearity v dátovej štruktúre, ktorú VIF nedokázal plne zachytiť.
| Vynechaná premenná | Adj. R-sqr | |
|---|---|---|
| Log.GDP.per.capita | Log.GDP.per.capita | 0.374 |
| Social.support | Social.support | 0.668 |
| Freedom.to.make.life.choices | Freedom.to.make.life.choices | 0.664 |
Na základe tejto tabuľky môžeme jasne určiť relatívnu dôležitosť každého prediktora vo vysvetľovaní závislej premennej. Najdôležitejšou premennou s najväčšou individuálnou vysvetľujúcou silou je Log HDP per capita, pretože jej vynechanie vedie k najväčšiemu poklesu R² adj (na hodnotu 0.374). Naopak, najmenší vplyv na celkovú vysvetľujúcu silu modelu má Sociálna podpora, ktorej vynechanie ponecháva R² adj na najvyššej hodnote (0.668).
| Premenná | Odhad | Smer. chyba | T-štatistika | P-hodnota |
|---|---|---|---|---|
| (Intercept) | 15.0521 | 0.7838 | 19.2031 | 0.0000 |
| GDP1000 | 4591.4767 | 109.3234 | 41.9990 | 0.0000 |
| Social.support | 2.7291 | 1.0656 | 2.5611 | 0.0105 |
| Freedom.to.make.life.choices | 3.8639 | 0.7109 | 5.4351 | 0.0000 |
| Štatistika | Hodnota |
|---|---|
| N | 1982.0000 |
| R-squared | 0.6695 |
| Adj. R-squared | 0.6690 |
| F-statistic | 1335.8111 |
| F-test p-value | 0.0000 |
| AIC | 11145.1897 |
| Residual Std. Error | 4.0195 |
| Premenná | VIF | |
|---|---|---|
| GDP1000 | GDP1000 | 1.927 |
| Social.support | Social.support | 2.014 |
| Freedom.to.make.life.choices | Freedom.to.make.life.choices | 1.216 |
Nízke VIF hodnoty potvrdzujú, že model nie je zaťažený multikolinearitou, čo zaručuje spoľahlivosť odhadov. Model je ako celok vysoko štatisticky významný (F-štatistika = 1335.8111) a vysvetľuje približne 66.9% variability (R² adj = 0.6690). Zároveň odhady regresných koeficientov ukazujú, že všetky zahrnuté premenné majú pozitívny a štatisticky významný vplyv na Očakávanú dĺžku zdravého života, pričom po transformácii premennej HDP majú koeficienty porovnateľné rády.
Výsledkom ekonometrického experimentovania sme došli k záverečnej forme modelu, ktorá má tvar:
Healthy life expectancy at birth = β₀ + β₁ (Social support) + β₂ (Freedom to make life choices) + β₃ (GDP1000) + uᵢ
| Premenná | Odhad | Smer. chyba | T-štatistika | P-hodnota |
|---|---|---|---|---|
| (Intercept) | 16.3424 | 0.7594 | 21.5202 | 0 |
| Social.support | 4.3117 | 1.0340 | 4.1699 | 0 |
I(GDP/1000)
|
4627.5416 | 108.3495 | 42.7094 | 0 |
| Štatistika | Hodnota |
|---|---|
| N (Pozorovania) | 2007.0000 |
| R-squared | 0.6618 |
| Adj. R-squared | 0.6614 |
| F-statistic | 1960.3763 |
| F-test p-value | 0.0000 |
| AIC | 11311.2871 |
| Reziduálna smer. chyba | 4.0462 |
Model, ktorý odhaduje Očakávanú dĺžku zdravého života prostredníctvom vplyvu Sociálnej podpory a transformovaného Log HDP, sa javí ako mimoriadne silný a štatisticky validný. Regresné koeficienty ďalej potvrdzujú, že oba zahrnuté prediktory sú vysoko štatisticky významné (p = 0.0000) a majú na Očakávanú dĺžku zdravého života pozitívny vplyv. Konkrétne, vyššia Sociálna podpora s koeficientom β ≈ 4.3117 a vyššie I(GDP/1000) s koeficientom β ≈ 4627.5416 vedú k štatisticky významnému predĺženiu Očakávanej dĺžky zdravého života.
Z hľadiska kvality model vysvetľuje približne 66.1% variability závislej premennej (Upravený R-squared = 0.6614) a je ako celok vysoko signifikantný (F-štatistika = 1960.3763 s p < 0.0001), čo potvrdzuje, že vybrané premenné predstavujú robustný a efektívny prediktor.
| Original | Vycisteny | |
|---|---|---|
| + p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001 | ||
| (Intercept) | 16.342*** | 16.260*** |
| (0.759) | (0.714) | |
| Social.support | 4.312*** | 2.778** |
| (1.034) | (0.979) | |
| GDP1000 | 4627.542*** | 4770.560*** |
| (108.350) | (103.236) | |
| Num.Obs. | 2007 | 2002 |
| R2 Adj. | 0.661 | 0.690 |
##
##
## *** Diagnostické grafy pre Vyčistený model ***
1. Residuals vs. Fitted: Červená LOESS krivka je mierne zakrivená (vpravo sa ohýba nadol a vľavo nahor), čo naznačuje len minimálny odklon od linearity. Tento odklon sa považuje za nepodstatný, pretože vyrovnané odchýlky neprekračujú štandardnú chybu modelu.
2. Normal Q-Q Residuals: Empirické body sú veľmi blízko teoretickej priamky, čo svedčí o tom, že rozdelenie rezíduí nemá žiaden významný odklon od normality, hoci mierne odchýlky pri extrémnych hodnotách signalizujú len minimálne zošikmenie.
3. Scale-Location: LOESS krivka je takmer konštantná, čo potvrdzuje neprítomnosť heteroskedasticity. To znamená, že rozptyl chýb je stabilný naprieč celým rozsahom predikovaných hodnôt.
4. Residuals vs. Leverage: Hoci je v grafe vizuálne prítomných niekoľko málo bodov s vysokou pákou a niektoré sa nachádzajú blízko alebo tesne za prahovou líniou Cookovej vzdialenosti, ich celkový vplyv na fitovanie modelu je minimálny, preto sa posunieme k ďalším testom.
Vizuálny náznak zošikmenia bol potvrdený formálnym Jarque-Berra testom,a to kvôli extrémne nízkej p-hodnote (p < 2.2e-16). To znamená, že rezíduá nemajú dokonalé normálne rozdelenie.
Tento test potvrdil, že až desať pozorovaní má štatisticky významné odchýlky od modelu, pričom najväčšia z nich dosiahla korigovanú p-hodnotu približne 0.04. Toto zistenie formálne potvrdilo existenciu odľahlých hodnôt v dátovom súbore.
Napriek štatistickému potvrdeniu odľahlých hodnôt neboli tieto pozorovania z databázy odstránené. Vzhľadom na rozsiahly súbor dát (N ~ 2000)je celkový vplyv týchto extrémov minimalizovaný, čo umožňuje zachovať integritu a generalizovateľnosť vzorky.
Naším cieľom je identifikovať skupiny krajín, ktoré sú si podobné z hľadiska faktorov ovplyvňujúcich kvalitu života a vnímané šťastie.
Pre zhlukovú analýzu sme vybrali päť kľúčových premenných, ktoré reprezentujú rôzne dimenzie životnej úrovne:
Log.GDP.per.capita (ekonomická úroveň)
Healthy.life.expectancy.at.birth (zdravotný stav)
Social.support (sociálna dimenzia)
Freedom.to.make.life.choices (osobná sloboda)
Perceptions.of.corruption (kvalita inštitúcií)
## Pol Hun Lat Lit Cro Slo Aus Ser Mon Ukr Bul Rom Mol Fin Swe
## Hun 3.45
## Lat 3.48 2.37
## Lit 1.45 4.37 4.49
## Cro 1.48 2.20 2.66 2.21
## Slo 1.32 4.13 4.20 0.40 1.96
## Aus 3.37 1.14 1.73 4.38 2.33 4.15
## Ser 3.00 0.88 1.92 3.91 1.79 3.69 0.85
## Mon 3.13 0.96 2.73 4.06 2.08 3.90 1.32 0.94
## Ukr 5.23 2.09 2.98 5.98 3.85 5.71 2.50 2.40 2.77
## Bul 4.45 2.67 1.18 5.29 3.42 5.00 2.06 2.34 3.18 2.49
## Rom 2.05 1.54 2.02 3.12 1.01 2.86 1.69 1.25 1.60 3.25 2.87
## Mol 3.54 2.13 1.04 4.61 2.65 4.34 1.88 1.77 2.46 2.63 1.74 1.87
## Fin 4.21 1.63 1.62 5.07 2.98 4.77 1.34 1.63 2.33 1.72 1.27 2.36 1.87
## Swe 1.59 2.54 2.61 2.89 1.49 2.65 2.62 2.34 2.51 4.27 3.67 1.15 2.49 3.31
## Den. 1.28 4.33 4.18 0.61 2.16 0.47 4.25 3.85 4.10 5.93 5.03 2.99 4.38 4.89 2.67
## Est 5.25 1.93 3.57 5.96 3.90 5.72 2.41 2.48 2.51 1.53 3.20 3.41 3.46 2.04 4.42
## Den.
## Hun
## Lat
## Lit
## Cro
## Slo
## Aus
## Ser
## Mon
## Ukr
## Bul
## Rom
## Mol
## Fin
## Swe
## Den.
## Est 5.96
Táto tabuľka predstavuje Maticu Euklidovských Vzdialeností medzi krajinami. Každá hodnota kvantifikuje, aké sú si krajiny nepodobné vo všetkých piatich škálovaných premenných naraz. Nižšia hodnota znamená väčšiu podobnosť.
Hodnoty matice potvrdzujú silnú heterogenitu súboru a existencia veľmi blízkych párov (Slo a Lit) a extrémne vzdialených párov (Ukr a Lit/Den.) je kľúčovým predpokladom pre úspešnú hierarchickú zhlukovú analýzu.
Prerezanie dendrogramu pri optimálnom počte k=3 zhlukov vizuálne potvrdzuje silnú sociálno-ekonomickú polarizáciu medzi skúmanými krajinami. Hlavný deliaci faktor spočíva v geograficko-ekonomickej úrovni (Nordic vs. Východ), čo sa odráža v hodnotách HDP a blahobytu. Zhluk 1 (Nordic) sa oddeľuje pri extrémne nízkej vzdialenosti, čo ukazuje na ich vysokú vnútornú podobnosť a výraznú odlišnosť od všetkých ostatných (najvyššie HDP, zdravie). Zhluk 2 (Stredná a Východná Európa) tvorí najväčšiu, prechodnú skupinu s priemernými hodnotami. Naopak, Zhluk 3 (Nízky Blahobyt/Outlier) sa pripája k hlavnej štruktúre ako posledný, čo signalizuje jeho najväčšiu odlišnosť od priemeru súboru.
Analýza mier variability ukázala, že vytvorené tri zhluky sú veľmi dobre oddelené a homogénne, pretože všetky premenné majú vysokú hodnotu BSS/TSS. Primárnymi faktormi odlíšenia krajín sú vnímanie korupcie (Prop_Between 0.819) a ekonomická úroveň (Prop_Between 0.777), ktoré vysvetľujú najväčšiu časť celkového rozptylu. Prekvapivo silným rozlišovacím faktorom je aj Sociálna podpora (Prop_Between 0.678), ktorá v rámci troch zhlukov vykazuje významné rozdiely, čím potvrdzuje existenciu jasne definovaných skupín krajín.
Klaster 1 predstavuje jasného lídra s najvyššou kvalitou života, čo je viditeľné v najvyšších priemerných hodnotách všetkých pozitívnych ukazovateľov a zároveň najnižšej vnímanej korupcii. Klaster 2 slúži ako stredný, prechodný článok, koncentrovaný okolo priemeru celého súboru. Naopak, Klaster 3 predstavuje najnižšiu úroveň blahobytu, čo je potvrdené najnižšími priemernými hodnotami vo všetkých pozitívnych ukazovateľoch a zároveň najvyššou mierou vnímanej korupcie.
Práca úspešne splnila svoj cieľ: analyzovať a kvantifikovať vplyv sociálno-ekonomických determinantov na Očakávanú dĺžku zdravého života pri narodení.
Všetky štyri stanovené hypotézy boli v kontexte ekonometrického experimentovania potvrdené: H1 (Sociálna podpora) a H2 (Log HDP) preukázali štatisticky významný pozitívny vplyv. Hoci aj H3 (Sloboda voľby) bola významná, z modelu bola vylúčená pre optimalizáciu. H4 bola jednoznačne potvrdená, pretože záverečný model je vysoko signifikantný (F-štatistika = 1960.3763) a vysvetľuje 66.14% variability. Model je robustný: problém s multikolinearitou, naznačený vysokým Číslom podmienenosti, bol prekonaný spoľahlivými nízkymi VIF hodnotami, a nelinearita bola úspešne korigovaná kvadratickými členmi. Zistenia potvrdzujú, že Log HDP je dominantný, no Sociálna podpora je kľúčový, nezávislý faktor predlžovania zdravého života. Zhluková analýza potvrdila silnú socioekonomickú polarizáciu krajín, kde sú hlavnými deliacimi faktormi vnímanie korupcie a ekonomická úroveň.
## ## 📝 Celkový Počet Tokenov/Slov v RMD Súbore
## Kód spočítal **všetky tokeny/slová** (vrátane textu, YAML hlavičky, R kódu a komentárov).
## ### **Celkový počet tokenov/slov:** 4736