1 Úvod

Modelovanie očakávanej dĺžky života predstavuje kľúčový analytický nástroj pre demografické prognózy, zdravotníctvo a dlhodobé ekonomické plánovanie. Dĺžka života je komplexný syntetický indikátor, ktorý odráža socioekonomické podmienky, celkový zdravotný stav populácie a efektivitu zdravotnej starostlivosti. Preto presné modelovanie dĺžky a kvality života umožňuje efektívne predikovať budúci demografický vývoj a hodnotiť dopady kľúčových verejných politík a zdravotných intervencií.

2 Údaje

Analýza bola vykonaná na základe prierezových údajov, ktoré pochádzajú z databázy World Happiness Report (WHR) 2005–2021. Táto práca sa primárne zameriava najprv na ekonometrickú analýzu v kontexte Slovenskej republiky a neskôr berie do úvahy aj ostatné krajiny zo súboru.

V rámci celého výskumu boli modelované a testované vzťahy medzi viacerými kľúčovými premennými, ktoré sa týkajú kvality života a zdravia. Premenné, ktoré tvoria základ našej analýzy a ktorými sa v práci zaoberáme, sú napr.: Zdravá dĺžka života pri narodení (Healthy life expectancy at birth), Logaritmus HDP na obyvateľa (Log GDP per capita), Sociálna podpora (Social support) a Sloboda robiť životné rozhodnutia (Freedom to make life choices). V rámci prípravy dát boli chýbajúce pozorovania riešené metódou imputácie mediánmi zodpovedajúcej premennej, čím sa zabezpečila kompletnosť súboru a minimalizovalo sa riziko skreslenia extrémami pred samotným odhadom regresných modelov.

2.1 Základné štatistiky

Štatistiky Indexu šťastia na Slovensku (2005-2021)
	Štatistiky Indexu šťastia
Year	N	Priemer	SD	Min	Q25	Medián	Q75	Max
2006	1	5.26	NA	5.26	5.26	5.26	5.26	5.26
2010	1	6.05	NA	6.05	6.05	6.05	6.05	6.05
2011	1	5.95	NA	5.95	5.95	5.95	5.95	5.95
2012	1	5.91	NA	5.91	5.91	5.91	5.91	5.91
2013	1	5.94	NA	5.94	5.94	5.94	5.94	5.94
2014	1	6.14	NA	6.14	6.14	6.14	6.14	6.14
2015	1	6.16	NA	6.16	6.16	6.16	6.16	6.16
2016	1	5.99	NA	5.99	5.99	5.99	5.99	5.99
2017	1	6.37	NA	6.37	6.37	6.37	6.37	6.37
2018	1	6.24	NA	6.24	6.24	6.24	6.24	6.24
2019	1	6.24	NA	6.24	6.24	6.24	6.24	6.24
2020	1	6.52	NA	6.52	6.52	6.52	6.52	6.52
2021	1	6.42	NA	6.42	6.42	6.42	6.42	6.42

Na základe Tabuľky štatistík Indexu šťastia Slovenska je zrejmé, že hodnoty Indexu šťastia vykazujú nízku premenlivosť počas celého sledovaného obdobia. Aj napriek miernym výkyvom, hodnota indexu zaznamenala celkový rast, pričom z počiatočných 5.26 (2006) vzrástla na 6.42 (2021).

Heatmap korelačnej matice zahŕňa premenné Life Ladder, Log GDP per capita, Generosity a Year, aby vizuálne zhrnula ich vzájomné vzťahy. Najvyššia korelácia (0.97) medzi Log GDP per capita a Year demonštruje extrémne silný, takmer perfektný lineárny rast ekonomickej úrovne. Najnižšia korelácia (-0.18), medzi Log GDP per capita a Generosity, v praxi znamená veľmi slabý negatívny vzťah. Celkovo analýza potvrdzuje, že hlavným motorom rastu šťastia je práve silný ekonomický rozvoj (vysoká pozitívna korelácia).

3 Výskumné hypotézy

Na základe teoretických predpokladov a cieľa práce, ktorým je kvantifikácia vplyvu kľúčových determinantov na Očakávanú dĺžku zdravého života, stanovujeme nasledujúce hypotézy:

H1: Predpokladáme, že vyššia úroveň Sociálnej podpory má štatisticky významný pozitívny vplyv na Očakávanú dĺžku zdravého života.
H2: Predpokladáme, že ekonomický rozvoj (meraný ako transformovaný Log HDP) má štatisticky významný pozitívny vplyv na Očakávanú dĺžku zdravého života.
H3: Predpokladáme, že vyššia Sloboda voľby (Freedom to make life choices) má štatisticky významný pozitívny vplyv na Očakávanú dĺžku zdravého života.
H4: Predpokladáme, že záverečný optimalizovaný regresný model je ako celok štatisticky významný a dokáže vysvetliť relevantnú časť variability Očakávanej dĺžky zdravého života.

4 Základný model

Tabuľka Odhadov Koeficientov (Rok 2015)
Premenná	Odhad	Smer. chyba	T-štatistika	P-hodnota
(Intercept)	17.3636	2.4034	7.2245	0.0000
Log GDP per capita	4.5698	0.3307	13.8208	0.0000
Social support	3.4013	3.0933	1.0996	0.2735
Freedom to make life choices	0.6343	2.2299	0.2844	0.7765

Tabuľka Kvality Vyrovnania Modelu (Rok 2015)
Štatistika	Hodnota
N	135.0000
R-squared	0.7622
Adj. R-squared	0.7567
F-statistic	139.9475
F-test p-value	0.0000
AIC	705.2186
Reziduálna smer. chyba	3.2252

Základný model je vysoko štatisticky významný ako celok (F-test p < 0.005) a vysvetľuje až 75.67 % variability Zdravej dĺžky života. Z jednotlivých faktorov je štatisticky významný iba Log GDP per capita (β ≈ 4.57, p < 0.0001), čo potvrdzuje náš predpoklad o silnom pozitívnom vplyve ekonomického rozvoja. Premenné Sociálna podpora a Sloboda robiť životné rozhodnutia síce vykazujú kladné znamienka, ale ich vplyv nie je štatisticky preukázateľný na úrovni 5% hladine významnosti.

4.1 Grafové interpretácie rezuduí

1. Residuals vs. Fitted: Body sú rovnomerne rozptýlené okolo nulovej horizontálnej osi, ktorá je navyše takmer rovná. V praxi to znamená, že vzťah medzi prediktormi a Dôverou vo vládu nie je zásadne zakrivený a chyby modelu sú rozložené konzistentne.

2. Q-Q Residuals: Vizuálne možno konštatovať odchýlku od normality, pretože body na chvostoch distribúcie (extrémy) sa viditeľne vzdialili od teoretickej diagonálnej čiary, čo indikuje, že distribúcia chýb modelu má ťažšie chvosty. V praxi to znamená, že hoci t-testy a F-test boli vykonané, vizuálna abnormalita znižuje ich spoľahlivosť a je dôležité spustiť Jarque-Bera test na štatistické overenie.

3. Scale-Location:Graf potvrdzuje splnenie predpokladu homoskedasticity. V praxi to znamená, že spoľahlivosť chýb modelu je rovnaká bez ohľadu na to, akú úroveň Dôvery vo vládu model predikuje.

4. Residuals vs. Leverage: Žiaden dátový bod neprekročil Cútove vzdialenosti. V praxi to znamená, že robustnosť modelu je potvrdená (závery modelu možno považovať za spoľahlivé).

4.2 Niektoré základné testy rezuduí

4.2.1 Test normality

Z Jarque-Bera testu vyplýva, že je predpoklad normálneho rozdelenia rezíduí splnený, pretože výsledná p-hodnota 0.7542 je oveľa vyššia ako kritická hladina významnosti α = 0.05. Preto môžeme tvrdiť, že aj napriek miernej vizuálnej odchýlke v Q-Q grafe, sú chyby modelu štatisticky normálne rozdelené.

4.2.2 Test odľahlých hodnôt

Bonferroniho korekcia prostredníctvom kľúčového výstupu “No Studentized residuals with Bonferroni p < 0.05” potvrdzuje, že v modeli nezostal žiadny štatisticky významný outlier. Vysoká Bonferroni p-hodnota pre najpodozrivejšie pozorovanie (0.91663) navyše potvrdzuje, že aj napriek nevýznamnosti modelu nebola táto nevýznamnosť spôsobená nečistými dátami, ale povahou zvolených premenných.

5 Heteroskedasticita

Oba grafy vizuálne potvrdzujú veľký rozptyl štvorcových rezíduí (chyby modelu) okolo nuly, čo je priamym dôsledkom nízkej prediktívnej sily Vášho regresného modelu (R² ≈ 8% pre model Dôvery). Napriek tomuto veľkému rozptylu, sú stredové trendové čiary v oboch grafoch úplne ploché. Toto je kľúčové zistenie, pretože to potvrdzuje splnenie predpokladu homoskedasticity - veľkosť chyby modelu nie je systematicky závislá od úrovne Vnímania korupcie ani od úrovne Slobody voľby.

Napriek tomu, že pôvodný model splnil predpoklad homoskedasticity (vizuálne aj štatisticky), demonštrujeme postup, akým by sme odstránili heteroskedasticitu.

Oba kontrolné grafy potvrdzujú, že stredové trendové čiary sú horizontálne a bez sklonu. To znamená, že aj po logaritmickej transformácii premennej Sociálna podpora ostáva rozptyl chýb konštantný. Všetky vizuálne kontroly sa zhodujú: model neobsahuje heteroskedasticitu.

5.1 Testovanie prítomnosti heteroskedasticity

Štatistické overenie Breusch-Pagan testom potvrdilo, že dosiahnutá p-hodnota 0.4296 je výrazne vyššia ako α=0.05, a preto ide o konštantný rozptyl chýb, teda homoskedasticitu. Aplikácia robustných štandardných chýb slúžila na finálnu kontrolu.

6 Špecifikácia modelu

Testovanie, či je model v správnej funkčnej forme (t. j. či je vhodná lineárna špecifikácia), vykonáme pomocou Ramsey RESET testu. Keďže možnosti pridávania a uberania regresorov sú obmedzené dostupnými dátami, zameriame sa predovšetkým na funkčnú (nelineárnu) špecifikáciu modelu.

6.1 Ramsey Reset Test

Stanovenie Hypotéz:

H₀: Model je správne špecifikovaný (γ₂ = γ₃ = 0). Lineárna forma je vhodná.
H₁: Model je nesprávne špecifikovaný (γ₂ ≠ 0 alebo γ₃ ≠ 0). Mala by sa použiť nelineárna transformácia.

Keďže dosiahnutá p-hodnota (0.007773) je nižšia ako štandardná hladina významnosti α = 0.05, nulovú hypotézu (H₀) o správnej špecifikácii modelu zamietame.

6.2 Grafická analýza

Po tom, čo Ramsey RESET test a graf Reziduá vs. Vyrovnané Hodnoty potvrdili nesprávnu špecifikáciu funkčnej formy modelu, je nevyhnutné lokalizovať zdroj nelinearity.

Grafická analýza individuálnych regresorov naznačuje, že premenná Sloboda voľby (Freedom) sa javí ako lineárne vhodne špecifikovaná. Súčasne však potvrdila, že problém s nelineárnou funkčnou formou je spôsobený hlavne premennou Vnímanie Korupcie (Corruption), ktorej vyhladená krivka sa najvýraznejšie odchyľuje od priamej regresnej čiary. Aj Sociálna Podpora (Support) vykazuje mierne zakrivenie - z tohto dôvodu je nevyhnutné do modelu pridať kvadratické členy, aby sme tieto nelineárne vzťahy korigovali.

6.3 Nelineárna špecifikácia

Do pôvodnej lineárnej rovnice sme zaviedli kvadratické členy pre tieto premenné:

I(Corruption²) a I(Social support²)

6.3.1 Porovnanie základného a kvadratického modelu

Tabuľka Koeficientov Kvadrátneho Modelu
Premenná	Odhad	Smer. chyba	T-štatistika	P-hodnota
(Intercept)	-0.4034	0.1097	-3.6784	2e-04
Freedom.to.make.life.choices	2.0960	0.2061	10.1704	0e+00
Social.support	1.9687	0.2732	7.2058	0e+00
I(Freedom.to.make.life.choices^2)	-1.9254	0.1477	-13.0371	0e+00
I(Social.support^2)	-1.3423	0.1839	-7.2981	0e+00

Tabuľka Kvality Vyrovnania Kvadrátneho Modelu
Štatistika	Hodnota
N (Pozorovania)	1957.0000
R-squared	0.3311
Adj. R-squared	0.3298
F-statistic	241.6059
F-test p-value	0.0000

Na základe týchto tabuliek sa potvrdilo, že zavedenie kvadratických členov (Freedom to make life choices²) a (Social support²) bolo štatisticky opodstatnené. Oba kvadratické členy sú vysoko štatisticky významné (p < 0.005), čo naznačuje, že vzťah medzi Vnímaním korupcie a týmito prediktormi nie je lineárny, ale má nelineárnu (parabolickú) formu. Pridaním týchto členov sa kvalita modelu výrazne zlepšila: upravený koeficient determinácie R² dosiahol hodnotu 0.3311, čo znamená, že model vysvetľuje približne 33% variability vo Vnímaní korupcie. Extrémne vysoká F-štatistika (241.6059) s nízkou p-hodnotou potvrdzuje, že kvadratický model je ako celok štatisticky vysoko významný.

7 Multikolinearita

Budeme pracovať s nasledovným regresným modelom, pričom skúmame faktory ovplyvňujúce zdravie:

Healthy life expectancy at birth = β₀ + β₁ (Social support) + β₂ (Log GDP per capita) + β₃ (Freedom to make life choices) + uᵢ

7.1 Korelačná matica

Korelačná matica vysvetľujúcich premenných
	Log HDP/obyv.	Soc. podpora	Sloboda voľby
Log.GDP.per.capita	1.000	0.686	0.361
Social.support	0.686	1.000	0.407
Freedom.to.make.life.choices	0.361	0.407	1.000

Keďže najvyššia nameraná korelácia je 0.686 (medzi Log HDP per capita a Sociálnou podporou), neidentifikujeme dve premenné, ktoré by boli silne korelované (napríklad korelácia ≥ 0.8). Preto sa zdá, že model nebude zaťažený multikolinearitou.

7.2 Variance Inflation Factor - VIF

VIF hodnoty
	Premenná	VIF
Social.support	Social.support	1.88
GDP1000	GDP1000	1.88

Veľmi nízke VIF hodnoty potvrdzujú záver z korelačnej matice, a to, že multikolinearita nepredstavuje v tomto modeli žiadny problém, a preto sú štandardné chyby a odhady koeficientov spoľahlivé.

7.3 Condition Number

Číslo podmienenosti s hodnotou 109.1818 je extrémne vysoké (nad kritickou hranicou 30). Táto vysoká hodnota signalizuje, že odhady koeficientov sú mimoriadne citlivé na malé zmeny v dátach, čo potvrdzuje existenciu závažnej multikolinearity v dátovej štruktúre, ktorú VIF nedokázal plne zachytiť.

7.4 Riešenie problému multikolinearity

7.4.1 Vynechanie premennej

Upravený R-sqr pri vynechaní premenných
	Vynechaná premenná	Adj. R-sqr
Log.GDP.per.capita	Log.GDP.per.capita	0.374
Social.support	Social.support	0.668
Freedom.to.make.life.choices	Freedom.to.make.life.choices	0.664

Na základe tejto tabuľky môžeme jasne určiť relatívnu dôležitosť každého prediktora vo vysvetľovaní závislej premennej. Najdôležitejšou premennou s najväčšou individuálnou vysvetľujúcou silou je Log HDP per capita, pretože jej vynechanie vedie k najväčšiemu poklesu R² adj (na hodnotu 0.374). Naopak, najmenší vplyv na celkovú vysvetľujúcu silu modelu má Sociálna podpora, ktorej vynechanie ponecháva R² adj na najvyššej hodnote (0.668).

7.4.2 Úprava premennej, ktorá zachová interpretovateľnosť

Tab. 7.5: Koeficienty modelu
Premenná	Odhad	Smer. chyba	T-štatistika	P-hodnota
(Intercept)	15.0521	0.7838	19.2031	0.0000
GDP1000	4591.4767	109.3234	41.9990	0.0000
Social.support	2.7291	1.0656	2.5611	0.0105
Freedom.to.make.life.choices	3.8639	0.7109	5.4351	0.0000

Tab. 7.6: Kvalita vyrovania
Štatistika	Hodnota
N	1982.0000
R-squared	0.6695
Adj. R-squared	0.6690
F-statistic	1335.8111
F-test p-value	0.0000
AIC	11145.1897
Residual Std. Error	4.0195

Tab. 7.7: VIF pre Adaptovaný model
	Premenná	VIF
GDP1000	GDP1000	1.927
Social.support	Social.support	2.014
Freedom.to.make.life.choices	Freedom.to.make.life.choices	1.216

Nízke VIF hodnoty potvrdzujú, že model nie je zaťažený multikolinearitou, čo zaručuje spoľahlivosť odhadov. Model je ako celok vysoko štatisticky významný (F-štatistika = 1335.8111) a vysvetľuje približne 66.9% variability (R² adj = 0.6690). Zároveň odhady regresných koeficientov ukazujú, že všetky zahrnuté premenné majú pozitívny a štatisticky významný vplyv na Očakávanú dĺžku zdravého života, pričom po transformácii premennej HDP majú koeficienty porovnateľné rády.

8 Návrh záverečného modelu

Výsledkom ekonometrického experimentovania sme došli k záverečnej forme modelu, ktorá má tvar:

Healthy life expectancy at birth = β₀ + β₁ (Social support) + β₂ (Freedom to make life choices) + β₃ (GDP1000) + uᵢ

8.1 Odhad modelu

Tabuľka 8.1: Regresné koeficienty modelu Healthy Life Expectancy
Premenná	Odhad	Smer. chyba	T-štatistika
(Intercept)	16.3424	0.7594	21.5202
Social.support	4.3117	1.0340	4.1699
`I(GDP/1000)`	4627.5416	108.3495	42.7094

Tabuľka 8.2: Kvalita vyrovania modelu
Štatistika	Hodnota
N (Pozorovania)	2007.0000
R-squared	0.6618
Adj. R-squared	0.6614
F-statistic	1960.3763
F-test p-value	0.0000
AIC	11311.2871
Reziduálna smer. chyba	4.0462

Model, ktorý odhaduje Očakávanú dĺžku zdravého života prostredníctvom vplyvu Sociálnej podpory a transformovaného Log HDP, sa javí ako mimoriadne silný a štatisticky validný. Regresné koeficienty ďalej potvrdzujú, že oba zahrnuté prediktory sú vysoko štatisticky významné (p = 0.0000) a majú na Očakávanú dĺžku zdravého života pozitívny vplyv. Konkrétne, vyššia Sociálna podpora s koeficientom β ≈ 4.3117 a vyššie I(GDP/1000) s koeficientom β ≈ 4627.5416 vedú k štatisticky významnému predĺženiu Očakávanej dĺžky zdravého života.

Z hľadiska kvality model vysvetľuje približne 66.1% variability závislej premennej (Upravený R-squared = 0.6614) a je ako celok vysoko signifikantný (F-štatistika = 1960.3763 s p < 0.0001), čo potvrdzuje, že vybrané premenné predstavujú robustný a efektívny prediktor.

Porovnanie regresných modelov (s a bez 5 najvplyvnejších pozorovaní)
	Original	Vycisteny
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001
(Intercept)	16.342***	16.260***
	(0.759)	(0.714)
Social.support	4.312***	2.778**
	(1.034)	(0.979)
GDP1000	4627.542***	4770.560***
	(108.350)	(103.236)
Num.Obs.	2007	2002
R2 Adj.	0.661	0.690

## 
## 
## *** Diagnostické grafy pre Vyčistený model ***

8.2 Grafové interpretácie rezíduí

1. Residuals vs. Fitted: Červená LOESS krivka je mierne zakrivená (vpravo sa ohýba nadol a vľavo nahor), čo naznačuje len minimálny odklon od linearity. Tento odklon sa považuje za nepodstatný, pretože vyrovnané odchýlky neprekračujú štandardnú chybu modelu.

2. Normal Q-Q Residuals: Empirické body sú veľmi blízko teoretickej priamky, čo svedčí o tom, že rozdelenie rezíduí nemá žiaden významný odklon od normality, hoci mierne odchýlky pri extrémnych hodnotách signalizujú len minimálne zošikmenie.

3. Scale-Location: LOESS krivka je takmer konštantná, čo potvrdzuje neprítomnosť heteroskedasticity. To znamená, že rozptyl chýb je stabilný naprieč celým rozsahom predikovaných hodnôt.

4. Residuals vs. Leverage: Hoci je v grafe vizuálne prítomných niekoľko málo bodov s vysokou pákou a niektoré sa nachádzajú blízko alebo tesne za prahovou líniou Cookovej vzdialenosti, ich celkový vplyv na fitovanie modelu je minimálny, preto sa posunieme k ďalším testom.

8.3 Niektoré základné testy rezíduí

8.3.1 Test normality

Vizuálny náznak zošikmenia bol potvrdený formálnym Jarque-Berra testom,a to kvôli extrémne nízkej p-hodnote (p < 2.2e-16). To znamená, že rezíduá nemajú dokonalé normálne rozdelenie.

8.3.2 Test odľahlých hodnôt

Tento test potvrdil, že až desať pozorovaní má štatisticky významné odchýlky od modelu, pričom najväčšia z nich dosiahla korigovanú p-hodnotu približne 0.04. Toto zistenie formálne potvrdilo existenciu odľahlých hodnôt v dátovom súbore.

Napriek štatistickému potvrdeniu odľahlých hodnôt neboli tieto pozorovania z databázy odstránené. Vzhľadom na rozsiahly súbor dát (N ~ 2000)je celkový vplyv týchto extrémov minimalizovaný, čo umožňuje zachovať integritu a generalizovateľnosť vzorky.

9 Zhluková analýza

Naším cieľom je identifikovať skupiny krajín, ktoré sú si podobné z hľadiska faktorov ovplyvňujúcich kvalitu života a vnímané šťastie.

9.1 Príprava údajov a data.frame so šlálovanými údajmi

Pre zhlukovú analýzu sme vybrali päť kľúčových premenných, ktoré reprezentujú rôzne dimenzie životnej úrovne:

Log.GDP.per.capita (ekonomická úroveň)
Healthy.life.expectancy.at.birth (zdravotný stav)
Social.support (sociálna dimenzia)
Freedom.to.make.life.choices (osobná sloboda)
Perceptions.of.corruption (kvalita inštitúcií)

##       Pol  Hun  Lat  Lit  Cro  Slo  Aus  Ser  Mon  Ukr  Bul  Rom  Mol  Fin  Swe
## Hun  3.45                                                                      
## Lat  3.48 2.37                                                                 
## Lit  1.45 4.37 4.49                                                            
## Cro  1.48 2.20 2.66 2.21                                                       
## Slo  1.32 4.13 4.20 0.40 1.96                                                  
## Aus  3.37 1.14 1.73 4.38 2.33 4.15                                             
## Ser  3.00 0.88 1.92 3.91 1.79 3.69 0.85                                        
## Mon  3.13 0.96 2.73 4.06 2.08 3.90 1.32 0.94                                   
## Ukr  5.23 2.09 2.98 5.98 3.85 5.71 2.50 2.40 2.77                              
## Bul  4.45 2.67 1.18 5.29 3.42 5.00 2.06 2.34 3.18 2.49                         
## Rom  2.05 1.54 2.02 3.12 1.01 2.86 1.69 1.25 1.60 3.25 2.87                    
## Mol  3.54 2.13 1.04 4.61 2.65 4.34 1.88 1.77 2.46 2.63 1.74 1.87               
## Fin  4.21 1.63 1.62 5.07 2.98 4.77 1.34 1.63 2.33 1.72 1.27 2.36 1.87          
## Swe  1.59 2.54 2.61 2.89 1.49 2.65 2.62 2.34 2.51 4.27 3.67 1.15 2.49 3.31     
## Den. 1.28 4.33 4.18 0.61 2.16 0.47 4.25 3.85 4.10 5.93 5.03 2.99 4.38 4.89 2.67
## Est  5.25 1.93 3.57 5.96 3.90 5.72 2.41 2.48 2.51 1.53 3.20 3.41 3.46 2.04 4.42
##      Den.
## Hun      
## Lat      
## Lit      
## Cro      
## Slo      
## Aus      
## Ser      
## Mon      
## Ukr      
## Bul      
## Rom      
## Mol      
## Fin      
## Swe      
## Den.     
## Est  5.96

Táto tabuľka predstavuje Maticu Euklidovských Vzdialeností medzi krajinami. Každá hodnota kvantifikuje, aké sú si krajiny nepodobné vo všetkých piatich škálovaných premenných naraz. Nižšia hodnota znamená väčšiu podobnosť.

Hodnoty matice potvrdzujú silnú heterogenitu súboru a existencia veľmi blízkych párov (Slo a Lit) a extrémne vzdialených párov (Ukr a Lit/Den.) je kľúčovým predpokladom pre úspešnú hierarchickú zhlukovú analýzu.

9.2 Hierarchické zhlukovanie (Wardova metóda)

Prerezanie dendrogramu pri optimálnom počte k=3 zhlukov vizuálne potvrdzuje silnú sociálno-ekonomickú polarizáciu medzi skúmanými krajinami. Hlavný deliaci faktor spočíva v geograficko-ekonomickej úrovni (Nordic vs. Východ), čo sa odráža v hodnotách HDP a blahobytu. Zhluk 1 (Nordic) sa oddeľuje pri extrémne nízkej vzdialenosti, čo ukazuje na ich vysokú vnútornú podobnosť a výraznú odlišnosť od všetkých ostatných (najvyššie HDP, zdravie). Zhluk 2 (Stredná a Východná Európa) tvorí najväčšiu, prechodnú skupinu s priemernými hodnotami. Naopak, Zhluk 3 (Nízky Blahobyt/Outlier) sa pripája k hlavnej štruktúre ako posledný, čo signalizuje jeho najväčšiu odlišnosť od priemeru súboru.

9.3 Deskriptívne štatistiky výsledkov

Analýza mier variability ukázala, že vytvorené tri zhluky sú veľmi dobre oddelené a homogénne, pretože všetky premenné majú vysokú hodnotu BSS/TSS. Primárnymi faktormi odlíšenia krajín sú vnímanie korupcie (Prop_Between 0.819) a ekonomická úroveň (Prop_Between 0.777), ktoré vysvetľujú najväčšiu časť celkového rozptylu. Prekvapivo silným rozlišovacím faktorom je aj Sociálna podpora (Prop_Between 0.678), ktorá v rámci troch zhlukov vykazuje významné rozdiely, čím potvrdzuje existenciu jasne definovaných skupín krajín.

Klaster 1 predstavuje jasného lídra s najvyššou kvalitou života, čo je viditeľné v najvyšších priemerných hodnotách všetkých pozitívnych ukazovateľov a zároveň najnižšej vnímanej korupcii. Klaster 2 slúži ako stredný, prechodný článok, koncentrovaný okolo priemeru celého súboru. Naopak, Klaster 3 predstavuje najnižšiu úroveň blahobytu, čo je potvrdené najnižšími priemernými hodnotami vo všetkých pozitívnych ukazovateľoch a zároveň najvyššou mierou vnímanej korupcie.

10 Záver

Práca úspešne splnila svoj cieľ: analyzovať a kvantifikovať vplyv sociálno-ekonomických determinantov na Očakávanú dĺžku zdravého života pri narodení.

Všetky štyri stanovené hypotézy boli v kontexte ekonometrického experimentovania potvrdené: H1 (Sociálna podpora) a H2 (Log HDP) preukázali štatisticky významný pozitívny vplyv. Hoci aj H3 (Sloboda voľby) bola významná, z modelu bola vylúčená pre optimalizáciu. H4 bola jednoznačne potvrdená, pretože záverečný model je vysoko signifikantný (F-štatistika = 1960.3763) a vysvetľuje 66.14% variability. Model je robustný: problém s multikolinearitou, naznačený vysokým Číslom podmienenosti, bol prekonaný spoľahlivými nízkymi VIF hodnotami, a nelinearita bola úspešne korigovaná kvadratickými členmi. Zistenia potvrdzujú, že Log HDP je dominantný, no Sociálna podpora je kľúčový, nezávislý faktor predlžovania zdravého života. Zhluková analýza potvrdila silnú socioekonomickú polarizáciu krajín, kde sú hlavnými deliacimi faktormi vnímanie korupcie a ekonomická úroveň.

## ## 📝 Celkový Počet Tokenov/Slov v RMD Súbore

## Kód spočítal **všetky tokeny/slová** (vrátane textu, YAML hlavičky, R kódu a komentárov).

## ### **Celkový počet tokenov/slov:** 4736

Ekonometria FM UK 2025

Linda Kakasová