Celem poniższej analizy jest weryfikacja empiryczna hipotezy cyklu życia, sformułowanej przez noblistę Franco Modiglianiego. Zgodnie z tym założeniem, jednostki planują swoją konsumpcję i oszczędności w perspektywie całego życia – zadłużają się za młodu, oszczędzają w wieku produkcyjnym, a zgromadzony kapitał konsumują na emeryturze. W ujęciu makroekonomicznym (dla całych państw) oznacza to, że na zagregowaną stopę oszczędności (sr) kluczowy wpływ powinna mieć struktura demograficzna społeczeństwa oraz dynamika dochodów. Poniższy raport sprawdza te zależności na uśrednionych danych dla 50 państw z lat 1960–1970.
library(datasets)
require(stats)
require(graphics)
Histogram wskaźnika oszczędności (sr) pokazuje, że rozkład tej zmiennej jest asymetryczny prawoskośnie. Większość badanych państw w tamtym okresie charakteryzowała się stosunkowo niską lub umiarkowaną stopą oszczędności (najwięcej obserwacji skupia się w przedziale między 5% a 15%). Zaledwie kilka państw osiągało bardzo wysokie wskaźniki oszczędności przekraczające 15%, co czyni je swoistymi wyjątkami na arenie międzynarodowej.
hist(LifeCycleSavings$sr,
main="Rozkład Oszczędności (sr)",
xlab="Agregowane Oszczędności (%)",
col="lightgreen", breaks=10)
Wykres pudełkowy (boxplot) obnaża drastyczne różnice w rzędach
wielkości analizowanych danych. Realny dochód rozporządzalny na
mieszkańca (dpi) jest wyrażony w wartościach bezwzględnych
(sięgających tysięcy dolarów), podczas gdy pozostałe zmienne to udziały
procentowe (przyjmujące wartości głównie od 0 do 50). Skutkuje to
całkowitym wizualnym zdominowaniem wykresu przez zmienną
dpi. Z perspektywy analitycznej jest to wyraźny sygnał, że
przed zastosowaniem niektórych algorytmów uczenia maszynowego (np.
opartych na dystansach) dane te wymagałyby standaryzacji, choć w
klasycznej klasycznej regresji liniowej (OLS) współczynniki po prostu
odpowiednio się przeskalują.
boxplot(LifeCycleSavings,
main="Boxplot dla wszystkich zmiennych",
col=terrain.colors(5),
las=2)
Powyższy wykres punktowy przedstawia zależność między wskaźnikiem oszczędności a odsetkiem populacji w wieku przedprodukcyjnym (poniżej 15 lat). Widoczna jest tu bardzo silna tendencja spadkowa. Zależność ta idealnie wpisuje się w logikę ekonomiczną: duży udział dzieci w społeczeństwie oznacza wysoki wskaźnik obciążenia demograficznego. Rodziny ponoszą wysokie bieżące koszty utrzymania i edukacji, co drastycznie ogranicza zdolność do odkładania jakichkolwiek nadwyżek finansowych, obniżając tym samym zagregowane oszczędności całego kraju.
plot(LifeCycleSavings$pop15, LifeCycleSavings$sr,
main="Oszczędności vs. Młoda Populacja (pop15)",
xlab="% populacji < 15 lat",
ylab="Agregowane Oszczędności (sr)",
pch=19, col="indianred")
Wykres ilustruje relację między oszczędnościami a absolutnym poziomem
realnego dochodu rozporządzalnego (dpi). W przeciwieństwie
do czynników demograficznych, tutaj nie obserwujemy silnego,
jednoznacznego trendu liniowego. Zjawisko to można tłumaczyć tym, że
wraz ze wzrostem dochodów, proporcjonalnie rosną również aspiracje i
poziom konsumpcji. Sam fakt bycia bogatym państwem nie gwarantuje więc
automatycznie wyższej stopy oszczędności – liczy się to, co z tym
dochodem robimy.
plot(LifeCycleSavings$dpi, LifeCycleSavings$sr,
main="Oszczędności vs. Dochód (dpi)",
xlab="Realny Dochód Rozporządzalny (dpi)",
ylab="Agregowane Oszczędności (sr)",
pch=19, col="steelblue")
Trzeci wykres rozrzutu rzuca światło na dynamikę dochodów
(ddpi). Widać tu lekką tendencję wzrostową: w krajach,
które szybko się bogacą (wysoki procentowy wzrost dochodu), skłonność do
oszczędzania jest wyższa. Hipoteza cyklu życia tłumaczy to zjawisko w
ten sposób, że społeczeństwa często traktują nagły wzrost dochodów jako
sytuację przejściową i wolą te “nadwyżki” zaoszczędzić, zamiast od razu
trwale podnosić swój standard bieżącej konsumpcji.
plot(LifeCycleSavings$ddpi, LifeCycleSavings$sr,
main="Oszczędności vs. Wzrost dochodu (ddpi)",
xlab="Procentowy wzrost dochodu (ddpi)",
ylab="Agregowane Oszczędności (sr)",
pch=19, col="darkorange")
W celu uzyskania szerszego kontekstu wygenerowano pełną macierz wykresów rozrzutu (pairs). Pozwala ona na szybką ocenę wzajemnych powiązań pomiędzy każdą możliwą parą zmiennych, co jest kluczowe dla wychwycenia ukrytych struktur w danych.
pairs(LifeCycleSavings, panel = panel.smooth,
main = "Macierz wykresów rozrzutu")
Macierz korelacji Pearsona precyzuje nasze obserwacje wizualne. Uwagę
zwraca ujemna korelacja stopy oszczędności z młodą populacją (r = -0.46)
oraz dodatnia z resztą zmiennych ekonomicznych. Co jednak najważniejsze
z punktu widzenia budowy modelu, macierz ujawnia drastycznie silne
współzależności między samymi predyktorami. Zmienna pop15
jest niemal doskonale ujemnie skorelowana z pop75 (r =
-0.91) oraz mocno skorelowana z dpi (r = -0.76). To typowy
obraz podziału świata na kraje rozwijające się (biedniejsze, z dużą
liczbą dzieci) oraz rozwinięte (bogate, starzejące się społeczeństwa).
Taka sytuacja grozi zjawiskiem współliniowości, co może sztucznie
zawyżać błędy standardowe w modelu regresji.
print(cor(LifeCycleSavings))
## sr pop15 pop75 dpi ddpi
## sr 1.0000000 -0.45553809 0.31652112 0.2203589 0.30478716
## pop15 -0.4555381 1.00000000 -0.90847871 -0.7561881 -0.04782569
## pop75 0.3165211 -0.90847871 1.00000000 0.7869995 0.02532138
## dpi 0.2203589 -0.75618810 0.78699951 1.0000000 -0.12948552
## ddpi 0.3047872 -0.04782569 0.02532138 -0.1294855 1.00000000
Opracowany model wielorakiej regresji liniowej pozwala ocenić
jednoczesny wpływ wszystkich badanych czynników na wskaźnik
oszczędności. Wyniki są jednoznaczne: zdecydowanie najważniejszym
statystycznie determinatem jest odsetek młodej populacji
(pop15, p-value < 0.01). Jego wpływ jest silnie
negatywny. Drugą istotną zmienną okazała się dynamika wzrostu dochodu
(ddpi, p-value < 0.05), która stymuluje oszczędzanie.
Zmienne takie jak absolutny poziom dochodu (dpi) czy
odsetek osób starszych (pop75) okazały się w tym ujęciu
nieistotne statystycznie (prawdopodobnie w dużej mierze przez wspomnianą
wcześniej współliniowość). Model jako całość jest istotny statystycznie
i tłumaczy blisko 34% (R-squared = 0.3385) całkowitej zmienności
wskaźnika oszczędności na świecie.
model <- lm(sr ~ pop15 + pop75 + dpi + ddpi, data = LifeCycleSavings)
print(summary(model))
##
## Call:
## lm(formula = sr ~ pop15 + pop75 + dpi + ddpi, data = LifeCycleSavings)
##
## Residuals:
## Min 1Q Median 3Q Max
## -8.2422 -2.6857 -0.2488 2.4280 9.7509
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 28.5660865 7.3545161 3.884 0.000334 ***
## pop15 -0.4611931 0.1446422 -3.189 0.002603 **
## pop75 -1.6914977 1.0835989 -1.561 0.125530
## dpi -0.0003369 0.0009311 -0.362 0.719173
## ddpi 0.4096949 0.1961971 2.088 0.042471 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.803 on 45 degrees of freedom
## Multiple R-squared: 0.3385, Adjusted R-squared: 0.2797
## F-statistic: 5.756 on 4 and 45 DF, p-value: 0.0007904
Aby wnioski wyciągnięte z modelu były wiarygodne, musi on spełniać podstawowe założenia Gaussa-Markowa. Analiza wykresów diagnostycznych wskazuje, że: 1. Reszty układają się dość losowo wokół zera (brak wyraźnego kształtu lejka), co pozwala zakładać w miarę stałą wariancję (homoskedastyczność). 2. Wykres Normal Q-Q pokazuje, że punkty układają się blisko linii prostej, co oznacza, że rozkład reszt jest zbliżony do rozkładu normalnego. Model można zatem uznać za poprawny statystycznie.
par(mfrow = c(2, 2))
plot(model)
par(mfrow=c(1, 1))
Przeprowadzona analiza graficzna i statystyczna dostarcza silnych dowodów na rzecz hipotezy cyklu życia Modiglianiego. Potwierdzono, że to nie absolutny poziom bogactwa państwa decyduje o jego stopie oszczędności, lecz w głównej mierze demografia – a dokładnie wskaźnik obciążenia osobami w wieku przedprodukcyjnym. Dodatkowym czynnikiem sprzyjającym akumulacji kapitału okazało się wysokie tempo wzrostu gospodarczego. Zastosowanie różnorodnych technik wizualizacyjnych okazało się niezbędnym narzędziem ułatwiającym poprawną interpretację wyników suchego modelu matematycznego.