Analiza oszczędności w cyklu życia

Celem poniższej analizy jest weryfikacja empiryczna hipotezy cyklu życia, sformułowanej przez noblistę Franco Modiglianiego. Zgodnie z tym założeniem, jednostki planują swoją konsumpcję i oszczędności w perspektywie całego życia – zadłużają się za młodu, oszczędzają w wieku produkcyjnym, a zgromadzony kapitał konsumują na emeryturze. W ujęciu makroekonomicznym (dla całych państw) oznacza to, że na zagregowaną stopę oszczędności (sr) kluczowy wpływ powinna mieć struktura demograficzna społeczeństwa oraz dynamika dochodów. Poniższy raport sprawdza te zależności na uśrednionych danych dla 50 państw z lat 1960–1970.

library(datasets)
require(stats)
require(graphics)

1. Rozkład oszczędności

Histogram wskaźnika oszczędności (sr) pokazuje, że rozkład tej zmiennej jest asymetryczny prawoskośnie. Większość badanych państw w tamtym okresie charakteryzowała się stosunkowo niską lub umiarkowaną stopą oszczędności (najwięcej obserwacji skupia się w przedziale między 5% a 15%). Zaledwie kilka państw osiągało bardzo wysokie wskaźniki oszczędności przekraczające 15%, co czyni je swoistymi wyjątkami na arenie międzynarodowej.

hist(LifeCycleSavings$sr,
     main="Rozkład Oszczędności (sr)", 
     xlab="Agregowane Oszczędności (%)", 
     col="lightgreen", breaks=10)

2. Różnice w skalach zmiennych

Wykres pudełkowy (boxplot) obnaża drastyczne różnice w rzędach wielkości analizowanych danych. Realny dochód rozporządzalny na mieszkańca (dpi) jest wyrażony w wartościach bezwzględnych (sięgających tysięcy dolarów), podczas gdy pozostałe zmienne to udziały procentowe (przyjmujące wartości głównie od 0 do 50). Skutkuje to całkowitym wizualnym zdominowaniem wykresu przez zmienną dpi. Z perspektywy analitycznej jest to wyraźny sygnał, że przed zastosowaniem niektórych algorytmów uczenia maszynowego (np. opartych na dystansach) dane te wymagałyby standaryzacji, choć w klasycznej klasycznej regresji liniowej (OLS) współczynniki po prostu odpowiednio się przeskalują.

boxplot(LifeCycleSavings,
        main="Boxplot dla wszystkich zmiennych", 
        col=terrain.colors(5), 
        las=2)

3. Demografia a oszczędności: Wpływ młodej populacji

Powyższy wykres punktowy przedstawia zależność między wskaźnikiem oszczędności a odsetkiem populacji w wieku przedprodukcyjnym (poniżej 15 lat). Widoczna jest tu bardzo silna tendencja spadkowa. Zależność ta idealnie wpisuje się w logikę ekonomiczną: duży udział dzieci w społeczeństwie oznacza wysoki wskaźnik obciążenia demograficznego. Rodziny ponoszą wysokie bieżące koszty utrzymania i edukacji, co drastycznie ogranicza zdolność do odkładania jakichkolwiek nadwyżek finansowych, obniżając tym samym zagregowane oszczędności całego kraju.

plot(LifeCycleSavings$pop15, LifeCycleSavings$sr,
     main="Oszczędności vs. Młoda Populacja (pop15)",
     xlab="% populacji < 15 lat",
     ylab="Agregowane Oszczędności (sr)",
     pch=19, col="indianred")

4. Oszczędności a bezwzględny poziom dochodu

Wykres ilustruje relację między oszczędnościami a absolutnym poziomem realnego dochodu rozporządzalnego (dpi). W przeciwieństwie do czynników demograficznych, tutaj nie obserwujemy silnego, jednoznacznego trendu liniowego. Zjawisko to można tłumaczyć tym, że wraz ze wzrostem dochodów, proporcjonalnie rosną również aspiracje i poziom konsumpcji. Sam fakt bycia bogatym państwem nie gwarantuje więc automatycznie wyższej stopy oszczędności – liczy się to, co z tym dochodem robimy.

plot(LifeCycleSavings$dpi, LifeCycleSavings$sr,
     main="Oszczędności vs. Dochód (dpi)",
     xlab="Realny Dochód Rozporządzalny (dpi)",
     ylab="Agregowane Oszczędności (sr)",
     pch=19, col="steelblue")

5. Wpływ dynamiki wzrostu dochodu

Trzeci wykres rozrzutu rzuca światło na dynamikę dochodów (ddpi). Widać tu lekką tendencję wzrostową: w krajach, które szybko się bogacą (wysoki procentowy wzrost dochodu), skłonność do oszczędzania jest wyższa. Hipoteza cyklu życia tłumaczy to zjawisko w ten sposób, że społeczeństwa często traktują nagły wzrost dochodów jako sytuację przejściową i wolą te “nadwyżki” zaoszczędzić, zamiast od razu trwale podnosić swój standard bieżącej konsumpcji.

plot(LifeCycleSavings$ddpi, LifeCycleSavings$sr,
     main="Oszczędności vs. Wzrost dochodu (ddpi)",
     xlab="Procentowy wzrost dochodu (ddpi)",
     ylab="Agregowane Oszczędności (sr)",
     pch=19, col="darkorange")

6. Wielowymiarowa analiza wizualna

W celu uzyskania szerszego kontekstu wygenerowano pełną macierz wykresów rozrzutu (pairs). Pozwala ona na szybką ocenę wzajemnych powiązań pomiędzy każdą możliwą parą zmiennych, co jest kluczowe dla wychwycenia ukrytych struktur w danych.

pairs(LifeCycleSavings, panel = panel.smooth,
      main = "Macierz wykresów rozrzutu")

7. Analiza korelacji liczbowej

Macierz korelacji Pearsona precyzuje nasze obserwacje wizualne. Uwagę zwraca ujemna korelacja stopy oszczędności z młodą populacją (r = -0.46) oraz dodatnia z resztą zmiennych ekonomicznych. Co jednak najważniejsze z punktu widzenia budowy modelu, macierz ujawnia drastycznie silne współzależności między samymi predyktorami. Zmienna pop15 jest niemal doskonale ujemnie skorelowana z pop75 (r = -0.91) oraz mocno skorelowana z dpi (r = -0.76). To typowy obraz podziału świata na kraje rozwijające się (biedniejsze, z dużą liczbą dzieci) oraz rozwinięte (bogate, starzejące się społeczeństwa). Taka sytuacja grozi zjawiskiem współliniowości, co może sztucznie zawyżać błędy standardowe w modelu regresji.

print(cor(LifeCycleSavings))

##               sr       pop15       pop75        dpi        ddpi
## sr     1.0000000 -0.45553809  0.31652112  0.2203589  0.30478716
## pop15 -0.4555381  1.00000000 -0.90847871 -0.7561881 -0.04782569
## pop75  0.3165211 -0.90847871  1.00000000  0.7869995  0.02532138
## dpi    0.2203589 -0.75618810  0.78699951  1.0000000 -0.12948552
## ddpi   0.3047872 -0.04782569  0.02532138 -0.1294855  1.00000000

8. Wyniki modelu regresji liniowej (OLS)

Opracowany model wielorakiej regresji liniowej pozwala ocenić jednoczesny wpływ wszystkich badanych czynników na wskaźnik oszczędności. Wyniki są jednoznaczne: zdecydowanie najważniejszym statystycznie determinatem jest odsetek młodej populacji (pop15, p-value < 0.01). Jego wpływ jest silnie negatywny. Drugą istotną zmienną okazała się dynamika wzrostu dochodu (ddpi, p-value < 0.05), która stymuluje oszczędzanie. Zmienne takie jak absolutny poziom dochodu (dpi) czy odsetek osób starszych (pop75) okazały się w tym ujęciu nieistotne statystycznie (prawdopodobnie w dużej mierze przez wspomnianą wcześniej współliniowość). Model jako całość jest istotny statystycznie i tłumaczy blisko 34% (R-squared = 0.3385) całkowitej zmienności wskaźnika oszczędności na świecie.

model <- lm(sr ~ pop15 + pop75 + dpi + ddpi, data = LifeCycleSavings)
print(summary(model))

## 
## Call:
## lm(formula = sr ~ pop15 + pop75 + dpi + ddpi, data = LifeCycleSavings)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -8.2422 -2.6857 -0.2488  2.4280  9.7509 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 28.5660865  7.3545161   3.884 0.000334 ***
## pop15       -0.4611931  0.1446422  -3.189 0.002603 ** 
## pop75       -1.6914977  1.0835989  -1.561 0.125530    
## dpi         -0.0003369  0.0009311  -0.362 0.719173    
## ddpi         0.4096949  0.1961971   2.088 0.042471 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.803 on 45 degrees of freedom
## Multiple R-squared:  0.3385, Adjusted R-squared:  0.2797 
## F-statistic: 5.756 on 4 and 45 DF,  p-value: 0.0007904

9. Diagnostyka poprawności modelu

Aby wnioski wyciągnięte z modelu były wiarygodne, musi on spełniać podstawowe założenia Gaussa-Markowa. Analiza wykresów diagnostycznych wskazuje, że: 1. Reszty układają się dość losowo wokół zera (brak wyraźnego kształtu lejka), co pozwala zakładać w miarę stałą wariancję (homoskedastyczność). 2. Wykres Normal Q-Q pokazuje, że punkty układają się blisko linii prostej, co oznacza, że rozkład reszt jest zbliżony do rozkładu normalnego. Model można zatem uznać za poprawny statystycznie.

par(mfrow = c(2, 2))
plot(model)

par(mfrow=c(1, 1))

Podsumowanie

Przeprowadzona analiza graficzna i statystyczna dostarcza silnych dowodów na rzecz hipotezy cyklu życia Modiglianiego. Potwierdzono, że to nie absolutny poziom bogactwa państwa decyduje o jego stopie oszczędności, lecz w głównej mierze demografia – a dokładnie wskaźnik obciążenia osobami w wieku przedprodukcyjnym. Dodatkowym czynnikiem sprzyjającym akumulacji kapitału okazało się wysokie tempo wzrostu gospodarczego. Zastosowanie różnorodnych technik wizualizacyjnych okazało się niezbędnym narzędziem ułatwiającym poprawną interpretację wyników suchego modelu matematycznego.