LinkedIn profile: https://www.linkedin.com/in/gaetano-caira-4216ba93

Analisi relazione PIL e investimenti

Obiettivo di questo lavoro è quello di capire la relazione tra investimenti e PIL nel tempo.

Per descrivere meglio il dataset sulle grandezze che verranno analizzate si presenta di seguito una breve statistica riepilogativa e una descrizione dei campi

Fonte:https://www.macrohistory.net/database/

## 
## Caricamento pacchetto: 'dplyr'
## I seguenti oggetti sono mascherati da 'package:stats':
## 
##     filter, lag
## I seguenti oggetti sono mascherati da 'package:base':
## 
##     intersect, setdiff, setequal, union
##       year           country           iy               gdp           
##  Min.   :1870   Australia: 151   Min.   :0.01729   Min.   :        0  
##  1st Qu.:1907   Belgium  : 151   1st Qu.:0.14098   1st Qu.:       54  
##  Median :1945   Canada   : 151   Median :0.19436   Median :     1811  
##  Mean   :1945   Denmark  : 151   Mean   :0.18884   Mean   :  2454826  
##  3rd Qu.:1983   Finland  : 151   3rd Qu.:0.23029   3rd Qu.:    50383  
##  Max.   :2020   France   : 151   Max.   :0.54698   Max.   :207046579  
##                 (Other)  :1812   NA's   :293       NA's   :77

Per prima cosa si decide di circoscrivere il dataset ai primi 5 e ultimi 5 Paesi che hanno investito (di più/meno) dal 1940-2020 usando come indicatore:

## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## 
## Caricamento pacchetto: 'gridExtra'
## Il seguente oggetto è mascherato da 'package:dplyr':
## 
##     combine
## Warning: Removed 55 rows containing non-finite values (`stat_boxplot()`).
## `geom_smooth()` using formula = 'y ~ x'

Dal grafico si evidenziano la Norvegia e il Giappone non solo per il valore mediano più alto, ma anche per l’asimmetria positiva; infine per la Norvegia si evidenzia un leggero trend in negativo.

Applichiamo ora il test ANOVA per essere statisticamente confidenti al 95% che il singolo Paese sia determinante sul valore assunto dal relativo iy

##               Df Sum Sq Mean Sq F value              Pr(>F)    
## country       17  1.916 0.11271   33.06 <0.0000000000000002 ***
## Residuals   2407  8.206 0.00341                                
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 293 osservazioni eliminate a causa di valori mancanti

Il p-value è molto inferiore al 5%, per cui il Paese è statisticamente significativo sulla grandezza iy, ovvero questa cambia in base al Paese di riferimento.

Si vuole quindi confrontare per i primi e gli ultimi 5 Paesi per valore medio di iy, a partire dal 1940, le seguenti due grandezze:

## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.
## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.

Dagli ultimi grafici possiamo notare:

  1. Trend in crescita dagli anni 70: tutti i Paesi hanno iniziato a registrare un trend in crescita del PIL a partire dal 1970.

  2. Frenata del 2000: Giappone, Spagna e Portogallo intorno al 2010 hanno registrato una frenata al PIL

  3. Giappone più veloce: il Giappone (evidenziato in rosso) è il Paese che ha avuto il trend di crescita maggiore rispetto agli altri nel periodo 1970-2010 ed è anche quello che ha investito di più rispetto agli altri nel decennio 1960-1970

  4. Francia e Svizzera al secondo posto: per ciò che riguarda la crescita del PIL subito dopo il Giappone c’è la Svizzera (evidenziato in giallo) e la Francia (evienziata in marrone) e, anche questi Paesi, parebbero trovarsi al secondo e terzo posto per somma investita nel decennio 1960-1970

  5. Portogallo recupera negli anni ’90: il Portogallo (in blu) ha un PIL che cresce meno velocemente rispetto agli altri ma intorno agli anni ’90 accelera la sua crescita e, lato investimento iy, investe sempre di più tra gli anni 70-80

  6. e la Norvegia?: la Norvegia, di cui sapevamo dai dati precedenti essersi distinta per investimenti, sembra essere tra i Paesi più penalizzati per ciò che riguarda la crescita del PIL. Dall’ultimo grafico pare che la Norvegia si è distinta maggiormente sugli investimenti:

    • nel periodo precedente gli anni 50-60

    • a tratti tra gli anni 70-80

    • dopo il 2010

Sulla base di queste ultime 6 considerazioni possiamo iniziare a ipotizzare la compresenza di 2 fenomeni, che andremo meglio ad analizzare successivamente:

  1. la crescita/stabilità congiunturale: il PIL di un Paese cresce se anche negli altri Paesi si registra una crescita (un pò come accade ai titoli finanziari che vengono trascinati in alto o in basso in base all’andamento complessivo della borsa). Per fare questo approfondimento si misurerà la correlazione tra le serie dgp_scaled ovvero PIL normalizzato tra 0 e 1 nei 10 Paesi e nel periodo identificato.

  2. investimenti prima della crescita congiunturale (Giappone): la crescita è più veloce se a “breve” distanza (5-10 anni prima, questo rimane ancora da approfondire) si ha investito di più. Per far questo appronfondimento si potrà utilizzare la correlazione tra iy e gdp_scaled opportunamente sfalsata nel tempo.

    Prima di approfondire i due punti precedenti, a causa della difficile lettura dell’ultimo grafico (iy su base su base annuale), si andrà a visualizzare su base quinquennale i primi 4 Paesi che si sono distinti con il valore medio di iy più alto.

    ## 
    ## Caricamento pacchetto: 'lubridate'
    ## I seguenti oggetti sono mascherati da 'package:base':
    ## 
    ##     date, intersect, setdiff, union
    ## `summarise()` has grouped output by 'country_abb'. You can override using the
    ## `.groups` argument.
    ## Warning in geom_col(mapping = aes(x = ord_country_abb, y = iy_mean, fill =
    ## country_abb, : Ignoring unknown aesthetics: na.rm

    Tramite questo grafico possiamo affinare le considerazioni precedenti precisando che:

    • il Giappone ha scelto di far crescere la sua % iy media dal ’50 col 21% al ’70 col 34%, per poi mantenere un valore stabile e alto

    • la Norvegia ha scelto al contrario di ridurre progressivamente la sua % iy media dal ’50 col 36% al ’70 col 28%

    • la Svizzera rientra nella top 4 per iy-medio solo tra il ’55 e il ’65 con un valore medio del 23-29%

    • il Portogallo rientra nella top 4 per iy-medio solo tra il ‘66 e l’ ’80 con un valore medio del 27-32%

    • la Francia investe in modo stabile nel tempo (iy sempre oscilla tra 26% e 28%)

Approfondimento 1: la crescita/stabilità congiunturale - correlazione di Pearson della gdp_scaled tra Paesi

Di seguito il database :

  1. viene formattato in modo da poter calcolare la covarianza incolonnando il gdp_scaled per ogni Paese di riferimento

  2. ne vengono eliminate le righe coi valori mancanti

  3. si calcola l’indice correlazione di Pearson e la relativa visualizzazione tramite scatterplot con linea di tendenza

## 
## Caricamento pacchetto: 'psych'
## I seguenti oggetti sono mascherati da 'package:ggplot2':
## 
##     %+%, alpha

Come ci aspettavamo l’indice di correlazione tra le serie storiche è positivo e prossimo al valore massimo (passa da un minimo di 0.82 ad 1). Si noti come apprentemente la distanza geografica tra Paesi incida in qualche modo, anche se non sempree sull’indicatore di correlazione, ad esempio: 0.82 tra Norvegia e Giappone, 0.87 tra Spagna e Giappone e 1 tra Spagna e Portogallo.

Approfondimento 2: investimenti prima della crescita congiunturale

Prima di procedere si precisa che la serie storica del PIL normalizzato per Paese, una volta tolti i valori mancanti, parte dal ’46.

Al fine di meglio evidenziare una relazione con la grandezza iy, a causa della fortissima correlazione temporale tra le serie storiche, si decide di sottrarre al PIL normalizzato di ogni Paese il valore medio ottenuto da tutti gli altri Paesi in quel medesimo anno. Chiameremo il PIL normalizzato depurato dalla media annuale di riferimento con l’appellativo di “non-congiunturale”

Tramite questo grafico siamo riusciti a rendere molto più visibile l’intuizione iniziale: al netto dell’andamento congiunturale, prima il Giappone (in modo più forte) e poi la Svizzera hanno avuto un incremento superiore agli altri Paesi del proprio PIL:

Si conferma anche che la Norvegia ha avuto un decremento significativo (valore negativo) del PIL rispetto agli altri Paesi tra il 1990 e il 2010.

Vengono di seguito ricalcolati i coefficienti di regressione e i vari scatterplot, tramite i quali si può vedere in quali casi è ridotta la correlazione rispetto a prima.

Prima di procedere nell’analisi oggetto dell’approfondimento, si riportano due considerazioni elementari implicite sugli investimenti:

Si cercherà quindi di legare questi incrementi, attenzione non il valore assoluto, di Gdp normalizzato e non congiunturale con gli investimenti fatti anni prima (lag L che varierà da 1 a 15 anni) su D anni successivi ( che varierà da 1 a 10 anni) tramite il coefficiente di correlazione di Pearson.

Nello specifico per misurare l’incremento di GdP normalizzato e non congiunturale tra due istanti t distanziati di un lag L per D anni in avanti, si utilizzerà la variazione %. Nello schema di seguito si cercherà di rendere più visibile tale logica in modo schematico e intuitivo

Nello schema di seguito si riporterà per i Paesi d’interesse:

## Warning: Using an external vector in selections was deprecated in tidyselect 1.1.0.
## ℹ Please use `all_of()` or `any_of()` instead.
##   # Was:
##   data %>% select(Country)
## 
##   # Now:
##   data %>% select(all_of(Country))
## 
## See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.

Per l’interpretazione della correlazione si consiglia di guardare all’asse x come secondario in termini d’importanza (una sorta di startificazione opzionale), mentre è fondamentale l’asse x e ovviamente la colorazione sottostante (colore).

Possiamo quindi identificare 3 raggruppamenti dei Paesi selezionati in base al valoredi correlazione lineare del iy col Gdp(*):

(*) o meglio l’incremento % del GdP:

Infine vengono presi 3 paesi, in ordine uno per raggruppamento, al fine di visualizzarne l’informazione sintetica della correllazione direttamente sulle le due time series opportunamente riportate nel tempo (al fine di fare confronti più immediati).

Putroppo queto grafico, che dovrebbe portarci a vedere nel Giappone una bassa correlazione tra i valori di iy e quelli traslati in avanti di L del PIL normalizzato e non congiunturale, mette in luce in modo evidente il limite dell’indicatore della correlazione lineare di Pearson, che non riesce ad intereccare correlazioni non lineari (in questo caso GDP t+L)

## Warning: Removed 5 rows containing missing values (`geom_line()`).

Conclusioni finali

Nello studiare la relazione tra PIL e investimenti, per il periodo e i Paesi selezionati, si possono quindi trarre tre principali conclusioni: