LinkedIn profile: https://www.linkedin.com/in/gaetano-caira-4216ba93
Obiettivo di questo lavoro è quello di capire la relazione tra investimenti e PIL nel tempo.
Per descrivere meglio il dataset sulle grandezze che verranno analizzate si presenta di seguito una breve statistica riepilogativa e una descrizione dei campi
iy Investment-to-GDP ratio
year
country
gdp GDP (nominal, local currency)
Fonte:https://www.macrohistory.net/database/
##
## Caricamento pacchetto: 'dplyr'
## I seguenti oggetti sono mascherati da 'package:stats':
##
## filter, lag
## I seguenti oggetti sono mascherati da 'package:base':
##
## intersect, setdiff, setequal, union
## year country iy gdp
## Min. :1870 Australia: 151 Min. :0.01729 Min. : 0
## 1st Qu.:1907 Belgium : 151 1st Qu.:0.14098 1st Qu.: 54
## Median :1945 Canada : 151 Median :0.19436 Median : 1811
## Mean :1945 Denmark : 151 Mean :0.18884 Mean : 2454826
## 3rd Qu.:1983 Finland : 151 3rd Qu.:0.23029 3rd Qu.: 50383
## Max. :2020 France : 151 Max. :0.54698 Max. :207046579
## (Other) :1812 NA's :293 NA's :77
Per prima cosa si decide di circoscrivere il dataset ai primi 5 e ultimi 5 Paesi che hanno investito (di più/meno) dal 1940-2020 usando come indicatore:
la media sull’intero periodo del iy Investment-to-GDP ratio per singolo Paese
la distribuzione di frequenza iy e il suo valore nel tempo per singolo Paese
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
##
## Caricamento pacchetto: 'gridExtra'
## Il seguente oggetto è mascherato da 'package:dplyr':
##
## combine
## Warning: Removed 55 rows containing non-finite values (`stat_boxplot()`).
## `geom_smooth()` using formula = 'y ~ x'
Dal grafico si evidenziano la Norvegia e il Giappone non solo per il valore mediano più alto, ma anche per l’asimmetria positiva; infine per la Norvegia si evidenzia un leggero trend in negativo.
Applichiamo ora il test ANOVA per essere statisticamente confidenti al 95% che il singolo Paese sia determinante sul valore assunto dal relativo iy
## Df Sum Sq Mean Sq F value Pr(>F)
## country 17 1.916 0.11271 33.06 <0.0000000000000002 ***
## Residuals 2407 8.206 0.00341
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 293 osservazioni eliminate a causa di valori mancanti
Il p-value è molto inferiore al 5%, per cui il Paese è statisticamente significativo sulla grandezza iy, ovvero questa cambia in base al Paese di riferimento.
Si vuole quindi confrontare per i primi e gli ultimi 5 Paesi per valore medio di iy, a partire dal 1940, le seguenti due grandezze:
iy all’ anno t
PIL all’ anno t normalizzato per ogni Paese in un range tra 0 e 1 - al fine di rendere tale valore confrontabile a livello grafico tra Paesi (annullando cosi le relative differenze di valuta)
## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.
## Scale for colour is already present.
## Adding another scale for colour, which will replace the existing scale.
Dagli ultimi grafici possiamo notare:
Trend in crescita dagli anni 70: tutti i Paesi hanno iniziato a registrare un trend in crescita del PIL a partire dal 1970.
Frenata del 2000: Giappone, Spagna e Portogallo intorno al 2010 hanno registrato una frenata al PIL
Giappone più veloce: il Giappone (evidenziato in rosso) è il Paese che ha avuto il trend di crescita maggiore rispetto agli altri nel periodo 1970-2010 ed è anche quello che ha investito di più rispetto agli altri nel decennio 1960-1970
Francia e Svizzera al secondo posto: per ciò che riguarda la crescita del PIL subito dopo il Giappone c’è la Svizzera (evidenziato in giallo) e la Francia (evienziata in marrone) e, anche questi Paesi, parebbero trovarsi al secondo e terzo posto per somma investita nel decennio 1960-1970
Portogallo recupera negli anni ’90: il Portogallo (in blu) ha un PIL che cresce meno velocemente rispetto agli altri ma intorno agli anni ’90 accelera la sua crescita e, lato investimento iy, investe sempre di più tra gli anni 70-80
e la Norvegia?: la Norvegia, di cui sapevamo dai dati precedenti essersi distinta per investimenti, sembra essere tra i Paesi più penalizzati per ciò che riguarda la crescita del PIL. Dall’ultimo grafico pare che la Norvegia si è distinta maggiormente sugli investimenti:
nel periodo precedente gli anni 50-60
a tratti tra gli anni 70-80
dopo il 2010
Sulla base di queste ultime 6 considerazioni possiamo iniziare a ipotizzare la compresenza di 2 fenomeni, che andremo meglio ad analizzare successivamente:
la crescita/stabilità congiunturale: il PIL di un Paese cresce se anche negli altri Paesi si registra una crescita (un pò come accade ai titoli finanziari che vengono trascinati in alto o in basso in base all’andamento complessivo della borsa). Per fare questo approfondimento si misurerà la correlazione tra le serie dgp_scaled ovvero PIL normalizzato tra 0 e 1 nei 10 Paesi e nel periodo identificato.
investimenti prima della crescita congiunturale (Giappone): la crescita è più veloce se a “breve” distanza (5-10 anni prima, questo rimane ancora da approfondire) si ha investito di più. Per far questo appronfondimento si potrà utilizzare la correlazione tra iy e gdp_scaled opportunamente sfalsata nel tempo.
Prima di approfondire i due punti precedenti, a causa della difficile lettura dell’ultimo grafico (iy su base su base annuale), si andrà a visualizzare su base quinquennale i primi 4 Paesi che si sono distinti con il valore medio di iy più alto.
##
## Caricamento pacchetto: 'lubridate'
## I seguenti oggetti sono mascherati da 'package:base':
##
## date, intersect, setdiff, union
## `summarise()` has grouped output by 'country_abb'. You can override using the
## `.groups` argument.
## Warning in geom_col(mapping = aes(x = ord_country_abb, y = iy_mean, fill =
## country_abb, : Ignoring unknown aesthetics: na.rm
Tramite questo grafico possiamo affinare le considerazioni precedenti precisando che:
il Giappone ha scelto di far crescere la sua % iy media dal ’50 col 21% al ’70 col 34%, per poi mantenere un valore stabile e alto
la Norvegia ha scelto al contrario di ridurre progressivamente la sua % iy media dal ’50 col 36% al ’70 col 28%
la Svizzera rientra nella top 4 per iy-medio solo tra il ’55 e il ’65 con un valore medio del 23-29%
il Portogallo rientra nella top 4 per iy-medio solo tra il ‘66 e l’ ’80 con un valore medio del 27-32%
la Francia investe in modo stabile nel tempo (iy sempre oscilla tra 26% e 28%)
Di seguito il database :
viene formattato in modo da poter calcolare la covarianza incolonnando il gdp_scaled per ogni Paese di riferimento
ne vengono eliminate le righe coi valori mancanti
si calcola l’indice correlazione di Pearson e la relativa visualizzazione tramite scatterplot con linea di tendenza
##
## Caricamento pacchetto: 'psych'
## I seguenti oggetti sono mascherati da 'package:ggplot2':
##
## %+%, alpha
Come ci aspettavamo l’indice di correlazione tra le serie storiche è positivo e prossimo al valore massimo (passa da un minimo di 0.82 ad 1). Si noti come apprentemente la distanza geografica tra Paesi incida in qualche modo, anche se non sempree sull’indicatore di correlazione, ad esempio: 0.82 tra Norvegia e Giappone, 0.87 tra Spagna e Giappone e 1 tra Spagna e Portogallo.
Prima di procedere si precisa che la serie storica del PIL normalizzato per Paese, una volta tolti i valori mancanti, parte dal ’46.
Al fine di meglio evidenziare una relazione con la grandezza iy, a causa della fortissima correlazione temporale tra le serie storiche, si decide di sottrarre al PIL normalizzato di ogni Paese il valore medio ottenuto da tutti gli altri Paesi in quel medesimo anno. Chiameremo il PIL normalizzato depurato dalla media annuale di riferimento con l’appellativo di “non-congiunturale”
Tramite questo grafico siamo riusciti a rendere molto più visibile l’intuizione iniziale: al netto dell’andamento congiunturale, prima il Giappone (in modo più forte) e poi la Svizzera hanno avuto un incremento superiore agli altri Paesi del proprio PIL:
dal 1970 al 2010 per il Giappone
dagli anni 70 in poi in maniera meno intensa ma più continuativa per la Svizzera
Si conferma anche che la Norvegia ha avuto un decremento significativo (valore negativo) del PIL rispetto agli altri Paesi tra il 1990 e il 2010.
Vengono di seguito ricalcolati i coefficienti di regressione e i vari scatterplot, tramite i quali si può vedere in quali casi è ridotta la correlazione rispetto a prima.
Prima di procedere nell’analisi oggetto dell’approfondimento, si riportano due considerazioni elementari implicite sugli investimenti:
l’effetto di un investimento fatto all’anno t si vede a partire da un t+L, dove L (Lag) lo faremo oscillare per un valore da 1 a 15 anni
l’effetto di un investimento dura per D anni (non si consuma necessiaramente in un solo anno), dove D lo faremo oscillare per un valore da 1 a 10 anni
Si cercherà quindi di legare questi incrementi, attenzione non il valore assoluto, di Gdp normalizzato e non congiunturale con gli investimenti fatti anni prima (lag L che varierà da 1 a 15 anni) su D anni successivi ( che varierà da 1 a 10 anni) tramite il coefficiente di correlazione di Pearson.
Nello specifico per misurare l’incremento di GdP normalizzato e non congiunturale tra due istanti t distanziati di un lag L per D anni in avanti, si utilizzerà la variazione %. Nello schema di seguito si cercherà di rendere più visibile tale logica in modo schematico e intuitivo
Nello schema di seguito si riporterà per i
Paesi d’interesse:
per riga il lag L che varia da 1 a 15 anni
per colonna il periodo D da 1 a 10 anni
(all’incrocio) la correlazione sottostante tra iy(t,L) e GdP%(t,L,D) attraverso il coefficiente di Pearson.
## Warning: Using an external vector in selections was deprecated in tidyselect 1.1.0.
## ℹ Please use `all_of()` or `any_of()` instead.
## # Was:
## data %>% select(Country)
##
## # Now:
## data %>% select(all_of(Country))
##
## See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
Per l’interpretazione della correlazione si consiglia di guardare all’asse x come secondario in termini d’importanza (una sorta di startificazione opzionale), mentre è fondamentale l’asse x e ovviamente la colorazione sottostante (colore).
Possiamo quindi identificare 3 raggruppamenti dei Paesi selezionati in base al valoredi correlazione lineare del iy col Gdp(*):
minimale o leggermente negativo: USA, Danimarca, Francia, Giappone, Svezia e Portogallo
fortemente negativo rispetto a investimenti fatti almeno 5-10 anni prima sul valore del Gdp(*) : UK meno la Spagna e in bassa misura la Svizzera
fortemente positivo per gli investimenti fatti al più 10 anni prima: Norvegia
(*) o meglio l’incremento % del GdP:
normalizzato (valore compreso tra 0 e 1)
non-congiunturale (depurato dal valore medio ottenuto dagli altri Paesi nello stesso anno)
nell’intervallo che va da t al valore medio ottenuto tra t+L e t+L+D
Infine vengono presi 3 paesi, in ordine uno per raggruppamento, al fine di visualizzarne l’informazione sintetica della correllazione direttamente sulle le due time series opportunamente riportate nel tempo (al fine di fare confronti più immediati).
Putroppo queto grafico, che dovrebbe portarci a vedere nel Giappone una bassa correlazione tra i valori di iy e quelli traslati in avanti di L del PIL normalizzato e non congiunturale, mette in luce in modo evidente il limite dell’indicatore della correlazione lineare di Pearson, che non riesce ad intereccare correlazioni non lineari (in questo caso GDP t+L)
## Warning: Removed 5 rows containing missing values (`geom_line()`).
Nello studiare la relazione tra PIL e investimenti, per il periodo e i Paesi selezionati, si possono quindi trarre tre principali conclusioni:
il meccanismo congiunturale: il PIL di ogni Paese in ogni anno dipende fortemente da quello degli altri Paesi. A livello gerarchico questo fenomeno è di primaria importanza rispetto all’effetto del iy.
incidenza residuale tra iy e il PIL de-congiunturalizzato: di secondaria importanza al meccanismo congiunturale, il valore residuale del PIL - ottenuto attraverso una sua depurazione - è legato agli investimenti fatti L anni prima (L=Lag) non necessariamente caratterizzati da un valore positivo, ma anche neutro o negativo. L e il tipo di correlazione (lineare) cambia da Paese a Paese
il Giappone sfrutta gli effetti dell’investimenti fatti prima della crescita congiunturale e cresce poi più velocemente: il Paese che è cresciuto più velocemente è stato il Giappone che ha messo a frutto investimenti maggiori (rispetto agli altri Paesi) nel periodo 60-70, ricaduti 5 anni dopo quando è iniziata la crescita congiunturale per tutti i Paesi.