Caricamento librerie:

library(dplyr)
library(ggplot2)

Parte 1: Dati e domanda di ricerca

In questo report si vogliono analizzare le correlazioni esistenti tra i dati sul salario minimo mensile scaricabili da Eurostat qui : https://ec.europa.eu/eurostat/databrowser/view/earn_mw_cur/settings_1/table?lang=en e i dati sugli indicatori economici della Banca Mondiale tra cui Reddito netto annuo, PIL procapite, Percentuale Part-time, Lavoro nei servizi ecc scaricabili da qui : https://databank.worldbank.org/source/world-development-indicators#

In particolare si vuole evidenziare che esistono fortissime correlazioni positive tra queste variabili, per cui al crescere del salario minimo crescono Reddito netto annuo, PIL procapite, Percentuale Part-time, Lavoro nei servizi ecc

Caricamento dei dati:

Indicatori_Data <- read.csv("Indicatori_Data.csv")
salario_minimo <- read.csv("salario_minimo.csv")

Parte 2 : Esplorazione dei dati

Si prendono in considerazione i dati del 2021, sebbene siano presenti nel dataset del salario minimo dati dal 2018 in poi e si uniscono i 2 dataset:

options(warn=-1)
df1<-salario_minimo %>%
  select(TIME,X2021.S2)

colnames(df1)[1] <- "Country"
colnames(df1)[2] <- "salario_minimo"

df2 <- Indicatori_Data %>%
  select(Country.Name, Series.Name,X2021..YR2021.)

colnames(df2)[1] <- "Country"
colnames(df2)[2] <- "name_indicator"
colnames(df2)[3] <- "value_indicator"

df <- merge(df1,df2, by.x="Country")

df$salario_minimo <- as.numeric(df$salario_minimo)
df$value_indicator <- as.numeric(df$value_indicator) 

Si eliminano i valori NA presenti nel dataset df :

colSums(is.na(df))
##         Country  salario_minimo  name_indicator value_indicator 
##               0              90               0              46
df<- df[-which(is.na(df$value_indicator)),]
df<- df[-which(is.na(df$salario_minimo)),]

Si calcola l’indice di correlazione di Pearson tra il salario minimo e il reddito netto procapite che risulta pari al 91,15% e si traccia il grafico Reddito per salario con la relativa retta di regressione notando la fortissima correlazione:

df3<- df %>%
  filter(name_indicator=="Adjusted net national income per capita (current US$)" ) 

cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.9115578
df3 %>%
  ggplot(aes(salario_minimo,value_indicator)) +
  geom_point()+
  geom_text(aes(label=Country), hjust=-0.2,size=3)+
  stat_smooth(method="lm")+
  xlab("Salario minimo")+
  ylab("Reddito netto procapite annuale")+
  ggtitle("Reddito netto procapite per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'

Si calcola l’indice di correlazione di Pearson tra il salario minimo e il PIL procapite che risulta pari all’ 89,5% e si traccia il grafico PIL per salario con la relativa retta di regressione notando la fortissima correlazione:

df3<- df %>%
  filter(name_indicator=="GDP per capita (constant 2015 US$)") 

cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.8950233
df3 %>%
  ggplot(aes(salario_minimo,value_indicator)) +
  geom_point()+
  geom_text(aes(label=Country), hjust=-0.2,size=3)+
  stat_smooth(method="lm")+
  xlab("Salario minimo")+
  ylab("PIL procapite")+
  ggtitle("PIL procapite per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'

Si calcola l’indice di correlazione di Pearson tra il salario minimo e le percentuali di part-time femminile, totale e maschile che risultano pari rispettivamente al 77,09% , 74,33% , 68,95% e si tracciano i grafici Percentuale Part-time per salario con le relative rette di regressione notando la forte correlazione:

df3<- df %>%
  filter(name_indicator=="Part time employment, female (% of total female employment)") 

cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7709827
df3 %>%
  ggplot(aes(salario_minimo,value_indicator)) +
  geom_point()+
  geom_text(aes(label=Country), hjust=-0.2,size=3)+
  stat_smooth(method="lm")+
  xlab("Salario minimo")+
  ylab("Percentuale Part-time femminile")+
  ggtitle("Percentuale Part-time femminile per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'

df3<- df %>%
  filter(name_indicator=="Part time employment, total (% of total employment)" ) 

cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7433926
df3 %>%
  ggplot(aes(salario_minimo,value_indicator)) +
  geom_point()+
  geom_text(aes(label=Country), hjust=-0.2,size=3)+
  stat_smooth(method="lm")+
  xlab("Salario minimo")+
  ylab("Percentuale Part-time maschile e femminile")+
  ggtitle("Percentuale Part-time maschile e femminile per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'

df3<- df %>%
  filter(name_indicator=="Part time employment, male (% of total male employment)" ) 

cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.6895798
df3<- df %>%
  filter(name_indicator=="Employment in services, male (% of male employment) (modeled ILO estimate)" ) 

cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7932328
df3 %>%
  ggplot(aes(salario_minimo,value_indicator)) +
  geom_point()+
  geom_text(aes(label=Country), hjust=-0.2,size=3)+
  stat_smooth(method="lm")+
  xlab("Salario minimo")+
  ylab("Percentuale lavoro maschile nei servizi")+
  ggtitle("Percentuale lavoro maschile nei servizi per salario minimo", subtitle = "nel 2021 con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'

Si calcola l’indice di correlazione di Pearson tra il salario minimo e la percentuale di lavoro nei servizi che risulta pari al 78,21% e si traccia il grafico Percentuale lavoro per salario con la relativa retta di regressione notando la forte correlazione:

df3<- df %>%
  filter(name_indicator=="Employment in services (% of total employment) (modeled ILO estimate)" ) 

cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7821231
df3 %>%
  ggplot(aes(salario_minimo,value_indicator)) +
  geom_point()+
  geom_text(aes(label=Country), hjust=-0.2,size=3)+
  stat_smooth(method="lm")+
  xlab("Salario minimo")+
  ylab("Percentuale lavoro nei servizi")+
  ggtitle("Percentuale lavoro nei servizi per salario minimo", subtitle = "nel 2021 con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'