library(dplyr)
library(ggplot2)
In questo report si vogliono analizzare le correlazioni esistenti tra i dati sul salario minimo mensile scaricabili da Eurostat qui : https://ec.europa.eu/eurostat/databrowser/view/earn_mw_cur/settings_1/table?lang=en e i dati sugli indicatori economici della Banca Mondiale tra cui Reddito netto annuo, PIL procapite, Percentuale Part-time, Lavoro nei servizi ecc scaricabili da qui : https://databank.worldbank.org/source/world-development-indicators#
In particolare si vuole evidenziare che esistono fortissime correlazioni positive tra queste variabili, per cui al crescere del salario minimo crescono Reddito netto annuo, PIL procapite, Percentuale Part-time, Lavoro nei servizi ecc
Caricamento dei dati:
Indicatori_Data <- read.csv("Indicatori_Data.csv")
salario_minimo <- read.csv("salario_minimo.csv")
Si prendono in considerazione i dati del 2021, sebbene siano presenti nel dataset del salario minimo dati dal 2018 in poi e si uniscono i 2 dataset:
options(warn=-1)
df1<-salario_minimo %>%
select(TIME,X2021.S2)
colnames(df1)[1] <- "Country"
colnames(df1)[2] <- "salario_minimo"
df2 <- Indicatori_Data %>%
select(Country.Name, Series.Name,X2021..YR2021.)
colnames(df2)[1] <- "Country"
colnames(df2)[2] <- "name_indicator"
colnames(df2)[3] <- "value_indicator"
df <- merge(df1,df2, by.x="Country")
df$salario_minimo <- as.numeric(df$salario_minimo)
df$value_indicator <- as.numeric(df$value_indicator)
Si eliminano i valori NA presenti nel dataset df :
colSums(is.na(df))
## Country salario_minimo name_indicator value_indicator
## 0 90 0 46
df<- df[-which(is.na(df$value_indicator)),]
df<- df[-which(is.na(df$salario_minimo)),]
Si calcola l’indice di correlazione di Pearson tra il salario minimo e il reddito netto procapite che risulta pari al 91,15% e si traccia il grafico Reddito per salario con la relativa retta di regressione notando la fortissima correlazione:
df3<- df %>%
filter(name_indicator=="Adjusted net national income per capita (current US$)" )
cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.9115578
df3 %>%
ggplot(aes(salario_minimo,value_indicator)) +
geom_point()+
geom_text(aes(label=Country), hjust=-0.2,size=3)+
stat_smooth(method="lm")+
xlab("Salario minimo")+
ylab("Reddito netto procapite annuale")+
ggtitle("Reddito netto procapite per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'
Si calcola l’indice di correlazione di Pearson tra il salario minimo e il PIL procapite che risulta pari all’ 89,5% e si traccia il grafico PIL per salario con la relativa retta di regressione notando la fortissima correlazione:
df3<- df %>%
filter(name_indicator=="GDP per capita (constant 2015 US$)")
cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.8950233
df3 %>%
ggplot(aes(salario_minimo,value_indicator)) +
geom_point()+
geom_text(aes(label=Country), hjust=-0.2,size=3)+
stat_smooth(method="lm")+
xlab("Salario minimo")+
ylab("PIL procapite")+
ggtitle("PIL procapite per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'
Si calcola l’indice di correlazione di Pearson tra il salario minimo e le percentuali di part-time femminile, totale e maschile che risultano pari rispettivamente al 77,09% , 74,33% , 68,95% e si tracciano i grafici Percentuale Part-time per salario con le relative rette di regressione notando la forte correlazione:
df3<- df %>%
filter(name_indicator=="Part time employment, female (% of total female employment)")
cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7709827
df3 %>%
ggplot(aes(salario_minimo,value_indicator)) +
geom_point()+
geom_text(aes(label=Country), hjust=-0.2,size=3)+
stat_smooth(method="lm")+
xlab("Salario minimo")+
ylab("Percentuale Part-time femminile")+
ggtitle("Percentuale Part-time femminile per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'
df3<- df %>%
filter(name_indicator=="Part time employment, total (% of total employment)" )
cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7433926
df3 %>%
ggplot(aes(salario_minimo,value_indicator)) +
geom_point()+
geom_text(aes(label=Country), hjust=-0.2,size=3)+
stat_smooth(method="lm")+
xlab("Salario minimo")+
ylab("Percentuale Part-time maschile e femminile")+
ggtitle("Percentuale Part-time maschile e femminile per salario minimo nel 2021", subtitle = "con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'
df3<- df %>%
filter(name_indicator=="Part time employment, male (% of total male employment)" )
cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.6895798
df3<- df %>%
filter(name_indicator=="Employment in services, male (% of male employment) (modeled ILO estimate)" )
cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7932328
df3 %>%
ggplot(aes(salario_minimo,value_indicator)) +
geom_point()+
geom_text(aes(label=Country), hjust=-0.2,size=3)+
stat_smooth(method="lm")+
xlab("Salario minimo")+
ylab("Percentuale lavoro maschile nei servizi")+
ggtitle("Percentuale lavoro maschile nei servizi per salario minimo", subtitle = "nel 2021 con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'
Si calcola l’indice di correlazione di Pearson tra il salario minimo e la percentuale di lavoro nei servizi che risulta pari al 78,21% e si traccia il grafico Percentuale lavoro per salario con la relativa retta di regressione notando la forte correlazione:
df3<- df %>%
filter(name_indicator=="Employment in services (% of total employment) (modeled ILO estimate)" )
cor(df3$salario_minimo,df3$value_indicator)
## [1] 0.7821231
df3 %>%
ggplot(aes(salario_minimo,value_indicator)) +
geom_point()+
geom_text(aes(label=Country), hjust=-0.2,size=3)+
stat_smooth(method="lm")+
xlab("Salario minimo")+
ylab("Percentuale lavoro nei servizi")+
ggtitle("Percentuale lavoro nei servizi per salario minimo", subtitle = "nel 2021 con relativa retta di regressione")
## `geom_smooth()` using formula = 'y ~ x'