Caricamento librerie

library(dplyr)
library(ggplot2)
library(reshape2)
options(warn = -1)

Parte 1 : Dati

Eurostat fornisce dati sul tasso di occupazione nei paesi europei dal 2014 al 2023 scaricabili da qui : https://ec.europa.eu/eurostat/databrowser/view/lfsa_ergan/default/table?lang=en&category=labour.employ.lfsa.lfsa_emprt

Inoltre fornisce dati sul tasso di occupazione nelle regioni dei paesi europei dal 2012 al 2023 scaricabili da qui : https://ec.europa.eu/eurostat/databrowser/view/tgs00007/default/table?lang=en&category=t_labour.t_employ.t_lfst

Da questi dati si estraggono i tassi di occupazione delle regioni italiane.

Caricamento dati:

df_ocse<- read.csv("Employment_rates_by_sex_age_and_citizenship.csv")
df_italy <- read.csv("Employment_rate_of_the_age_group_15-64_by_regions.csv")
Provincia <- read.csv("Provincia.csv", sep = ";")

Parte 2 : Esplorazione dati

PAESI OCSE

df_ocse$X2023 <- as.numeric(df_ocse$X2023) 

df <- df_ocse[-which(is.na(df_ocse$X2023)),]

df$italy <- ifelse(df$Territorio=="Italy","Yes","No")
df %>%
  mutate(Territorio=reorder(Territorio,X2023)) %>%
  mutate(italy= factor(italy, levels = c("Yes","No"))) %>%
  ggplot(aes(Territorio,X2023, fill = italy))+
  geom_bar(stat = "identity", colour="white")+
  coord_flip()+
  geom_text(aes(label=X2023), hjust=0, size=3 )+
  guides(fill="none")+
  ylim(0,90)+
  ylab("Tasso di occupazione (%)")+
  ggtitle("Tasso di occupazione in Europa nel 2023")

colnames(df_ocse)[2:11]<-2014:2023
df_ocse <- melt(df_ocse, id="Territorio")
colnames(df_ocse)[2] <- "Anno"
df_ocse$Anno <- as.integer(as.character(df_ocse$Anno))
df_ocse$value <- as.numeric(df_ocse$value)
df_ocse %>%
  filter(Territorio %in% c("Italy","Greece","Spain","France","Germany")) %>%
  ggplot(aes(Anno,value, colour = Territorio))+
  geom_line(linewidth=1)+
  scale_x_continuous(breaks = 2014:2023)+
  scale_y_continuous(breaks = seq(40,80,5))+
  ylab("Tasso di occupazione (%)")+
  ggtitle("Tasso di occupazione dal 2014 al 2023")

ITALIA

df_italy$Regione[df_italy$Regione=="Valle d’Aosta"] <-"Valle D'Aosta"

df_italy$Regione[df_italy$Regione=="Provincia Autonoma di Trento"] <-"Trentino Alto Adige"

df_italy$Regione[df_italy$Regione=="Friuli-Venezia Giulia"] <-"Friuli Venezia Giulia"

df_italy$Regione[df_italy$Regione=="Emilia-Romagna" ] <-"Emilia Romagna"
colnames(Provincia)[6] <- "Regione"
df1<-Provincia %>%
  select(Regione,DescrMacroregione)
df1 <- unique(df1)

df <- merge(df_italy,df1, by="Regione")
df %>%
  mutate(Regione=reorder(Regione,X2023)) %>%
  ggplot(aes(Regione,X2023, fill = DescrMacroregione ))+
  geom_bar(stat = "identity", colour="white")+
  coord_flip()+
  geom_text(aes(label=X2023), hjust=0, size=3 )+
  ylim(0,80)+
  ylab("Tasso di occupazione (%)")+
  ggtitle("Tasso di occupazione in Italia nel 2023")

colnames(df_italy)[2:13]<-2012:2023
df_italy <- melt(df_italy, id="Regione")
colnames(df_italy)[2] <- "Anno"
df_italy$Anno <- as.integer(as.character(df_italy$Anno))
df_italy %>%
  ggplot(aes(Anno,value, colour = Regione))+
  geom_line(linewidth=1)+
  scale_x_continuous(breaks = 2012:2023)+
  scale_y_continuous(breaks = seq(40,80,5))+
  theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1))+
  ylab("Tasso di occupazione (%)")+
  ggtitle("Tasso di occupazione in Italia nel 2023")