knitr::opts_chunk$set(echo = TRUE, cache=TRUE)
# Leemos los archivos
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.2.3
## Warning: package 'ggplot2' was built under R version 4.2.3
## Warning: package 'tibble' was built under R version 4.2.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.0 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.2 ✔ tibble 3.2.1
## ✔ lubridate 1.9.2 ✔ tidyr 1.3.0
## ✔ purrr 1.0.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the ]8;;http://conflicted.r-lib.org/conflicted package]8;; to force all conflicts to become errors
library(dplyr)
library(knitr)
library(cluster)
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.2.3
library(factoextra)
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(NbClust)
library(clValid)
## Warning: package 'clValid' was built under R version 4.2.3
library(readxl)
library(ggplot2)
library(sf)
## Warning: package 'sf' was built under R version 4.2.3
## Linking to GEOS 3.9.3, GDAL 3.5.2, PROJ 8.2.1; sf_use_s2() is TRUE
library(spData)
## Warning: package 'spData' was built under R version 4.2.3
## To access larger datasets in this package, install the spDataLarge
## package with: `install.packages('spDataLarge',
## repos='https://nowosad.github.io/drat/', type='source')`
library(mapSpain)
## Warning: package 'mapSpain' was built under R version 4.2.3
library(RColorBrewer)
library(tidyr)
library(ggplot2)
library(maps)
## Warning: package 'maps' was built under R version 4.2.3
##
## Attaching package: 'maps'
##
## The following object is masked from 'package:cluster':
##
## votes.repub
##
## The following object is masked from 'package:purrr':
##
## map
library(readr)
Como los tenemos almacenados en ficheros csv, utilizamos la librería readxl para poder leerlos.
knitr::opts_chunk$set(echo = TRUE)
library(readxl)
# Bases de datos a nivel Valencia:
seccion = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/Bases de datos/Seccion/Seccion.csv", sep=';')
NivF = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/Bases de datos/Nivel Formativo/NivelForm.csv", sep = ';')
NivFBUENO = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/NivFormOFICIAL.csv", sep = ';')
GruO = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/Bases de datos/Grupo de ocupación/GruOcupacion.csv", sep = ';', header=TRUE, stringsAsFactors=FALSE, fileEncoding="latin1")
Gen = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/Bases de datos/Género y Edad/GenEdad.csv", sep = ';', header=TRUE, stringsAsFactors=FALSE, fileEncoding="latin1")
#Otras bases
guess_encoding("C:/Users/carlo/Downloads/Poblacion por municipios CV.csv")
## # A tibble: 1 × 2
## encoding confidence
## <chr> <dbl>
## 1 ISO-8859-1 0.5
poblacionpormunicipiosCV = read.csv("C:/Users/carlo/Downloads/Poblacion por municipios CV.csv", sep = ";", fileEncoding = "ISO-8859-1")
guess_encoding("C:/Users/carlo/Downloads/PoblacionB.csv")
## # A tibble: 1 × 2
## encoding confidence
## <chr> <dbl>
## 1 ISO-8859-1 0.45
poblacion = read.csv("C:/Users/carlo/Downloads/PoblacionB.csv", sep = ";", fileEncoding = "ISO-8859-1")
head(poblacion)
## Municipios Sexo Periodo Total Var PorVar
## 1 46 Valencia/València Total 2022 2.605.757 16.445 0,64%
## 2 46 Valencia/València Total 2021 2.589.312 -2.563 -0,10%
## 3 46 Valencia/València Total 2020 2.591.875 26.751 1,04%
## 4 46 Valencia/València Total 2019 2.565.124 17.138 0,67%
## 5 46 Valencia/València Total 2018 2.547.986 2.546.986 254698,60%
## 6 46001 Ademuz Total 2022 1.000 -27 -2,63%
#Bases de datos a nivel nacional:
sector = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/COMUNIDAD_SECTOR.csv", sep = ";")
formacion = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/COMUNIDAD_SEXO_FORMACION.csv", sep = ";")
sexo = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/COMUNIDAD_SEXO_EDAD2.csv", fileEncoding = "Latin1", sep = ";")
La limpieza de datos fue una parte muy importante y costosa de nuestro proyecto. Como descargamos los datos procedentes de distintos proveedores (INE y Generalitat Valenciana) tuvimos mucho trabajo ya que cada página utilizaba, por ejemplo, un idioma diferente para los nombres de los municipios o comunidades autónomas.
# Eliminamos traducciones de municipios quedándonos con el primer nombre hasta la barra inclinada (Rafelbuñol/Rafelbunyol).
seccion$DESC_PROV <- sub("/.*", "", seccion$DESC_PROV)
seccion$DESC_MUN <- sub("/.*", "", seccion$DESC_MUN)
# Ahora quitamos las tildes de los nombres (función iconv()) para no tener problemas con el encoding y los ponemos en mayúsculas (función toupper())
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
seccion$DESC_MUN <- toupper(iconv(seccion$DESC_MUN, to = "ASCII//TRANSLIT"))
seccion$DESC_SECCION <- toupper(iconv(seccion$DESC_SECCION, to = "ASCII//TRANSLIT"))
write.csv2(seccion, 'seccionBUENO.csv', row.names = TRUE)
NivF$DESC_PROV <- sub("/.*", "", NivF$DESC_PROV)
NivF$DESC_MUN <- sub("/.*", "", NivF$DESC_MUN)
NivF$DESC_PROV <- toupper(iconv(NivF$DESC_PROV, to = "ASCII//TRANSLIT"))
NivF$DESC_MUN <- toupper(iconv(NivF$DESC_MUN, to = "ASCII//TRANSLIT"))
NivF$DESC_NIVEL <- toupper(iconv(NivF$DESC_NIVEL, to = "ASCII//TRANSLIT"))
NivF$COD_NIVEL <- sub("80", "0", NivF$COD_NIVEL) # Se reemplaza el código 80 por el 0, ya que indica los estudios nulos, y para nuestro análisis preferimos tener esta variable como numérica ordinal indicando que es el nivel más bajo de estudios.
# A partir de cierto año, en la base de datos descargada pasaron de escribir el nivel formativo entero a indicarlo con su código, por lo que para poder interpretarlo mejor reemplazamos los códigos por los nombres de los niveles de estudio coincidentes observando los años donde sí que estaban escritos.
Niv <- NivF$DESC_NIVEL
Niv <- gsub("60", "ENSENANZAS UNIVERSITARIAS OFICIALES DE MASTER", Niv)
Niv <- gsub("0", "SIN ESTUDIOS", Niv)
Niv <- gsub("11", "ESTUDIOS PRIMARIOS INCOMPLETOS", Niv)
Niv <- gsub("12", "ESTUDIOS PRIMARIOS COMPLETOS", Niv)
Niv <- gsub("21", "PROGRAMAS PARA LA FORMACION E INSERCION LABORAL QUE NO PRECISAN DE UNA TITULACION ACADEMICA DE LA 1A ETAPA DE SECUNDARIA PARA SU REALIZACION (MAS DE 3SIN ESTUDIOSSIN ESTUDIOS HORAS).", Niv)
Niv <- gsub("22", "PRIMERA ETAPA DE EDUCACION SECUNDARIA SIN TITULO DE GRADUADO ESCOLAR O EQUIVALENTE.", Niv)
Niv <- gsub("23", "PRIMERA ETAPA DE EDUCACION SECUNDARIA CON TITULO DE GRADUADO ESCOLAR O EQUIVALENTE.", Niv)
Niv <- gsub("31", "PROGRAMAS PARA LA FORMACION E INSERCION LABORAL QUE PRECISAN DE UNA TITULACION DE ESTUDIOS SECUNDARIOS DE PRIMERA ETAPA PARA SU REALIZACION (MAS DE 300 HORAS).", Niv)
Niv <- gsub("32", "ENSENANZAS DE BACHILLERATO", Niv)
Niv <- gsub("33", "EQUIVALENTE", Niv)
Niv <- gsub("34", "ENSENANZAS DE GRADO MEDIO DE MUSICA Y DANZA", Niv)
Niv <- gsub("41", "ENSENANZAS PARA LA FORMACION E INSERCION LABORAL QUE PRECISAN DE UNA TITULACION DE ESTUDIOS SECUNDARIOS DE 2A ETAPA PARA SU REALIZACION (MAS DE 300 HORAS).", Niv)
Niv <- gsub("51", "ENSENANZAS DE GRADO SUPERIOR DE FORMACION PROFESIONAL ESPECIFICA Y EQUIVALENTES, ARTES PLASTICAS Y DISENO Y DEPORTIVAS.", Niv)
Niv <- gsub("52", "TITULOS PROPIOS DE LAS UNIVERSIDADES Y OTRAS ENSENANZAS QUE PRECISAN DEL TITULO DE BACHILLER (2 Y MAS ANOS).", Niv)
Niv <- gsub("53", "ENSENANZAS PARA LA FORMACION E INSERCION LABORAL QUE PRECISAN DE UNA FORMACION PROFESIONAL DE GRADO SUPERIOR PARA SU REALIZACION (MAS DE 300 HORAS).", Niv)
Niv <- gsub("54", "ENSENANZAS UNIVERSITARIAS DE PRIMER CICLO Y EQUIVALENTES O PERSONAS QUE HAN APROBADO 3 CURSOS COMPLETOS DE UNA LICENCIATURA O CREDITOS EQUIVALENTES (DIPLOMADOS)", Niv)
Niv <- gsub("55", "ENSENANZAS UNIVERSITARIAS DE 1 ER Y 2O CICLO, DE SOLO SEGUNDO CICLO Y EQUIVALENTES (LICENCIADOS)", Niv)
Niv <- gsub("56", "ESTUDIOS OFICIALES DE ESPECIALIZACION PROFESIONAL.", Niv)
Niv <- gsub("59", "ENSENANZAS UNIVERSITARIAS DE GRADO", Niv)
Niv <- gsub("61", "DOCTORADO UNIVERSITARIO.", Niv)
NivF$DESC_NIVEL <- Niv
# Guardamos la base de datos limpia en un csv nuevo.
write.csv2(NivF, 'NivFormBUENO.csv', row.names = TRUE)
# Repetimos las funciones descritas anteriormente con las demás bases a nivel provincia de Valencia
GruO$DESC_PROV <- sub("/.*", "", GruO$DESC_PROV)
GruO$DESC_MUN <- sub("/.*", "", GruO$DESC_MUN)
GruO$DESC_PROV <- toupper(iconv(GruO$DESC_PROV, to = "ASCII//TRANSLIT"))
GruO$DESC_MUN <- toupper(iconv(GruO$DESC_MUN, to = "ASCII//TRANSLIT"))
GruO$DESC_GRUPO <- toupper(iconv(GruO$DESC_GRUPO, to = "ASCII//TRANSLIT"))
write.csv2(GruO, 'GruOcuBUENO.csv', row.names = TRUE)
Gen$DESC_PROV <- sub("/.*", "", Gen$DESC_PROV)
Gen$DESC_MUN <- sub("/.*", "", Gen$DESC_MUN)
Gen$DESC_PROV <- toupper(iconv(Gen$DESC_PROV, to = "ASCII//TRANSLIT"))
Gen$DESC_MUN <- toupper(iconv(Gen$DESC_MUN, to = "ASCII//TRANSLIT"))
write.csv2(Gen, 'GenEdadBUENO.csv', row.names = TRUE)
poblacionpormunicipiosCV$Municipios <- sub("/.*", "", poblacionpormunicipiosCV$Municipios)
poblacionpormunicipiosCV$Municipios <- toupper(iconv(poblacionpormunicipiosCV$Municipios, to = "ASCII//TRANSLIT"))
write.csv2(poblacionpormunicipiosCV, 'poblacionpormunicipiosCVBUENO.csv', row.names = TRUE)
poblacion$Municipios <- sub("/.*", "", poblacion$Municipios)
poblacion$Municipios <- toupper(iconv(poblacion$Municipios, to = "ASCII//TRANSLIT"))
codigos <- str_split(poblacion$Municipios, " ", n=2)
poblacion$codigos <- codigos
poblacion$codigos <- separate(poblacion, Municipios, into=c("codigo, Municipios"), sep="")
## Warning: Expected 1 pieces. Additional pieces discarded in 1335 rows [1, 2, 3, 4, 5, 6,
## 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, ...].
write.csv2(poblacion, 'poblacionBSI.csv', row.names = TRUE)
#Normalización números
GenBUENO = read.csv("C:/Users/carlo/OneDrive - UPV/Escritorio/UNI/2º/PROY II/GenEdadBUENO.csv", sep=';')
# A partir de cierto año, en la base de Género y Edad empiezan a indicar la edad de los demandantes con números escritos (por ejemplo treinta y tres). Para poder arreglar esto, se utilizan los códigos de las edades (COD_EDAD) ya que a partir de ese mismo año indican la edad escrita en número, y ya con ese número implementos una función que clasifique cada edad dentro de un intervalo de 5 años. Finalmente, los valores correspondientes de 15 a 19 años los definimos como <20 años y los valores mayores a 59 años los definimos como >59 años.
Edades <- GenBUENO$DESC_EDAD
EdadesSI <- GenBUENO$COD_EDAD
Edades[[53492]]
## [1] "Veinticuatro"
EdadSI <- Edades[-(1:53491)]
EdadiSI <- EdadesSI[-(1:53491)]
EdaSI <- Edades[1:53491]
EdadSI <- EdadiSI
#EdadiSI tiene las edades y hay que pasarlas a intervalo:
transformar_edad_a_intervalo <- function(edad) {
intervalo_inferior <- floor(edad/5) * 5
intervalo_superior <- intervalo_inferior + 4
paste0(intervalo_inferior, "-", intervalo_superior)
}
intervalos <- sapply(EdadiSI, transformar_edad_a_intervalo)
intervalos <- gsub("15-19", "< 20", intervalos)
intervalos <- gsub("60-64", "> 59", intervalos)
intervalos <- gsub("65-69", "> 59", intervalos)
intervalos <- gsub("70-74", "> 59", intervalos)
intervalos <- gsub("75-79", "> 59", intervalos)
intervalos <- gsub("80-84", "> 59", intervalos)
intervalos <- gsub("85-89", "> 59", intervalos)
intervalos <- gsub("90-94", "> 59", intervalos)
intervalos <- gsub("95-99", "> 59", intervalos)
Edad <- c(EdaSI, intervalos)
Edad <- gsub("\\s+", "", Edad)
GenBUENO$DESC_EDAD <- Edad
#Eliminar filas en las que DESC_EDAD reciba un valor extraño
#GenBUENO$DESC_EDAD <- GenBUENO$DESC_EDAD[!GenBUENO$DESC_EDAD == "-4" | !GenBUENO$DESC_EDAD == "01/10/2014"]
#Finalmente, eliminamos las filas en las que los municipios obtengan un valor faltante:
#GenBUENO$COD_MUN <- GenBUENO$COD_MUN[!GenBUENO$COD_MUN == -3]
# Arreglar municipios con nombre en castellano y valenciano ya que hay municipios que cuentan doble debido a que reciben su nombre en valencia y en castellano. Lo conseguimmos reemplazando el nombre en valenciano por el castellano para que cuenten correctamente como un único municipio.
transformar_mun <- function(x){
x <- gsub("ALCOI", "ALCOY", x)
x <- gsub("ALBORAIA", "ALBORAYA", x)
x <- gsub("ALGIMIA D'ALFARA", "ALGIMIA DE ALFARA", x)
x <- gsub("ALMASSORA", "ALMAZORA", x)
x <- gsub("ALQUERIA DE LA COMTESSA(L')", "ALQUERIA DE LA COMTESSA, L'", x)
x <- gsub("BENASSAL", "BENASAL", x)
x <- gsub("BENICASSIM", "BENICASIM", x)
x <- gsub("BENISSANO", "BENISANO", x)
x <- gsub("BENISSUERA", "BENISUERA", x)
x <- gsub("BENLLOC", "BENLLOCH", x)
x <- gsub("CAMP DE MIRA, EL", "CAMPO DE MIRA", x)
x <- gsub("CASTELL DE GUADALEST (EL)", "CASTELL DE GUADALEST, EL", x)
x <- gsub("CASTELLON DE LA PLANA", "CASTELLO DE LA PLANA", x)
x <- gsub("FAGECA", "FACHECA", x)
x <- gsub("GENOVES", "GENOVES, EL", x)
x <- gsub("GUADASSEQUIES", "GUADASEQUIES", x)
x <- gsub("HERBES", "HERBERS", x)
x <- gsub("JAVEA", "XABIA", x)
x <- gsub("JIJONA", "XIXONA", x)
x <- gsub("LLOSA DE RANES (LA)", "LOSA DE RANES, LA", x)
x <- gsub("MASALAVES", "MASSALAVES", x)
x <- gsub("MOGENTE", "MOIXENT", x)
x <- gsub("MONOVER", "MONOVAR", x)
x <- gsub("MONTIXELVO", "MONTICHELVO", x)
x <- gsub("MONTROI", "MONTROY", x)
x <- gsub("NOVETLE", "NOVELE", x)
x <- gsub("ORPESA", "OROPESA DEL MAR", x)
x <- gsub("PALOMAR (EL)", "PALOMAR, EL", x)
x <- gsub("RAFELBUNOL", "RAFELBUNYOL", x)
x <- gsub("RAFOL D'ALMUNIA , EL", "RAFOL D'ALMUNIA, EL", x)
x <- gsub("REAL DE GANDIA, EL", "REAL DE GANDIA", x)
x <- gsub("SAGUNT", "SAGUNTO", x)
x <- gsub("SUERAS", "SUERA", x)
x <- gsub("LES USERES", "USERAS", x)
x <- gsub("VALL DE GALLINERA, LA", "VALL DE GALLINERA", x)
x <- gsub("VALL DE LAGUAR (LA)", "VALL DE LAGUAR, LA", x)
x <- gsub("VERGER (EL)", "VERGER, EL", x)
x <- gsub("VISTABELLA DEL MAESTRAZGO", "VISTABELLA DEL MAESTRAT", x)
x <- gsub("GATOVA", "YATOVA", x)
x <- gsub("ARES DEL MAESTRE", "ARES DEL MAESTRAR", x)
}
# Eliminamos los municipios repetidos con nombres en valenciano y castellano
municipi <- sapply(GenBUENO$DESC_MUN, transformar_mun)
GenBUENO$DESC_MUN <- municipi
write.csv2(GenBUENO, 'GenEdadOFICIAL.csv', row.names = TRUE)
# Análisis
# SECTOR COMUNIDAD
# Primero conseguimos las frecuencias relativas de cada variable y las añadimos en una columna nueva:
# Filtrar el dataframe para excluir el sector "TOTAL" ya que lo calculamos sobre eso
empleo_filt <- subset(sector, sector$Sector_economico != "TOTAL")
# Calcular el total de demandantes de empleo para cada comunidad y año
total_comunidad <- aggregate(Total ~ Año + Comunidades_y_Ciudades_Autonomas, data = empleo_filt, sum)
# Unir el dataframe original con el dataframe de totales
empleo_total_comunidad <- merge(empleo_filt, total_comunidad, by = c("Año", "Comunidades_y_Ciudades_Autonomas"), suffixes = c("", "_total"))
# Calcular la frecuencia relativa para cada sector en cada comunidad y año
empleo_freq_rel <- transform(empleo_total_comunidad, freq_rel = Total / Total_total)
# Guardamos el resultado en un csv nuevo.
write.csv2(empleo_freq_rel, 'comunidad_sector_freq.csv', row.names = TRUE)
# SEXO COMUNIDAD
# Reemplazamos las comas por los puntos para que al leer el archivo R los pueda detectar como numéricos sin ningún error.
sexo$TOTAL <- gsub(",", ".", sexo$TOTAL)
sexo$TOTAL <- as.numeric(sexo$TOTAL)
# Nos quedamos con los sexos Hombres y Mujeres ya que para estudiar ambos juntos sumaré los hombres y las mujeres.
sexo <- subset(sexo, Sexo != "Ambos sexos")
# Calculamos la frecuencia relativa como para la base de datos anterior.
sexo_totales <- aggregate(TOTAL ~ Año + Comunidades.y.Ciudades.Autónomas, data = sexo, sum)
sexo <- merge(sexo, sexo_totales, by = c("Año", "Comunidades.y.Ciudades.Autónomas"), suffixes = c("", "_total"))
sexo$Freq_Relativa <- sexo$TOTAL / sexo$TOTAL_total
write.csv2(sexo, 'sexo_comunidad_freq.csv', row.names = TRUE)
# FORMACIÓN
# Reemplazamos las comas por los puntos para que al leer el archivo R los pueda detectar como numéricos sin ningún error.
formacion$Total <- gsub(",", ".", formacion$Total)
formacion$Total <- as.numeric(formacion$Total)
## Warning: NAs introducidos por coerción
# Nos quedamos con los sexos Hombres y Mujeres ya que para estudiar ambos juntos sumaré los hombres y las mujeres.
formacion <- subset(formacion, Sexo != "Ambos sexos")
# Calcular el total de demandantes de empleo para cada comunidad y año
formacion_totales <- aggregate(Total ~ Periodo + Comunidades_Autónomas, data = formacion, sum)
# Unir los totales con el DataFrame original
formacion <- merge(formacion, formacion_totales, by = c("Periodo", "Comunidades_Autónomas"), suffixes = c("", "_total"))
# Dividir la cantidad de demandantes de cada sector de cada comunidad en cada periodo por el total de la comunidad en ese periodo
formacion$Freq_Relativa <- formacion$Total / formacion$Total_total
# Guardar todo en un nuevo csv
write.csv2(formacion, 'formacion_sector_freq.csv', row.names = TRUE)
# SECTOR NACIONAL
# GRÁFICO DE BARRAS
# !!!!!!!!!!!! idea: sacar clusters para zonas que se parecen > por comunidad / dist euclidea porcentajes similares
#sector_filtrado <- subset(sector, Sector_economico != "TOTAL")
ggplot(empleo_freq_rel, aes(x = Año, y = freq_rel, fill = Sector_economico)) +
geom_bar(stat = "identity", position = "stack") +
facet_wrap(~empleo_freq_rel$Comunidades_y_Ciudades_Autonomas) +
labs(title = "Número de demandantes de empleo por comunidad autónoma y sector", x = "Año", y = "Demandantes de empleo")
En este gráfico de barras acumuladas se puede observar claramente la proporción que representa cada sector del total en cada comunidad. Por ejemplo, a pesar de que en todas las comunidades autónomas el sector Servicios representa la gran mayoría de la proporción de la demanda es muy útil para ver las comunidades donde el sector de agricultura es el segundo sector con más importancia en cuanto a demandantes. A primera vista se puede decir que en algunas comunidades se confirma que el sector de agricultura es el segundo más revelante, teniendo sentido el análisis ya que coincie con las que han sido más rurales históricamente, como Andalucía o Extremadura.
# GRÁFICO DE TARTA
empleo_andalucia <- subset(empleo_freq_rel, empleo_freq_rel$Comunidades_y_Ciudades_Autonomas == "GALICIA")
# Crear gráficos de tartas por año y comunidad
ggplot(empleo_andalucia, aes(x = "", y = freq_rel, fill = Sector_economico)) +
theme(plot.width = 100, plot.height = 50) +
geom_bar(stat = "identity", width = 3) +
coord_polar(theta = "y") +
facet_wrap(vars(Comunidades_y_Ciudades_Autonomas, Año), ncol = 4) +
theme_void() +
theme(strip.text = element_text(size = 12),
legend.position = "bottom",
legend.title = element_blank(),
panel.spacing = unit(0, "cm"))
En este gráfico se puede observar cómo para la comunidad autónoma de Galicia el sector servicios representa casi un 75% del total de demandantes, seguido del sector industria y de los sectores de construcción y agricultura que tienen un porcentaje similar.
# MAPAS
#sectores sin servicios 2019
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- subset(empleo_freq_rel, Sector_economico != "SERVICIOS")
datos_2019 <- datos %>% filter(Año == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_y_Ciudades_Autonomas) %>%
top_n(1, freq_rel) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades_y_Ciudades_Autonomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("SERVICIOS" = "red", "INDUSTRIA" = "blue", "CONSTRUCCION" = "green", "AGRICULTURA" = "orange")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_economico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Sector con mayor frecuencia relativa en 2022") +
guides(fill = guide_legend(title = "Sector"))
Este mapa da una visión clara de cuál es el sector con más demandantes de cada comunidad autónoma para el año 2022. Se ha hecho el análisis obviando el sector servicios, ya que como hemos visto en análisis anteriores era el sector más importante para toda España. En el mapa resultante se puede ver como los sectores más influyentes se reparten entre el sector de la agricultura, el de construcción y el de industria. Este gráfico resulta muy interesante para nuestro análisis ya que se puede observar claramente cómo las comunidades están repartidas en Norte, Sur y Islas principalmente. En el norte, el sector predominante se trata del industrial, cosa que tiene sentido ya que históricamente el norte de España ha representado la zona donde más se ha llevado a cabo esta actividad. En cambio, en el sur el sector predominante es el agricultor, que al igual que antes se contrastaría con la actividad que siempre se ha llevado en esas zonas, incluyendo a comunidades como Andalucía, Extremadura y Murcia. Finalmente, en las Islas y en Madrid el sector predominante es el de la construcción, causado debido a que en estas zonas se actividad económica se centra en mayor medida en el sector servicios (90% del total), por lo que el segundo sector más demandado es el de la construcción, probablemente debido a ser las zonas más turísticas de nuestro país.
# SEXO Y EDAD NACIONAL
# GRÁFICO DE BARRAS
empleo_andalucia <- subset(sexo, sexo$Comunidades.y.Ciudades.Autónomas == "ANDALUCIA")
ggplot(empleo_andalucia, aes(x = Año, y = Freq_Relativa, fill = Edad)) +
geom_bar(stat = "identity", position = "dodge") +
#facet_wrap(~sexo$Comunidades.y.Ciudades.Autónomas) +
labs(title = "Número de demandantes de empleo por comunidad autónoma y Edad", x = "Año", y = "Demandantes de empleo")
empleo_valencia <- subset(sexo, sexo$Comunidades.y.Ciudades.Autónomas == "COMUNITAT VALENCIANA")
ggplot(empleo_valencia, aes(x = Año, y = Freq_Relativa, fill = Edad)) +
geom_bar(stat = "identity", position = "dodge") +
#facet_wrap(~sexo$Comunidades.y.Ciudades.Autónomas) +
labs(title = "Número de demandantes de empleo por comunidad autónoma y Edad", x = "Año", y = "Demandantes de empleo")
empleo_madrid <- subset(sexo, sexo$Comunidades.y.Ciudades.Autónomas == "MADRID,")
ggplot(empleo_madrid, aes(x = Año, y = Freq_Relativa, fill = Edad)) +
geom_bar(stat = "identity", position = "dodge") +
#facet_wrap(~sexo$Comunidades.y.Ciudades.Autónomas) +
labs(title = "Número de demandantes de empleo por comunidad autónoma y Edad", x = "Año", y = "Demandantes de empleo")
En el gráfico se puede observar que para todas las comunidades los rangos de edad más jóvenes son los que menos demandantes tienen, ya que sus intervalos son más reducidos en tiempo. A partir de los 24 años, dependiendo de la comunidad autónoma se intercambian los valores de las edades de cuál es en la que hay más demandantes hasta los 55 años, donde a pesar de abarcar más años hay menos demandantes debido a estar en una edad donde la cantidad de población activa empieza a ser menor.
# GRÁFICO DE TARTA
empleo_andalucia <- subset(sexo, sexo$Comunidades.y.Ciudades.Autónomas == "ANDALUCIA")
# Crear gráficos de tartas por año y comunidad
ggplot(empleo_andalucia, aes(x = "", y = Freq_Relativa, fill = Edad)) +
theme(plot.width = 100, plot.height = 50) +
geom_bar(stat = "identity", width = 3) +
coord_polar(theta = "y") +
facet_wrap(vars(Comunidades.y.Ciudades.Autónomas, Año), ncol = 4) +
theme_void() +
theme(strip.text = element_text(size = 12),
legend.position = "bottom",
legend.title = element_blank(),
panel.spacing = unit(0, "cm"))
empleo_rioja <- subset(sexo, sexo$Comunidades.y.Ciudades.Autónomas == "RIOJA,")
# Crear gráficos de tartas por año y comunidad
ggplot(empleo_rioja, aes(x = "", y = Freq_Relativa, fill = Edad)) +
theme(plot.width = 100, plot.height = 50) +
geom_bar(stat = "identity", width = 3) +
coord_polar(theta = "y") +
facet_wrap(vars(Comunidades.y.Ciudades.Autónomas, Año), ncol = 4) +
theme_void() +
theme(strip.text = element_text(size = 12),
legend.position = "bottom",
legend.title = element_blank(),
panel.spacing = unit(0, "cm"))
## Warning: Removed 4 rows containing missing values (`position_stack()`).
En este gráfico se representa la evolución en los años de los demandantes de Andalucía, y no se ven cambios importantes en los demandantes de los distintos rangos de edad.
# MAPAS
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- subset(sexo, Sexo != "Hombres")
datos_2019 <- datos %>% filter(Año == 2019)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades.y.Ciudades.Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades.y.Ciudades.Autónomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("DE 16 A 19 ANOS" = "red", "DE 20 A 24 ANOS" = "blue", "DE 25 A 34 ANOS" = "green", "DE 35 A 44 ANOS" = "orange", "DE 45 A 54 ANOS" = "lightblue", "55 Y MAS ANOS" = "magenta")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Edad)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Mujeres por edad en 2019") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- subset(sexo, Sexo != "Mujeres")
datos_2019 <- datos %>% filter(Año == 2019)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades.y.Ciudades.Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades.y.Ciudades.Autónomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("DE 16 A 19 ANOS" = "red", "DE 20 A 24 ANOS" = "blue", "DE 25 A 34 ANOS" = "green", "DE 35 A 44 ANOS" = "orange", "DE 45 A 54 ANOS" = "lightblue", "55 Y MAS ANOS" = "magenta")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Edad)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Hombres por edad en 2019") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- subset(sexo, Sexo != "Hombres")
datos_2019 <- datos %>% filter(Año == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades.y.Ciudades.Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades.y.Ciudades.Autónomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("DE 16 A 19 ANOS" = "red", "DE 20 A 24 ANOS" = "blue", "DE 25 A 34 ANOS" = "green", "DE 35 A 44 ANOS" = "orange", "DE 45 A 54 ANOS" = "lightblue", "55 Y MAS ANOS" = "magenta")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Edad)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Mujeres por edad en 2022") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- subset(sexo, Sexo != "Mujeres")
datos_2019 <- datos %>% filter(Año == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades.y.Ciudades.Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades.y.Ciudades.Autónomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("DE 16 A 19 ANOS" = "red", "DE 20 A 24 ANOS" = "blue", "DE 25 A 34 ANOS" = "green", "DE 35 A 44 ANOS" = "orange", "DE 45 A 54 ANOS" = "lightblue", "55 Y MAS ANOS" = "magenta")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Edad)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Hombres por edad en 2022") +
guides(fill = guide_legend(title = "Sector"))
En estos gráficos se ha querido observar cómo se reparten los distintos rangos de edad que más demandan de cada comunidad autónoma divididos en hombres y mujeres, y se han algunos resultados interesantes. En primer lugar, un hecho que nos ha sorprendido es que en la única comunidad autónoma donde la mayor parte de los demandantes tienen 55 o más años en 2019 es en La Rioja para los demandantes hombres. Para el mapa de las mujeres en 2019, se observa como en general en el sur la mayor parte de demandantes están más envejecidos que en el norte, siendo en el sur el rango más demandante de 45 a 54 años y en el norte justo los 10 años anteriores. Sin embargo, al comparar los mapas de 2019 con los mismos 4 años después dan resultados bastante distintos. Comparando el mapa de mujeres con el de hombres de 2022 podemos ver como la mayor parte de demandantes mujeres son 20 años mayores que los hombres, siendo un hecho común en casi toda España. Este hecho puede haber estado causado debido a la crisis por la pandemia de 2019, haciendo que muchos jóvenes hayan tenido que pedir trabajo.
# GRÁFICO DE BARRAS
#sector_filtrado <- subset(sector, Sector_economico != "TOTAL")
ggplot(formacion, aes(x = Periodo, y = Freq_Relativa, fill = Sector_Económico)) +
geom_bar(stat = "identity", position = "stack") +
facet_wrap(~formacion$Comunidades_Autónomas) +
labs(title = "Número de demandantes de empleo por comunidad autónoma y estudios", x = "Año", y = "Demandantes de empleo")
## Warning: Removed 41 rows containing missing values (`position_stack()`).
# GRÁFICO DE TARTA
empleo_andalucia <- subset(formacion, formacion$Comunidades_Autónomas == "COMUNITAT VALENCIANA")
# Crear gráficos de tartas por año y comunidad
ggplot(empleo_andalucia, aes(x = "", y = Freq_Relativa, fill = Sector_Económico)) +
theme(plot.width = 100, plot.height = 50) +
geom_bar(stat = "identity", width = 3) +
coord_polar(theta = "y") +
facet_wrap(vars(Comunidades_Autónomas, Periodo), ncol = 4) +
theme_void() +
theme(strip.text = element_text(size = 12),
legend.position = "bottom",
legend.title = element_blank(),
panel.spacing = unit(0, "cm"))
# MAPAS
#sectores sin servicios 2019
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos <- subset(datos, Sexo != "Hombres")
datos_2019 <- datos %>% filter(Periodo == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Mujeres seccion más demandada en 2022") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos <- subset(datos, Sexo != "Mujeres")
datos_2019 <- datos %>% filter(Periodo == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Hombres seccion más demandada en 2022") +
guides(fill = guide_legend(title = "Sector"))
Estos mapas muestran que sección han demandado más hombres y mujeres para trabajar. Como se puede ver, las secciones demandandas entre hombres y mujeres en 2022 difieren mucho entre sí, por lo que no se puede comentar ninguna relación entre los valores de ambas. Únicamente, para las mujeres se ve que en todas las comunidades de la costa mediterránea la sección más demandada por ellas es el de formación general.
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos_2019 <- datos %>% filter(Periodo == 2020)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Sector con mayor frecuencia relativa en 2019") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos_2019 <- datos %>% filter(Periodo == 2021)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Sector con mayor frecuencia relativa en 2019") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos_2019 <- datos %>% filter(Periodo == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Sector con mayor frecuencia relativa en 2019") +
guides(fill = guide_legend(title = "Sector"))
No interesante (Ya hemos hablado sobre esto en el anterior mapa)
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- subset(sexo, Sexo != "Mujeres")
datos_2019 <- datos %>% filter(Año == 2019)
datos_2019 <- datos %>% filter(Edad == "DE 16 A 19 ANOS")
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades.y.Ciudades.Autónomas) %>%
top_n(1, Freq_Relativa) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades.y.Ciudades.Autónomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
#colores <- c("DE 16 A 19 ANOS" = "red", "DE 20 A 24 ANOS" = "blue", "DE 25 A 34 ANOS" = "green", "DE 35 A 44 ANOS" = "orange", "DE 45 A 54 #ANOS" = "lightblue", "55 Y MAS ANOS" = "magenta")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Freq_Relativa*100)) +
scale_fill_gradient(low = "white", high = "red") +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Demandantes por rango de edad específico en 2019") +
guides(fill = guide_legend(title = "Sector (%)"))
Este mapa para VÍDEO
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
#datos <- subset(empleo_freq_rel, sector != "SERVICIOS")
datos_2019 <- datos %>% filter(Año == 2020)
datos_2019 <- subset(empleo_freq_rel, Sector_economico == "SERVICIOS")
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_y_Ciudades_Autonomas) %>%
top_n(1, freq_rel) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades_y_Ciudades_Autonomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
#colores <- c("SERVICIOS" = "red", "INDUSTRIA" = "blue", "CONSTRUCCION" = "green", "AGRICULTURA" = "orange")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = freq_rel*100)) +
scale_fill_gradient(low = "white", high = "green") +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Demandantes por sector específico en 2019") +
guides(fill = guide_legend(title = "Sector (%)"))
Mapa para VÍDEO
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos <- subset(datos, Sexo != "Mujeres")
datos_2019 <- datos %>% filter(Periodo == 2019)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
slice_min(Freq_Relativa, n = 1) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Hombres seccion MENOS demandada en 2019") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos <- subset(datos, Sexo != "Hombres")
datos_2019 <- datos %>% filter(Periodo == 2019)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
slice_min(Freq_Relativa, n = 1) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Mujeres seccion MENOS demandada en 2019") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos <- subset(datos, Sexo != "Mujeres")
datos_2019 <- datos %>% filter(Periodo == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
slice_min(Freq_Relativa, n = 1) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Hombres seccion MENOS demandada en 2022") +
guides(fill = guide_legend(title = "Sector"))
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_Autónomas"
datos <- subset(formacion, Sector_Económico != "Sectores desconocidos o no especificados")
datos <- subset(datos, Sexo != "Hombres")
datos_2019 <- datos %>% filter(Periodo == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_Autónomas) %>%
slice_min(Freq_Relativa, n = 1) %>%
ungroup()
seccion$DESC_PROV <- toupper(iconv(seccion$DESC_PROV, to = "ASCII//TRANSLIT"))
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(iconv(Comunidades_Autónomas, to = "ASCII//TRANSLIT")))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluña", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("Formación general, formación básica de adultos y habilidades personales" = "red", "Servicios" = "blue", "Salud y servicios sociales" = "lightyellow", "Educación" = "orange", "Tecnologías de la información y las comunicaciones (TIC)" = "magenta", "Negocios, administración y derecho" = "brown", "Ciencias naturales, químicas, físicas y matemáticas" = "cyan", "Agricultura, ganadería, pesca, silvicultura y veterinaria" = "green", "Artes, humanidades y lenguas" = "purple", "Ciencias sociales, periodismo y documentación" = "lightgray")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_Económico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Mujeres seccion MENOS demandada en 2022") +
guides(fill = guide_legend(title = "Sector"))
Para responder a el supuesto planteado en el objetivo, se ha representado un mapa con las secciones menos demandadas por hombres y por mujeres en 2019 y en 2022 A grandes rasgos, se puede observar cómo una de las secciones con menor número demandantes hombres es la de la educación, mientras que para las mujeres esta sección pasa a ser la de agricultura y ganadería. Estos resultados se puede afirmar que son realistas debido a que en la realidad podemos observar que se da esta distribución de sexos para la gente que ya está ocupada. El resultado que se puede interpretar para la Comunidad Valenciana, es que la sección menos demandada por los hombres para ambos años es la de administración y derecho, por lo que se ha mantenido este fenómeno durante 4 años, mientras que para las mujeres esta sección pasa a ser la de tecnologías de la información en 2019, resultado aparentemente con sentido, y la sección de educación para 2022, resultado que no se esperaba sobre todo para las mujeres demandantes
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- subset(empleo_freq_rel, sector != "SERVICIOS")
datos_2019 <- datos %>% filter(Año == 2022)
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades_y_Ciudades_Autonomas) %>%
slice_min(freq_rel, n = 1) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades_y_Ciudades_Autonomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("SERVICIOS" = "red", "INDUSTRIA" = "blue", "CONSTRUCCION" = "green", "AGRICULTURA" = "orange")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Sector_economico)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Sectores menos demandados en 2022") +
guides(fill = guide_legend(title = "Sector"))
En cuanto a los sectores menos demandados en general en España, se observa una clara distribución dependiendo la región de cada comunidad autónoma. Aquellas que son de costa, el sector menos demandado es el de la agricultura, mientras que para las comunidades del interior de España se observa cómo el sector menos demandado es el de la construcción. Finalmente, las comunidades que se diferencian de las demás en estos resultados son Andalucía, Murcia y las Islas Baleares y Canarias, donde el sector menos demandado es el de la industria. Comparando estos resultados con los obtenidos anteriormente, se puede afirmar que en regiones del sur como Andalucía, su actividad económica se centra más en los sectores rurales.
CCAA_sf <- esp_get_ccaa()
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos <- sexo
#datos <- subset(sexo, Sexo != "Mujeres")
datos_2019 <- datos %>% filter(Año == 2022)
datos_2019 <- subset(datos_2019, Edad != "DE 16 A 19 ANOS")
datos_2019 <- subset(datos_2019, Edad != "55 Y MAS ANOS")
datos_2019 <- subset(datos_2019, Edad != "DE 20 A 24 ANOS")
sector_mayor_2019 <- datos_2019 %>%
group_by(Comunidades.y.Ciudades.Autónomas) %>%
slice_min(Freq_Relativa, n = 1) %>%
ungroup()
sector_mayor_2019 <- sector_mayor_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades.y.Ciudades.Autónomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c("DE 16 A 19 ANOS" = "red", "DE 20 A 24 ANOS" = "blue", "DE 25 A 34 ANOS" = "green", "DE 35 A 44 ANOS" = "orange", "DE 45 A 54 ANOS" = "lightblue", "55 Y MAS ANOS" = "magenta")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = Edad)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Edades menos demandantes en 2022") +
guides(fill = guide_legend(title = "Sector"))
Finalmente, se ha creado un gráfico para observar qué edades son las que menos demandan, y se han obtenido unos resultados poco interesantes, debido a que los rangos de edad menos demandantes han resultado ser aquellos que abarcan a los jóvenes hasta 24 años, debido a que tienen un rango de edades menor. Sin embargo, quitando del estudio a los jóvenes y a los mayores de 55 años que era el siguiente rango predominante en toda España, se han obtenido unos resultados muy repartidos por toda España, quedando únicamente tres rangos en el estudio. Se observa que en la mayor parte de España el rango de edades que menos demanda es el de 35 a 44 años, sin embargo no resulta un análisis interesante ni realista ya que se han eliminado muchas variables del estudio original.
# LECTURA DATOS
DATOS1 <- empleo_freq_rel
#Selección de variables a utilizar y preparación de datos
df_nuevo <- select(DATOS1,Año, Comunidades_y_Ciudades_Autonomas,Sector_economico, freq_rel)
df <- df_nuevo %>%
filter(Año == 2022)
df <- subset(df, Comunidades_y_Ciudades_Autonomas != "Ceuta")
df <- subset(df, Comunidades_y_Ciudades_Autonomas != "Melilla")
df_transpuesto <- df %>%
pivot_wider(names_from = Sector_economico, values_from = freq_rel)
df_transpuesto = subset(df_transpuesto, select = -c(Año))
#que el sector nos salga en columnas , transformar la tabla
library(factoextra)
midist <- get_dist(df_transpuesto, stand = FALSE, method = "euclidean")
## Warning in stats::dist(x, method = method, ...): NAs introducidos por coerción
fviz_dist(midist, show_labels = TRUE, lab_size = 0.3,
gradient = list(low = "#00AFBB", mid = "white", high = "#FC4E07"))
library(grid)
library(gridExtra)
p1 = fviz_nbclust(x = df_transpuesto, FUNcluster = hcut, method = "silhouette",
hc_method = "ward.D2", k.max = 10, verbose = FALSE,
hc_metric = "euclidean") + labs(title = "Num. optimo clusters")
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
p2 = fviz_nbclust(x = df_nuevo, FUNcluster = hcut, method = "wss",
hc_method = "ward.D2", k.max = 10, verbose = FALSE,
hc_metric = "euclidean") + labs(title = "Num. optimo clusters")
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
## Warning in stats::dist(x): NAs introducidos por coerción
grid.arrange(p1, p2, nrow = 1)
clust1 <- hclust(midist, method="ward.D2")
grupos1 <- cutree(clust1, k=3)
table(grupos1)
## grupos1
## 1 2 3
## 3 9 7
fviz_dend(clust1, k = 3,
cex = 0.5, color_labels_by_k = TRUE,
rect = TRUE) # dibujar rectángulos
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
## Please report the issue at <]8;;https://github.com/kassambara/factoextra/issueshttps://github.com/kassambara/factoextra/issues]8;;>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# Asignar los nombres de las comunidades autónomas a los clusters
nombres_comunidades <- df_transpuesto$COMUNIDADES
## Warning: Unknown or uninitialised column: `COMUNIDADES`.
clusters_asignados <- as.factor(grupos1)
nombres_clusters <- levels(clusters_asignados)
nombres_comunidades_por_cluster <- nombres_clusters[clusters_asignados]
# Crear un nuevo dataframe con los nombres de las comunidades y los clusters asignados
datos_con_nombres <- cbind(df_transpuesto, NombresComunidades = nombres_comunidades_por_cluster)
datos = datos_con_nombres#subset(datos_con_nombres, select = -c(SERVICIOS, INDUSTRIA, CONSTRUCCION, AGRICULTURA))
CCAA_sf <- esp_get_ccaa()
CCAA_sf <- subset(CCAA_sf, ine.ccaa.name != "Ceuta")
CCAA_sf <- subset(CCAA_sf, ine.ccaa.name != "Melilla")
names(CCAA_sf)[1] <- "Comunidades_y_Ciudades_Autonomas"
datos_2019 <- datos
sector_mayor_2019 <- datos_2019 %>%
mutate(Comunidades_y_Ciudades_Autonomas = tolower(Comunidades_y_Ciudades_Autonomas))
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("andalucia", "Andalucía", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("aragon", "Aragón", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("asturias,", "Asturias, Principado de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("balears,", "Balears, Illes", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("canarias", "Canarias", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cantabria", "Cantabria", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla la mancha", "Castilla - La Mancha", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("castilla y leon", "Castilla y León", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("cataluna", "Cataluña", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("ceuta", "Ceuta", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("comunitat valenciana", "Comunitat Valenciana", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("extremadura", "Extremadura", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("galicia", "Galicia", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("madrid,", "Madrid, Comunidad de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("melilla", "Melilla", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("murcia,", "Murcia, Región de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("navarra,", "Navarra, Comunidad Foral de", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("pais vasco", "País Vasco", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019$Comunidades_y_Ciudades_Autonomas <- gsub("rioja,", "Rioja, La", sector_mayor_2019$Comunidades_y_Ciudades_Autonomas)
sector_mayor_2019 <- sector_mayor_2019 %>% rename(ine.ccaa.name = Comunidades_y_Ciudades_Autonomas)
# Realizar la fusión de las tablas
mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by = "ine.ccaa.name", all.x = TRUE)
#mapa_sectores <- merge(CCAA_sf, sector_mayor_2019, by.x = "Comunidades_y_Ciudades_Autonomas", by.y = "Comunidades_y_Ciudades_Autonomas", all.x = TRUE)
colores <- c( "limegreen", "orange", "mediumslateblue")
ggplot() +
geom_sf(data = mapa_sectores, aes(fill = NombresComunidades)) +
scale_fill_manual(values = colores) +
coord_sf(crs = "+proj=longlat +datum=WGS84") +
theme_void() +
labs(title = "Clusters sectores Comunidades Autónomas") +
guides(fill = guide_legend(title = "Cluster"))
Finalmente, se ha hecho un clustering pivotando la base original para
obtener cómo se agrupan las comunidades de España. El gráfico resultante
muestra qué comunidades pertenecen a cada cluster, observándose una
distribución entre regiones, donde la mayor parte de España se encuentra
agrupada en el clúster 2 mientras que las comunidades más rurales como
Andalucía y Extremadura se encuentra en el clúster 1 y las comunidades
más turísticas como las Islas o Madrid se encuentran en el clúster 3.
Comparando este mapa con el obtenido para los sectores con mayor demanda
en España, se ve una distrbución similar en cuanto a los clusters y los
sectores más influyentes, indicando que en efecto existen tres grupos
con actividad económica diferenciada.
Finalmente, hay una compilación con aquellas pruebas que no resultaron durante la realización del proyecto, econtrándose sobre todo problemas relacionados con la limpieza de datos, ya que es uno de las fases que más nos ha costado completar del estudio.
# Pruebas fallidas:
numeros_letras <- EdadSI
numeros_letras <- gsub("Diez", "10", numeros_letras)
numeros_letras <- gsub("Dieciseis", "16", numeros_letras)
numeros_letras <- gsub("Diecisiete", "17", numeros_letras)
numeros_letras <- gsub("Dieciocho", "18", numeros_letras)
numeros_letras <- gsub("Diecinueve", "19", numeros_letras)
numeros_letras <- gsub("Veinte", "20", numeros_letras)
numeros_letras <- gsub("Veintiuno", "21", numeros_letras)
numeros_letras <- gsub("Veintidos", "22", numeros_letras)
numeros_letras <- gsub("Veintitres", "23", numeros_letras)
numeros_letras <- gsub("Veinticuatro", "24", numeros_letras)
numeros_letras <- gsub("Veinticinco", "25", numeros_letras)
numeros_letras <- gsub("Veintiseis", "26", numeros_letras)
numeros_letras <- gsub("Veintisiete", "27", numeros_letras)
numeros_letras <- gsub("Veintiocho", "28", numeros_letras)
numeros_letras <- gsub("Veintinueve", "29", numeros_letras)
numeros_letras <- gsub("Treinta", "30", numeros_letras)
numeros_letras <- gsub("Cuarenta", "40", numeros_letras)
numeros_letras <- gsub("Cincuenta", "50", numeros_letras)
numeros_letras <- gsub("Sesenta", "60", numeros_letras)
numeros_letras <- gsub("Setenta", "70", numeros_letras)
numeros_letras <- gsub("Ochenta", "80", numeros_letras)
numeros_letras <- gsub("Noventa", "90", numeros_letras)
numeros_letras <- gsub("uno", "1", numeros_letras)
numeros_letras <- gsub("dos", "2", numeros_letras)
numeros_letras <- gsub("tres", "3", numeros_letras)
numeros_letras <- gsub("cuatro", "4", numeros_letras)
numeros_letras <- gsub("cinco", "5", numeros_letras)
numeros_letras <- gsub("seis", "6", numeros_letras)
numeros_letras <- gsub("siete", "7", numeros_letras)
numeros_letras <- gsub("ocho", "8", numeros_letras)
numeros_letras <- gsub("nueve", "9", numeros_letras)
resultados <- vector("numeric", length(numeros_letras))
function(numeros_letras){
for (i in 1:length(numeros_letras)) {
if (numeros_letras[i] == "uno") {
numeros_numericos[i] <- 1
} else if (numeros_letras[i] == "dos") {
numeros_numericos[i] <- 2
} else if (numeros_letras[i] == "tres") {
numeros_numericos[i] <- 3
} else if (numeros_letras[i] == "cuatro") {
numeros_numericos[i] <- 4
} else if (numeros_letras[i] == "cinco") {
numeros_numericos[i] <- 5
} else if (numeros_letras[i] == "seis") {
numeros_numericos[i] <- 6
} else if (numeros_letras[i] == "siete") {
numeros_numericos[i] <- 7
} else if (numeros_letras[i] == "ocho") {
numeros_numericos[i] <- 8
} else if (numeros_letras[i] == "nueve") {
numeros_numericos[i] <- 9
} else if (numeros_letras[i] == "diez") {
numeros_numericos[i] <- 10
} else if (numeros_letras[i] == "veinte") {
numeros_numericos[i] <- 20
} else if (numeros_letras[i] == "treinta") {
numeros_numericos[i] <- 30
} else if (numeros_letras[i] == "cuarenta") {
numeros_numericos[i] <- 40
} else if (numeros_letras[i] == "cincuenta") {
numeros_numericos[i] <- 50
} else if (numeros_letras[i] == "sesenta") {
numeros_numericos[i] <- 60
} else if (numeros_letras[i] == "setenta") {
numeros_numericos[i] <- 70
} else if (numeros_letras[i] == "ochenta") {
numeros_numericos[i] <- 80
} else if (numeros_letras[i] == "noventa") {
numeros_numericos[i] <- 90
} else if (numeros_letras[i] == "dieciseis") {
numeros_numericos[i] <- 16
} else if (numeros_letras[i] == "diecisiete") {
numeros_numericos[i] <- 17
} else if (numeros_letras[i] == "dieciocho") {
numeros_numericos[i] <- 18
} else if (numeros_letras[i] == "diecinueve") {
numeros_numericos[i] <- 19
} else if (numeros_letras[i] == "veintiuno") {
numeros_numericos[i] <- 21
} else if (numeros_letras[i] == "veintidos") {
numeros_numericos[i] <- 22
} else if (numeros_letras[i] == "veintitres") {
numeros_numericos[i] <- 23
} else if (numeros_letras[i] == "veinticuatro") {
numeros_numericos[i] <- 24
} else if (numeros_letras[i] == "veinticinco") {
numeros_numericos[i] <- 25
} else if (numeros_letras[i] == "veintiseis") {
numeros_numericos[i] <- 26
} else if (numeros_letras[i] == "veintisiete") {
numeros_numericos[i] <- 27
} else if (numeros_letras[i] == "veintiocho") {
numeros_numericos[i] <- 28
} else if (numeros_letras[i] == "veintinueve") {
numeros_numericos[i] <- 29
}
}
}
numeros_numericos <- as.numeric(resultados)
#Prueba NO
library(stringr)
library(readr)
numeros_letras <- EdadSI
numeros_letras <- str_split(numeros_letras, " ")
numeros <- c(0,1,2,3,4,5,6,7,8,9,10,20,30,40,50,60,70,80,90,100)
letras <- c("cero", "uno", "dos", "tres", "cuatro", "cinco", "seis", "siete", "ocho", "nueve", "diez", "veinte", "treinta", "cuarenta", "cincuenta", "sesenta", "ochenta", "noventa", "cien")
convertir_letras_a_numeros <- function(x){
for (i in 1:length(numeros_letras)) {
x <- gsub(letras[i], numeros_letras[i], x)
}
}
numeros_letras <-convertir_letras_a_numeros(numeros_letras); numeros_letras <- as.numeric(numeros_letras)
for (i in 1:length(numeros_letras)) {
numeros_letras[[i]] <- numeros[match(numeros_letras[[i]], numeros)]
}
numeros_letras <- sapply(numeros_letras, paste0, collapse = "")
numeros_cifras <- as.numeric(numeros_letras)
#Prueba II
convertir_letras_a_numeros <- function(x){
for (i in 1:length(numeros_letras)) {
if(i=="cero"){x[[i]]=0}
if(i=="uno"){x[[i]]=1}
if(i=="dos"){x[[i]]=2}
if(i=="tres"){x[[i]]=3}
if(i=="cuatro"){x[[i]]=4}
if(i=="cinco"){x[[i]]=5}
if(i=="seis"){x[[i]]=6}
if(i=="siete"){x[[i]]=7}
if(i=="ocho"){x[[i]]=8}
if(i=="nueve"){x[[i]]=9}
if(i=="diez"){x[[i]]=10}
if(i=="veinte"){x[[i]]=20}
if(i=="treinta"){x[[i]]=30}
if(i=="cuarenta"){x[[i]]=40}
if(i=="cincuenta"){x[[i]]=50}
if(i=="sesenta"){x[[i]]=60}
if(i=="setenta"){x[[i]]=70}
if(i=="ochenta"){x[[i]]=80}
if(i=="noventa"){x[[i]]=90}
if(i=="cien"){x[[i]]=100}
}
}
EdadSI <-convertir_letras_a_numeros(EdadSI)
EdadSI <- as.numeric(EdadSI)
library(stringr)
letras_a_numeros <- function(texto){
numeros <- list("cero" = 0, "uno" = 1, "dos" = 2, "tres" = 3, "cuatro" = 4, "cinco" = 5,
"seis" = 6, "siete" = 7, "ocho" = 8, "nueve" = 9, "diez" = 10, "once" = 11,
"doce" = 12, "trece" = 13, "catorce" = 14, "quince" = 15, "dieciséis" = 16,
"diecisiete" = 17, "dieciocho" = 18, "diecinueve" = 19, "veinte" = 20,
"treinta" = 30, "cuarenta" = 40, "cincuenta" = 50, "sesenta" = 60,
"setenta" = 70, "ochenta" = 80, "noventa" = 90)
palabras <- str_split(texto, "\\s+")[[1]]
numeros_convertidos <- sapply(palabras, function(palabra){
numeros[[tolower(palabra)]]
})
return(sum(numeros_convertidos))
}
for (i in 1:length(EdadSI)){letras_a_numeros(i)}
#Pruebas Gráficos
Mun_NivF <- distinct(NivF['DESC_MUN'])
Niv_NivF <- NivF['DEMANDANTES']
Num_NivF <- NivF['DESC_NIVEL']
ggplot(data = Mun_NivF)
localizacion=c(lat=39.473686,lon= -0.370486)
ggplot() +
borders("world", "valencia") + geom_point(data = Mun_NivF)
ggplot() + borders("world", "spain")
mex_map <- st_read(Mun_NivF)