Esta guía está destinada a explicar cómo usar la librería “ggplot2”, con una tabla de Excel, en este caso:
La SEG, el INE y el Ministerio de la Mujer y Equidad de Género realizaron un estudio sobre la brecha de género en empleos públicos, del año 2018 al 2024.
library(readxl)
base_generoo <- read_excel("~/Desktop/base_generoo.xlsx")
View(base_generoo)
En la tabla se encuentran las variables “año”, “estamento”, en N° total de personas seleccionas, el N° de hombres y mujeres, sus respectivas distribuciones porcentuales (%), y la brecha de género, medida en puntos porcentuales.
A partir de los datos, crearemos los gráficos correspondientes.
(Recuerda que, con la librería “dplyr” podemos cambiar los nombres de las variables si es necesario, en este caso, tendremos que cambiar “año”)
Luego, instalamos la librería “ggplot2”, que nos servirá para graficar!
library(ggplot2)
Gráfico de líneas
1.- Queremos saber como fluctúa a través de los años la cantidad de mujeres en cargos directivos, para ello podemos hacer un gráfico de líneas:
Primero vamos a filtrar “Directiva”, de la variable “Estamento”:
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
base_directiva<-filter(base_generoo, Estamento == "Directiva")
En “base_directiva” estarán solo los datos de las mujeres y hombres en cargos directivos.
Ahora podemos gráficar!
grafico_de_lineas<- ggplot(base_directiva, aes(x = Anio, y = N_mujeres, group = 1)) +
geom_line(color = "purple") +
geom_point(color = "lightgreen")+
labs(title = "grafico de lineas",
x = "años",
y = "N° de Mujeres en cargos directivos")
print(grafico_de_lineas)
Conclusión
Podemos concluir que hubo un fuerte descenso en la cantidad de mujeres en cargos directivos, en los años 2019 y 2022, bajando de entre 60-70 a menos de 40, aunque luego, en el año 2023, hubo un ascenso significativo, alcanzando casi 80 mujeres directivas, que se mantuvo en el año 2024.
2.- Queremos graficar cuántas mujeres hay en un estamento, en el año 2024.
Los gráficos de barra sirven para observar la frecuencia en variables categóricas, por lo que es el tipo de gráfico más indicado.
Para ello, primero debemos filtrar los datos del 2024.
base2024<- filter(base_generoo, Anio == 2024)
Luego graficamos con los datos del 2024.
barras<- ggplot(base2024, aes(x = Estamento, y = N_mujeres))+
geom_bar(stat = "identity", fill = "salmon", color = "darkred")+
labs(title = "grafico de barras",
x = "Cargos",
y = "N° de Mujeres")
print(barras)
Conclusión
En los empleos públicos del año 2024, el estamento profesional concentra la mayor cantidad de mujeres, con aproximadamente 4000 funcionarias, mientras que existen un poco más de la mitad de auxiliares, le siguen las técnico, con 1000 funcionarias, y luego, podemos concluir que hay significativamente menos directivas y fiscalizadoras.
Diagrama de dispersión
Los diagramas de dispersión suelen utilizarse para hacer un análisis bivariable, en este caso, teniendo en cuenta nuestras variables, nuestra variable dependiente podría ser la brecha de género, ya que varía según las cantidades de hombres y mujeres que hay en los empleos públicos.
Si queremos analizar la correlación entre la brecha de género (y), y el N° de mujeres en empleos publicos (X):
cor(base2024$N_mujeres, base2024$Brecha_de_genero, use = "complete.obs")
## [1] 0.5838493
(El código “use =”complete.obs”” se utiliza cuando hay datos NA en las variables, este indica que solo deben usarse los datos que tienen un valor)
La correlación es positiva, pero no muy fuerte. Debemos tener en cuenta que en temas así, es difícil tener correlaciones perfectas (1 o -1), ya que hay más variables que afectan nuestra variable dependiente.
diagrama_dispersion<- ggplot(data = base2024, aes(x = N_mujeres, y = Brecha_de_genero))+
geom_point(stat = "identity", color = "violet") +
geom_smooth(method = "lm", color = "purple")+
labs(title = "Diagrama de dispersión",
x = "N° de mujeres",
y = "Brecha de género")
print(diagrama_dispersion)
## `geom_smooth()` using formula = 'y ~ x'
Conclusión
Primero, debemos saber en qué unidades están expresadas nuestras variables, en este caso, la brecha está expresada en PP (puntos porcentuales), debemos tener cuidado en nuestra interpretación, ya que en este caso, podríamos pensar que la brecha es mayor a mayor porcentaje de hombres en los empleos publicos, pero es al revés, la brecha es positiva cuando hay más mujeres.
Por lo tanto, podemos concluir que existe una correlación positiva entre la cantidad de mujeres en empleos publicos y la brecha de género, la cúal aumenta cuando aumenta el N° de mujeres, pero no podemos establecer que sea altamente significativa, ya que existe dispersión entre los datos.
Recuerda que, con la correlación no podemos asumir causalidad, ya que solo estamos observando los datos.
Consideraciones
.- El nombre de las variables no puede empezar con números, o tener espacios, en esos casos, utiliza “rename”. .- Para graficar e interpretar, debes tener claro cúal es tu variable X e Y, recuerda que estamos viendo el efecto de X sobre Y, en este caso, el efecto del N° de mujeres en empleos publicos sobre la brecha de género.