library(readxl)
datos <- read_excel("~/Downloads/EHPM SPSS 2016/Datos incertidumbre/mujeres_trabajadoras.xlsx")
¿Qué proporción de mujeres no trabajaron ni al momento de la encuesta, ni el año anterior a la encuesta?
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
datos$no_trabajo_nunca <- ifelse(datos$AÑO == 0 & datos$AÑOP == 0, "No trabajó", "Trabajó en algun año")
tabla <- table(datos$no_trabajo_nunca)
proporcion <- prop.table(tabla)
tabla_prop <- data.frame(Grupo = names(proporcion), Proporcion = as.numeric(proporcion))
print(tabla_prop)
## Grupo Proporcion
## 1 No trabajó 0.25
## 2 Trabajó en algun año 0.75
ggplot(tabla_prop, aes(x = Grupo, y = Proporcion, fill = Grupo)) +
geom_col() +
scale_y_continuous(labels = scales::percent_format()) +
labs(title = "Proporción de mujeres según situación laboral en ambos años",
x = "Condición laboral",
y = "Proporción") +
scale_fill_manual(values = c("orange", "blue")) +
theme_minimal() +
theme(legend.position = "none")
¿Cómo se comportan los salarios del esposo, para mujeres que trabajan y
para las que no trabajan?
promedio_salarios <- datos %>%
group_by(no_trabajo_nunca) %>%
summarise(Salario_Promedio = mean(INGESP))
print(promedio_salarios)
## # A tibble: 2 × 2
## no_trabajo_nunca Salario_Promedio
## <chr> <dbl>
## 1 No trabajó 10.6
## 2 Trabajó en algun año 8.23
# Gráfico de barras con ggplot2
ggplot(promedio_salarios, aes(x = no_trabajo_nunca, y = Salario_Promedio, fill = no_trabajo_nunca)) +
geom_bar(stat = "identity", width = 0.6) +
labs(title = "Salario promedio del esposo",
x = "Situación esposa",
y = "Salario promedio (miles de dólares)") +
theme_minimal() +
scale_fill_manual(values = c("orange", "blue"))
¿Qué podemos decir de la edad de las mujeres incluidas en la
muestra?
ggplot(datos, aes(x = EDAD)) +
geom_histogram(binwidth = 2, fill = "lightblue", color = "black") +
labs(title = "Distribución de la edad de las mujeres",
x = "Edad", y = "Frecuencia") +
theme_minimal()
¿Qué sucede con la proporción de las mujeres no trabajadora, de acuerdo al nivel educativo?
proporciones_por_educ <- datos %>%
group_by(EDUC, no_trabajo_nunca) %>%
summarise(Numero = n()) %>%
group_by(EDUC) %>%
mutate(Proporcion = Numero / sum(Numero))
## `summarise()` has grouped output by 'EDUC'. You can override using the
## `.groups` argument.
print(proporciones_por_educ)
## # A tibble: 9 × 4
## # Groups: EDUC [5]
## EDUC no_trabajo_nunca Numero Proporcion
## <dbl> <chr> <int> <dbl>
## 1 7 No trabajó 1 0.167
## 2 7 Trabajó en algun año 5 0.833
## 3 10 No trabajó 2 0.0833
## 4 10 Trabajó en algun año 22 0.917
## 5 12 No trabajó 45 0.294
## 6 12 Trabajó en algun año 108 0.706
## 7 16 No trabajó 2 0.182
## 8 16 Trabajó en algun año 9 0.818
## 9 18 Trabajó en algun año 6 1
ggplot(proporciones_por_educ, aes(x = factor(EDUC), y = Proporcion, fill = no_trabajo_nunca)) +
geom_bar(stat = "identity") +
labs(title = "Proporción de Mujeres Trabajadoras y No Trabajadoras por Años de Escolaridad",
x = "Años de Escolaridad",
y = "Proporción") +
scale_fill_manual(values = c("orange", "blue"), labels = c("No trabajó", "Trabajó")) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
¿Hay más mujeres trabajadoras con niños menores de dos años o mayores?
trabajadoras <- subset(datos, no_trabajo_nunca == "Trabajó en algun año")
trabajadoras_con_nin1 <- subset(trabajadoras, NIN1 == 1)
cantidad_nin1 <- nrow(trabajadoras_con_nin1)
trabajadoras_con_nin2 <- subset(trabajadoras, NIN2 == 1)
cantidad_nin2 <- nrow(trabajadoras_con_nin2)
print(paste("Trabajadoras con niños menores de 2 años:", cantidad_nin1))
## [1] "Trabajadoras con niños menores de 2 años: 3"
print(paste("Trabajadoras con niños entre 2 y 6 años:", cantidad_nin2))
## [1] "Trabajadoras con niños entre 2 y 6 años: 39"
resumen_niños <- data.frame(
Grupo = c("Niños menores de 2 años", "Niños entre 2 y 6 años"),
Trabajadoras = c(cantidad_nin1, cantidad_nin2)
)
print(resumen_niños)
## Grupo Trabajadoras
## 1 Niños menores de 2 años 3
## 2 Niños entre 2 y 6 años 39
ggplot(resumen_niños, aes(x = Grupo, y = Trabajadoras, fill = Grupo)) +
geom_bar(stat = "identity", width = 0.6) +
labs(title = "Cantidad de Mujeres Trabajadoras con Hijos por Rango de Edad",
x = "Edad de los Hijos",
y = "Número de Trabajadoras") +
scale_fill_manual(values = c("orange", "blue")) +
theme_minimal()
¿Qué proporción de mujeres negras trabajaron durante los dos años
referidos en la muestra? Y ¿qué proporción de mujeres no negras
trabajaron durante el mismo periodo?
negras <- subset(datos, RAZAN == 1)
prop_negras <- mean(negras$no_trabajo_nunca == "Trabajó en algun año", na.rm = TRUE)
no_negras <- subset(datos, RAZAN == 0)
prop_no_negras <- mean(no_negras$no_trabajo_nunca == "Trabajó en algun año", na.rm = TRUE)
grafico_razan <- data.frame(
Grupo = c("Mujeres negras", "Mujeres no negras"),
Proporcion = c(prop_negras, prop_no_negras)
)
ggplot(grafico_razan, aes(x = Grupo, y = Proporcion, fill = Grupo)) +
geom_bar(stat = "identity", width = 0.6) +
labs(title = "Proporción de Mujeres que Trabajaron según su Raza",
x = "",
y = "Proporción") +
scale_fill_manual(values = c("orange", "blue")) +
theme_minimal()
¿Qué podemos decir acerca de las características de las mujeres que trabajan?
mean(subset(datos, no_trabajo_nunca == "Trabajó en algun año")$EDAD)
## [1] 35.44
mean(subset(datos, no_trabajo_nunca == "Trabajó en algun año")$EDUC)
## [1] 12.02
mean(subset(datos, no_trabajo_nunca == "Trabajó en algun año")$INGESP)
## [1] 8.225327
El promedio de edad de las mujeres que trabajaron en por lo menos un año es de 35 años con 12 años de escolaridad. El ingreso del esposo de estas personas fue en promedio de 8 mil 200 dolares.
Si vemos las gráficas anteriores podemos darnos cuenta de que las mujeres no negras trabajaron menos que las mujeres negras y además solo 3 mujeres con hijos menores de dos años trabajaron en algún año.