#install.packages("readxl")
library(readxl)
base_general <- read_excel("/Users/ahtzirigarcia/Downloads/mujeres_trabajadoras (1).xlsx")

¿Qué proporción de mujeres no trabajaron al momento de aplicar la encuesta, ni el año anterior?

base_general$trabaja_mujer <- ifelse(base_general$ANIOA == 0 & base_general$ANIOP == 0,
                                     "No trabaja", "Sí trabaja")

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
proporciones <- base_general %>%
  count(trabaja_mujer) %>%
  mutate(porcentaje = (n / sum(n)) * 100)


library(ggplot2)

ggplot(proporciones, aes(x = trabaja_mujer, y = porcentaje, fill = trabaja_mujer)) +
  geom_col() +
  geom_text(aes(label = paste0(round(porcentaje), "%")), vjust = -0.5) +
  labs(title = "Mujeres según situación laboral")

El 25% de mujeres es la proporción que no trabajó ni el año previo al aplicar la encuesta ni en ese.

 

¿Cómo se comportan los salarios del esposo para las mujeres que trabajan y que no trabajan?

base_general %>%
  group_by(trabaja_mujer) %>%
  summarise(
    media_ingesp = mean(INGESP, na.rm = TRUE),
    mediana_ingesp = median(INGESP, na.rm = TRUE),
    sd_ingesp = sd(INGESP, na.rm = TRUE),
    n = n()
  )
## # A tibble: 2 × 5
##   trabaja_mujer media_ingesp mediana_ingesp sd_ingesp     n
##   <chr>                <dbl>          <dbl>     <dbl> <int>
## 1 No trabaja           10.6            8.59      8.92    50
## 2 Sí trabaja            8.23           7.7       4.62   150
ggplot(base_general, aes(x = trabaja_mujer, y = INGESP)) +
  geom_boxplot(fill = "purple") +
  labs(title = "Ingreso del esposo según situación laboral de la mujer",
       x = "¿La mujer trabaja?",
       y = "Ingreso del esposo")

Con este gráfico puedo observar que hay unos cuantos outliers de ingresos muy altos de los maridos en ambos status de las mujeres en su situación laboral, aunque la mayoría se encuentra en ingresos bajos, lo que representa la desigualdad económica. Por otro lado, se nota que la mediana es ligeramente más alta (.89) cuando las mujeres no trabajan.

 

¿Qué podemos decir de la edad de las mujeres incluida en la muestra?

base_general %>%
  group_by(trabaja_mujer) %>%
  summarise(
    edad_promedio = mean(EDAD, na.rm = TRUE),
    edad_mediana = median(EDAD, na.rm = TRUE),
    edad_min = min(EDAD, na.rm = TRUE),
    edad_max = max(EDAD, na.rm = TRUE),
    n = n()
  )
## # A tibble: 2 × 6
##   trabaja_mujer edad_promedio edad_mediana edad_min edad_max     n
##   <chr>                 <dbl>        <dbl>    <dbl>    <dbl> <int>
## 1 No trabaja             33.9           32       23       46    50
## 2 Sí trabaja             35.4           35       21       46   150
ggplot(base_general, aes(x = trabaja_mujer, y = EDAD)) +
  geom_boxplot(fill = "lightgreen") +
  labs(title = "Edad de mujeres según su situación laboral",
       x = "¿La mujer trabaja?",
       y = "Edad")

Las mujeres con empleo tienden a ser mayores, aunque la diferencia es de pocos años. En promedio las mujeres sin empleo tienen aproximadamente 34 años, mientras que las mujeres empleadas tienen un promedio cercano a 35 años.

 

¿Qué sucede con la proporción de mujeres no trabajadoras, de acuerdo al nivel educativo?

proporcion_por_educ <- base_general %>%
  group_by(EDUC, trabaja_mujer) %>%
  summarise(n = n()) %>%
  group_by(EDUC) %>%
  mutate(proporcion = n / 200)
## `summarise()` has grouped output by 'EDUC'. You can override using the
## `.groups` argument.
print(proporcion_por_educ)
## # A tibble: 9 × 4
## # Groups:   EDUC [5]
##    EDUC trabaja_mujer     n proporcion
##   <dbl> <chr>         <int>      <dbl>
## 1     7 No trabaja        1      0.005
## 2     7 Sí trabaja        5      0.025
## 3    10 No trabaja        2      0.01 
## 4    10 Sí trabaja       22      0.11 
## 5    12 No trabaja       45      0.225
## 6    12 Sí trabaja      108      0.54 
## 7    16 No trabaja        2      0.01 
## 8    16 Sí trabaja        9      0.045
## 9    18 Sí trabaja        6      0.03
ggplot(proporcion_por_educ, aes(x = as.factor(EDUC), y = proporcion, fill = trabaja_mujer)) +
  geom_col(position = "fill") +
  labs(title = "Proporción de mujeres no trabajadoras según nivel educativo",
       x = "Nivel educativo",
       y = "Proporción",
       fill = "Situación laboral")

Los datos nos enseñan que en proporción, las mujeres que no trabajan recibieron menos años de educación. A partir de los 18 años de educación, todas tienen trabajo.

 

¿Hay más mujeres trabajadoras con niños menores de dos años o mayores?

trabajosi_con_ninos <- base_general %>%
  filter(trabaja_mujer == "Sí trabaja") %>%
  summarise(
    con_ninos_menores_2 = sum(NIN1 == 1),
    con_ninos_2a6 = sum(NIN2 == 1)
  )
print(trabajosi_con_ninos)
## # A tibble: 1 × 2
##   con_ninos_menores_2 con_ninos_2a6
##                 <int>         <int>
## 1                   3            39

Hay más mujeres trabajadoras con niños mayores de 2 años.

 

¿Qué proporcion de mujeres negras trabbajaron durante los dos años referidos en la muestra y qué proporción de mujeres no negras trabajaron durante el mismo periodo?

proporcion_trabajo_por_raza <- base_general %>%
  group_by(RAZAN, trabaja_mujer) %>%
  summarise(n = n()) %>%
  group_by(RAZAN) %>%
  mutate(proporcion = round((n / sum(n)) * 100, 2))
## `summarise()` has grouped output by 'RAZAN'. You can override using the
## `.groups` argument.
print(proporcion_trabajo_por_raza )
## # A tibble: 4 × 4
## # Groups:   RAZAN [2]
##   RAZAN trabaja_mujer     n proporcion
##   <dbl> <chr>         <int>      <dbl>
## 1     0 No trabaja       45       27.3
## 2     0 Sí trabaja      120       72.7
## 3     1 No trabaja        5       14.3
## 4     1 Sí trabaja       30       85.7

La proporcion de mujeres negras que trabajaron durante los dos años (85.71) fue más alta que la de las mujeres blancas que también trabajaron en ese periodo (72.73), con una diferencia de 12.98 puntos porcentuales.

 

¿Qué podemos decir acerca de las caracteristicas de las mujeres que trabajan?

Considerando la información obtenida a lo largo de este análisis puedo decir que,durante los dos años en los que se analiza la información las mujeres que si trabajan son mayormente mujeres negras con una edad promedio de 35 años, la mayoría de ellas tienen hijos de entre 2 a 6 años, proporcionalmente las trabajadoras han recibido un mayor numero de años en educación que las que no tienen empleo y que cuando sí trabaja la mujer en promedio su esposo gana menos.