R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

  1. Base de datos
library(haven)
## Warning: package 'haven' was built under R version 4.4.3
datos <- read_dta("C:/Users/USUARIO/Downloads/ENUT2020.dta")
  1. Pregunta de investigacion

¿Existen diferencias entre hombres y mujeres en el tiempo dedicado a la higiene y las tareas domesticas?

Justificacion:

Esta pregunta es relevante debido a que permite analizar la forma en que los roles de genero, entendiendolos como las expectativas socioculturales que orientan el comportamiento de hombres y mujeres dentro de la estructura social, influyen en la distribución del tiempo dedicado tanto a la higiene personal como al trabajo no remunerado dentro del hogar (Tareas domesticas) entre hombres y mujeres. A su vez, comprender estas dinamicas permite visibilizar desigualdades en la distribución del tiempo dedicado al hogar y estereotipos dañinos persistentes en la cultura colombiana. Este analisis es fundamental para promover la equidad de genero y crear conciencia del peligro proveniente de la estigmatizacion por genero en un pais con distintas tradiciones machistas y misoginas vigentes.

  1. Variables

Continuas: Tiempo higiene propia, Edad, Tiempo tareas domesticas.

Tiempo higiene propia:

Asearse, vestirse y arreglarse (P1144S3A1 + P1144S3A2)

Ir a peluqueria, barberia, salón o spa (P1144S4A1 + P1144SAA2)

Tiempo tareas domesticas:

Preparar y servir alimentos (P1143S1A1 + P1143S1A2)

Levantar platos, lavar la loza (P1143S2A1 + P1143S2A2)

Preparar conservas, quesos o embutidos(P1143S3A1 + P1143S3A2)

Llevar comida a personas fuera del hogar (P1143S4A1 + P1143S4A2)

Lavar, planchar o guardar ropa (P1142S1A1 + P1142S1A2)

Reparar ropa, manteles, calzado, etc. (P1142S2A1 + P1142S2A2) Elaborar prendas de vestir (P1142S3A1 + P1142S3A2)

Llevar o recoger ropa o calzado a lavandería ( P1142S4A1 + P1142S4A2)

Limplar la vivienda (barrer, trapear, etc.) (P1136S1A1 + P1136S1A2)

Cuidar mascotas (P1136S2A1 + 1136S2A2)

Cuidar jardin o plantas ornamentales (P1136S3A1 + P1136S3A2)

lavar o desinfectar alimentos al ingresar ( P1136S7A1 + P1136S7A2)

Oficios del hogar (cocinar, limpiar, lavar ropa, planchar, hacer compras, etc) (P1128S1A1 +P1128S1A2)

Reparaciones menores o jardineria ( P1128S2A1 + P1128S2A2)

Trasladarse para realizar actividades hogar (P1128S3A1 + P1128S3A2)

Categoricas: Sexo, estrato socioeconomico, region.

Justificacion:

La variable sexo es fundamental porque permite analizar y comparar las diferencias entre hombres y mujeres en el tiempo dedicado a la higiene y las tareas domesticas, visibilizando asi las desigualdades de genero en la distribución dem trabajo no remunerado y el sesgo cultural hacia la higiene y preparacion segun el sexo; la edad permite comprender cómo estas actovidadrs varían a lo largo de las etapas de la vida, evidenciando la influencia de roles de genero, y como estos cambian entre las generaciones; la region refleja las diferencias culturales y sociales en las distintas zonas del pais, mostrando como las normas y expectativas afectan considerablemenre la participacion en estas actividades; el estrato socioeconomixo influye en la carga domestica, ya que en estratos najos suele existir una mayor carga de trabajo no remunerado, mientras que en estratos altos puede haber mayor delegacion de estas tareas; tiempo higiene es relevante debido a que permite conocer cuanto tiempo las personas dedican al cuidado de su apariencia y salud, reflejando patrones culturales, habitos de social y diferencias en la construccion subjetiva que se tiene de cada genero; tiempo en tareas domesticas es clave para analizar la distribución del trabajo no remunerado, ya que estas actividades suelen recaer de manera desproporcionada sobre las mujeres, visibilizando la persistencia de roles de género tradicionales y su impacto en la desigualdad social.

Tiempo tareas domesticas e higiene:

Se juntaron las distintas variables que contenian el tiempo invertido en actividades de trabajo no remunerado dentro del hogar y el tiempo en actividades de higiene personal en dos variables, las primera se llama datos_tareas_domestica y la siguiente datos_higiene_propia. Para esto, se sumaron los minutos con las horas multiplicadas por 60 para permitirnos ver cuantos minutos al dia se dedican a estas actividades.

sumar_con_na <- function(df) {
  suma <- rowSums(df, na.rm = TRUE)       
  n_no_na <- rowSums(!is.na(df))          
  suma[n_no_na == 0] <- NA                 
  return(suma)
}

# Variables horas para higiene personal propia
vars_higiene_propia_horas <- c("p1144s3a1", "p1144s4a1")
vars_higiene_propia_minutos <- c("p1144s3a2", "p1144s4a2")

# Variables horas para cuidado de higiene de otra persona
vars_higiene_otro_horas <- c("p1134s1a1", "p1134s2a1", "p1134s3a1")
vars_higiene_otro_minutos <- c("p1134s1a2", "p1134s2a2", "p1134s3a2")

# Variables horas para tareas domésticas
vars_tareas_domesticas_horas <- c(
  "p1143s1a1", "p1143s2a1", "p1143s3a1", "p1143s4a1",
  "p1142s1a1", "p1142s2a1", "p1142s3a1", "p1142s4a1",
  "p1136s1a1", "p1136s2a1", "p1136s3a1", "p1136s4a1",
  "p1136s7a1", "p1128s1a1", "p1128s2a1", "p1128s3a1", "p1128s8a1"
)
vars_tareas_domesticas_minutos <- sub("a1$", "a2", vars_tareas_domesticas_horas)

# Convertir horas y minutos a minutos totales para cada grupo
datos_higiene_propia <- datos[vars_higiene_propia_horas] * 60 + datos[vars_higiene_propia_minutos]
datos_higiene_otro <- datos[vars_higiene_otro_horas] * 60 + datos[vars_higiene_otro_minutos]
datos_tareas <- datos[vars_tareas_domesticas_horas] * 60 + datos[vars_tareas_domesticas_minutos]

# Crear variables sumando los tiempos de cada actividad (en minutos)
datos$tiempo_higiene_propia <- sumar_con_na(datos_higiene_propia)
datos$tiempo_higiene_otro <- sumar_con_na(datos_higiene_otro)
datos$tiempo_tareas_domesticas <- sumar_con_na(datos_tareas)

Variable sexo:

Para esta variable se modificaron los nombres de las categorias de forma en que la categoria 1 pase a ser hombre y la 2 sea mujer, esto con el fin de facilitar la lectura de los resultados.

datos$sexo <- ifelse(datos$p6020 == 1, "Hombre",
                     ifelse(datos$p6020 == 2, "Mujer", NA))

datos$sexo <- factor(datos$sexo, levels = c("Hombre", "Mujer"))

table(datos$sexo)
## 
## Hombre  Mujer 
##  69913  77666

Variable Edad:

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
datos <- datos %>%
  rename(edad = p6040)

Variable Region:

Para esta variable, se cambiaron los nombres de la categorias de modo que cada numero represente una de las distintas regiones del pais.

datos$region <- factor(datos$region,
                       levels = 1:6,
                       labels = c("Caribe", "Central", "Oriental", 
                                  "Pacífica", "Bogotá", "San Andrés"))

Variable estrato:

En esta variable utilizare una funcion que me permita reorganizar los nombres de las categorias, para que en vez de numeros, me aparezcan los distintos estratos de clasificacion socioeconomica presente en el pais.

datos$Estrato_tarifa <- factor(datos$p4030s1a1,
                               levels = 1:6,
                               labels = c("Estrato 1", "Estrato 2", "Estrato 3",
                                          "Estrato 4", "Estrato 5", "Estrato 6"))
  1. Estadistica descriptiva

Exclusion 0: Con el objetivo de mejorar los resultados obtenidos, se excluyeron los 0 de ciertas funciones, ya que la presencia de estos eran incoherentes con ciertas variables como la de higiene personal o tareas domesticas, ademas el objetivo de la investigacion es analizar el tiempo que dedican directamente en estas actividades, con lo que tener valores 0 afectaria severamente a esa lectura y la interpretacion obtenida de los datos. Debido a que no permite visualizar del todo como es que en los hogares que existe una distribución por ambas partes, aun existe una mayor carga de trabajo por parte de uno de los 2 sexos encuestados.

Tiempo invertido en higiene propia:

mean(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
## [1] 45.26555
median(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
## [1] 40
sd(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
## [1] 27.52058
min_cuidado <- min(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
max_cuidado <- max(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
rango_cuidado <- max_cuidado - min_cuidado

Interpretacion:

En promedio, la poblacion encuestada por el DANE dedican aproximadamente 45.2 minutos al dia a actividades relacionadas con su aseo, vestirse, arreglarse y organizar su cabello. Esto a su vez, se mantiene coherente con la mediana, en la que las personas dedican 40 minutos o menos al dia a actividades de higiene personal propia como asearse, vertirse, etc. Y la otra mitad dedica mas de 40 minutos a estas actividades. Lo que refleja un tiempo apropiado para la carga que estas actividades implican. Mientras que la desviacion estandar señale que estas actividades varian entre un poco menos de media hora y un poco mas de una hora, con 17,7 minutos y 72.7 minutos al dia (1 hora y 12 minutos). Esto sugiere que a pesar de ser tareas consideradas cortas y sencillas, existe cierta variabilidad en la duracion de los patrones de autolimpieza de los individuos, con algunos utilizando mas o menos tiempo.

El valor minimo es de 1 minuto, mientras que el valor maximo es 599 minutos al dia, lo que indica que el rango es de 598 minutos diarios, esto significa que existe una gran variabilidad en el tiempo dedicado a la higiene personal dentro de la poblacion. A su vez, muestra que aunque algunos individuos dedican menos de una hora, otros pueden llegar hasta casi 10 horas, lo que evidencia las diferentes dinamicas que tienen los diferentes estilos de vida de los encuestados, mientras que abre la posibilidad de una mala interpretacion de la pregunta o de una condicion de salud que influya en sus patroness de higiene personal.

Tiempo Tareas Domesticas:

mean(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
## [1] 173.5004
median(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
## [1] 140
sd(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
## [1] 135.3901
min_cuidado <- min(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
max_cuidado <- max(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
rango_cuidado <- max_cuidado - min_cuidado

Interpretacion:

El promedio dedicado a tareas domesticas es de 173.5 minutos, es decir, 2 horas y 53 minutos. Lo que refleja una considerable carga de trabajo no remunerado para los hogares de Colombia y a su vez, lo exigentes que son las diversas tareas del hogar y el tiempo que requieren. Mientras que la mediana se aleja considerablemente de este valor, situandose en los 140 minutos al dia, y a su vez, advirtiendo de la posible presencia de valores atipicos que afecten a la media, lo que abre la posibilidad de que esos valores atipicos esten relacionados con la desigualdad entre hombres y mujeres en la carga de trabajo no remunerado dentro del hogar. La desviacion estandar, es de 135.3 minutos al dia, presentando una gran dispersion respecto al tiempo dedicado a tareas domesticas, con una variabilidad promedio de mas de 2 horas y 15 minutos frente a la media. Esto refuerza las importantes diferencias entre personas o grupos en la carga de trabajo domestico, de modo que ciertos individuos le dedican poco tiempo al trabajo no remunerado dentro del hogar comparado al largo tiempo que otros le pueden dedicar.

El valor minimo es de 1 minuto al dia, mientras que el valor maximo es de 1487 minutos al dia, exactamente 24 horas, por lo cual el rango es de 1486 minutos al dia, 24 horas. Este dato muestra la presencia de una enorme variabilidad en el tiempo dedicado a tareas domestica. Esto fortalece la hipotesis de la presencia de casos extremos que se alejan considerablemente de la media y la mediana, estos a su vez reportan dedicar un dia completo a estas actividades. Lo que refleja diferencias marcadas en las responsabilidades domesticas, como; sobrecarga domesticas, condiciones de vida exigentes o la posibilidad de que el encuestado malinterpreto la pregunta.

Asimetria y curtosis:

# Librería para calcular asimetría y curtosis
library(e1071)
## Warning: package 'e1071' was built under R version 4.4.3
skewness(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)   # Asimetría
## [1] 1.128179
kurtosis(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)   # Curtosis
## [1] 1.753148
skewness(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)   # Asimetría
## [1] 3.234326
kurtosis(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)   # Curtosis
## [1] 30.17784

Interpretacion:

La asimetria del tiempo invertido en tareas domesticas es 1.1 lo que indica que la mayoria dedica pocos minutos a las tareas domesticas, pero un grupo mas pequeño dedica muchas, teniendo asi un sesgo moderado a la derecha (cola larga a la derecha)

La asimetria del tiempo invertido en higiene es de 3.2, lo que indica que la mayoria dedica tiempo bajos o moderados a la higiene, pero estan presentes casos altos que distorsionan la distribuccion, de alli que haya un sesgo fuerte a la derecha(cola larga)

curtosis:

La curtosis del tiempo dedicado en tareas domesticas es de 1.7, que al ser lejana a 3, indica que la distribucion tiene una forma similar algo mas achatada que la de una distribuccion normal en cuanto a la concentracion de datos en la cola y el pico, siendo asi algo plana y achatada.

La curtosis del tiempo invertido en higiene es de 30.01 lo que indica una distribución con picos muy elevados y colas pesadas, de modo que muchos valores estan presentes cerca de la mediana pero tambien valores extremos muy alejados, esto termina por confirmar la presencia de valores atipicos.

Moda:

moda <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

moda(datos$sexo)
## [1] Mujer
## Levels: Hombre Mujer

El sexo mas frecuente es la mujer, lo que muestra que la mayoria de encuestados por la DANE son mujeres, esto es extremadamente relevante ya que puede influir en los patrones observados de tiempo dedicado a la higiene propia y a las tares domesticas, debido a que la cultura colombina aun esta sujeta a roles de genero machistas que provocan que las mujeres suelen asumir esas actividades.

Frecuencia relativa:

#Filtrar los diferentes datos de region y aplicarlos en una frecuencia absoluta.

datos_region <- datos[!is.na(datos$region) & datos$region != 0, ]
freq_region_abs <- table(datos_region$region)
freq_region_rel <- prop.table(freq_region_abs)
freq_region_pct <- round(freq_region_rel * 100, 2)

# Filtrar los datos de estrato socioeconomico
datos_estrato <- datos[!is.na(datos$Estrato_tarifa) & datos$Estrato_tarifa != 0, ]
freq_estrato_abs <- table(datos_estrato$Estrato_tarifa)
freq_estrato_rel <- prop.table(freq_estrato_abs)
freq_estrato_pct <- round(freq_estrato_rel * 100, 2)


list(
  "Frecuencia relativa Región (%)" = freq_region_pct,
  "Frecuencia relativa Estrato (%)" = freq_estrato_pct
)
## $`Frecuencia relativa Región (%)`
## 
##     Caribe    Central   Oriental   Pacífica     Bogotá San Andrés 
##      24.35      24.19      17.73      16.14      15.28       2.30 
## 
## $`Frecuencia relativa Estrato (%)`
## 
## Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6 
##     40.00     33.43     18.26      5.22      2.01      1.07

Interpretación:

La muestra está distribuida principalmente entre las regiones Caribe y Central, cuyos datos representan casi la mitad de los encuestados (48.54%). Mientras las regiones Oriental, Pacífica y Bogotá tienen una representación moderada. San Andrés es la menos representada con solo el 2.3%. Esto señala que los resultados del análisis estarán principalmente influenciados por las características culturales, politicas sociales y económicas de las regiones Caribe y Central.

La mayorias de la muestra pertenece a los estratos socioeconomicos mas bajos: el 40% al estrato 1 y el 33.43% al estrato 2, junto equivale al 73% de la poblacion. Mientras que los estratos medios y altos (3 a 6) estan poco representados. Lo que refleja que los resultados observados en los patrones de tiempo de higiene y tareas domesticas reflejen principalmente las condiciones y habitos de personas con menores recursos economicos, lo que puede influir a su vez, en la carga de trabajo no remunerado y el acceso a servicios.

Grafico de barras:

Sexo:

library(ggplot2)
## 
## Adjuntando el paquete: 'ggplot2'
## The following object is masked from 'package:e1071':
## 
##     element
ggplot(datos, aes(x = sexo)) +
  geom_bar(fill = "steelblue", alpha = 0.7) +
  labs(title = "Distribución por sexo",
       x = "Sexo",
       y = "Frecuencia") +
  theme_minimal()

Interpretacion:

La gráfica evidencia que la muestra está compuesta por una cantidad relativamente equilibrada de hombres y mujeres. Sin embargo . Sin embargo, se observa una ligera mayoría de mujeres frente a los hombres. Lo que indica que las mujeres estan un poco mas representadas, factor fundamental ya que se busca analizar las diferencias en el tiempo dedicado a la higiene y a las tareas domésticas entre sexos, esta mayor proporción de mujeres puede influir en los resultados descriptivos generales.

Comparacion entre las Variables continuas tiempo dedicado a higiene propia con la variable sexo:

library(dplyr)

datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia != 0) %>%
  group_by(sexo, Estrato_tarifa) %>%
  summarise(
    n = n(),
    media_cuidado = mean(tiempo_higiene_propia),
    mediana_cuidado = median(tiempo_higiene_propia),
    sd_cuidado = sd(tiempo_higiene_propia)
  )
## `summarise()` has grouped output by 'sexo'. You can override using the
## `.groups` argument.
## # A tibble: 14 × 6
## # Groups:   sexo [2]
##    sexo   Estrato_tarifa     n media_cuidado mediana_cuidado sd_cuidado
##    <fct>  <fct>          <int>         <dbl>           <dbl>      <dbl>
##  1 Hombre Estrato 1      23009          41.9              30       28.1
##  2 Hombre Estrato 2      19444          39.8              30       26.1
##  3 Hombre Estrato 3      10731          40.3              30       24.8
##  4 Hombre Estrato 4       3063          40.4              30       24.9
##  5 Hombre Estrato 5       1169          41.2              30       21.1
##  6 Hombre Estrato 6        618          42.4              30       22.6
##  7 Hombre <NA>             754          40.3              30       23.2
##  8 Mujer  Estrato 1      24938          49.8              45       28.5
##  9 Mujer  Estrato 2      22466          47.9              45       26.7
## 10 Mujer  Estrato 3      12897          49.2              45       27.6
## 11 Mujer  Estrato 4       3823          50.0              45       29.0
## 12 Mujer  Estrato 5       1505          52.4              60       28.7
## 13 Mujer  Estrato 6        834          55.2              60       34.5
## 14 Mujer  <NA>             659          47.5              60       23.1
library(ggplot2)


datos %>%
  filter(
    !is.na(tiempo_higiene_propia),
    tiempo_higiene_propia > 0,
    !is.na(Estrato_tarifa),
    !is.na(sexo)
  ) %>%
  ggplot(aes(x = Estrato_tarifa, y = tiempo_higiene_propia, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3) +
  labs(
    title = "Tiempo de higiene personal por sexo y estrato",
    x = "Estrato socioeconómico",
    y = "Tiempo en minutos"
  ) +
  theme_minimal()

Interpretacion:

El gráfico muestra la distribución del tiempo dedicado a la higiene personal según el sexo y el estrato socioeconómico. En general, se encontro una importante diferencia entre la media y mediana por sexo, con los hombres dedicandole en promedio entre 39 minutos al dia y 41 minutos, con una consistente mediana de 30 minutos. Mientras que las mujeres le dedican un promedio de entre 47 minutos al dia y 53 minutos, dependiendo del estrato socioeconomico, por su parte, la mediana es de entre 45 minutos al dia, y 60 minutos al dia. Demostrando que existe una diferencia considerable entre los tiempos dedicados a estas actividades por parte de las mujeres, a su vez, existe una mayor diferencia por estrato entre las mujeres que en los hombres, cuyo promedio se mantiene similar. En las mujeres, a medida que el estrato socioeconomico es mas alto, el tiempo dedicado a la higiene personal es mayor, con un promedio de hasta 53 minutos y una mediana de 60 minutos. Esto a su vez, confirma la idea de que existe un papel de los estereotipos de genero y una mayor expectativa hacia la mujer en lo que respeta a su aseo personal y una necesidad de destacar en un pais con estandares de belleza dañinos hegemonicos y opresivos, principalmente en los estratos mas altos donde se inculca a las mujeres que para ser exitosas necesitan cumplir con esos estandares. Ademas es importante destacar que las mujeres de estrato menores con dificultad podrian acceder a los productos que pueden utilizar las mujeres de las clase mas altas, por lo que estan mas restringidas en lo que respecta a la higiene.

Tiempo dedicado por edad y genero:

datos <- datos %>%
  mutate(
    edad_grupos = cut(edad,
                      breaks = c(seq(0, 90, by = 10), Inf),
                      right = FALSE,
                      include.lowest = TRUE,
                      labels = c("0-9", "10-19", "20-29", "30-39", "40-49",
                                 "50-59", "60-69", "70-79", "80-89", "90+"))
  )

library(dplyr)

estadisticas_higiene_edad_sexo <- datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  group_by(edad_grupos, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_higiene_propia, na.rm = TRUE),
    mediana = median(tiempo_higiene_propia, na.rm = TRUE),
    sd = sd(tiempo_higiene_propia, na.rm = TRUE),
    .groups = "drop"
  ) %>%
  arrange(edad_grupos, sexo)

print(estadisticas_higiene_edad_sexo)
## # A tibble: 18 × 6
##    edad_grupos sexo       n media mediana    sd
##    <fct>       <fct>  <int> <dbl>   <dbl> <dbl>
##  1 10-19       Hombre 10885  41.8      30  27.8
##  2 10-19       Mujer  10779  52.7      60  28.5
##  3 20-29       Hombre 11241  42.4      30  28.5
##  4 20-29       Mujer  12033  52.0      60  29.4
##  5 30-39       Hombre 10038  40.3      30  25.4
##  6 30-39       Mujer  11774  49.3      45  27.7
##  7 40-49       Hombre  8760  39.3      30  24.0
##  8 40-49       Mujer  10138  47.9      40  27.8
##  9 50-59       Hombre  7776  39.2      30  25.6
## 10 50-59       Mujer   9372  45.9      40  25.4
## 11 60-69       Hombre  5646  40.0      30  26.8
## 12 60-69       Mujer   7063  45.6      40  26.9
## 13 70-79       Hombre  3035  40.9      30  25.4
## 14 70-79       Mujer   3982  46.8      40  26.7
## 15 80-89       Hombre  1195  44.8      40  25.3
## 16 80-89       Mujer   1606  50.5      60  26.6
## 17 90+         Hombre   212  48.0      40  25.9
## 18 90+         Mujer    375  55.1      60  28.6

Interpretacion: Existe una considerable diferencia por sexo entre el tiempo dedicado a higiene propia en diferentes rangos de edad. En el que la mujer suele ser aquella con el promedio mas alto, entre los 10 y los 19 años, su promedio es de 52 minutos al dia con una mediana de 60, mientras que el promedio del hombre es de 40 minutos al dia con una mediana de 30, lo que nos muestra que la diferencia entre ambos, los estandares opresivos de belleza que incitan a las mujeres a utilizar mas tiempo para su aseo personal y su vestimente estan en la cultura colombiana desde la niñez y adolesencia de estas. A su vez, ese promedio de diferencia se mantiene en los distintos rangos de edad. Cabe destacar que la dispersion de datos se mantiene similar en los hombres y mujeres, variendo por edad entre los 25 y 29 minutos.

# Boxplot: Tiempo dedicado a higiene personal por grupo de edad y sexo
datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  ggplot(aes(x = edad_grupos, y = tiempo_higiene_propia, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a higiene personal por grupo de edad y sexo",
    x = "Grupo de edad",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Set3") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Interpretacion:

El grafico señala que la mayoria de los encuestados dedica entre 30 y 60 minutos diarios a la higiene personal, pero los valores atipicos amplian considerablemente la dispersion, un ejemplo de esto, es que en las mujeres de 20 a 29 años hay casos que superan los 500 minutos, mientras que en hombres de 40 y 49 años hay casos que superan los 500 minutos. Esto demuestra que, aunque la mediana es estable con alrededor de 40 minutos para los hombres y 60 para las mujeres, unos pocos casos extremos elevan la variabilidad de ambos sexos, ademas, esos datos extremos son mas frecuentes y mayores en las mujeres, que junto a las medianas de cada sexo, confirma aun mas una desigualdad entre ambos sexos respecto a la higiene y su relacion con los estandares de belleza opresivos a los que se ven sometidas principalmente las mujeres.

Para ilustrar esta diferencia entre hombres y mujeres respecto a la higiene personal, es prudente utilizar un boxplot por la cantidad de datos que permite visualizar:

library(ggplot2)

# Filtrar datos para evitar NA y valores no válidos
datos_filtrados <- datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(sexo))

# Crear boxplot
ggplot(datos_filtrados, aes(x = sexo, y = tiempo_higiene_propia)) +
  geom_boxplot(fill = "lightblue", color = "darkblue") +
  labs(title = "Boxplot de tiempo de higiene propia por sexo",
       x = "Sexo",
       y = "Tiempo de higiene propia") +
  theme_minimal()

Interpretacion:

El boxplot muestra que tanto hombres como mujeren invierten en promedio entre 30 y 60 minutos diarios a la higiene personal, con medianas cercanas a los 40 minutos en hombres y 50 en mujeres. A pesar de esto, se observan valores atípicos que superan los 600 minutos en ambos sexos, lo cual indica que ciertos encuestadis destinan tiempo muy elevados al cuidado de su higiene. Ademas, aunque las diferencias centrales son pequeñas la mayor dispersion en mujeres sugiere que hay mas casos extremos respecto a los hombres. Lo que responde directamente a la pregunta de investigacion, al mostrar que existe una diferencias respecto al tiempo dedicado a la higiene entre hombres y mujeres.

Tiempo invertido a Tareas domesticas/ trabajo no remunerado dentro del hogar:

estadisticas_por_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(sexo)) %>%
  group_by(sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(sexo)

print(estadisticas_por_sexo)
## # A tibble: 2 × 5
##   sexo       n media mediana    sd
##   <fct>  <int> <dbl>   <dbl> <dbl>
## 1 Hombre 29207  95.1      60  86.6
## 2 Mujer  58791 212.      190 138.

La tabla de estadistica descriptiva muestra un claro contraste entre hombres y mujeres en lo que respecta al tiempo dedicado a las tareas domesticas. En promedio, los hombres invierten 95.1 minutos diarios (1 hora y 35 minutos), mientras que las mujeres dedican 212.4 minutos al dia (aproximadamente 3 horas y 32 minutos). La mediana hace aun mas visible esta diferencia: la mitad de los hombres destinan 60 minutos o menos, de cara a los 190 minutos en las mujeres, tres veces mas. La desviacion estandar es de 138.3 minutos de las mujeres frente a 86.6 en hombres, lo que indica una gran dispersion en el manejo de sus tiempos: mientras algunos hogares pueden compartir de maneras mas equitativa las tareas, en otros los hogares pueden compartir mas equitativamente las tareas. Ademas, es importante considerar la diferencia abismal de numeros entre hombres y mujeres que contestaron la pregunta, en las mujeres fueron 58791, mientras que en los hombres 29207, lo que deja abierta la posibilidad de que los que no contestaron directamente no invertian tiempo a las responsabilidades domesticas, esto refuerza la idea de que el papel y rol cultural dado a la mujer en Colombia sigue influyendo en desigualdades de genero, sobreexplotacion y misoginia.

Grafico que lo ilustre:

library(ggplot2)
library(dplyr)

datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(sexo)) %>%
  ggplot(aes(x = sexo, y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3) +
  labs(
    title = "Distribución del tiempo dedicado a tareas domésticas por sexo",
    x = "Sexo",
    y = "Tiempo en minutos"
  ) +
  scale_fill_brewer(palette = "Set2") +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    axis.title = element_text(size = 12),
    axis.text = element_text(size = 10),
    legend.position = "none"
  )

Interpretación: El grafico ilustra una brecha significativa en el tiempo dedicado a las tareas domesticas entre hombres y mujeres. En los hombres, la mediana es de 60 minutos al dia, con un rango intercuartilico de entre 30 minutos y 120 minutos, lo que muestra que la mayirua invierte entre media hora y dos horas, aunque existan valores atipicos que superan las 12 horas. En las mujeres, por el contrario, la mediana asciende a 190 minutos, con un rango intercuartilico considerablemente mas extenso (Q1= 105, Q3= 300), lo que implica que la mitad de las encuestadas dedica entre casi 2 y 5 horas diarias. Ademas se observan valores extremos que sobrepasan los 1480 minutos, reforzando aun mas la idea de que la carga del trabajo no remunerado recae de manera desproporcionada sobre las mujeres.

Comparacion tareas domesticas hombres y mujeres por estrato economico:

Tiempo dedicado a tareas domesticas por estrato:

# Tiempo dedicado a tareas domésticas por estrato y sexo
estadisticas_por_estrato_sexo <- datos %>%  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(Estrato_tarifa), !is.na(sexo)) %>%
  group_by(Estrato_tarifa, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(Estrato_tarifa, sexo)
## `summarise()` has grouped output by 'Estrato_tarifa'. You can override using
## the `.groups` argument.
print(estadisticas_por_estrato_sexo)
## # A tibble: 12 × 6
## # Groups:   Estrato_tarifa [6]
##    Estrato_tarifa sexo       n media mediana    sd
##    <fct>          <fct>  <int> <dbl>   <dbl> <dbl>
##  1 Estrato 1      Hombre  9741  93.5      60  83.7
##  2 Estrato 1      Mujer  22368 223.      210 140. 
##  3 Estrato 2      Hombre 10171  95.1      60  88.2
##  4 Estrato 2      Mujer  19765 212.      190 137. 
##  5 Estrato 3      Hombre  6197  96.4      63  87.9
##  6 Estrato 3      Mujer  11150 203.      180 138. 
##  7 Estrato 4      Hombre  1806  93.9      60  84.4
##  8 Estrato 4      Mujer   3195 188.      170 131. 
##  9 Estrato 5      Hombre   642 101.       70  91.5
## 10 Estrato 5      Mujer   1152 182.      150 135. 
## 11 Estrato 6      Hombre   299 103.       60 103. 
## 12 Estrato 6      Mujer    553 189.      150 144.

Interpretacion:

Los datos reflejan una clara desigualdad entre los hombres y las mujeres en lo que respecta a la distribucion de tareas domesticas, y agrega un factor socioeconomico al analisis, esto debido a que en todos los estratos socioeconomicos las mujeres dedican sistemáticamente más tiempo a las tareas domésticas, con un promedio de entre 90 minutos y 120 mas al dia que los hombres. Estas diferencias se hacen mas predominantes dependiendo de la clase socioeconomica. Por ejemplo, en el estrato 1, los hombres registran una media de 93 minutos con mediana de 60, mientras que las mujeres alcanzan 223 minutos con mediana de 210, lo que evidencia una diferencia superior a las 2 horas diarias. Esta tendencia se mantiene en todos los niveles: incluso en los estratos mas altos, como en el caso del 6, donde los hombres tienen una media de 103 minutos frente a 189 minutos en las mujeres, con medianas de 60 y 150 minutos respectivamente. Esto confirma que la desigualdad en la distribución del trabajo doméstico no desaparece con mayores recursos económicos. la desviación estándar es sistematicamente mayor en las mujeres (entre 130 y 145 minutos), lo que indica mayor dispersión en sus tiempos, con casos donde ellas asumen cargas muy superiores al promedio, mientras que los hombres presentan una distribución más homogénea y reducida. En conjunto, los datos evidencian una brecha de género profunda y persistente en el uso del tiempo, que atraviesa tanto a los hogares de bajos como de altos estratos.

Boxplot:

# Boxplot: Tiempo dedicado a tareas domésticas por estrato y sexo
datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(Estrato_tarifa), !is.na(sexo)) %>%
  ggplot(aes(x = Estrato_tarifa, y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a tareas domesticas por estrato socioeconomico y sexo",
    x = "Estrato socioeconomico",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Set1") +
  theme_minimal()

Interpretacion: El grafico evidencia que en todos los estratos socioeconomicos las mujeres dedican una cantidad superior de tiempo a las tareas domesticas que los hombres. Mientras que ellos mantienen medianas estables cercanas a 60 minutos diarios, las mujeres oscilan entre 150 y 210 minutos, con una dispersion mucho mayor. Podemos observar que la diferencia es mas pronunciada en los estratos bajos, y aunque disminuye un poco en los altos, nunca desaparece, lo que confirma una desigualdad persistente en la carga de trabajo no remunerado del hogar, y influencia de factores socioeconomicos en donde la carga de trabajo se vuelve mayor para personas con bajos recursos y roles de genero mas marcados.

Tiempo dedicado a tareas domesticas por region y sexo:

estadisticas_por_region_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(region), !is.na(sexo)) %>%
  group_by(region, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(region, sexo)
## `summarise()` has grouped output by 'region'. You can override using the
## `.groups` argument.
print(estadisticas_por_region_sexo)
## # A tibble: 12 × 6
## # Groups:   region [6]
##    region     sexo       n media mediana    sd
##    <fct>      <fct>  <int> <dbl>   <dbl> <dbl>
##  1 Caribe     Hombre  5127  86.9      60  78.4
##  2 Caribe     Mujer  13293 210.      180 138. 
##  3 Central    Hombre  6972 103.       75  92.0
##  4 Central    Mujer  14471 232.      220 143. 
##  5 Oriental   Hombre  5750  92.9      60  89.1
##  6 Oriental   Mujer  10425 206.      185 139. 
##  7 Pacífica   Hombre  5041  91.5      60  83.5
##  8 Pacífica   Mujer   9957 213.      200 131. 
##  9 Bogotá     Hombre  5494  97.5      65  89.2
## 10 Bogotá     Mujer   9274 198.      180 139. 
## 11 San Andrés Hombre   823  99.8      60  61.6
## 12 San Andrés Mujer   1371 174.      150  99.2

Enla tabla demuestra que en todas las regiones de colombia las mujeres dedican mas tiempo a las tareas domesticas que los hombres,comprobando asi la presencia no solo de un factor socioeconomico que influya en la desigualdad de genero respecto al tiempo invertido en las tareas domesticas, sino tambien un factor geografico y cultural, en el que las distintas politicas de las regiones influyen en la carga de trabajo no remunerados dentro del hogar. Esto se confirma con la mediana, ya que, en las mujeres se situa entre los 150 minutos diarios y los 220. Mientras que los que en los hombres se mantiene entre los 60 y 75 minutos. Ese factor geografico se hace aun mas evidente en las regiones de Caribe, Central y Bogotá, zonas en las que se aprecia una mayor dispersión en el tiempo invertido por parte de las mujeres (desde 138 minutos hasta 142 minutos), lo que sugiere una mayor desigualdad a causa de politicas mas ortodoxas.

Por su parte, la media se mantiene entre los 174 y los 231 minutos al dia en las mujeres, superando ampliamente los promedios de entre 86 y 103 minutos al dia de los hombres, sosteniendo asi la brecha entre hombres y mujeres.

library(dplyr)

iqr_tareas_domesticas_estrato_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(Estrato_tarifa), !is.na(sexo)) %>%
  group_by(Estrato_tarifa, sexo) %>%
  summarise(
    Q1 = quantile(tiempo_tareas_domesticas, 0.25, na.rm = TRUE),
    Mediana = quantile(tiempo_tareas_domesticas, 0.5, na.rm = TRUE),
    Q3 = quantile(tiempo_tareas_domesticas, 0.75, na.rm = TRUE),
    IQR = IQR(tiempo_tareas_domesticas, na.rm = TRUE),
    .groups = "drop"
  )

print(iqr_tareas_domesticas_estrato_sexo)
## # A tibble: 12 × 6
##    Estrato_tarifa sexo      Q1 Mediana    Q3   IQR
##    <fct>          <fct>  <dbl>   <dbl> <dbl> <dbl>
##  1 Estrato 1      Hombre    30      60   120    90
##  2 Estrato 1      Mujer    120     210   300   180
##  3 Estrato 2      Hombre    30      60   120    90
##  4 Estrato 2      Mujer    105     190   300   195
##  5 Estrato 3      Hombre    30      63   130   100
##  6 Estrato 3      Mujer     90     180   295   205
##  7 Estrato 4      Hombre    30      60   125    95
##  8 Estrato 4      Mujer     90     170   265   175
##  9 Estrato 5      Hombre    30      70   135   105
## 10 Estrato 5      Mujer     70     150   260   190
## 11 Estrato 6      Hombre    30      60   135   105
## 12 Estrato 6      Mujer     80     150   270   190

Tiempo dedicado a tareas domesticas por grupo de edad y sexo:

# Tiempo dedicado a tareas domésticas por grupo de edad y sexo
datos <- datos %>%
  mutate(
    edad_grupos = cut(edad,
                      breaks = seq(0, 100, by = 10),
                      right = FALSE,
                      include.lowest = TRUE,
                      labels = c("0-9", "10-19", "20-29", "30-39", "40-49",
                                 "50-59", "60-69", "70-79", "80-89", "90+"))
  )

estadisticas_por_edad_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  group_by(edad_grupos, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(edad_grupos, sexo)
## `summarise()` has grouped output by 'edad_grupos'. You can override using the
## `.groups` argument.
print(estadisticas_por_edad_sexo)
## # A tibble: 18 × 6
## # Groups:   edad_grupos [9]
##    edad_grupos sexo       n media mediana    sd
##    <fct>       <fct>  <int> <dbl>   <dbl> <dbl>
##  1 10-19       Hombre  5988  68.3      60  62.8
##  2 10-19       Mujer   8519 111.       80  94.0
##  3 20-29       Hombre  5640  88.9      60  81.1
##  4 20-29       Mujer  10411 194.      180 132. 
##  5 30-39       Hombre  4640  97.9      65  86.6
##  6 30-39       Mujer  10598 228.      210 136. 
##  7 40-49       Hombre  4014 104.       75  92.5
##  8 40-49       Mujer   9242 243.      230 140. 
##  9 50-59       Hombre  3730 109.       85  93.0
## 10 50-59       Mujer   8783 253.      240 139. 
## 11 60-69       Hombre  3014 116.       90  99.6
## 12 60-69       Mujer   6594 250.      240 134. 
## 13 70-79       Hombre  1631 114.       90  98.2
## 14 70-79       Mujer   3506 230.      210 130. 
## 15 80-89       Hombre   508 101.       70  85.3
## 16 80-89       Mujer   1027 175.      150 125. 
## 17 90+         Hombre    42  86.0      60  79.0
## 18 90+         Mujer    111 119.       90  98.1
datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  ggplot(aes(x = edad_grupos, y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a tareas domesticas por grupo de edad y sexo",
    x = "Grupo de edad",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Dark2") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Interpretacion:

Tanto el grafico como la tabla evidencian que el tiempo dedicado a las tareas domesticas aumenta con la edad en ambos sexos. Sin embargo, no es un aumento proporcional en hombres y mujeres, ya que existe una importante brecha entre los dos sexos en las que las mujeres salen afectadas. Esto se observa desde el rango de 10-19 años, donde los hombres presentan un promedio de 68 minutos al dia (poco mas de una hora) y una mediana de 60 minutos, mientras que las mujeres tienen una media de 110 minutos (poco menos de dos horas) y una mediana de 80 minutos, siendo esta la menor diferencia entre medianas de toda la tabla y de todos los analisis de esta variable. Esto a su vez, indica que la desigualdad esta desde las edades mas temprenas,al mostrar que desde pequeños se les impone a las mujeres las tareas domesticas como una obligacion mientras que a los hombres se les exime de esas responsabilidades. lo que puede tener repercucion en la distribucion de estas en edades mayores, Esto se refuerza con el rango de edad de 20-29 años, en la que suelen consolidarse como tareas que requieren un trabajo no remunerado dentro del hogar, en este periodo los hombres mantienen una mediana de 60 minutos y las mujeres aumentan hasta los 180 minutos (3 horas diarias). A los 30-39 años, la brecha se intentifica a la vez que la carga laboral y familiar, donde las mujeres llegan hasta los 227 minutos (3 horas y 27 minutos).la dispersión (sd) es mayor en mujeres en todos los rangos de edad, lo que indica que algunas dedican tiempos extremadamente altos que se ven reflejados en valores atipicos de hasta mas de 1400 minutos (23 horas). Esto demuestra a su vez que la carga desproporcionada impuesta a la mujer en lo que respecta a las tareas del hogar no es algo que aparezca a una edad especifica sino que esta presente durante todo su ciclo de vida.

Histograma higiene propia:

library(ggplot2)


datos_filtrados <- datos[!is.na(datos$tiempo_higiene_propia) & datos$tiempo_higiene_propia != 0, ]


media_higiene <- mean(datos_filtrados$tiempo_higiene_propia)
sd_higiene <- sd(datos_filtrados$tiempo_higiene_propia)


ggplot(datos_filtrados, aes(x = tiempo_higiene_propia)) +
  geom_histogram(binwidth = 20, fill = "skyblue", color = "black") +
  geom_vline(xintercept = media_higiene, color = "red", linetype = "solid", size = 1) +
  geom_vline(xintercept = media_higiene + sd_higiene, color = "darkgreen", linetype = "dashed") +
  geom_vline(xintercept = media_higiene - sd_higiene, color = "darkgreen", linetype = "dashed") +
  labs(title = "Distribución del tiempo dedicado a higiene personal propia",
       x = "Tiempo en minutos",
       y = "Frecuencia") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Interpretacion: El histograma muestra que la mayor parte de la poblacion encuestada por el DANE dedica un tiempo reducido a la higiene personal, concentrandose principalmente entre los 10 y 60 minutos al dia. La distribución es asimétrica a la derecha, con pocos casos que superan los 120 minutos y algunos valores extremos que alcanzan hasta mas de 600 minutos. La media (linea roja) se encuentra desplazada hacia la derecha respecto a la mediana (linea verde), lo que confirma la presencia de outliers que elevan el promedio. En conjunto, los datos evidencian que la mayoria de personas dedican una hora al dia a su higiene personal y unos pocos dedican mucho mas tiempo.

Tiempo tarea domestica:

library(ggplot2)


datos_filtrados <- datos[!is.na(datos$tiempo_tareas_domesticas) & datos$tiempo_tareas_domesticas != 0, ]


media_tareas <- mean(datos_filtrados$tiempo_tareas_domesticas)
sd_tareas <- sd(datos_filtrados$tiempo_tareas_domesticas)


ggplot(datos_filtrados, aes(x = tiempo_tareas_domesticas)) +
  geom_histogram(binwidth = 30, fill = "skyblue", color = "black") +
  geom_vline(xintercept = media_tareas, color = "red", linetype = "solid", size = 1) +
  geom_vline(xintercept = media_tareas + sd_tareas, color = "darkgreen", linetype = "dashed") +
  geom_vline(xintercept = media_tareas - sd_tareas, color = "darkgreen", linetype = "dashed") +
  labs(title = "Distribución del tiempo dedicado a tareas domésticas",
       x = "Tiempo en minutos",
       y = "Frecuencia") +
  theme_minimal()

Interpretacion:

El histograma evidencia una mayor concentracion de datos entre los 30 y los 250 minutos diarios a las tareas domesticas, con un enfasis en los 100-150 minutos. La distribución es asimetrica a la derecha, con una cola larga que refleja la existencia de casos que superan los 600 minutos e incluso llegan a alcanzar mas de 1000. La media se ubica por encima de la mediana, lo que indica que los valores atipicos elevan al promedio. En conjunto, los datos muestran que, aunque la mayor parte invierta entre 1 y 4 horas, existe un grupo reducido que dedica tiempo mucho mayores, generando asi dispersion.

Grafico de barras:

Sexo:

library(ggplot2)


ggplot(datos, aes(x = sexo)) +
  geom_bar(fill = "steelblue", alpha = 0.7) +
  labs(title = "Distribución por sexo",
       x = "Sexo",
       y = "Frecuencia") +
  theme_minimal()

Interpretacion:

La gráfica evidencia que la muestra está compuesta por una cantidad relativamente equilibrada de hombres y mujeres. Sin embargo . Sin embargo, se observa una ligera mayoría de mujeres frente a los hombres. Lo que indica que las mujeres estan un poco mas representadas, factor fundamental ya que se busca analizar las diferencias en el tiempo dedicado a la higiene y a las tareas domésticas entre sexos, esta mayor proporción de mujeres puede influir en los resultados descriptivos generales.

Estrato:

library(ggplot2)

ggplot(datos, aes(x = Estrato_tarifa )) +
  geom_bar(fill = "coral", alpha = 0.7) +
  labs(title = "Distribución por estrato",
       x = "Estrato",
       y = "Frecuencia") +
  theme_minimal()

La gráfica muestra que la mayor parte de las personas encuestadas pertenecen a los estratos socioeconómicos más bajos. El estrato 1 es el más numeroso, con cerca de 60.000 casos, seguido del estrato 2, con poco menos de 50.000. Juntos, estos dos grupos concentran la mayor parte de la población, lo que tiene implicaciones directas en las demas variables ya que las condiciones materiales del hogar y el acceso a recursos suelen estar fuertemente relacionados con la disponibilidad de tiempo para tareas domésticas y de cuidado.

                         Conclusiones:
                         

Podemos encontrar que el analisis responde directamente a la pregunta de investigacion, demostrando que factores culturales, sociales, geograficos, politicos, generacionales y economicos influyen en que existe una diferencia entre hombres y mujeres respecto al tiempo al que dedican a realizar tareas domesticas, esto se refuerza con los resultados, graficos y tablas que se obtuvieron de diversas variables, donde la carga en el trabajo no remunerado dentro del hogar de las mujeres era mucho mayor que las de los hombres, teniendo una mediana de hasta el doble de la de los hombres en cada uno de los casos.

La segunda variables evaludada refuerza aun mas la idea de que existen ciertos roles de genero que influyen en el comportamiento de los hombres y mujeres, llegando a diferenciar negativamente, a promover desigualdad y estereotipos dañinos, que se vuelven mas fuertes con las presencia de otras variables que afectan en estas problematicas y crean expectativas sociales respecto a lo que deben hacer, en la higiene propia, las mujeres superaron por un tiempo relativamente amplio a los hombres, principalmente si consideramos que en su mayoria ninguna de estas actividades superan la hora al dia. Entre estos datos, la presencia de distintos outliers entre las mujeres que superan los 120 minutos o los 400 nos hablan de un posible estandar de belleza agresivo que obliga a las mujeres a invertir mas tiempo en su aseo y vestimenta con tal de cumplirlo o al menos acercarse, mientras que en los hombres, ese estandar es menos agresivo y les permite mas margen de maniobra respecto al tiempo que gastan en su higiene.

Con esto, podemos encontrar que existe un papel de los roles de genero en la distribución de tiempo en ciertas actividades que social y culturalmente se han asociado a lo largo del tiempo a la mujer, y este papel se ve afectado por diversos factores que llegan a reducir o aumentar esas expectativas.