R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

  1. Base de datos
library(haven)
## Warning: package 'haven' was built under R version 4.4.3
datos <- read_dta("C:/Users/USUARIO/Downloads/ENUT2020.dta")
  1. Pregunta de investigacion

¿Existen diferencias entre hombres y mujeres en el tiempo dedicado a la higiene y las tareas domesticas?

Justificacion:

Esta pregunta es relevante porque busca analizar cómo los roles de género influyen en la distribución del tiempo dedicado a la higiene personal y a las tareas domésticas entre hombres y mujeres. Comprender estas dinámicas permite visibilizar desigualdades persistentes en la cultura colombiana, como la sobrecarga de trabajo no remunerado que recae principalmente en las mujeres, así como las diferencias en la participación de los hombres en estas actividades. Este análisis es fundamental para promover la equidad de género y diseñar políticas públicas que fomenten una distribución más justa de las responsabilidades en el hogar.

  1. Variables

Continuas: Tiempo higiene, Edad, Tiempo tareas domesticas.

Categoricas: Sexo, estrato socioeconomico, region.

Justificacion:

La variable sexo es fundamental porque permite analizar y comparar las diferencias entre hombres y mujeres en el tiempo dedicado a la higiene y las tareas domesticas, visibilizando asi las desigualdades de genero en la distribución dem trabajo no remunerado y el sesgo cultural hacia la higiene y preparacion segun el sexo; la edad permite comprender cómo estas actovidadrs varían a lo largo de las etapas de la vida, evidenciando la influencia de roles de genero, y como estos cambian entre las generaciones; la region refleja las diferencias culturales y sociales en las distintas zonas del pais, mostrando como las normas y expectativas afectan considerablemenre la participacion en estas actividades; el estrato socioeconomixo influye en la carga domestica, ya que en estratos najos suele existir una mayor carga de trabajo no remunerado, mientras que en estratos altos puede haber mayor delegacion de estas tareas; tiempo higiene es relevante debido a que permite conocer cuanto tiempo las personas dedican al cuidado de su apariencia y salud, reflejando patrones culturales, habitos de social y diferencias en la construccion subjetiva que se tiene de cada genero; tiempo en tareas domesticas es clave para analizar la distribución del trabajo no remunerado, ya que estas actividades suelen recaer de manera desproporcionada sobre las mujeres, visibilizando la persistencia de roles de género tradicionales y su impacto en la desigualdad social.

Tiempo tareas domesticas e higiene:

sumar_con_na <- function(df) {
  suma <- rowSums(df, na.rm = TRUE)       
  n_no_na <- rowSums(!is.na(df))          
  suma[n_no_na == 0] <- NA                 
  return(suma)
}

# Variables horas para higiene personal propia
vars_higiene_propia <- c(
  "p1144s3a1",  
  "p1144s4a1"   
)

# Variables horas para cuidado de higiene de otra persona
vars_higiene_otro <- c(
  "p1134s1a1",
  "p1134s2a1",
  "p1134s3a1"
)

# Variables horas para tareas domésticas
vars_tareas_domesticas <- c(
  "p1143s1a1",
  "p1143s2a1",
  "p1143s3a1",
  "p1143s4a1",
  "p1142s1a1",
  "p1142s2a1",
  "p1142s3a1",
  "p1142s4a1",
  "p1136s1a1",
  "p1136s2a1",
  "p1136s3a1",
  "p1136s4a1",
  "p1136s7a1",
  "p1128s1a1",
  "p1128s2a1",
  "p1128s3a1",
  "p1128s8a1"
)

# Convertir horas a minutos para las variables seleccionadas
datos_higiene_propia <- datos[vars_higiene_propia] * 60
datos_higiene_otro <- datos[vars_higiene_otro] * 60
datos_tareas <- datos[vars_tareas_domesticas] * 60

# Crear variable tiempo higiene personal propia (en minutos)
datos$tiempo_higiene_propia <- sumar_con_na(datos_higiene_propia)

# Crear variable tiempo cuidado higiene de otra persona (en minutos)
datos$tiempo_higiene_otro <- sumar_con_na(datos_higiene_otro)

datos$tiempo_tareas_domesticas <- sumar_con_na(datos_tareas)

Variable sexo:

`

datos$sexo <- ifelse(datos$p6020 == 1, "Hombre",
                     ifelse(datos$p6020 == 2, "Mujer", NA))

datos$sexo <- factor(datos$sexo, levels = c("Hombre", "Mujer"))

table(datos$sexo)
## 
## Hombre  Mujer 
##  69913  77666

Variable Edad:

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
datos <- datos %>%
  rename(edad = p6040)

summary(datos$edad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.00   17.00   33.00   34.98   51.00  115.00

Variable Region:

datos$region <- factor(datos$region,
                       levels = 1:6,
                       labels = c("Caribe", "Central", "Oriental", 
                                  "Pacífica", "Bogotá", "San Andrés"))


head(datos$region)
## [1] Central Central Central Central Central Central
## Levels: Caribe Central Oriental Pacífica Bogotá San Andrés

Variable estrato:

datos$Estrato_tarifa <- factor(datos$p4030s1a1,
                               levels = 1:6,
                               labels = c("Estrato 1", "Estrato 2", "Estrato 3",
                                          "Estrato 4", "Estrato 5", "Estrato 6"))


head(datos$Estrato_tarifa)
## [1] Estrato 4 Estrato 4 Estrato 2 Estrato 2 Estrato 2 Estrato 2
## Levels: Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6
  1. Estadistica descriptiva

Exclusion 0: Con el objetivo de mejorar los resultados dados, se excluyeron los 0 de ciertas medidas, ya que la presencia de estos eran incoherentes con ciertas variables como la de higiene personal o tareas domesticas, ademas el objetivo de la investigacion es analizar el tiempo que dedican como tal.

Media:

mean(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
## [1] 66.66267
mean(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
## [1] 182.7424
mean(datos$edad[datos$edad != 0], na.rm = TRUE)
## [1] 35.34022

Interpretacion:

La edad promedio es 35 años, lo cual indica que la poblacion encuestada por el DANE estaba compuesta principalmente por gente adultos jovenes y de mediana edad.

En promedio, la poblacion encuestada por el DANE dedican aproximadamente 66.6 minutos al dia a actividades relacionadas con su aseo, vestirse, arreglarse y organizar su cabello. Esto evidencia que en colombia es comun que las personas no le dediquen menos de una hora, sino poco mas de una. Lo que a su vez, sirve como indicativo de que estas actividades no requieren mucho tiempo.

El promedio dedicado a tareas domesticas es de 182.2 minutos, es decir, 3 horas y 2 minutos. Lo que refleja una considerable carga de trabajo no remunerado para los hogares de Colombia y a su vez, lo exigentes que son las diversas tareas del hogar y el tiempo que requieren.

Mediana:

median(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
## [1] 60
median(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
## [1] 180
median(datos$edad[datos$edad != 0], na.rm = TRUE)
## [1] 33

Las personas dedican 60 minutos o menos al dia a actividades de higiene personal propia como asearse, vertirse, etc. Y la otra mitad dedica mas de 60 minutos a estas actividades. Lo que refleja un tiempo apropiado para la carga que estas actividades implican y demostrando una hora al dia como un valor comun.

indica que la mitad de las personas dedican hasta 180 minutos a las tareas domestica, lo que muestra la dificultad de este trabajo, la pesada carga que es el trabajo no remunerado dentro del hogar, dejando entre ver las posibles implicaciones en la distribucion del tiempo y la carga laboral dentro de las familias colombianas.

la mitad de la poblacion tiene 33 años o menos, que va en sintonia por los resultados obtenidos en la media que era de 35 años, lo que refuerza aun mas la idea de que la poblacion encuestada esta compuesta principalmente por jovenes adultos y de mediana edad. Lo que a su vez puede influir en los patrones de tiempo dedicados a higiene y tareas domesticas, ya que este grupo etario suele estar en etapas activas de la vida familiar y laboral.

Desviacion Estandar:

sd(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
## [1] 25.01061
sd(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
## [1] 124.5125
sd(datos$edad[datos$edad != 0], na.rm = TRUE)
## [1] 21.59441

Interpretacion:

La mayoria de la poblacion encuestada por la DANE dedica entre 41 y 91 minutos a su higiene personal (media ± DE). Lo que sugiere la presencia de cierta variabilidad en la duracion de los patrones de limpieza de los individuos, con algunos utilizando mas o menos tiempo.

La desviacion estandar de 124.51 minutos muestra una gran dispersion respecto al tiempo dedicado a tareas domesticas, con una variabilidad promedio de mas de 2 horas y 2 minutos frente a la media. Esto indica importantes diferentes entre personas o grupos en la carga de trabajo domestico, de modo que ciertos individuos le dedican poco tiempo al trabajo no remunerado dentro del hogar comparado al largo tiempo que otros le pueden dedicar.

La dispersion promedio de la edad es de 21.59, lo que señala la presencia de una considerable variabilidad alrededor de la media. Esto sugiere que la poblacion encuestada por el DANE incluye un porcentaje considerable de jovenes y adultos mayores, lo que puede influir en los resultados del tiempo invertido en tareas domesticas e higiene. Debido a que estas edades estan menos dispuestos y tienen mayores limitaciones al momento de realizar las actividades anteriormente mencionadas.

Rango:

min_cuidado <- min(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
max_cuidado <- max(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)
rango_cuidado <- max_cuidado - min_cuidado

Interpretacion:

El valor minimo es de 60 minutos, mientras que el valor maximo es 600 minutos al dia, lo que indica que el rango es de 540 minutos diarios, esto significa que existe una gran variabilidad en el tiempo dedicado a la higiene personal dentro de la poblacion. A su vez, muestra que aunque algunos individuos dedican 1 hora, otros pueden llegar hasta 10 horas, lo que evidencia las diferentes dinamicas que los estilos de vida traen consigo, mientras que abre la posibilidad de una mala interpretacion de la pregunta o de una condicion de salud que influya en sus patroness de higiene personal.

min_cuidado <- min(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
max_cuidado <- max(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)
rango_cuidado <- max_cuidado - min_cuidado

Interpretacion:

El valor minimo es de 60 minutos al dia, mientras que el valor maximo es de 1440 minutos al dia, exactamente 24 horas, por lo cual el rango es de 1380 minutos al dia, 23 horas. Este dato muestra la presencia de una enorme variabilidad en el tiempo dedicado a tareas domestica. Lo que da indicios de que a pesar de que la mayoria dedica un tiempo de una hora, lo que esconsiderado produnte, otros casos extremos reportan dedicar un dia completo a estas actividades, lo que refleja diferenecias muy marcadas en las responsabilidades domesticas, sobrecarga domenticas ,condiciones de vida o la posibilidad de que malinterpreto la pregunta.

min_cuidado <- min(datos$edad[datos$edad != 0], na.rm = TRUE)
max_cuidado <- max(datos$edad[datos$edad != 0], na.rm = TRUE)
rango_cuidado <- max_cuidado - min_cuidado

El valor minimo es de 1 año de edad, mientras que el maximo es de 115 años de edad, por lo que el rango es de 114 años de edad. Estos datos evidencian que la DANA considero a cada persona o intengrante de un hogar encuestado, lo cual genera cierta variabilidad en la edad y la presencia de datos extremos que se alejan significativamente de la media y la mediana.

Asimetria y curtosis:

# Librería para calcular asimetría y curtosis
library(e1071)
## Warning: package 'e1071' was built under R version 4.4.3
skewness(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)   # Asimetría
## [1] 1.339942
kurtosis(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas != 0], na.rm = TRUE)   # Curtosis
## [1] 2.736993
skewness(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)   # Asimetría
## [1] 6.420238
kurtosis(datos$tiempo_higiene_propia[datos$tiempo_higiene_propia != 0], na.rm = TRUE)   # Curtosis
## [1] 73.05867
skewness(datos$edad[datos$edad != 0], na.rm = TRUE)   # Asimetría
## [1] 0.3577311
kurtosis(datos$edad[datos$edad != 0], na.rm = TRUE)   # Curtosis
## [1] -0.7407028

Interpretacion:

La asimetria del tiempo invertido en tareas domesticas es 1.3 lo que indica que la mayoria dedica pocos minutos a las tareas domesticas, pero un grupo mas pequeño dedica muchas, teniendo asi un sesgo moderado a la derecha (cola larga a la derecha)

La asimetria del tiempo invertido en higiene es de 6.4, lo que indica que la mayoria dedica tiempo bajos o moderados a la higiene, pero estan presentes casos muy altos que distorsionan la distribuccion, de alli que haya un sesgo muy fuerte a la derecha(cola larga)

La asimetria de la edad es de 0.36, lo que significa que la distribucion de la edad es casi simetrica, con una ligera inclinacion hacia las edades mayores. Lo que indica que la mayoria de las personas estan cercanas a la media con una muy leve sesgo hacia la derecha.

curtosis:

La curtosis del tiempo dedicado en tareas domesticas es de 2.7, que al ser cercana a 3, indica que la distribucion tiene una forma similar al de una distribucion normal en cuanto a la concentracion de datos en la cola y el pico, no muy picuda o plana.

La curtosis del tiempo invertido en higiene es de 73.05 lo que indica una distribución con picos muy elevados y colas pesadas, de modo que muchos valores estan presentes cerca de la mediana pero tambien valores extremos muy alejados, esto termina por confirmar la presencia de valores atipicos.

La curtuosis de la edad es de -0.74, lo que revela que la distribucion es mas plana que una normal, con colas mas ligeras y menos concentradas en el pico, esto indica que la edad esta distribuida de manera mas uniforme sin muchos valores extremos.

Moda:

moda <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

moda(datos$sexo)
## [1] Mujer
## Levels: Hombre Mujer
moda(datos$Estrato_tarifa)
## [1] Estrato 1
## Levels: Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6
moda(datos$region)
## [1] Caribe
## Levels: Caribe Central Oriental Pacífica Bogotá San Andrés

El sexo mas frecuente es la mujer, lo que muestra que la mayoria de encuestados por la DANE son mujeres, esto es extremadamente relevante ya que puede influir en los patrones observados de tiempo dedicado a la higiene propia y a las tares domesticas, debido a que la cultura colombina aun esta sujeta a roles de genero machistas que provocan que las mujeres suelen asumir esas actividades.

La moda del estrato socioeconomico es el estrato 1, dato fundamental debido a que esta es la clase social mas bajo. Lo que sugiere una muestra mas concentrada en personas de menores recursos, lo que puede afectar el acceso a servicios, habitos y tiempos dedicados a la higiene y tareas domesticadas, ademas es comun que los individuos pertenecientes a este estrato social no tengan facilidad a la hora de acceder a la educacion y por eso continuen con creencias antiguas muy arraigadas, que implican una presencia mayor de la mujer en trabajos no remunerados dentro del hogar.

La moda es Caribe, evidenciando que la mayoria de los participantes provienen de esta region. Aspecto importante debido a que esta region tiene caracteristicas culturales, climaticas y socioeconomicas que influyan directamente dentro de la distribuccion de los habitos de higiene y del trabajo no remunerado dentro del hogar.

Frecuencia relativa:

datos_region <- datos[!is.na(datos$region) & datos$region != 0, ]
freq_region_abs <- table(datos_region$region)
freq_region_rel <- prop.table(freq_region_abs)
freq_region_pct <- round(freq_region_rel * 100, 2)


datos_estrato <- datos[!is.na(datos$Estrato_tarifa) & datos$Estrato_tarifa != 0, ]
freq_estrato_abs <- table(datos_estrato$Estrato_tarifa)
freq_estrato_rel <- prop.table(freq_estrato_abs)
freq_estrato_pct <- round(freq_estrato_rel * 100, 2)


datos_sexo <- datos[!is.na(datos$sexo) & datos$sexo != 0, ]
freq_sexo_abs <- table(datos_sexo$sexo)
freq_sexo_rel <- prop.table(freq_sexo_abs)
freq_sexo_pct <- round(freq_sexo_rel * 100, 2)


list(
  "Frecuencia relativa Región (%)" = freq_region_pct,
  "Frecuencia relativa Estrato (%)" = freq_estrato_pct,
  "Frecuencia relativa Sexo (%)" = freq_sexo_pct
)
## $`Frecuencia relativa Región (%)`
## 
##     Caribe    Central   Oriental   Pacífica     Bogotá San Andrés 
##      24.35      24.19      17.73      16.14      15.28       2.30 
## 
## $`Frecuencia relativa Estrato (%)`
## 
## Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6 
##     40.00     33.43     18.26      5.22      2.01      1.07 
## 
## $`Frecuencia relativa Sexo (%)`
## 
## Hombre  Mujer 
##  47.37  52.63

Interpretación:

La muestra está distribuida principalmente entre las regiones Caribe y Central, cuyos datos representan casi la mitad de los encuestados (48.54%). Mientras las regiones Oriental, Pacífica y Bogotá tienen una representación moderada. San Andrés es la menos representada con solo el 2.3%. Esto señala que los resultados del análisis estarán principalmente influenciados por las características culturales, politicas sociales y económicas de las regiones Caribe y Central.

La muestra esta relativamente pareja en cuanto a sexo, con una ligera superioridad de mujeres (52.63%). Esto es relevante para el analisis de diferencias en el tiempo dedicado a higiene y tareas domesticas, ya que permite comparar ambos grupos con una representacion similar, con un ligero sesgo hacia las mujeres, quienes culturalmente en colombia, han sido quienes usualmente suelen asumir una mayor carga en estas actividades.

La mayorias de la muestra pertenece a los estratos socioeconomicos mas bajos: el 40% al estrato 1 y el 33.43% al estrato 2, junto equivale al 73% de la poblacion. Mientras que los estratos medios y altos (3 a 6) estan poco representados. Lo que refleja que los resultados observados en los patrones de tiempo de higiene y tareas domesticas reflejen principalmente las condiciones y habitos de personas con menores recursos economicos, lo que puede influir a su vez, en la carga de trabajo no remunerado y el acceso a servicios.

Graficas:

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.4.3
datos_filtrados <- datos[!is.na(datos$tiempo_higiene_propia) & datos$tiempo_higiene_propia != 0, ]


media_higiene <- mean(datos_filtrados$tiempo_higiene_propia)
sd_higiene <- sd(datos_filtrados$tiempo_higiene_propia)


ggplot(datos_filtrados, aes(x = tiempo_higiene_propia)) +
  geom_histogram(binwidth = 20, fill = "skyblue", color = "black") +
  geom_vline(xintercept = media_higiene, color = "red", linetype = "solid", size = 1) +
  geom_vline(xintercept = media_higiene + sd_higiene, color = "darkgreen", linetype = "dashed") +
  geom_vline(xintercept = media_higiene - sd_higiene, color = "darkgreen", linetype = "dashed") +
  labs(title = "Distribución del tiempo dedicado a higiene personal propia",
       x = "Tiempo en minutos",
       y = "Frecuencia") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Interpretacion:

En la encuesta realizada por el DANE, el tiempo destinado a la higien personal es cercano a 60 minutos diarios. Siendo asi que la mayoria de los individuos (aproximadamente un 68%) dedica entre 41 y 91 minutos, rango señalado por las lineas verdes, mientras que solo unos pocos casos atipicos reportan tiempos mucho mayores que se alejen del comportamiento general, lo que refuerza la idea de que el tiempo invertido a la higiene es relativamente corto y no suele variar demasiado mas alla de datos atipicos.

Tiempo tarea domestica:

library(ggplot2)


datos_filtrados <- datos[!is.na(datos$tiempo_tareas_domesticas) & datos$tiempo_tareas_domesticas != 0, ]


media_tareas <- mean(datos_filtrados$tiempo_tareas_domesticas)
sd_tareas <- sd(datos_filtrados$tiempo_tareas_domesticas)


ggplot(datos_filtrados, aes(x = tiempo_tareas_domesticas)) +
  geom_histogram(binwidth = 30, fill = "skyblue", color = "black") +
  geom_vline(xintercept = media_tareas, color = "red", linetype = "solid", size = 1) +
  geom_vline(xintercept = media_tareas + sd_tareas, color = "darkgreen", linetype = "dashed") +
  geom_vline(xintercept = media_tareas - sd_tareas, color = "darkgreen", linetype = "dashed") +
  labs(title = "Distribución del tiempo dedicado a tareas domésticas",
       x = "Tiempo en minutos",
       y = "Frecuencia") +
  theme_minimal()

Interpretacion:

En la encuesta realizada por el DANE, el tiempo dedicado a las tareas domesticas es de alrededor de 200 minutos diarios. Aproximadamente 70% de la poblacion se concentra entre 58 y 230 minutos, rango indicado por las lineas verdes, mientras que algunos pocos casos excepcionales dedican tiempos muy elevados que superan las 20 horas, alejandose por mucho del comportamiento general.

datos_edad <- datos[!is.na(datos$edad) & datos$edad != 0, ]
ggplot(datos_edad, aes(x = edad)) +
  geom_histogram(binwidth = 5, fill = "salmon", color = "black") +
  labs(title = "Histograma: Edad",
       x = "Edad (años)",
       y = "Frecuencia") +
  theme_minimal()

Interpretacion:

En la enceusta realizada por el DANE, la distribucion de edades muestra una mayor concentracion de personas entre los 15 y 35 años, alcanzando su punto mas alto alrededor de los 25 años. Desde esas edad, la frecuencia comienza a descender progresivamente, con una disminucio marcada despues de los años 60 y valores atipicos que superan los 60. Lo que refleja que la poblacion compuesta principalmente por personas de estrato socioeconomico de estrato 1 y 2 es mayoritariamente joven y la presencia de personas en edades avanzadas leve en comparacion.

Boxplot:

datos_violin <- datos[!is.na(datos$tiempo_higiene_propia) & datos$tiempo_higiene_propia != 0, ]


ggplot(datos_violin, aes(x = "", y = tiempo_higiene_propia)) +
  geom_violin(fill = "lightblue", alpha = 0.6, trim = FALSE) +
  geom_boxplot(width = 0.1, fill = "white") +
  labs(title = "Distribución de tiempo dedicado a higiene personal (violín + caja)",
       x = NULL, y = "Tiempo (minutos)") +
  theme_minimal()

Interpretacion:

El gráfico muestra que la mayoría de los encuestados dedica alrededor de 60 minutos a la higiene personal, pero existe un pequeño grupo que supera las 6 horas, llegando hasta las 10 horas, lo cual alarga la cola superior de la distribución. Estos valores extremos no representan el comportamiento general, pero sí son importantes porque pueden reflejar situaciones particulares: personas con hábitos de autocuidado muy intensivos, actividades relacionadas con la estética o, incluso, problemas de registro en la encuesta.

tareas domesticas:

library(ggplot2)


datos_violin_tareas <- datos[!is.na(datos$tiempo_tareas_domesticas) & datos$tiempo_tareas_domesticas != 0, ]


ggplot(datos_violin_tareas, aes(x = "", y = tiempo_tareas_domesticas)) +
  geom_violin(fill = "lightgreen", alpha = 0.6, trim = FALSE) +
  geom_boxplot(width = 0.1, fill = "white") +
  labs(title = "Distribución de tiempo dedicado a tareas domésticas (violín + caja)",
       x = NULL, y = "Tiempo (minutos)") +
  theme_minimal()

Interpretacion:

El grafico revela que la mayoria de los encuestados dedica entre 2 y 4 horas diarias a las tareas domesticas, que coincide con la media y mediana calculadas (alrededor de 180-200 minutos). Sin embargo, se observa una amplia dispersion y la presencia de valores extremos que llegan hasta las 24 horas al dia. Este tipo de datos extremos, aunque poco frecuentes, resultan relevantes porque evidencian la percepción de una sobrecarga doméstica en ciertos hogares, donde una persona puede asumir prácticamente todo el trabajo no remunerado, y al haber una desigualdad marcada en la distribuccion de tiempo, esto puede indicar una diferencia significativa entre grupos.

Grafico de barras:

Sexo:

library(ggplot2)


ggplot(datos, aes(x = sexo)) +
  geom_bar(fill = "steelblue", alpha = 0.7) +
  labs(title = "Distribución por sexo",
       x = "Sexo",
       y = "Frecuencia") +
  theme_minimal()

Interpretacion:

La gráfica evidencia que la muestra está compuesta por una cantidad relativamente equilibrada de hombres y mujeres. Sin embargo . Sin embargo, se observa una ligera mayoría de mujeres frente a los hombres. Lo que indica que las mujeres estan un poco mas representadas, factor fundamental ya que se busca analizar las diferencias en el tiempo dedicado a la higiene y a las tareas domésticas entre sexos, esta mayor proporción de mujeres puede influir en los resultados descriptivos generales.

Estrato:

library(ggplot2)

ggplot(datos, aes(x = Estrato_tarifa )) +
  geom_bar(fill = "coral", alpha = 0.7) +
  labs(title = "Distribución por estrato",
       x = "Estrato",
       y = "Frecuencia") +
  theme_minimal()

La gráfica muestra que la mayor parte de las personas encuestadas pertenecen a los estratos socioeconómicos más bajos. El estrato 1 es el más numeroso, con cerca de 60.000 casos, seguido del estrato 2, con poco menos de 50.000. Juntos, estos dos grupos concentran la mayor parte de la población, lo que tiene implicaciones directas en las demas variables ya que las condiciones materiales del hogar y el acceso a recursos suelen estar fuertemente relacionados con la disponibilidad de tiempo para tareas domésticas y de cuidado.

  1. Cruces

Tiempo de higiene por estrato y sexo

library(dplyr)

datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia != 0) %>%
  group_by(sexo, Estrato_tarifa) %>%
  summarise(
    n = n(),
    media_cuidado = mean(tiempo_higiene_propia),
    mediana_cuidado = median(tiempo_higiene_propia),
    sd_cuidado = sd(tiempo_higiene_propia)
  )
## `summarise()` has grouped output by 'sexo'. You can override using the
## `.groups` argument.
## # A tibble: 14 × 6
## # Groups:   sexo [2]
##    sexo   Estrato_tarifa     n media_cuidado mediana_cuidado sd_cuidado
##    <fct>  <fct>          <int>         <dbl>           <dbl>      <dbl>
##  1 Hombre Estrato 1       7602          67.7              60       27.8
##  2 Hombre Estrato 2       5708          65.8              60       27.5
##  3 Hombre Estrato 3       3161          65.8              60       24.6
##  4 Hombre Estrato 4        877          65.3              60       26.0
##  5 Hombre Estrato 5        382          63.6              60       14.9
##  6 Hombre Estrato 6        213          64.8              60       16.3
##  7 Hombre <NA>             258          64.2              60       18.6
##  8 Mujer  Estrato 1      12208          67.3              60       23.9
##  9 Mujer  Estrato 2      10280          65.9              60       23.2
## 10 Mujer  Estrato 3       6017          66.7              60       24.6
## 11 Mujer  Estrato 4       1780          67.4              60       25.5
## 12 Mujer  Estrato 5        812          66.8              60       24.2
## 13 Mujer  Estrato 6        450          70.8              60       31.6
## 14 Mujer  <NA>             331          64.0              60       17.0
library(ggplot2)


datos %>%
  filter(
    !is.na(tiempo_higiene_propia),
    tiempo_higiene_propia > 0,
    !is.na(Estrato_tarifa),
    !is.na(sexo)
  ) %>%
  ggplot(aes(x = Estrato_tarifa, y = tiempo_higiene_propia, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3) +
  labs(
    title = "Tiempo de higiene personal por sexo y estrato",
    x = "Estrato socioeconómico",
    y = "Tiempo en minutos"
  ) +
  theme_minimal()

Interpretacion:

El gráfico muestra la distribución del tiempo dedicado a la higiene personal según el sexo y el estrato socioeconómico. En general, tanto hombres como mujeres presentan una mediana similar en todos los estratos, cercana a los 60 minutos diarios. Sin embargo, se observan algunos valores atípicos muy elevados (superiores a 400 minutos), en todos los estratos, pero principalmente en el los del 1 al 4 lo que indica que un pequeño grupo de personas dedica mucho más tiempo a esta actividad que la mayoría de los estratos mas altos, quienes no pasan de 250 minutos. A pesar de eso, no se aprecian diferencias marcadas entre estratos, lo que sugiere que el tiempo de higiene personal es bastante homogéneo entre grupos socioeconómicos y entre sexos. Esto refuerza a su vez los resultados presentes en la tabla, donde los datos son muy similares sin importar el sexo y la clase socioeconomica, con el promedio entre 63 y 70 minutos por dia.

library(dplyr)

datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas != 0) %>%
  group_by(sexo, Estrato_tarifa) %>%
  summarise(
    n = n(),
    media_cuidado = mean(tiempo_tareas_domesticas),
    mediana_cuidado = median(tiempo_tareas_domesticas),
    sd_cuidado = sd(tiempo_tareas_domesticas)
  )
## `summarise()` has grouped output by 'sexo'. You can override using the
## `.groups` argument.
## # A tibble: 14 × 6
## # Groups:   sexo [2]
##    sexo   Estrato_tarifa     n media_cuidado mediana_cuidado sd_cuidado
##    <fct>  <fct>          <int>         <dbl>           <dbl>      <dbl>
##  1 Hombre Estrato 1       5644          115.              60       80.2
##  2 Hombre Estrato 2       5640          120.             120       84.7
##  3 Hombre Estrato 3       3475          118.              60       84.2
##  4 Hombre Estrato 4        937          118.              60       79.7
##  5 Hombre Estrato 5        347          123.              60       89.5
##  6 Hombre Estrato 6        169          129.             120      102. 
##  7 Hombre <NA>             231          116.             120       77.2
##  8 Mujer  Estrato 1      19496          212.             180      131. 
##  9 Mujer  Estrato 2      16938          202.             180      127. 
## 10 Mujer  Estrato 3       9283          197.             180      127. 
## 11 Mujer  Estrato 4       2581          182.             180      119. 
## 12 Mujer  Estrato 5        874          188.             180      125. 
## 13 Mujer  Estrato 6        444          190              180      136. 
## 14 Mujer  <NA>             561          216.             180      121.

Intepretacion:

La tabla muestra una diferencia considerable entre los hombres y las mujeres de diferentes estratos socioeconomicos respecto al tiempo dedicado a las tareas domesticas, mientras los hombres tienen en promedio entre 115 a 130 minutos por dia dedicados a las tareas domesticas, las mujeres desde 182 minutos por dia hasta 212 minutos, lo que muestra una desigualdad en la carga de trabajo no remunerado, desigualdad que aumenta entre mas bajo sea el estracto, ya que en los estrato 1 y 2, la carga de tiempo dedicado a tareas domesticas en mujeres es bastante mayor al de los hombres, ademas que los hombres dedican menos tiempo que en estrato altos y las mujeres mas tiempo.

Visualizacion:

library(dplyr)
library(ggplot2)

datos %>%
  filter(
    !is.na(tiempo_tareas_domesticas),
    tiempo_tareas_domesticas > 0,
    !is.na(Estrato_tarifa),
    !is.na(sexo)
  ) %>%
  ggplot(aes(x = factor(Estrato_tarifa), y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  scale_y_continuous(limits = c(0, quantile(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas > 0], 0.95, na.rm = TRUE)), 
                     breaks = seq(0, 600, 100)) +  
  scale_fill_brewer(palette = "Set2") +
  labs(
    title = "Tiempo dedicado a tareas domésticas por sexo y estrato",
    x = "Estrato socioeconómico",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    axis.title = element_text(size = 12),
    axis.text = element_text(size = 10)
  )
## Warning: Removed 2461 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

Interpretacion: Esta grafica visualiza de forma perfecta lo mencionado anteriormente y la gran desigualdad entre hombres y mujeres respecto a la carga de trabajo no remunerado dentro del hogar, las mujeres tienen medianas cercanas a 180 minutos frenta a 120 de los hombres. Ademas, la dispersion es mayor en las mujeres, lo que refleja que algunas asumen cargas superiores al promedio, llegando incluso hasta 400 minutos diarios. Esto de cierto modo responde a la pregunta de investigacion, ya que señala no solo la existencia de una brecha entre hombres y mujeres respecto al tiempo dedicado a tareas domesticas, sino que muestra que detras de eso existe un factor socioeconomico que aumenta estos resultados de modo que las mujeres alcance datos fuera del promedio.

library(dplyr)

datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas != 0) %>%
  group_by(region, Estrato_tarifa) %>%
  summarise(
    n = n(),
    media_cuidado = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana_cuidado = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd_cuidado = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  )
## `summarise()` has grouped output by 'region'. You can override using the
## `.groups` argument.
## # A tibble: 41 × 6
## # Groups:   region [6]
##    region  Estrato_tarifa     n media_cuidado mediana_cuidado sd_cuidado
##    <fct>   <fct>          <int>         <dbl>           <dbl>      <dbl>
##  1 Caribe  Estrato 1       8980          190.             180       132.
##  2 Caribe  Estrato 2       3046          175.             120       120.
##  3 Caribe  Estrato 3       1214          171.             120       116.
##  4 Caribe  Estrato 4        390          150.             120       102.
##  5 Caribe  Estrato 5        126          168.             120       126.
##  6 Caribe  Estrato 6         85          169.             120       111.
##  7 Caribe  <NA>             472          195.             180       120.
##  8 Central Estrato 1       5440          208.             180       135.
##  9 Central Estrato 2       6666          196.             180       128.
## 10 Central Estrato 3       3099          188.             180       128.
## # ℹ 31 more rows

Grafico:

library(dplyr)
library(ggplot2)

datos %>%
  filter(
    !is.na(tiempo_tareas_domesticas),
    tiempo_tareas_domesticas > 0,
    !is.na(Estrato_tarifa),
    !is.na(region)
  ) %>%
  ggplot(aes(x = factor(Estrato_tarifa), y = tiempo_tareas_domesticas, fill = region)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  scale_y_continuous(
    limits = c(0, quantile(datos$tiempo_tareas_domesticas[datos$tiempo_tareas_domesticas > 0], 0.95, na.rm = TRUE)),
    breaks = seq(0, 600, 100)
  ) +  
  scale_fill_brewer(palette = "Set3") +
  labs(
    title = "Tiempo dedicado a tareas domésticas por región y estrato",
    x = "Estrato socioeconómico",
    y = "Tiempo en minutos",
    fill = "Región"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    axis.title = element_text(size = 12),
    axis.text = element_text(size = 10)
  )
## Warning: Removed 2461 rows containing non-finite outside the scale range
## (`stat_boxplot()`).

Interpretacion:

La grafica muestra que, independientemente del estrato socioeconomico de los encuestados, el tiempo dedicado a tareas domesticas presenta una distribucion relativamente similar entre las regiones, con medias que oscilan entre 100 y 230 minutos diarios y valores atipicos que superan los 400 minutos. En eso, se observa que los estratos mas bajors (1 y 2) sus medianaas tienden a ser ligeramente mas alta, lo que sugiere una mayor carga de trabajo no remunerado dentro del hogar, en contextos de menos recursos, mientras que en estratos mas altos (5 y 6) el tiempo tiende a reducirse, posiblemenre debido a la posibilidad de acceder a servicio externos de apoyos, entre las regiones no hay diferencias marcadas, mas alla de una mayor dispersion en zonas del Caribe, Bogota y la region Oriental. Este grafico confirma lo visto en el anterior de una districion ligeramente diferentes del tiempo dedicado a tareas domesticas de personas con estrato social mas bajo, cosa que tambien puede estar influida por el alto porcentaje de encuentados de estos contextos socioeconomicos.

¿Por que unicamente un cruce con variable tiempo dedico a higiene?

esto se debe a que la muestra es muy homogénea sin importar el sexo, la region o el estrato socioeconomico, debido a que son actividades que no suelen tomar mucho mas de una hora e incluso en algunos caso, menos de 1, por lo que una variacion de este dato es relativamente dificil, principalmente si consideramos que la mayoria de la poblacion encuestada son adultos jovenes o mayores cuyos trabajos probablemente requieran que sean eficientes respecto a su higiene.

  1. Tareas domesticas:
estadisticas_por_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(sexo)) %>%
  group_by(sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(sexo)

print(estadisticas_por_sexo)
## # A tibble: 2 × 5
##   sexo       n media mediana    sd
##   <fct>  <int> <dbl>   <dbl> <dbl>
## 1 Hombre 16443  118.      60  83.0
## 2 Mujer  50177  204.     180 128.

Interpretacion:

La tabla de estadistica descriptiva muestra un claro contraste entre hombres y mujeres en lo que respecta al tiempo dedicado a las tareas domesticas. En promedio, los hombres invierten 117.7 minutos diarios (cerca de 2 horas), mientras que las mujeres dedican 204.1 (aproximadamente 3 horas y 24 minutos). La mediana hace aun mas visible esta diferencia: la mitad de los hombres destinan 60 minutos o menos, de cara a los 180 minutos en las mujeres, tres veces mas. La desviacion estandar es de 128.4 minutos de las mujeres frente a 83.0 en hombres, lo que indica una gran dispersion en el manejo de sus tiempos: mientras algunos hogares pueden compartir de maneras mas equitativa las tareas, en otros los hogares pueden compartir mas equitativamente las tareas. Ademas, es importante considerar la diferencia abismal de numeros entre hombres y mujeres que contestaron la pregunta, en las mujeres fueron 50177, mientras que en los hombres 16443, lo que deja abierta la posibilidad de que los que no contestaron directamente no invertian tiempo a las responsabilidades domesticas, esto refuerza la idea de que el papel y rol cultural dado a la mujer en Colombia sigue influyendo en desigualdades de genero, sobreexplotacion y misoginia.

Para ilustrar de mejor manera estas diferencias, presentare un grafico boxplot:

library(ggplot2)
library(dplyr)

datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(sexo)) %>%
  ggplot(aes(x = sexo, y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3) +
  labs(
    title = "Distribución del tiempo dedicado a tareas domésticas por sexo",
    x = "Sexo",
    y = "Tiempo en minutos"
  ) +
  scale_fill_brewer(palette = "Set2") +
  theme_minimal() +
  theme(
    plot.title = element_text(face = "bold", size = 14, hjust = 0.5),
    axis.title = element_text(size = 12),
    axis.text = element_text(size = 10),
    legend.position = "none"
  )

Interpretacion: El diagrama de cajas visibiliza una diferencia marcada en la distribución del tiempo dedicado a tareas domesticas entre hombres y mujeres, en los hombres, la mediana se ubica en torno a los 60 minutos diarios, con un rango intercuartílico estrecho (Q1 = 30 y Q3 = 120), lo que evidencia que la mayoria dedica entre media hora y dos horas, aunque existen valores atipicos que superan ampliamente las 10 horas. En contraste, las mujeres presentan una mediana cercana a los 180 minutos, que son 3 horas y un rango intercuartílico más amplio (Q1 = 120 y Q3 = 270), esto indica que el 50% de ellas dedica entre 2 y 4.5 horas al dia, con numerosos valores extremos que alcanzan más de 1.000 minutos. Esto complementa la idea previa de que existe una clara desigualdad en la distribución del tiempo en el trabajo no remunerado dentro del hogar.

Tiempo dedicado a tareas domesticas por estrato:

# Tiempo dedicado a tareas domésticas por estrato y sexo
estadisticas_por_estrato_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(Estrato_tarifa), !is.na(sexo)) %>%
  group_by(Estrato_tarifa, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(Estrato_tarifa, sexo)
## `summarise()` has grouped output by 'Estrato_tarifa'. You can override using
## the `.groups` argument.
print(estadisticas_por_estrato_sexo)
## # A tibble: 12 × 6
## # Groups:   Estrato_tarifa [6]
##    Estrato_tarifa sexo       n media mediana    sd
##    <fct>          <fct>  <int> <dbl>   <dbl> <dbl>
##  1 Estrato 1      Hombre  5644  115.      60  80.2
##  2 Estrato 1      Mujer  19496  212.     180 131. 
##  3 Estrato 2      Hombre  5640  120.     120  84.7
##  4 Estrato 2      Mujer  16938  202.     180 127. 
##  5 Estrato 3      Hombre  3475  118.      60  84.2
##  6 Estrato 3      Mujer   9283  197.     180 127. 
##  7 Estrato 4      Hombre   937  118.      60  79.7
##  8 Estrato 4      Mujer   2581  182.     180 119. 
##  9 Estrato 5      Hombre   347  123.      60  89.5
## 10 Estrato 5      Mujer    874  188.     180 125. 
## 11 Estrato 6      Hombre   169  129.     120 102. 
## 12 Estrato 6      Mujer    444  190      180 136.

Interpretacion:

Los datos reflejan una clara desigualdad entre los hombres y las mujeres en lo que respecta a la distribucion de tareas domesticas, y agrega un factor socioeconomico al analisis, esto debido a que en todos los estratos socioeconomicos las mujeres dedican sistemáticamente más tiempo a las tareas domésticas que los hombres, con diferencias que rondan entre 65 y 100 minutos diarios en promedio. Estas diferencias se hacen mas predominantes dependiendo de la clase socioeconomica, en el estrato 1, por ejemplo, los hombres registran una media de 115 minutos con mediana de 60, mientras que las mujeres alcanzan 212 minutos con mediana de 180, lo que evidencia una brecha de más de 1 hora y media diaria. Esta tendencia se mantiene en todos los niveles: incluso en estratos altos como el 5, los hombres tienen una media de 123 minutos frente a 188 minutos en las mujeres, lo que confirma que la desigualdad en la distribución del trabajo doméstico no desaparece con mayores recursos económicos. Esto se evidencia con las medianas, las cuales se mantienen estables en los hombres con 60 minutos diarios y las mujeres con 180 minutos. la desviación estándar es siempre mayor en las mujeres, lo que indica mayor dispersión en sus tiempos, con casos donde ellas asumen cargas muy superiores al promedio, mientras que los hombres presentan una distribución más homogénea y reducida. En conjunto, los datos evidencian una brecha de género profunda y persistente en el uso del tiempo, que atraviesa tanto a los hogares de bajos como de altos estratos.

visualizacion boxplot:

# Boxplot: Tiempo dedicado a tareas domésticas por estrato y sexo
datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(Estrato_tarifa), !is.na(sexo)) %>%
  ggplot(aes(x = Estrato_tarifa, y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a tareas domesticas por estrato socioeconomico y sexo",
    x = "Estrato socioeconomico",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Set1") +
  theme_minimal()

Interpretacion:

El grafico visualiza que los hombres dedican entre 30 y 120 minutos diarios a las tareas domesticas (Q1-Q3), con una mediana de 60, mientras que las mujeres que se ubican entre 120 y 270 minutos, con una medida de 180 minutos al dia. Esto implica que el 75% de ellas dedica al menos 2 horas diarias, frente a menos de 2 en los hombres. Ademas, las mujeres presentan numerosos valores atipicos que superan las 16 horas, lo que evidencia casos de sobrecarga extrema, mientras que en los hombres los outliers son menos frecuentes y de menor magnitud.

Tiempo Tareas domesticas por region:

# Tiempo dedicado a tareas domésticas por región y sexo
estadisticas_por_region_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(region), !is.na(sexo)) %>%
  group_by(region, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(region, sexo)
## `summarise()` has grouped output by 'region'. You can override using the
## `.groups` argument.
print(estadisticas_por_region_sexo)
## # A tibble: 12 × 6
## # Groups:   region [6]
##    region     sexo       n media mediana    sd
##    <fct>      <fct>  <int> <dbl>   <dbl> <dbl>
##  1 Caribe     Hombre  2914 109.       60  76.8
##  2 Caribe     Mujer  11399 204.      180 130. 
##  3 Central    Hombre  4083 124.      120  86.6
##  4 Central    Mujer  12699 219.      180 133. 
##  5 Oriental   Hombre  3046 121.      120  86.9
##  6 Oriental   Mujer   8608 202.      180 127. 
##  7 Pacífica   Hombre  2712 114.       60  80.2
##  8 Pacífica   Mujer   8521 200.      180 118. 
##  9 Bogotá     Hombre  3047 122.       60  85.8
## 10 Bogotá     Mujer   7731 195.      180 131. 
## 11 San Andrés Hombre   641  97.9      60  54.3
## 12 San Andrés Mujer   1219 147.      120  93.5
# Boxplot: Tiempo dedicado a tareas domésticas por región y sexo
datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(region), !is.na(sexo)) %>%
  ggplot(aes(x = region, y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a tareas domesticas por region y sexo",
    x = "Region",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Pastel2") +
  theme_minimal()

Interpretacion:

Tanto el grafico como la tabla demuestra que en todas las regiones de colombia las mujeres dedican sistematicamente mas tiempo a las tareas domesticas que los hombres, demostrando tambien la presencia no solo de un factor socioeconomico que influya en la desigualdad de genero respecto al tiempo invertido en las tareas domesticas, sino tambien un factor geografico y cultural, en el que las distintas politicas de las regiones influyen en la carga de trabajo no remunerados dentro del hogar. Esto se confirma con la mediana que en llas mujeres se situa en 180 minutos diarios con un rango intercuartilico de aproximadamente 120 a 270 minutos. Mientras que los que en los hombres se mantiene en casi todos en 60 minutos, y el 75% dedica menos de 2 horas al dia. Ese factor geografico se hace aun mas evidente en las regiones de Caribe, Central y Bogotá, zonas en las que se aprecia una mayor dispersión, lo que sugiere una mayor desigualdad a causa de politicas mas ortodoxas. San andres tambien aparece como el menor dato y en el unico donde el promedio de las mujeres sea de 120 minutos (2 horas) sin embargo, es probable que los pocos encuestados de esa zona sea la causa de esa disminucion

Tiempo tareas domesticas por edades:

# Tiempo dedicado a tareas domésticas por grupo de edad y sexo
datos <- datos %>%
  mutate(
    edad_grupos = cut(edad,
                      breaks = seq(0, 100, by = 10),
                      right = FALSE,
                      include.lowest = TRUE,
                      labels = c("0-9", "10-19", "20-29", "30-39", "40-49",
                                 "50-59", "60-69", "70-79", "80-89", "90+"))
  )

estadisticas_por_edad_sexo <- datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  group_by(edad_grupos, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_tareas_domesticas, na.rm = TRUE),
    mediana = median(tiempo_tareas_domesticas, na.rm = TRUE),
    sd = sd(tiempo_tareas_domesticas, na.rm = TRUE)
  ) %>%
  arrange(edad_grupos, sexo)
## `summarise()` has grouped output by 'edad_grupos'. You can override using the
## `.groups` argument.
print(estadisticas_por_edad_sexo)
## # A tibble: 18 × 6
## # Groups:   edad_grupos [9]
##    edad_grupos sexo       n media mediana    sd
##    <fct>       <fct>  <int> <dbl>   <dbl> <dbl>
##  1 10-19       Hombre  2571  99.1      60  63.8
##  2 10-19       Mujer   5192 132.      120  90.6
##  3 20-29       Hombre  3005 113.       60  78.9
##  4 20-29       Mujer   8641 189.      180 123. 
##  5 30-39       Hombre  2663 119.      120  81.6
##  6 30-39       Mujer   9514 210.      180 129. 
##  7 40-49       Hombre  2442 122.      120  87.2
##  8 40-49       Mujer   8453 222.      180 133. 
##  9 50-59       Hombre  2384 123.      120  87.0
## 10 50-59       Mujer   8165 227.      180 134. 
## 11 60-69       Hombre  1964 130.      120  93.1
## 12 60-69       Mujer   6137 224.      180 128. 
## 13 70-79       Hombre  1081 127.      120  93.8
## 14 70-79       Mujer   3201 208.      180 124. 
## 15 80-89       Hombre   308 119.      120  74.4
## 16 80-89       Mujer    805 178.      180 110. 
## 17 90+         Hombre    25 115.      120  73.3
## 18 90+         Mujer     69 146.      120  88.8

Boxplot:

# Boxplot: Tiempo dedicado a tareas domésticas por grupo de edad y sexo
datos %>%
  filter(!is.na(tiempo_tareas_domesticas), tiempo_tareas_domesticas > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  ggplot(aes(x = edad_grupos, y = tiempo_tareas_domesticas, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a tareas domesticas por grupo de edad y sexo",
    x = "Grupo de edad",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Dark2") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Interpretacion:

El grafico y la tabla de datos muestran que el tiempo dedicado a las tareas domesticas aumenta con la edad en ambos sexos, pero refuerza aun mas la brecha entre los dos sexos a favor de las mujeres. En primer lugar, el grupo de 10-19 años, los hombres presentan una mediana de 60 minutos (1 hora), mientras que las mujeres de 120 (2 horas), que indica que la desigualdad en las tareas domesticas se da desde edades extremadamente tempranos, lo que a su vez, puede tener un impacto en edades mayores, ya que muestra que desde pequeños se les impone esas tareas domesticas como una obligacion que tienen que hacer al ser mujeres, mientras que a los hombres se les exime de esas responsabilidades. A partir de los 20-29 suelen consolidarse como tareas que requieren un trabajo no remunerado dentro del hogar, en este periodo los hombres mantienen una mediana de 60 minutos y las mujeres aumentan hasta los 180 minutos (3 horas diarias). A los 30 y 59 minutos, la brecha se intentifica a la vez que la carga laboral y familiar, donde las mujeres llegan hasta los 220 minutos (3 horas y 20 minutos).la dispersión (sd) es mayor en mujeres en todos los rangos de edad, lo que indica que algunas dedican tiempos extremadamente altos que se ven reflejados en valores atipicos de hasta mas de 12 horas. Esto demuestra a su vez que la carga desproporcionada impuesta a la mujer en lo que respecta a las tareas del hogar no es algo que aparezca a una edad especifica sino que esta presente durante todo su ciclo de vida.

Tiempo dedicado a higiene por sexo:

library(dplyr)

estadisticas_por_sexo_higiene <- datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(sexo)) %>%
  group_by(sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_higiene_propia, na.rm = TRUE),
    mediana = median(tiempo_higiene_propia, na.rm = TRUE),
    sd = sd(tiempo_higiene_propia, na.rm = TRUE)
  ) %>%
  arrange(sexo)

print(estadisticas_por_sexo_higiene)
## # A tibble: 2 × 5
##   sexo       n media mediana    sd
##   <fct>  <int> <dbl>   <dbl> <dbl>
## 1 Hombre 18201  66.5      60  26.7
## 2 Mujer  31878  66.8      60  24.0

Tiempo higiene por edad:

library(dplyr)

estadisticas_higiene_edad_sexo <- datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  group_by(edad_grupos, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_higiene_propia, na.rm = TRUE),
    mediana = median(tiempo_higiene_propia, na.rm = TRUE),
    sd = sd(tiempo_higiene_propia, na.rm = TRUE)
  ) %>%
  arrange(edad_grupos, sexo)
## `summarise()` has grouped output by 'edad_grupos'. You can override using the
## `.groups` argument.
print(estadisticas_higiene_edad_sexo)
## # A tibble: 18 × 6
## # Groups:   edad_grupos [9]
##    edad_grupos sexo       n media mediana    sd
##    <fct>       <fct>  <int> <dbl>   <dbl> <dbl>
##  1 10-19       Hombre  3657  67.2      60  27.7
##  2 10-19       Mujer   5849  67.6      60  24.0
##  3 20-29       Hombre  3630  67.9      60  29.9
##  4 20-29       Mujer   6257  67.5      60  26.1
##  5 30-39       Hombre  2972  66.0      60  24.8
##  6 30-39       Mujer   5644  66.3      60  23.7
##  7 40-49       Hombre  2513  65.0      60  22.0
##  8 40-49       Mujer   4506  66.8      60  24.4
##  9 50-59       Hombre  2200  65.7      60  27.4
## 10 50-59       Mujer   3932  65.3      60  21.0
## 11 60-69       Hombre  1678  66.5      60  29.0
## 12 60-69       Mujer   2894  66.3      60  23.9
## 13 70-79       Hombre   968  66.2      60  23.8
## 14 70-79       Mujer   1766  66.1      60  23.3
## 15 80-89       Hombre   489  66.1      60  20.1
## 16 80-89       Mujer    816  67.1      60  21.8
## 17 90+         Hombre    93  67.1      60  21.4
## 18 90+         Mujer    211  68.8      60  24.3

Boxplot:

# Boxplot: Tiempo dedicado a higiene personal por grupo de edad y sexo
datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(edad_grupos), !is.na(sexo)) %>%
  ggplot(aes(x = edad_grupos, y = tiempo_higiene_propia, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a higiene personal por grupo de edad y sexo",
    x = "Grupo de edad",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Set3") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Tiempo higiene por region:

estadisticas_higiene_region_sexo <- datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(region), !is.na(sexo)) %>%
  group_by(region, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_higiene_propia, na.rm = TRUE),
    mediana = median(tiempo_higiene_propia, na.rm = TRUE),
    sd = sd(tiempo_higiene_propia, na.rm = TRUE)
  ) %>%
  arrange(region, sexo)
## `summarise()` has grouped output by 'region'. You can override using the
## `.groups` argument.
print(estadisticas_higiene_region_sexo)
## # A tibble: 12 × 6
## # Groups:   region [6]
##    region     sexo       n media mediana    sd
##    <fct>      <fct>  <int> <dbl>   <dbl> <dbl>
##  1 Caribe     Hombre  5457  67.8      60  27.6
##  2 Caribe     Mujer   8449  69.4      60  27.1
##  3 Central    Hombre  3773  63.8      60  18.2
##  4 Central    Mujer   7672  64.6      60  18.7
##  5 Oriental   Hombre  2563  65.2      60  24.0
##  6 Oriental   Mujer   4641  66.7      60  25.9
##  7 Pacífica   Hombre  2640  70.1      60  35.9
##  8 Pacífica   Mujer   4817  67.9      60  26.5
##  9 Bogotá     Hombre  2651  64.0      60  25.5
## 10 Bogotá     Mujer   5030  64.4      60  20.5
## 11 San Andrés Hombre  1117  69.9      60  27.7
## 12 San Andrés Mujer   1269  67.5      60  23.7

Boxplot:

# Boxplot: Tiempo dedicado a higiene personal por región y sexo
datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(region), !is.na(sexo)) %>%
  ggplot(aes(x = region, y = tiempo_higiene_propia, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a higiene personal por region y sexo",
    x = "Region",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Pastel1") +
  theme_minimal()

Tiempo higiene por estrato socioeconomico:

library(dplyr)
# Estadísticas por estrato socioeconómico y sexo para tiempo dedicado a higiene personal
estadisticas_higiene_estrato_sexo <- datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(Estrato_tarifa), !is.na(sexo)) %>%
  group_by(Estrato_tarifa, sexo) %>%
  summarise(
    n = n(),
    media = mean(tiempo_higiene_propia, na.rm = TRUE),
    mediana = median(tiempo_higiene_propia, na.rm = TRUE),
    sd = sd(tiempo_higiene_propia, na.rm = TRUE)
  ) %>%
  arrange(Estrato_tarifa, sexo)
## `summarise()` has grouped output by 'Estrato_tarifa'. You can override using
## the `.groups` argument.
print(estadisticas_higiene_estrato_sexo)
## # A tibble: 12 × 6
## # Groups:   Estrato_tarifa [6]
##    Estrato_tarifa sexo       n media mediana    sd
##    <fct>          <fct>  <int> <dbl>   <dbl> <dbl>
##  1 Estrato 1      Hombre  7602  67.7      60  27.8
##  2 Estrato 1      Mujer  12208  67.3      60  23.9
##  3 Estrato 2      Hombre  5708  65.8      60  27.5
##  4 Estrato 2      Mujer  10280  65.9      60  23.2
##  5 Estrato 3      Hombre  3161  65.8      60  24.6
##  6 Estrato 3      Mujer   6017  66.7      60  24.6
##  7 Estrato 4      Hombre   877  65.3      60  26.0
##  8 Estrato 4      Mujer   1780  67.4      60  25.5
##  9 Estrato 5      Hombre   382  63.6      60  14.9
## 10 Estrato 5      Mujer    812  66.8      60  24.2
## 11 Estrato 6      Hombre   213  64.8      60  16.3
## 12 Estrato 6      Mujer    450  70.8      60  31.6
library(ggplot2)
library(dplyr)

# Boxplot: Tiempo dedicado a higiene personal por estrato y sexo
datos %>%
  filter(!is.na(tiempo_higiene_propia), tiempo_higiene_propia > 0,
         !is.na(Estrato_tarifa), !is.na(sexo)) %>%
  ggplot(aes(x = Estrato_tarifa, y = tiempo_higiene_propia, fill = sexo)) +
  geom_boxplot(alpha = 0.7, outlier.alpha = 0.3, position = position_dodge(width = 0.8)) +
  labs(
    title = "Tiempo dedicado a higiene personal por estrato socioeconomico y sexo",
    x = "Estrato socioeconomico",
    y = "Tiempo en minutos",
    fill = "Sexo"
  ) +
  scale_fill_brewer(palette = "Set2") +
  theme_minimal()

Interpretacion:

En lo que respecta al tiempo invertido en habitos de higiene, sin importar el estrato, el sexo, la region o la edad, la mayoria de las personas gastan un minimo promedio de entre 63 minutos y un maximo de 70 minutos por dia en actividades de aseo, con una desviacion estandar de 25.01. Los (Q1 y Q3) Estan entre 60 habitualmente debido a que la diferencia entre la cantidad de personas que dedican a su tiempo de higiene entre menos o un pocos mas de 1 es tanta, que cualquier otro dato aparece comp si fuera un dato atipico o un valor extremo, lo que permite que el resultado sea bastante homogéneo en la población analizada. Esto sugiere que la higiene es un hábito cotidiano relativamente uniforme, en contraste con las marcadas desigualdades observadas en el trabajo doméstico, y ademas, rebate la idea de que existe una marcada diferencia de higiene entre hombres y mujeres, mostrando que los roles sociales que implican que las mujeres tengan que dedicar mucho mas tiempo a la higiene con tal de cumplir un estandar de belleza absoluto a disminuido,o no es tan marcado en ciertos casos mas alla de los datos atipicos. Esto a su vez responde un poco a la idea de que si bien es cierto que los roles de genero y sexo existen e influyen en la desigualdad presente a la mujer en los trabajos domesticos, en lo que respecta a higiene y un estandar de belleza en el que las mujeres tengan que utilizar mas tiempo en su higiene no es tan predominante.

                             Conclusiones:
                             

Podemos encontrar que el analisis responde directamente a la pregunta de investigacion, demostrando que factores culturales, sociales, geograficos, politicos y economicos influyen en que existe una diferencia entre hombres y mujeres respecto al tiempo al que dedican a realizar tareas domesticas, esto se refuerza con los resultados, graficos y tablas que se obtuvieron de diversas variables, donde la carga en el trabajo no remunerado dentro del hogar de las mujeres era mucho mayor que las de los hombres, teniendo una mediana de hasta el doble de la de los hombres. Sin embargo, la segunda variable puesta en cuestion no dejan resultados tan desesperanzadores respecto a los roles de genero de la cultura colombiana, ya que los datos de higiene se mantuvieron similares sin importanter el sexo, el estrato, la religion o la edad, manteniendose homogenea y demostrando que a pesar de los altos estandares de belleza que se les suele imponer a la mujer, en el tiempo dedicado a la higiene que contiene “vestirse”, no cambia exponencialmente el tiempo dedicado a estas actividades y no es suficiente para que exista una diferencia.