Planteamineto del problema

En la actualidad, el trabajo infantil sigue siendo una problemática significativa en Colombia, donde esté es más común en las zonas rurales que en las urbanas. Por lo tanto, se presenta la tasa de trabajo infantil en zonas rurales como aproximadamente el doble que, en las zonas urbanas, en el cual, los sectores económicos que más utilizan trabajo infantil, en orden de importancia, son: Agricultura, ganadería, caza, silvicultura, pesca,comercio, hoteles y restaurantes (Portal ICBF, 2025). De esta manera, los menores de 18 años son quienes en ocasiones se ven forzados a ingresar al mercado laboral debido a las condiciones económicas que puedan presentar, número de integrantes de la familia o a la falta de oportunidades.

Entiéndase por trabajo infantil que es

“Todo aquel realizado por un niño, niña o adolescente que no alcance la edad mínima de admisión al empleo y en los términos establecidos por la legislación nacional y que, por consiguiente, impida la educación y el pleno desarrollo del niño la niña o el adolescente; el que se ajuste a la definición de trabajo peligroso o aquel que está incluido como peores formas de trabajo infantil” (Portal ICBF, 2017).

Estas circunstancias generan un impacto negativo de manera directa en el bienestar de los jóvenes, como también de su desarrollo educativo y sus oportunidades a futuro. Aunque existen políticas públicas que se implementan para enfrentar las tasas de trabajo infantil, todavía persisten tasas con gran relevancia entre regiones en cuanto a la edad en la que los jóvenes empiezan con su vida laboral, el tamaño de las familias y el parentesco que tienen los menores con su jefe de trabajo. En este contexto, es crucial analizar, mediante herramientas y métodos estadísticos previamente vistos en la clase de estadística inferencial, si existen diferencias significativas entre alginas ciudades de Colombia en cuanto al trabajo infantil. Utilizando como herramienta los datos del Modulo de Trabajo Infantil (MTI) de la Gran Encuesta Integrada de Hogares (GEIH) 2023 del DANE, se busca responder las siguientes preguntas de investigación:

¿Existen diferencias significativas en el promedio de edad de los menores de 18 años trabajadores en relación con las ciudades de Bogotá y Tunja?

¿Existen diferencias significativas en el promedio del tamaño de las familias de los menores de edad trabajadores en las ciudades de Barranquilla y Manizales?

¿Cual es la proporción de menores trabajadores respecto al sexo biológico en la cuidad de Bogotá?

Estas preguntas de investigación son importantes, ya que permiten describir la situación respecto al trabajo infantil en diferentes ciudades del país, esto puede aportar información importante para dar a conocer las tasas del trabajo infantil.

Objetivo general

Analizar las diferencias entre algunas de las características sociodemográficas como lo son el sexo biológico, la edad y el tamaño del hogar de los menores de edad basándonos en los datos obtenidos del Módulo de Trabajo Infantil (MTI) de la Gran Encuesta Integrada de Hogares (GEIH) 2023, realizada por el DANE.

Objetivos especificos

  1. Analizar el promedio de edad de los menores de 18 años trabajadores en relación con las ciudades de Bogotá y Tunja.

  2. Identificar el promedio del tamaño de las familias de los menores de edad trabajadores en las ciudades de Barranquilla y Manizales.

  3. Determinar la proporción de menores trabajadores respecto al sexo biológico en la cuidad de Bogotá

Antecedentes

En cuanto a investigaciones previas que han utilizado datos de la GEIH para analizar el trabajo infantil en Colombia.Se tiene, que por ejemplo, Aparicio (2013) examinó los factores que influyen en la elección de actividades económicas por parte de menores, destacando la relación entre pobreza y trabajo infantil. Holgado et al. (2014) demostraron que el trabajo infantil afecta negativamente el rendimiento académico, especialmente en áreas urbanas con alta informalidad.

En el contexto regional, Pérez Caballero et al. (2022) analizaron la explotación infantil en Cartagena, señalando que el turismo y el comercio informal son sectores de riesgo. A nivel internacional, la OIT (2020) estimó que 160 millones de niños trabajan globalmente, con América Latina enfrentando desafíos particulares debido a la informalidad y la desigualdad.

Estos estudios subrayan la necesidad de análisis desagregados por regiones urbanas, ya que las condiciones del trabajo infantil varían según el contexto socioeconómico. Sin embargo, pocos trabajos han comparado simultáneamente ciudades como Bogotá, Barranquilla, Tunja y Manizales en términos de edad, tamaño del hogar e ingresos, lo que representa una oportunidad para este proyecto de contribuir con nuevos conocimientos.

Contexto del Trabajo Infantil en Colombia

El trabajo infantil sigue siendo una problemática significativa en Colombia, donde factores socioeconómicos como la pobreza, la desigualdad y la falta de acceso a la educación impulsan a niños y niñas a integrarse al mercado laboral, a menudo en condiciones precarias o peligrosas. Según la Organización Internacional del Trabajo (OIT), el trabajo infantil abarca cualquier actividad económica que realicen menores de 15 años que afecte su desarrollo o educación, o menores de 18 años en trabajos peligrosos (OIT, 2020). En Colombia, la Ley 1098 de 2006 (Código de la Infancia y la Adolescencia) prohíbe el empleo de menores de 15 años, salvo en actividades artísticas o culturales autorizadas, y regula estrictamente el trabajo de adolescentes de 15 a 17 años. Sin embargo, datos del DANE (2022) indican que aproximadamente el 5.4% de los menores de 5 a 17 años estaban ocupados, con una mayor incidencia en sectores como la agricultura, el comercio informal y los servicios domésticos.

El “Módulo de Trabajo Infantil - MTI” de la Gran Encuesta Integrada de Hogares (GEIH) 2023, realizado por el DANE, proporciona datos detallados sobre la población de 5 a 17 años, incluyendo variables como edad, horas trabajadas, ingresos y área geográfica (DANE, 2023). Este módulo, aplicado en el cuarto trimestre de cada año desde 2012, permite desagregar información por ciudades como Bogotá, Barranquilla, Tunja y Manizales, lo que facilita el análisis de diferencias regionales en las condiciones laborales de los menores. Este tipo de estudios es crucial para diseñar políticas públicas que aborden las disparidades urbanas y promuevan la erradicación del trabajo infantil, en línea con los Objetivos de Desarrollo Sostenible (ODS), particularmente el ODS 8 (Trabajo decente y crecimiento económico).

Relevancia para Administración de Empresas

Como estudiantes de Administración de Empresas en la UPTC, abordar el trabajo infantil desde una perspectiva estadística es altamente pertinente, ya que combina el uso de herramientas de inferencia estadística con un problema socioeconómico que tiene implicaciones directas en la gestión empresarial moderna. Las empresas, especialmente en contextos globalizados, enfrentan una creciente presión para garantizar cadenas de suministro éticas y cumplir con estándares de responsabilidad social corporativa (RSC). El trabajo infantil, al ser una práctica que vulnera los derechos humanos y perpetúa la pobreza, representa un desafío ético y operativo para los administradores, quienes deben diseñar estrategias que eviten su proliferación en sectores como el comercio, la agricultura o la industria informal.

El curso de Inferencia Estadística ofrece un marco ideal para aplicar técnicas como pruebas de hipótesis, análisis de varianza (ANOVA) y correlaciones a datos reales del MTI-GEIH, permitiendo a los estudiantes analizar diferencias significativas en variables como edad, horas trabajadas e ingresos. Este enfoque no solo fortalece las competencias analíticas, sino que también sensibiliza a los futuros administradores sobre la importancia de integrar consideraciones sociales en la toma de decisiones empresariales, promoviendo un modelo de gestión sostenible y socialmente responsable.

Desarrollo del proyecto

Carga de la base de datos

Para dar inicio al análisis, se cargó la base de datos proporcionada por el DANE a través del Módulo de Trabajo Infantil (MTI) de la Gran Encuesta Integrada de Hogares (GEIH) 2023. Esta información se encuentra contenida en un archivo de Excel denominado “DATOS DANE.xlsx”.

La lectura del archivo se realizó con el paquete readxl, utilizando la función read_excel(), lo que permitió importar correctamente los datos al entorno de trabajo en R. Posteriormente, se imprimió el contenido de la base de datos para verificar su estructura y variables disponibles. La base contiene un total de 42.572 registros y 132 variables, que incluyen información sociodemográfica relevante como el tamaño del hogar, el sexo biológico, la edad y otras características de los menores de edad en el contexto del trabajo infantil.

#install.packages("readxl") #para leer archivos excel
library(readxl)
 list.files("../Datos")
## [1] "DATOS DANE.xlsx"
data <- read_excel("../Datos/DATOS DANE.xlsx")
data
## # A tibble: 42,572 × 132
##    DIRECTORIO SECUENCIA_P TAM_HOGAR ORDEN P3271 P6040 P6050 P6070 P6090 P6100
##         <dbl>       <dbl>     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1    7567356           1         5     3     2    15     3     6     1     1
##  2    7567356           1         5     4     1     8     3    NA     1     1
##  3    7567356           1         5     5     2     5     3    NA     1     1
##  4    7567358           1         4     4     2    16     3     4     1     3
##  5    7567360           1         4     3     1     6     8    NA     1     3
##  6    7567361           1         3     3     2     8     3    NA     1     3
##  7    7567362           1         2     2     2    13     3     6     1     1
##  8    7567367           1         5     3     1    11     3     6     1     1
##  9    7567367           1         5     4     2     7     3    NA     1     1
## 10    7567367           1         5     5     1     6     3    NA     1     1
## # ℹ 42,562 more rows
## # ℹ 122 more variables: P6110 <dbl>, P6120 <dbl>, P6160 <dbl>, P6170 <dbl>,
## #   P3041 <dbl>, P3042 <dbl>, P3042S1 <dbl>, P3042S2 <dbl>, CLASE <dbl>,
## #   P400 <dbl>, P401 <dbl>, P402 <dbl>, P403 <dbl>, P404 <dbl>, P3564 <dbl>,
## #   P405 <dbl>, P408 <dbl>, P409 <dbl>, P410 <dbl>, P410S1 <dbl>, P411 <dbl>,
## #   P411S1 <lgl>, P412 <dbl>, P412S1 <lgl>, P413 <dbl>, P414 <dbl>, P415 <dbl>,
## #   P416 <dbl>, P420 <dbl>, P3131S1 <dbl>, P3131S1A1 <dbl>, P3131S1A2 <dbl>, …

PRIMER OBJETIVO

Selección de ciudades y toma de las respectivas muestras

Como parte del primer objetivo del proyecto, se seleccionaron dos ciudades específicas para el análisis: Tunja y Bogotá. Para ello, se utilizó la variable AREA, que identifica las diferentes áreas geográficas dentro de la base de datos del DANE.

  • AREA == 15 corresponde a la ciudad de Tunja.
  • AREA == 11 corresponde a la ciudad de Bogotá.
AREA15 <- subset(data,AREA==15)
AREA11 <- subset(data,AREA==11)

Una vez filtradas las observaciones de cada ciudad, se procedió a seleccionar una muestra aleatoria simple de 63 registros para cada una, utilizando la función sample() de R. Esta muestra servirá como base para el análisis estadístico posterior.

  • Para Tunja:
set.seed(123)
Tunja <- AREA15[sample(nrow(AREA15),63),]
Tunja
## # A tibble: 63 × 132
##    DIRECTORIO SECUENCIA_P TAM_HOGAR ORDEN P3271 P6040 P6050 P6070 P6090 P6100
##         <dbl>       <dbl>     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1    7605362           1         3     3     1    16     3     6     1     3
##  2    7605447           1         7     7     1    10     3     6     1     1
##  3    7585385           1         4     3     2    15     3     6     1     1
##  4    7612955           1         3     3     1    16     3     6     1     3
##  5    7585409           1         4     4     2     7     3    NA     1     1
##  6    7642938           1         3     3     2    15     3     6     1     3
##  7    7574005           1         4     2     1    10     3     6     1     1
##  8    7592747           1         9     8     1     7     9    NA     1     3
##  9    7592662           1         5     4     2     7     3    NA     1     1
## 10    7592679           1         4     4     1    13     3     6     1     1
## # ℹ 53 more rows
## # ℹ 122 more variables: P6110 <dbl>, P6120 <dbl>, P6160 <dbl>, P6170 <dbl>,
## #   P3041 <dbl>, P3042 <dbl>, P3042S1 <dbl>, P3042S2 <dbl>, CLASE <dbl>,
## #   P400 <dbl>, P401 <dbl>, P402 <dbl>, P403 <dbl>, P404 <dbl>, P3564 <dbl>,
## #   P405 <dbl>, P408 <dbl>, P409 <dbl>, P410 <dbl>, P410S1 <dbl>, P411 <dbl>,
## #   P411S1 <lgl>, P412 <dbl>, P412S1 <lgl>, P413 <dbl>, P414 <dbl>, P415 <dbl>,
## #   P416 <dbl>, P420 <dbl>, P3131S1 <dbl>, P3131S1A1 <dbl>, P3131S1A2 <dbl>, …

Se realizó un análisis descriptivo de la variable edad para los niños trabajadores en la ciudad de Tunja, a partir de la muestra seleccionada de 63 observaciones, donde se calularon las medidas de tendencia central.

summary(Tunja$P6040)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5.00    9.00   12.00   11.84   15.00   17.00

Estos resultados muestran que la mayoría de los niños trabajadores en Tunja tienen entre 5 y 17 años, concentrándose en torno a los 11 años (mediana). La media (10.95) es cercana a la mediana, lo que indica una distribución relativamente simétrica. Sin embargo, existen casos de trabajo infantil desde los 5 años, lo cual representa una situación crítica desde el punto de vista legal y social, dado que se trata de una edad muy temprana.

  • Para Bogota:

De manera similar, para la ciudad de Bogotá, se filtraron los datos utilizando la condición AREA == 11. A partir de esta base filtrada, se seleccionó también una muestra aleatoria de 63 registros, con el fin de mantener la comparabilidad entre ambas ciudades en el análisis posterior.

set.seed(123)
Bogota <- AREA11[sample(nrow(AREA11),63),]
Bogota
## # A tibble: 63 × 132
##    DIRECTORIO SECUENCIA_P TAM_HOGAR ORDEN P3271 P6040 P6050 P6070 P6090 P6100
##         <dbl>       <dbl>     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1    7602443           1         3     3     2     5     3    NA     1     1
##  2    7605225           1         4     4     2    11     3     6     1     1
##  3    7580400           1         6     3     2    10     3     6     1     1
##  4    7612669           1         4     3     2    14     3     6     1     1
##  5    7585272           1         4     3     2    15     3     6     1     3
##  6    7642711           1         5     4     2    12     8     6     1     1
##  7    7652214           1         3     3     2    17     3     6     1     1
##  8    7623058           1         3     3     1     7     3    NA     1     1
##  9    7622899           1         3     3     2    11     3     6     1     1
## 10    7627649           1         3     2     2     9     3    NA     1     1
## # ℹ 53 more rows
## # ℹ 122 more variables: P6110 <dbl>, P6120 <dbl>, P6160 <dbl>, P6170 <dbl>,
## #   P3041 <dbl>, P3042 <dbl>, P3042S1 <dbl>, P3042S2 <dbl>, CLASE <dbl>,
## #   P400 <dbl>, P401 <dbl>, P402 <dbl>, P403 <dbl>, P404 <dbl>, P3564 <dbl>,
## #   P405 <dbl>, P408 <dbl>, P409 <dbl>, P410 <dbl>, P410S1 <dbl>, P411 <dbl>,
## #   P411S1 <lgl>, P412 <dbl>, P412S1 <lgl>, P413 <dbl>, P414 <dbl>, P415 <dbl>,
## #   P416 <dbl>, P420 <dbl>, P3131S1 <dbl>, P3131S1A1 <dbl>, P3131S1A2 <dbl>, …
summary(Bogota$P6040)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5.00    9.00   12.00   11.52   15.00   17.00

A diferencia de Tunja, se observa que en Bogotá los niños trabajadores tienden a ser ligeramente mayores. La edad mediana es de 11,3 años y la media es de 11 años, lo que refleja una distribución centrada en la adolescencia temprana. No obstante, al igual que en Tunja, existen casos de trabajo infantil desde los 5 años, lo que evidencia la persistencia del problema incluso en una ciudad capital.

Unión de las muestras

Con el objetivo de realizar un análisis conjunto de las dos ciudades seleccionadas, se procedió a unir las muestras de Tunja y Bogotá utilizando la función rbind(), la cual permite combinar conjuntos de datos que tienen las mismas variables o columnas.

De esta forma, se creó un nuevo objeto llamado muestra_total que contiene las 126 observaciones (63 por ciudad). Este conjunto de datos será utilizado para realizar comparaciones y análisis globales sobre el trabajo infantil en ambas ciudades.

muestra_total <- rbind(Tunja,Bogota)

Prueba t para comparar la edad media entre Tunja y Bogotá

Con el fin de determinar si existe una diferencia significativa en la edad promedio de los niños trabajadores entre Tunja y Bogotá, se aplicó una prueba t de muestras independientes.

  • Donde se plantearon las siguientes hipotesis:

(H₀):(\(\mu_1 = \mu_2\))= No hay diferencia en la edad promedio entre los dos ciudades.
(H₁):(\(\mu_1 \neq \mu_2\))= Hay una diferencia significativa en la edad promedio entre las dos ciudades.

t.test(muestra_total$P6040~muestra_total$AREA,muestra_total=muestra_total)
## 
##  Welch Two Sample t-test
## 
## data:  muestra_total$P6040 by muestra_total$AREA
## t = -0.50524, df = 123.98, p-value = 0.6143
## alternative hypothesis: true difference in means between group 11 and group 15 is not equal to 0
## 95 percent confidence interval:
##  -1.5611206  0.9261999
## sample estimates:
## mean in group 11 mean in group 15 
##         11.52381         11.84127

Los resultados indican que la edad media en Bogotá es de 11,3 años, mientras que en Tunja es de 10,98 años. Sin embargo, el valor de p = 0.6143 sugiere que no hay una diferencia estadísticamente significativa entre ambas medias, dado que p > 0.05.

El intervalo de confianza del 95% para la diferencia de medias va de -1.5611206 a 0.9261999, lo cual incluye el valor 0, reforzando la conclusión de que la diferencia observada puede atribuirse al azar.Por lo tanto, se acepta la hipótesis nula

En consecuencia,con un nivel de significancia de 0,05, se estima que no hay diferencias significativas en la edad promedio de los niños trabajadores entre las dos ciudades.

Diagrama de cajas y bigotes:

En esta gráfica se compara la distribución de la edad de los niños trabajadores en Bogotá y Tunja.

boxplot(muestra_total$P6040 ~ muestra_total$AREA,
        main = "Distribucion de Edad por Ciudad",
        xlab = "Ciudad",
        ylab = "Edad",
        col = c("skyblue", "tomato"),   
        border = c("black", "black"),
        names = c("Bogota", "Tunja"))   

Para Bogotá, la edad mínima registrada es de 5 años, el primer cuartil (Q1) es 9 años, la mediana es 11 años, la media es 11,3 años, el tercer cuartil (Q3) es 14,5 años y la edad máxima es de 17 años.En Tunja, la edad mínima también es de 5 años, el primer cuartil es 7 años, la mediana es 11 años, la media es 10,95 años, el tercer cuartil es 15 años, y la edad máxima igualmente es de 17 años.

Ambas ciudades presentan distribuciones de edad similares en cuanto a los valores extremos y la mediana. Sin embargo, Bogotá tiene una media ligeramente superior, lo que sugiere que, en promedio, los niños trabajadores en esta ciudad tienden a ser un poco mayores que los de Tunja.

En términos de dispersión, el rango intercuartílico (RIC) —es decir, la diferencia entre el tercer y primer cuartil— es más estrecho en Bogotá (5,5 años) que en Tunja (8 años), lo que indica que las edades de los niños trabajadores en Bogotá están más concentradas alrededor de la mediana.

SEGUNDO OBJETIVO

Selección de ciudades y toma de las respectivas muestras

Como parte del segundo objetivo del proyecto, se seleccionaron dos ciudades específicas para el análisis: Barraqnuilla y Manizales. Para ello,al igual que para el primer obetivo de este proyect,se utilizó la variable AREA, que identifica las diferentes áreas geográficas dentro de la base de datos del DANE.

  • AREA == 08 corresponde a la ciudad de Barranquilla.
  • AREA == 17 corresponde a la ciudad de Manizales.
AREA08 <- subset(data, AREA == 8)
AREA17 <- subset(data, AREA == 17)

Una vez filtradas las observaciones de cada ciudad, se procedió a seleccionar una muestra aleatoria simple de 63 registros para cada una, utilizando la función sample() de R. Esta muestra servirá como base para el análisis estadístico posterior.

  • Para Barranquilla:
set.seed(123)
Barranquilla <- AREA08[sample(nrow(AREA08),63),]
Barranquilla
## # A tibble: 63 × 132
##    DIRECTORIO SECUENCIA_P TAM_HOGAR ORDEN P3271 P6040 P6050 P6070 P6090 P6100
##         <dbl>       <dbl>     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1    7592225           1         5     3     1     7     3    NA     1     3
##  2    7592301           1         4     4     1     8     3    NA     1     3
##  3    7573580           1         3     3     2    10     3     6     1     3
##  4    7597004           1         4     3     1    13     3     6     1     3
##  5    7573604           1         6     4     1    17     3     6     1     3
##  6    7622862           1         5     4     1     5     3    NA     1     1
##  7    7637280           1         5     3     1    10     3     6     1     3
##  8    7651889           1         7     4     1    11     8     6     1     3
##  9    7642509           1        10     7     2     5     8    NA     1     3
## 10    7642534           1         5     3     2    16     3     6     1     1
## # ℹ 53 more rows
## # ℹ 122 more variables: P6110 <dbl>, P6120 <dbl>, P6160 <dbl>, P6170 <dbl>,
## #   P3041 <dbl>, P3042 <dbl>, P3042S1 <dbl>, P3042S2 <dbl>, CLASE <dbl>,
## #   P400 <dbl>, P401 <dbl>, P402 <dbl>, P403 <dbl>, P404 <dbl>, P3564 <dbl>,
## #   P405 <dbl>, P408 <dbl>, P409 <dbl>, P410 <dbl>, P410S1 <dbl>, P411 <dbl>,
## #   P411S1 <lgl>, P412 <dbl>, P412S1 <lgl>, P413 <dbl>, P414 <dbl>, P415 <dbl>,
## #   P416 <dbl>, P420 <dbl>, P3131S1 <dbl>, P3131S1A1 <dbl>, P3131S1A2 <dbl>, …

Se realizó un análisis descriptivo de la variable tamaño del hogar para los niños trabajadores en la ciudad de Barranquilla, a partir de la muestra seleccionada de 63 observaciones, donde se calularon las medidas de tendencia central.

summary(Barranquilla$TAM_HOGAR)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.000   4.000   5.000   5.381   6.500  11.000

Estos resultados muestran que el tamaño del hogar de los niños trabajadores en Barranquilla varía entre 2 y 11 personas, concentrándose en torno a las 5 personas (mediana). La media (5.38) es cercana a la mediana, lo que indica una distribución relativamente simétrica. Sin embargo, existen casos de hogares con hasta 11 integrantes, lo cual puede reflejar condiciones de hacinamiento y mayor presión económica en el entorno familiar, aspectos que podrían influir en la necesidad de que los menores trabajen.

  • Para Manizales:

De manera similar, para la ciudad de Bogotá, se filtraron los datos utilizando la condición AREA == 17. A partir de esta base filtrada, se seleccionó también una muestra aleatoria de 63 registros.

set.seed(123)
Manizales <- AREA17[sample(nrow(AREA17),63),]
Manizales
## # A tibble: 63 × 132
##    DIRECTORIO SECUENCIA_P TAM_HOGAR ORDEN P3271 P6040 P6050 P6070 P6090 P6100
##         <dbl>       <dbl>     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1    7597695           1         4     3     1     7     3    NA     1     1
##  2    7605498           1         4     4     1     5     3    NA     1     1
##  3    7580644           1         2     2     1     9     3    NA     1     3
##  4    7605701           1         4     3     1     7     3    NA     1     1
##  5    7580731           1         2     2     1     5     3    NA     1     3
##  6    7647878           1         5     5     2     7     8    NA     1     1
##  7    7652615           1         3     3     2     5     3    NA     1     1
##  8    7623455           1         4     2     2     5     3    NA     1     1
##  9    7613125           1         3     3     1    16     8     6     1     1
## 10    7623585           1         4     3     2    13     3     6     1     3
## # ℹ 53 more rows
## # ℹ 122 more variables: P6110 <dbl>, P6120 <dbl>, P6160 <dbl>, P6170 <dbl>,
## #   P3041 <dbl>, P3042 <dbl>, P3042S1 <dbl>, P3042S2 <dbl>, CLASE <dbl>,
## #   P400 <dbl>, P401 <dbl>, P402 <dbl>, P403 <dbl>, P404 <dbl>, P3564 <dbl>,
## #   P405 <dbl>, P408 <dbl>, P409 <dbl>, P410 <dbl>, P410S1 <dbl>, P411 <dbl>,
## #   P411S1 <lgl>, P412 <dbl>, P412S1 <lgl>, P413 <dbl>, P414 <dbl>, P415 <dbl>,
## #   P416 <dbl>, P420 <dbl>, P3131S1 <dbl>, P3131S1A1 <dbl>, P3131S1A2 <dbl>, …
summary(Manizales$TAM_HOGAR)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   2.000   3.000   4.000   3.825   4.000   8.000

Estos resultados muestran que el tamaño del hogar de los niños trabajadores en Manizales varía entre 2 y 8 personas, concentrándose en torno a las 4 personas (mediana). La media (3.83) es cercana a la mediana, lo que indica una distribución relativamente simétrica. Aunque el tamaño promedio de los hogares es moderado, la presencia de hogares con hasta 8 integrantes podría estar asociada a una mayor carga económica, lo cual podría ser un factor que incentive la participación de los menores en actividades laborales.

Unión de las muestras

Para llevar a cabo un análisis comparativo entre las ciudades de Barranquilla y Manizales, se integraron las muestras seleccionadas de cada ciudad utilizando la función rbind().

Así, se creó un nuevo objeto llamado muestra_total, que reúne un total de 126 observaciones (63 de cada ciudad). Este conjunto consolidado será empleado para realizar análisis conjuntos sobre las características del trabajo infantil en ambas ciudades.

muestra_total <- rbind(Barranquilla,Manizales)

Prueba t para comparar el tamaño promedio del hogar entre Barranquilla y Manizales

Con el fin de determinar si existe una diferencia significativa en el tamaño promedio del hogar de los niños trabajadores entre Barranquilla y Manizales, se aplicó una prueba t de muestras independientes.

  • Donde se plantearon las siguientes hipotesis:

(H₀):(\(\mu_1 = \mu_2\))= No hay diferencia en el tamaño promedio del hogar entre los dos ciudades.
(H₁):(\(\mu_1 \neq \mu_2\))= Hay una diferencia significativa en el tamaño promedio del hogar entre las dos ciudades.

t.test(muestra_total$TAM_HOGAR~muestra_total$AREA,muestra_total=muestra_total)
## 
##  Welch Two Sample t-test
## 
## data:  muestra_total$TAM_HOGAR by muestra_total$AREA
## t = 5.0546, df = 97.734, p-value = 2.012e-06
## alternative hypothesis: true difference in means between group 8 and group 17 is not equal to 0
## 95 percent confidence interval:
##  0.9448158 2.1662953
## sample estimates:
##  mean in group 8 mean in group 17 
##         5.380952         3.825397
Los resultados obtenidos indican que el tamaño promedio del hogar para los niños trabajadores en Barranquilla es de aproximadamente 5,38 personas, mientras que en Manizales es de 3,83 personas. Esta diferencia es considerable y, además, estadísticamente significativa, dado que el valor de p = 2.012e-06 es mucho menor que el nivel de significancia convencional de 0,05.

El intervalo de confianza del 95% para la diferencia entre las medias va de 0.9448158 a 2.1662953, lo que refuerza la conclusión de que la diferencia observada no es producto del azar, ya que no incluye el valor 0.

Por lo tanto, se rechaza la hipótesis nula y se concluye que sí existe una diferencia significativa en el tamaño promedio del hogar entre las ciudades de Barranquilla y Manizales. Esto sugiere que los niños trabajadores de Barranquilla tienden a vivir en hogares más grandes en comparación con sus pares en Manizales.

Diagrama de cajas y bigotes:

En esta gráfica se compara la distribución del promedio del tamaño del hogar de los niños trabajadores en Barranquilla y Manizales.

boxplot(muestra_total$TAM_HOGAR ~ muestra_total$AREA,
        main = "Distribucion de tamaño promedio del hogar por Ciudad",
        xlab = "Ciudad",
        ylab = "N° de personas",
        col = c("yellow", "green"),   
        border = c("black", "black"),
        names = c("Barranquilla", "Manizales")) 

En Barranquilla, el tamaño mínimo del hogar es de 2 personas, el primer cuartil (Q1) es 4, la mediana es 5, la media es 5,38, el tercer cuartil (Q3) es 6,5 y el tamaño máximo es de 11 personas. En Manizales, el mínimo también es 2, el primer cuartil es 3, la mediana es 4, la media es 3,83, el tercer cuartil es 4 y el máximo es 8 personas.

Ambas ciudades presentan diferencias marcadas en las medidas de tendencia central. Barranquilla tiene una mediana y una media superiores, lo que sugiere que los niños trabajadores viven en hogares más numerosos en comparación con Manizales.

En cuanto a la dispersión, el rango intercuartílico (RIC) en Barranquilla es de 2,5 personas, mientras que en Manizales es de solo 1 persona, indicando que el tamaño de los hogares en Manizales está más concentrado alrededor de la mediana.

TERCER OBJETIVO

Selección de la ciudad y toma de la respectiva muestra

Como parte del tercer objetivo, se selecciono la ciudad de Bogotá. Para ello, se utilizó la variable AREA, que identifica las diferentes áreas geográficas dentro de la base de datos del DANE.

  • AREA == 11 corresponde a la ciudad de Bogota.
set.seed(123)
Bogota <- AREA11[sample(nrow(AREA11),63),]
Bogota
## # A tibble: 63 × 132
##    DIRECTORIO SECUENCIA_P TAM_HOGAR ORDEN P3271 P6040 P6050 P6070 P6090 P6100
##         <dbl>       <dbl>     <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1    7602443           1         3     3     2     5     3    NA     1     1
##  2    7605225           1         4     4     2    11     3     6     1     1
##  3    7580400           1         6     3     2    10     3     6     1     1
##  4    7612669           1         4     3     2    14     3     6     1     1
##  5    7585272           1         4     3     2    15     3     6     1     3
##  6    7642711           1         5     4     2    12     8     6     1     1
##  7    7652214           1         3     3     2    17     3     6     1     1
##  8    7623058           1         3     3     1     7     3    NA     1     1
##  9    7622899           1         3     3     2    11     3     6     1     1
## 10    7627649           1         3     2     2     9     3    NA     1     1
## # ℹ 53 more rows
## # ℹ 122 more variables: P6110 <dbl>, P6120 <dbl>, P6160 <dbl>, P6170 <dbl>,
## #   P3041 <dbl>, P3042 <dbl>, P3042S1 <dbl>, P3042S2 <dbl>, CLASE <dbl>,
## #   P400 <dbl>, P401 <dbl>, P402 <dbl>, P403 <dbl>, P404 <dbl>, P3564 <dbl>,
## #   P405 <dbl>, P408 <dbl>, P409 <dbl>, P410 <dbl>, P410S1 <dbl>, P411 <dbl>,
## #   P411S1 <lgl>, P412 <dbl>, P412S1 <lgl>, P413 <dbl>, P414 <dbl>, P415 <dbl>,
## #   P416 <dbl>, P420 <dbl>, P3131S1 <dbl>, P3131S1A1 <dbl>, P3131S1A2 <dbl>, …
muestra_bogota <- AREA11[sample(nrow(AREA11), 63), ]

Se divide la muestra de Bogotá en dos subconjuntos: uno con mujeres (P3271 == 1) y otro con hombres (P3271 == 2)

mujeres_bogota <- subset(muestra_bogota,P3271 ==1)
hombres_bogota <- subset(muestra_bogota,P3271 ==2)

Se crea una tabla de frecuencia para la variable sexo (P3271) en la muestra de Bogotá Luego se renombran los niveles para que aparezcan como “Hombres” y “Mujeres” Donde se encontro lo siguiente:

sexo_tabla <- table(muestra_bogota$P3271)
names(sexo_tabla) <- c("Hombres", "Mujeres")
sexo_tabla
## Hombres Mujeres 
##      31      32

Posteriormente, se calculó la proporción de cada grupo respecto al total de la muestra.

porcentaje_sexo <- round(prop.table(sexo_tabla) * 100, 2)
porcentaje_sexo
## Hombres Mujeres 
##   49.21   50.79

Los resultados muestran que el 49,21% de los niños trabajadores en Bogotá son hombres, mientras que el 50,79% son mujeres. Estas proporciones indican una distribución bastante equilibrada entre ambos sexos, aunque se observa una ligera mayoría de niñas trabajadoras en la muestra analizada.

Grafica de barras

Se utilizó una tabla de frecuencias para representar la distribución por sexo biológico de los niños trabajadores en Bogotá. Con la función barplot() de R, se generó una gráfica de barras que permite visualizar y comparar la cantidad de hombres y mujeres en la muestra.

barplot(sexo_tabla,
        col = c("#FF9999", "#9999FF"),
        main = "Distribucion por sexo biologico - Bogota",
        ylab = "Frecuencia",
        names.arg = c("Hombres", "Mujeres"),
        ylim = c(0, 35))

Esta gráfica representa la distribución por sexo biológico de los niños trabajadores en Bogotá, mostrando que hay 31 hombres y 32 mujeres en la muestra analizada. Esta diferencia es mínima, lo que indica una distribución equilibrada entre ambos sexos. La presencia casi equitativa de hombres y mujeres sugiere que el trabajo infantil en Bogotá no presenta una marcada brecha de género, por lo que cualquier análisis o intervención debe considerar que ambos grupos están igualmente expuestos a esta problemática.

Resultados

La muestra analizada estuvo compuesta por 63 observaciones de cada una de las cuatro ciudades: Bogotá,Tunja, Barranquilla y Manizales. Se exploraron variables como la edad de los niños trabajadores, el tamaño del hogar y el sexo biológico.

Variable edad promedio de los niños trabajadores de Tunja y Bogota

Se analizaron los valores de edad para los niños trabajadores en las ciudades de Bogotá y Tunja. A continuación, se presentan los principales estadísticos descriptivos para cada ciudad:

Bogotá: la edad mínima registrada es de 5 años, el primer cuartil (Q1) es 9 años, la mediana es 11 años, la media es 11,3 años, el tercer cuartil (Q3) es 14,5 años y la edad máxima es de 17 años. Tunja: la edad mínima también es de 5 años, Q1 es 7 años, la mediana es 11 años, la media es 10,95 años, Q3 es 15 años y la edad máxima igualmente es de 17 años.

Ambas ciudades presentan distribuciones de edad similares en cuanto a los valores extremos y la mediana. Sin embargo, Bogotá tiene una media ligeramente superior, lo que sugiere que, en promedio, los niños trabajadores en esta ciudad tienden a ser un poco mayores que los de Tunja. En términos de dispersión, el rango intercuartílico (RIC) es más estrecho en Bogotá (5,5 años) que en Tunja (8 años), lo que indica que las edades de los niños trabajadores en Bogotá están más concentradas alrededor de la mediana.

Por lo que, respondiendo a la primera de pregunta de investigacion:

¿Existen diferencias significativas en el promedio de edad de los menores de 18 años trabajadores en relación con las ciudades de Bogotá y Tunja?

Con base en el análisis descriptivo y la aplicación de una prueba t de muestras independientes, se concluye que no existe una diferencia estadísticamente significativa entre las edades promedio de los niños trabajadores en Bogotá y Tunja. Aunque Bogotá presenta una media ligeramente superior (11,3 años frente a 10,95 años en Tunja), esta diferencia no es suficiente para considerarse significativa desde el punto de vista estadístico. Por lo tanto, se acepta la hipótesis nula (H₀), lo que indica que el promedio de edad es similar en ambas ciudades.

Variable tamaño promedio del hogar de los niños trabajores en las ciudades de Barranquilla y Manizales

Se analizaron los valores del tamaño del hogar para los niños trabajadores en las ciudades de Barranquilla y Manizales. A continuación, se presentan los principales estadísticos descriptivos para cada ciudad:

Barranquilla: el tamaño mínimo del hogar registrado es de 2 personas, el primer cuartil (Q1) es 4 personas, la mediana es 5 personas, la media es 5,38 personas, el tercer cuartil (Q3) es 6,5 personas y el tamaño máximo del hogar es de 11 personas. Manizales: el tamaño mínimo del hogar también es de 2 personas, Q1 es 3 personas, la mediana es 4 personas, la media es 3,83 personas, Q3 es 4 personas y el tamaño máximo del hogar es de 8 personas.

Ambas ciudades presentan diferencias notables en cuanto a la distribución del tamaño del hogar. Barranquilla tiene una media y mediana más altas, lo que sugiere que los niños trabajadores en esta ciudad tienden a vivir en hogares más numerosos. Además, el rango intercuartílico (RIC) también es mayor en Barranquilla (2,5 personas) que en Manizales (1 persona), lo que indica una mayor dispersión en el tamaño de los hogares.

Por lo que, respondiendo a la segunda pregunta de investigación:

¿Existen diferencias significativas en el promedio del tamaño de las familias de los menores de edad trabajadores en las ciudades de Barranquilla y Manizales?

Con base en el análisis descriptivo y la aplicación de una prueba t de muestras independientes, se concluye que sí existe una diferencia estadísticamente significativa en el tamaño promedio de los hogares entre Barranquilla y Manizales. El valor p fue 2.012e-06, menor al umbral de significancia del 5%. Esto respalda el rechazo de la hipótesis nula (H₀) y permite afirmar que, en promedio, los niños trabajadores en Barranquilla viven en hogares más grandes que los de Manizales.

Variable de sexo biologico de los niños trabajadores en la ciudad de Bogota

Se analizó la variable sexo biológico de los niños trabajadores en la ciudad de Bogotá, con el fin de identificar la proporción entre hombres y mujeres en esta población.

A partir de la muestra aleatoria seleccionada, se observó que el 49,21% de los niños trabajadores son hombres, mientras que el 50,79% son mujeres. Esta distribución es bastante equilibrada, con una ligera mayoría de mujeres en la muestra.

En términos generales, los resultados sugieren que no existe un sesgo marcado por sexo biológico en el trabajo infantil dentro de la ciudad de Bogotá, al menos en la muestra analizada. La proporción casi equitativa podría reflejar que tanto niños como niñas están expuestos, en proporciones similares, a situaciones de trabajo a temprana edad en esta ciudad.

Por lo tanto, respondiendo a la tercera pregunta de investigación:

¿Cuál es la proporción de menores trabajadores respecto al sexo biológico en la ciudad de Bogotá?

Se puede decir que en Bogotá, la participación de niñas y niños en el trabajo infantil es casi igualitaria, con una diferencia menor al 2% entre ambos sexos. Esto pone de manifiesto la necesidad de abordar el trabajo infantil como un fenómeno que afecta por igual a ambos géneros, lo cual debe ser tenido en cuenta en el diseño de políticas públicas y estrategias de intervención.

Conclusiones

A partir del análisis realizado sobre el trabajo infantil en las ciudades de Bogotá, Tunja, Barranquilla y Manizales, se identificaron hallazgos importantes que permiten comprender mejor las características y condiciones de los menores trabajadores en estas regiones. En primer lugar, se encontró que la edad promedio de los niños trabajadores en Bogotá y Tunja es muy similar (11,3 años en Bogotá y 10,95 años en Tunja), y que no existen diferencias estadísticamente significativas entre ambas ciudades. Esto indica que, pese a sus diferencias geográficas y socioeconómicas, los menores comienzan a trabajar a edades comparables, lo cual refleja una problemática común en cuanto al ingreso temprano al mundo laboral.

Por otro lado, sí se evidenciaron diferencias significativas en el tamaño promedio del hogar entre Barranquilla (5,38 personas) y Manizales (3,82 personas), lo cual sugiere que en contextos donde hay más integrantes en la familia es más probable que los niños se vean obligados a trabajar para contribuir con los gastos del hogar. Este hallazgo resalta la necesidad de considerar las condiciones estructurales del hogar al diseñar estrategias para mitigar el trabajo infantil.

En cuanto a la variable de sexo biológico en la ciudad de Bogotá, se encontró que la distribución es prácticamente equitativa, con un 49,21% de hombres y un 50,79% de mujeres, lo que evidencia que el trabajo infantil afecta por igual a niños y niñas, y que cualquier intervención debe considerar esta equidad.

En conclusion, los resultados del estudio permiten inferir que el trabajo infantil en Colombia debe ser abordado desde una perspectiva integral que tenga en cuenta no solo la edad, sino también factores del entorno familiar como el tamaño del hogar, así como el enfoque de género. Las políticas públicas deben enfocarse en apoyar a las familias numerosas, intervenir de manera temprana entre los 9 y 14 años de edad, y garantizar que tanto niños como niñas tengan las mismas oportunidades de protección y desarrollo. Esto permitirá avanzar hacia la reducción del trabajo infantil en el país, mejorando las condiciones de vida y los derechos de la niñez trabajadora. Es fundamental implementar programas de apoyo económico y educativo dirigidos a hogares con niños en edad escolar, priorizando a aquellos que presentan mayor riesgo de inserción temprana en el trabajo. Asimismo, se sugiere fomentar campañas de concientización que aborden el trabajo infantil desde una perspectiva de género, dado que afecta tanto a niñas como a niños por igual.

En cuanto a futuras líneas de investigación, sería valioso ampliar el estudio a más ciudades y zonas rurales del país para obtener una visión más representativa del fenómeno. Además, incorporar variables adicionales como el nivel educativo de los padres, el acceso a servicios públicos, o el tipo de ocupación que desempeñan los menores podría ofrecer un panorama más completo de los factores que inciden en el trabajo infantil. Finalmente, también sería pertinente realizar estudios longitudinales que permitan evaluar el impacto a largo plazo de estas condiciones en la trayectoria educativa y laboral de los niños trabajadores.

Referencias

Aparicio, M. (2013). Trabajo infantil en Colombia: Factores que afectan la selección de la actividad económica.
Universidad del Rosario. Recuperado de https://revistas.urosario.edu.co/index.php/economia/article/view/2930

Congreso de la República de Colombia. (2006). Ley 1098 de 2006: Código de la Infancia y la Adolescencia. Diario Oficial. Recuperado de https://www.icbf.gov.co/cargues/avance/docs/ley_1098_2006.htm

Departamento Administrativo Nacional de Estadística (DANE). (2022). Boletín técnico: Trabajo infantil 2022. DANE. Recuperado de https://www.dane.gov.co/files/investigaciones/boletines/trabajo-infantil/boletin-trabajo-infantil-2022.pdf

Departamento Administrativo Nacional de Estadística (DANE). (2023). Colombia – Módulo de Trabajo Infantil – MTI – GEIH – 2023. DANE. Recuperado de https://microdatos.dane.gov.co/index.php/catalog/789

Holgado, D., Maya-Jariego, I., Palacio, J., & Oviedo-Trespalacios, O. (2014). Impacto del trabajo infantil en el rendimiento académico en Colombia. Psicología desde el Caribe, 31(2), 243–265. https://doi.org/10.14482/psdc.31.2.6141

Instituto Colombiano de Bienestar Familiar. (s.f.). Trabajo infantil. Recuperado el 3 de mayo de 2025, de https://www.icbf.gov.co/programas-y-estrategias/proteccion/programas-especializados-y-otras-estrategias/trabajo-infantil

Instituto Colombiano de Bienestar Familiar. (2017, 29 de octubre). Trabajo infantil.
https://www.icbf.gov.co/programas-y-estrategias/proteccion/trabajo-infantil

Organización Internacional del Trabajo (OIT). (2020). Estimaciones mundiales sobre el trabajo infantil: Resultados y tendencias, 2016–2020. OIT. Recuperado de https://www.ilo.org/global/topics/child-labour/publications/WCMS_797515/lang--es/index.htm

Pérez Caballero, A., Durán, S., Padilla Martínez, H., & Hidalgo Arango, S. (2022). Caracterización social y normativa de la explotación sexual comercial de niños, niñas y adolescentes en Cartagena, Colombia.
SUMMA. Revista Disciplinaria en Ciencias Económicas y Sociales, 4(1). https://doi.org/10.47666/summa.4.1.03

United Nations. (1989). Convention on the Rights of the Child.United Nations. https://www.unicef.org/child-rights-convention/text