## [1] 82
##            ESTU_TIPODOCUMENTO             ESTU_NACIONALIDAD 
##                             0                             0 
##                   ESTU_GENERO          ESTU_FECHANACIMIENTO 
##                             1                             0 
##                       PERIODO              ESTU_CONSECUTIVO 
##                             0                             0 
##               ESTU_ESTUDIANTE              ESTU_PAIS_RESIDE 
##                             0                             0 
##               ESTU_TIENEETNIA             ESTU_DEPTO_RESIDE 
##                             3                             1 
##         ESTU_COD_RESIDE_DEPTO             ESTU_MCPIO_RESIDE 
##                             1                             1 
##         ESTU_COD_RESIDE_MCPIO          FAMI_ESTRATOVIVIENDA 
##                             1                           290 
##            FAMI_PERSONASHOGAR             FAMI_CUARTOSHOGAR 
##                           149                           159 
##           FAMI_EDUCACIONPADRE           FAMI_EDUCACIONMADRE 
##                           270                           271 
##        FAMI_TRABAJOLABORPADRE        FAMI_TRABAJOLABORMADRE 
##                           155                           152 
##            FAMI_TIENEINTERNET          FAMI_TIENESERVICIOTV 
##                           277                           283 
##          FAMI_TIENECOMPUTADOR            FAMI_TIENELAVADORA 
##                           153                           162 
##      FAMI_TIENEHORNOMICROOGAS           FAMI_TIENEAUTOMOVIL 
##                           168                           170 
##         FAMI_TIENEMOTOCICLETA  FAMI_TIENECONSOLAVIDEOJUEGOS 
##                           159                           174 
##                FAMI_NUMLIBROS       FAMI_COMELECHEDERIVADOS 
##                           415                           332 
##    FAMI_COMECARNEPESCADOHUEVO FAMI_COMECEREALFRUTOSLEGUMBRE 
##                           285                           298 
##       FAMI_SITUACIONECONOMICA  ESTU_DEDICACIONLECTURADIARIA 
##                           176                           281 
##       ESTU_DEDICACIONINTERNET       ESTU_HORASSEMANATRABAJA 
##                           293                           161 
##         ESTU_TIPOREMUNERACION             COLE_CODIGO_ICFES 
##                           170                             0 
## COLE_COD_DANE_ESTABLECIMIENTO   COLE_NOMBRE_ESTABLECIMIENTO 
##                             0                             0 
##                   COLE_GENERO               COLE_NATURALEZA 
##                             0                             0 
##               COLE_CALENDARIO                 COLE_BILINGUE 
##                             0                           916 
##                 COLE_CARACTER            COLE_COD_DANE_SEDE 
##                           200                             0 
##              COLE_NOMBRE_SEDE           COLE_SEDE_PRINCIPAL 
##                             0                             0 
##           COLE_AREA_UBICACION                  COLE_JORNADA 
##                             0                             0 
##      COLE_COD_MCPIO_UBICACION          COLE_MCPIO_UBICACION 
##                             0                             0 
##      COLE_COD_DEPTO_UBICACION          COLE_DEPTO_UBICACION 
##                             0                             0 
##         ESTU_PRIVADO_LIBERTAD   ESTU_COD_MCPIO_PRESENTACION 
##                             0                             0 
##       ESTU_MCPIO_PRESENTACION       ESTU_DEPTO_PRESENTACION 
##                             0                             0 
##   ESTU_COD_DEPTO_PRESENTACION          PUNT_LECTURA_CRITICA 
##                             0                             0 
##     PERCENTIL_LECTURA_CRITICA        DESEMP_LECTURA_CRITICA 
##                             0                             0 
##              PUNT_MATEMATICAS         PERCENTIL_MATEMATICAS 
##                             0                             0 
##            DESEMP_MATEMATICAS              PUNT_C_NATURALES 
##                             0                             0 
##         PERCENTIL_C_NATURALES            DESEMP_C_NATURALES 
##                             0                             0 
##      PUNT_SOCIALES_CIUDADANAS PERCENTIL_SOCIALES_CIUDADANAS 
##                             0                             0 
##    DESEMP_SOCIALES_CIUDADANAS                   PUNT_INGLES 
##                             0                            41 
##              PERCENTIL_INGLES                 DESEMP_INGLES 
##                            41                            41 
##                   PUNT_GLOBAL              PERCENTIL_GLOBAL 
##                             0                            41 
##     PERCENTIL_ESPECIAL_GLOBAL          ESTU_INSE_INDIVIDUAL 
##                          5172                           143 
##           ESTU_NSE_INDIVIDUAL      ESTU_NSE_ESTABLECIMIENTO 
##                           143                             0 
##      ESTU_ESTADOINVESTIGACION             ESTU_GENERACION.E 
##                             0                             0
##     PERCENTIL_ESPECIAL_GLOBAL                 COLE_BILINGUE 
##                   97.05385626                   17.18896603 
##                FAMI_NUMLIBROS       FAMI_COMELECHEDERIVADOS 
##                    7.78757741                    6.23006193 
## FAMI_COMECEREALFRUTOSLEGUMBRE       ESTU_DEDICACIONINTERNET 
##                    5.59204354                    5.49821730 
##          FAMI_ESTRATOVIVIENDA    FAMI_COMECARNEPESCADOHUEVO 
##                    5.44192156                    5.34809533 
##          FAMI_TIENESERVICIOTV  ESTU_DEDICACIONLECTURADIARIA 
##                    5.31056483                    5.27303434 
##            FAMI_TIENEINTERNET           FAMI_EDUCACIONMADRE 
##                    5.19797335                    5.08538187 
##           FAMI_EDUCACIONPADRE                 COLE_CARACTER 
##                    5.06661663                    3.75304935 
##       FAMI_SITUACIONECONOMICA  FAMI_TIENECONSOLAVIDEOJUEGOS 
##                    3.30268343                    3.26515294 
##           FAMI_TIENEAUTOMOVIL         ESTU_TIPOREMUNERACION 
##                    3.19009195                    3.19009195 
##      FAMI_TIENEHORNOMICROOGAS            FAMI_TIENELAVADORA 
##                    3.15256146                    3.03996998 
##       ESTU_HORASSEMANATRABAJA             FAMI_CUARTOSHOGAR 
##                    3.02120473                    2.98367424 
##         FAMI_TIENEMOTOCICLETA        FAMI_TRABAJOLABORPADRE 
##                    2.98367424                    2.90861325 
##          FAMI_TIENECOMPUTADOR        FAMI_TRABAJOLABORMADRE 
##                    2.87108275                    2.85231751 
##            FAMI_PERSONASHOGAR          ESTU_INSE_INDIVIDUAL 
##                    2.79602177                    2.68343029 
##           ESTU_NSE_INDIVIDUAL                   PUNT_INGLES 
##                    2.68343029                    0.76937512 
##              PERCENTIL_INGLES                 DESEMP_INGLES 
##                    0.76937512                    0.76937512 
##              PERCENTIL_GLOBAL               ESTU_TIENEETNIA 
##                    0.76937512                    0.05629574 
##                   ESTU_GENERO             ESTU_DEPTO_RESIDE 
##                    0.01876525                    0.01876525 
##         ESTU_COD_RESIDE_DEPTO             ESTU_MCPIO_RESIDE 
##                    0.01876525                    0.01876525 
##         ESTU_COD_RESIDE_MCPIO            ESTU_TIPODOCUMENTO 
##                    0.01876525                    0.00000000 
##             ESTU_NACIONALIDAD          ESTU_FECHANACIMIENTO 
##                    0.00000000                    0.00000000 
##                       PERIODO              ESTU_CONSECUTIVO 
##                    0.00000000                    0.00000000 
##               ESTU_ESTUDIANTE              ESTU_PAIS_RESIDE 
##                    0.00000000                    0.00000000 
##             COLE_CODIGO_ICFES COLE_COD_DANE_ESTABLECIMIENTO 
##                    0.00000000                    0.00000000 
##   COLE_NOMBRE_ESTABLECIMIENTO                   COLE_GENERO 
##                    0.00000000                    0.00000000 
##               COLE_NATURALEZA               COLE_CALENDARIO 
##                    0.00000000                    0.00000000 
##            COLE_COD_DANE_SEDE              COLE_NOMBRE_SEDE 
##                    0.00000000                    0.00000000 
##           COLE_SEDE_PRINCIPAL           COLE_AREA_UBICACION 
##                    0.00000000                    0.00000000 
##                  COLE_JORNADA      COLE_COD_MCPIO_UBICACION 
##                    0.00000000                    0.00000000 
##          COLE_MCPIO_UBICACION      COLE_COD_DEPTO_UBICACION 
##                    0.00000000                    0.00000000 
##          COLE_DEPTO_UBICACION         ESTU_PRIVADO_LIBERTAD 
##                    0.00000000                    0.00000000 
##   ESTU_COD_MCPIO_PRESENTACION       ESTU_MCPIO_PRESENTACION 
##                    0.00000000                    0.00000000 
##       ESTU_DEPTO_PRESENTACION   ESTU_COD_DEPTO_PRESENTACION 
##                    0.00000000                    0.00000000 
##          PUNT_LECTURA_CRITICA     PERCENTIL_LECTURA_CRITICA 
##                    0.00000000                    0.00000000 
##        DESEMP_LECTURA_CRITICA              PUNT_MATEMATICAS 
##                    0.00000000                    0.00000000 
##         PERCENTIL_MATEMATICAS            DESEMP_MATEMATICAS 
##                    0.00000000                    0.00000000 
##              PUNT_C_NATURALES         PERCENTIL_C_NATURALES 
##                    0.00000000                    0.00000000 
##            DESEMP_C_NATURALES      PUNT_SOCIALES_CIUDADANAS 
##                    0.00000000                    0.00000000 
## PERCENTIL_SOCIALES_CIUDADANAS    DESEMP_SOCIALES_CIUDADANAS 
##                    0.00000000                    0.00000000 
##                   PUNT_GLOBAL      ESTU_NSE_ESTABLECIMIENTO 
##                    0.00000000                    0.00000000 
##      ESTU_ESTADOINVESTIGACION             ESTU_GENERACION.E 
##                    0.00000000                    0.00000000
##   FAMI_ESTRATOVIVIENDA                FAMI_EDUCACIONPADRE
## 1            Estrato 2 Secundaria (Bachillerato) completa
## 2            Estrato 2 Secundaria (Bachillerato) completa
## 3            Estrato 2                            Ninguno
## 4            Estrato 2     Técnica o tecnológica completa
## 5            Estrato 2   Técnica o tecnológica incompleta
## 6            Estrato 2     Técnica o tecnológica completa
##                  FAMI_EDUCACIONMADRE
## 1     Técnica o tecnológica completa
## 2     Técnica o tecnológica completa
## 3                            Ninguno
## 4     Técnica o tecnológica completa
## 5   Técnica o tecnológica incompleta
## 6 Secundaria (Bachillerato) completa
##                                                                   FAMI_TRABAJOLABORPADRE
## 1                                                    Es agricultor, pesquero o jornalero
## 2             Trabaja como personal de limpieza, mantenimiento, seguridad o construcción
## 3                                              Trabaja en el hogar, no trabaja o estudia
## 4                           Es operario de máquinas o conduce vehículos (taxita, chofer)
## 5                           Es operario de máquinas o conduce vehículos (taxita, chofer)
## 6 Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)
##                                                                                 FAMI_TRABAJOLABORMADRE
## 1               Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)
## 2               Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)
## 3                                                            Trabaja en el hogar, no trabaja o estudia
## 4                                                            Trabaja en el hogar, no trabaja o estudia
## 5 Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc
## 6                                                         Es vendedor o trabaja en atención al público
##   FAMI_TIENEINTERNET FAMI_TIENESERVICIOTV FAMI_TIENECOMPUTADOR
## 1                 Si                   Si                   Si
## 2                 Si                   Si                   Si
## 3                 No                   No                   No
## 4                 Si                   Si                   Si
## 5                 Si                   No                   Si
## 6                 Si                   Si                   No
##   FAMI_TIENELAVADORA FAMI_TIENEHORNOMICROOGAS FAMI_TIENEAUTOMOVIL
## 1                 Si                       Si                  No
## 2                 Si                       Si                  No
## 3                 Si                       No                  No
## 4                 Si                       Si                  No
## 5                 Si                       Si                  No
## 6                 Si                       No                  No
##   FAMI_TIENEMOTOCICLETA  FAMI_NUMLIBROS     FAMI_COMELECHEDERIVADOS
## 1                    No 26 A 100 LIBROS      3 a 5 veces por semana
## 2                    No 26 A 100 LIBROS      3 a 5 veces por semana
## 3                    No   0 A 10 LIBROS      1 o 2 veces por semana
## 4                    Si 26 A 100 LIBROS Todos o casi todos los días
## 5                    No   0 A 10 LIBROS Todos o casi todos los días
## 6                    No   0 A 10 LIBROS      3 a 5 veces por semana
##    FAMI_COMECARNEPESCADOHUEVO FAMI_COMECEREALFRUTOSLEGUMBRE
## 1 Todos o casi todos los días        1 o 2 veces por semana
## 2 Todos o casi todos los días        1 o 2 veces por semana
## 3      3 a 5 veces por semana        1 o 2 veces por semana
## 4 Todos o casi todos los días   Todos o casi todos los días
## 5 Todos o casi todos los días        1 o 2 veces por semana
## 6      3 a 5 veces por semana        3 a 5 veces por semana
##   FAMI_SITUACIONECONOMICA ESTU_DEDICACIONLECTURADIARIA ESTU_DEDICACIONINTERNET
## 1                   Mejor        Entre 30 y 60 minutos          Más de 3 horas
## 2                   Igual        Entre 30 y 60 minutos       Entre 1 y 3 horas
## 3                   Igual           30 minutos o menos   Entre 30 y 60 minutos
## 4                   Igual           30 minutos o menos      30 minutos o menos
## 5                   Igual        Entre 30 y 60 minutos       Entre 1 y 3 horas
## 6                   Igual           30 minutos o menos       Entre 1 y 3 horas
##   ESTU_GENERO COLE_NATURALEZA COLE_AREA_UBICACION PUNT_LECTURA_CRITICA
## 1           M      NO OFICIAL              URBANO                   72
## 2           F         OFICIAL              URBANO                   74
## 3           M         OFICIAL               RURAL                   43
## 4           F         OFICIAL              URBANO                   49
## 5           F         OFICIAL              URBANO                   46
## 6           M         OFICIAL              URBANO                   56
##   PUNT_MATEMATICAS PUNT_C_NATURALES PUNT_SOCIALES_CIUDADANAS PUNT_INGLES
## 1               64               69                       64          77
## 2               71               69                       66          63
## 3               53               46                       33          44
## 4               42               49                       45          50
## 5               35               41                       35          37
## 6               55               51                       63          54
##   DESEMP_LECTURA_CRITICA DESEMP_MATEMATICAS DESEMP_C_NATURALES
## 1                      4                  3                  3
## 2                      4                  4                  3
## 3                      2                  3                  2
## 4                      2                  2                  2
## 5                      2                  1                  2
## 6                      3                  3                  2
##   DESEMP_SOCIALES_CIUDADANAS DESEMP_INGLES PUNT_GLOBAL
## 1                          3            B1         340
## 2                          3            A2         347
## 3                          1            A-         219
## 4                          2            A1         233
## 5                          1            A-         195
## 6                          3            A1         280
## [1] 5329   33
## [1] "data.frame"
## Dimensiones antes de limpiar: 5329 33
## Dimensiones después de limpiar: 4560 33
##          FAMI_ESTRATOVIVIENDA           FAMI_EDUCACIONPADRE 
##                             0                             0 
##           FAMI_EDUCACIONMADRE        FAMI_TRABAJOLABORPADRE 
##                             0                             0 
##        FAMI_TRABAJOLABORMADRE            FAMI_TIENEINTERNET 
##                             0                             0 
##          FAMI_TIENESERVICIOTV          FAMI_TIENECOMPUTADOR 
##                             0                             0 
##            FAMI_TIENELAVADORA      FAMI_TIENEHORNOMICROOGAS 
##                             0                             0 
##           FAMI_TIENEAUTOMOVIL         FAMI_TIENEMOTOCICLETA 
##                             0                             0 
##                FAMI_NUMLIBROS       FAMI_COMELECHEDERIVADOS 
##                             0                             0 
##    FAMI_COMECARNEPESCADOHUEVO FAMI_COMECEREALFRUTOSLEGUMBRE 
##                             0                             0 
##       FAMI_SITUACIONECONOMICA  ESTU_DEDICACIONLECTURADIARIA 
##                             0                             0 
##       ESTU_DEDICACIONINTERNET                   ESTU_GENERO 
##                             0                             0 
##               COLE_NATURALEZA           COLE_AREA_UBICACION 
##                             0                             0 
##          PUNT_LECTURA_CRITICA              PUNT_MATEMATICAS 
##                             0                             0 
##              PUNT_C_NATURALES      PUNT_SOCIALES_CIUDADANAS 
##                             0                             0 
##                   PUNT_INGLES        DESEMP_LECTURA_CRITICA 
##                             0                             0 
##            DESEMP_MATEMATICAS            DESEMP_C_NATURALES 
##                             0                             0 
##    DESEMP_SOCIALES_CIUDADANAS                 DESEMP_INGLES 
##                             0                             0 
##                   PUNT_GLOBAL 
##                             0
## [1] 33

Introducción y Contextualización

Contexto

Calidad Educativa

La calidad educativa es un concepto complejo y dinámico, que ha sido objeto de estudio en los campos de investigación educativa, innovación pedagógica y de políticas públicas de la educación, a nivel global (United Nations Educational, Scientific and Cultural Organization [UNESCO] & United Nations International Children’s Emergency Fund [UNICEF], 2007; Rothen et al. 2019; Ferreyra et al., 2020; Dachet & Baye, 2022; Chong et al., 2022; Azaña-Lucio et al., 2024). Por un lado, el carácter complejo de la calidad educativa obedece a su naturaleza polisémica y a que ha sido objeto de múltiples interpretaciones teóricas y normativas. En primer lugar, resulta pertinente abordar las diferentes concepciones académicas del concepto. Para Javornil & Klemenčič (2023) la calidad educativa surge en respuesta a las políticas de educación centradas en el acceso e implica una orientación hacia el resultado, que pasa por un proceso de tres fases: primero, la definición de unas competencias y resultados de aprendizaje esperados; segundo, un proceso de enseñanza estandarizado que permita desarrollarlos; y tercero, pruebas objetivas estandarizadas que permitirán evaluarlos. En complemento, Azaña-Lucio et al. (2024) plantean que la efectividad a la hora de alcanzar resultados de aprendizaje y contribuir al desarrollo de competencias depende de la pedagogía y el acceso a recursos educativos. Por su parte, el enfoque basado en competencias, propuesto como una vía para garantizar la empleabilidad y la productividad futura de los estudiantes, concibe que la calidad de la educación depende del desarrollo de habilidades y destrezas necesarias para la adaptación de los egresados al mercado laboral; de aquí, que se prioricen las capacidades técnicas y la formación en gestión empresarial (Álvarez y Matarranz, 2020; Bueno, 2022).

En contraste, el enfoque basado en valores emerge como una crítica hacia la “pedagogía del examen”, es decir, la noción de que la calidad educativa está ligada a la medición cuantitativa (evaluación) de los resultados académicos (Guzmán, 2020). Esta noción se caracteriza por considerar que los valores y la diversidad cultural son elementos por considerar a la hora de hablar de calidad educativa; de aquí, que se enfatice en la necesidad de integrar aspectos socioformativos y contextuales al proceso evaluativo, reconociendo que la calidad es un término amplio y sujeto a interpretación que debe responder a las necesidades y demandas sociales (Ferreyra et al., 2020; Chávez y Ordoñez. 2020). En complemento, los modelos del bienestar traen elementos de la psicología para explicar la calidad educativa y desligarse de la orientación hacia los resultados cognitivos (Leal-Soto & Cuadros., 2021). Por un lado, el enfoque del bienestar psicológico considera que la calidad educativa requiere de un balance entre los recursos internos del estudiante con las exigencias del contexto, algo que obtiene al fomentar el desarrollo de los seis componentes del bienestar: el propósito de vida, la autonomía, el crecimiento personal, el dominio ambiental, las relaciones positivas y la autoaceptación (Ryff, 2014). Por otro lado, el enfoque del bienestar subjetivo le asigna una importancia central al aspecto afectivo y relacional del estudiante a la hora de alcanzar la calidad educativa, dado que su proceso de aprendizaje y los subsecuentes resultados académicos dependen de su satisfacción con el entorno educativo; sus relaciones con docentes y seres queridos; y el balance entre las emociones positivas y negativas (Diener et al., 2009). En ambos casos, se sostiene que la calidad educativa está intrínsecamente ligada a la dimensión socioemocional y relacional de los estudiantes, lo que convierte al desarrollo integral y social del estudiante en un factor determinante en la consecución de sus resultados académicos (Leal-Soto & Cuadros, 2021).

Ahora bien, desde la perspectiva del modelo “Teaching Learning Support (TLS)”, se sostiene que la calidad educativa es resultado de la interdependencia de seis elementos esenciales para el proceso educativo de cada estudiante: (a) un estilo de vida de calidad, que se refiere a la salud, integridad y nutrición de los estudiantes; (b) un currículo de calidad, que esté diseñado para explorar y mejorar el potencial innato de los estudiantes; (c) docentes de calidad, es decir, calificados, motivados y con la capacidad de generar experiencias de aprendizaje útiles; (d) líderes educativos de calidad, que alude a la gestión de las directivas de los colegios y su capacidad de generar un ambiente escolar que favorezca la calidad; (e) padres de calidad, que reconoce la influencia del entorno y las dinámicas familiares en el rendimiento académico; y (f) recursos apropiados, que se refiere a los materiales y la infraestructura (Thinley, 2021). Este modelo considera que la articulación apropiada de estos seis elementos en los establecimientos educativos resultará en la formación y desarrollo integral de los alumnos, lo que asegura que se convertirán en ciudadanos cualificados y motivados (Thinley, 2021). Este enfoque se posiciona como una síntesis de las dos tendencias que se mencionaron anteriormente, pues le confiere importancia tanto a los elementos cognitivos del aprendizaje (resultados académicos), como a los elementos relacionales y socioemocionales.

En segundo lugar, se traen a colación algunas definiciones normativas y legales de la calidad educativa. La UNESCO (2025) aduce que el derecho humano a la educación va más allá del acceso, en tanto que implica un aprendizaje significativo, que proporcione a los estudiantes “los conocimientos; las habilidades cognitivas, emocionales y sociales; y los valores necesarios para desenvolverse y contribuir activamente en el mundo” (párr. 1). En este sentido, el concepto de calidad educativa va más allá de la adquisición de competencias básicas: Se espera que “que los estudiantes se involucren con lo que aprenden y le den sentido” (párr. 2). Desde esta concepción, se concibe a la educación como un medio para mejorar las vidas de los individuos y generar prosperidad en sus comunidades. En complemento, la Declaración de Incheon, principal instrumento orientador del objetivo de desarrollo sostenible sobre educación (ODS 4), concibe a la calidad educativa como una transformación sistémica que tiene cuatro pilares fundamentales: Primero, la equidad y la inclusión, que exige erradicar todas las formas de marginación, desigualdad y disparidad en el acceso a la educación, el desarrollo de habilidades y los resultados de aprendizaje, asegurando que nadie se quede atrás (United Nations Development Programme [UNDP] et al., 2015, art. 7). Segundo, la igualdad de género, al aducir que la calidad educativa requiere de la eliminación de todas las formas de discriminación y violencia contra las niñas y las mujeres. Tercero, la integralidad, que se entiende como el fortalecimiento de insumos, procesos y los mecanismos de evaluación para mejorar los resultados de aprendizaje. Y cuarto, el aprendizaje a lo largo de la vida, que implica entender que el aprendizaje va más allá de la infancia y la juventud (educación primaria y secundaria), por tanto, deben ofrecerse oportunidades de formación técnica y profesional accesibles, asequibles y de calidad. Ambas nociones de calidad educativa se reflejan en la Agenda 2030, por consiguiente, son fundamentos de política pública en Colombia, en virtud del CONPES 3918 de 2018. Por último, conviene señalar que la Ley General de Educación reúne a todos los enfoques teóricos abordados anteriormente en su definición de calidad educativa, en tanto que asigna una importancia central a la inspección y evaluación del proceso educativo, los recursos y los métodos educativos (orientación hacia los resultados), a la cualificación y formación de los educadores (TLS), a la innovación e investigación educativa, a la orientación hacia la profesionalidad (enfoque basado en competencias), a la formación en valores (enfoque basado en valores) y el desarrollo de la personalidad dentro de un proceso de formación integral, física, psíquica, intelectual, moral, espiritual, social, afectiva, ética y cívica (modelos de bienestar).

La educación en Colombia

La educación en Colombia ha experimentado avances significativos en términos de cobertura y acceso en las últimas décadas, consolidándose como un derecho fundamental y un pilar para el desarrollo social y económico del país. El sistema educativo colombiano se estructura en cinco niveles formales: educación inicial, educación preescolar, educación básica (que incluye primaria y secundaria), educación media, y educación superior. Estos niveles están diseñados para ofrecer un proceso formativo integral, garantizando la educación obligatoria desde temprana edad hasta la culminación de la educación media, que otorga el título de bachiller; posteriormente, los estudiantes pueden acceder a la educación superior para continuar su formación académica o técnica (Ministerio de Educación Nacional, 2024; Universidad Javeriana, 2024).

El panorama educativo colombiano durante el año 2021 estuvo marcado por un contexto excepcional derivado de la pandemia de COVID-19, la cual profundizó las desigualdades históricas y destacó vulnerabilidades en la cobertura y calidad del sistema. La transición rápida hacia la educación remota y modelos híbridos se vio marcada por la distribución desigual de recursos tecnológicos y el apoyo familiar, evidenciando las brechas socioeconómicas preexistentes.

En términos cuantitativos, la tasa bruta educativa, que representa la matrícula total sin importar la edad de los estudiantes en relación con la población en edad teórica para cada nivel educativo, alcanzó valores superiores al 100% en ciertos niveles. Esto refleja la presencia significativa de estudiantes en “extraedad” debido a repitencias o atrasos. De manera contrastante, la tasa neta, que mide la matrícula de estudiantes en la edad normativa para su nivel, fue considerablemente inferior, situándose en torno al 80% en educación básica. Tal discrepancia evidencia desafíos de eficiencia educativa y dificultades para asegurar el acceso y progresión oportunos dentro del sistema (Banco de la República, 2021; Ministerio de Educación Nacional, 2023).

Adicionalmente, en 2021 se reportaron aproximadamente 333.000 casos de deserción escolar y más de 643.000 reprocesos, indicadores que ejemplifican el impacto adverso del contexto sanitario en la continuidad y el desempeño académico de los estudiantes. Estos datos ponen de manifiesto que, aunque la cobertura nominal permaneció amplia, la eficacia del sistema y la equidad educativa se vieron severamente comprometidas, enfrentando retos estructurales que requieren atención prioritaria (ANIF, 2021; Universidad Javeriana, 2024).

Más allá de los números que reflejan la cobertura educativa, es fundamental entender que la educación en Colombia enfrenta problemáticas estructurales profundas que limitan la inclusión, la calidad y la progresión adecuada de los estudiantes a lo largo de sus trayectorias escolares. Las desigualdades sociales, culturales y económicas configuradas históricamente se traducen en desigual acceso a recursos fundamentales, tales como infraestructura educativa adecuada, docentes capacitados, materiales pedagógicos y tecnologías, lo cual condiciona de manera determinante la calidad del aprendizaje. Esta situación está estrechamente ligada a la segmentación del sistema educativo, donde las diferencias entre educación pública y privada, así como entre regiones urbanas y rurales, reproducen y exacerban brechas de oportunidad (Ayala, 2021; Mazo, 2024).

La pandemia de COVID-19 agudizó este panorama al imponer una transición abrupta hacia modelos educativos remotos, que demandaron acceso a tecnologías y apoyo familiar que no estuvieron al alcance para una proporción significativa de estudiantes, particularmente en contextos de vulnerabilidad socioeconómica y geográfica. Esta crisis evidenció la interdependencia entre capital económico (recursos monetarios y materiales), capital cultural (conocimientos, competencias y hábitos educativos) y capital simbólico (prestigio y legitimidad social asociados al contexto educativo), como factores determinantes para garantizar el acceso efectivo y la permanencia en el sistema educativo (Banco Mundial, 2023; Gutiérrez et al., 2025).

Estas desigualdades estructurales no solo afectan la cobertura o la tasa de permanencia, sino que repercuten directamente en los resultados académicos y, en última instancia, en las oportunidades de movilidad social. La teoría de la reproducción social y cultural de Bourdieu permite comprender cómo la distribución diferencial de estos capitales en la sociedad colombiana condiciona la experiencia educativa, perpetuando desigualdades intergeneracionales.

En este sentido, el sistema educativo se convierte en un mecanismo que legitima y reproduce un determinado orden social, moldeando habitus y prácticas que refuerzan las jerarquías socioeconómicas existentes (Bourdieu, 1986). Así, el diagnóstico del sistema en 2021 es especialmente relevante para analizar cómo las oportunidades de éxito en pruebas estandarizadas como Saber 11 están marcadas por esta interacción compleja entre factores estructurales, culturales y económicos (Gutiérrez, 2025; ANIF, 2021).

Estado del Arte El rendimiento académico de los estudiantes en Colombia, medido a través de la prueba Saber 11, se encuentra profundamente condicionado por factores de tipo familiar, socioeconómico, institucional y cultural. En primer lugar, el entorno familiar constituye un elemento determinante, dado que el nivel educativo de los padres, el estrato socioeconómico y los recursos culturales disponibles en el hogar, como la presencia de libros o el acceso a dispositivos tecnológicos, inciden directamente en el desempeño estudiantil (García-González & Skrita, 2019). En concordancia, Cruz Castro et al. (2016) destacan que los niveles socioeconómicos y culturales familiares, sintetizados mediante índices compuestos, se correlacionan positivamente con los puntajes obtenidos en las pruebas Saber 11. A su vez, la heterogeneidad regional y la naturaleza de las instituciones educativas también repercuten significativamente: existen brechas notorias entre los resultados de colegios públicos y privados, explicadas principalmente por las diferencias en los recursos escolares y por las condiciones sociales de los estudiantes (Tobar Bedoya et al., 2016). Estas desigualdades se expresan de manera más amplia a nivel regional, donde factores estructurales como las necesidades básicas insatisfechas, la desigualdad económica y el producto interno bruto territorial se asocian con la calidad de la educación media (Fajardo Ortiz et al., 2021).

Por otro lado, estudios longitudinales entre 2014 y 2019 han evidenciado que el dominio del idioma inglés se constituye como un componente relevante del capital cultural y un factor con alta influencia en el desempeño académico general (Collazos Valenzuela et al., 2021). Asimismo, la combinación entre capital cultural y género incide en las trayectorias educativas, reproduciendo desigualdades en el acceso y permanencia en la educación superior, en correspondencia con las tesis de la reproducción social planteadas por Bourdieu y Passeron (Rodríguez, 2022).

En los años más recientes, la pandemia de COVID-19 agudizó las brechas preexistentes en materia de aprendizaje, generando una disminución en los puntajes de las pruebas Saber 11 y una ampliación de las desigualdades entre estudiantes de distintos contextos socioeconómicos. Entre los principales factores explicativos se destacan la falta de acceso a internet, la precariedad tecnológica y la menor disponibilidad de espacios adecuados para el estudio en el hogar (Marín Llanes et al., 2023; Alvarado et al., 2023; Mejía Castaño, et al., 2020; Moreno Lizarazo, 2023). En suma, la evidencia empírica muestra que el capital económico, social y cultural de las familias, junto con la infraestructura educativa y tecnológica disponible, determina en gran medida las oportunidades de éxito académico y la continuidad en la educación superior en el contexto colombiano (Rangel & Lleras, 2010; Corsi, 2012).

Marco Teórico Referencial

Descripción de Variables

Capital económico:

De acuerdo con Pierre Bourdieu (1986), el capital económico se refiere al conjunto de recursos materiales y financieros que un individuo o grupo posee, los cuales determinan su capacidad de acceder a bienes, servicios y condiciones de vida que sostienen una posición social determinada dentro del espacio de clases. En este sentido, variables como el estrato socioeconómico, la tenencia de vivienda, la posesión de automóvil, horno, lavadora o motocicleta constituyen indicadores directos de capital económico, ya que expresan tanto el nivel de ingreso disponible como el patrimonio acumulado del hogar. Asimismo, el consumo frecuente de alimentos como leche, proteínas, frutas, cereales y legumbres refleja la posibilidad de destinar recursos a una alimentación variada y nutritiva, lo que también denota una posición económica más estable. Como lo plantea Bourdieu (1979), las diferencias en los hábitos de consumo material y alimentario están estrechamente relacionadas con la estructura de clases, dado que los agentes sociales manifiestan su posición en el espacio social a través de las prácticas de consumo y las condiciones materiales de existencia.

Capital cultural:

Según la conceptualización de Pierre Bourdieu (1986), el capital cultural comprende el conjunto de conocimientos, habilidades, disposiciones y bienes culturales que los individuos adquieren y acumulan a lo largo de su trayectoria social y educativa, y que contribuyen a mantener o mejorar su posición dentro del espacio social. Este capital puede presentarse en tres formas: incorporada, como los hábitos de lectura o el uso cotidiano de medios informativos; objetivada, representada por bienes culturales materiales como libros, computadores o acceso a tecnologías de información; y institucionalizada, evidenciada en credenciales educativas o formas de reconocimiento académico. En este sentido, variables como el acceso a un computador, el acceso a internet, el tiempo dedicado al uso de internet, y el servicio de televisión reflejan la disponibilidad de medios que facilitan la apropiación de conocimientos y la participación en circuitos informativos y culturales. A su vez, el número de libros en el hogar y la lectura diaria son expresiones del capital cultural incorporado, pues evidencian prácticas orientadas al aprendizaje y la formación de gustos o disposiciones intelectuales. Así, estas variables no solo capturan el nivel de acceso a recursos educativos y simbólicos, sino también las diferencias en las prácticas culturales que, según Bourdieu, estructuran la reproducción de las desigualdades sociales.

Las variables “acceso a un computador”, “acceso a internet”, “tiempo dedicado al uso de internet”, “servicio de televisión”, “número de libros” y “lectura diaria” pueden interpretarse como indicadores del capital cultural en sus dimensiones objetivada e incorporada, según la teoría de Bourdieu (1986). El acceso a dispositivos tecnológicos y la conectividad reflejan nuevas formas de capital cultural objetivado, vinculadas a la inclusión digital y al acceso a la información (Cabero-Almenara & Ruiz-Palmero, 2018), mientras que los hábitos de lectura y la disponibilidad de libros expresan el capital cultural incorporado, asociado a la interiorización de disposiciones cognitivas y lingüísticas que favorecen el desempeño académico (Rangel & Lleras, 2010; Corsi, 2012). En conjunto, estos elementos permiten comprender cómo las desigualdades en el acceso a recursos culturales y tecnológicos inciden en las diferencias de rendimiento observadas en la prueba Saber 11.

Teoría de la reproducción social:

En complemento a la teoría del capital social, Bourdieu y Passeron desarrollaron la teoría de reproducción social y cultural con el propósito de explicar la transmisión intergeneracional de los capitales. Esta teoría parte de la premisa de que la propiedad de los capitales es objeto de dinámicas de conversión y reconversión que crean y recrean diferencias sociales (Nash, 2008). La tenencia diferenciada de los capitales da lugar a un sistema de clases, entendido como un orden social en el que se configuran relaciones de poder que pretenden perpetuar la dominación (el monopolio) de la clase dominante (Bourdieu, 1990). Esta conceptualización surge como una crítica a los enfoques puramente economicistas (como el marxista) que se concentran exclusivamente en el capital económico (factores convertibles en dinero) a la hora de estudiar el orden social (Nash, 2008; Bourdieu, 1973). Por su parte, Bourdieu privilegia la transferencia del capital cultural como el factor más determinante y mejor oculto de la reproducción de un determinado orden social (Bourdieu, 1986; Azubuike et al., 2023). El sistema educativo, en tanto escenario institucional de socialización secundaria, es el aparato que se emplea para producir y reproducir el capital cultural. De aquí, que Bourdieu y Passeron lo posicionen como el principal aparato responsable de la reproducción cultural y social.

Antes de pretender explicar el papel del sistema educativo en la reproducción social y cultural, resulta pertinente definir ambos conceptos. Por un lado, la reproducción cultural se refiere al proceso histórico de transferencia del capital cultural, en el que un arbitrario cultural específico de un grupo o clase es inculcado de manera duradera (Bourdieu & Passeron, 1990). En este sentido, el paso por el sistema educativo (exposición a la acción pedagógica) culmina en la producción de un habitus durable, homogéneo y transponible, que moldea las disposiciones de los agentes para generar prácticas que reproducen el sistema de clases de un determinado orden social. El arbitrario cultural se define como una “selección arbitraria de significados que expresa los intereses y objetivos de un poder arbitrario, es decir, grupos sociales o clases dominantes” (Bourdieu & Passeron, 1990, p. 7, trad. libre). Es arbitrario, en tanto que su estructura y funciones no se deducen de un principio universal de carácter físico o biológico, sino que son artificialmente construidas para perpetuar la estructura de clases Bourdieu & Passeron, 1990, p. 205, trad. libre).

Por su parte, la reproducción social es entendida como la perpetuación de la estructura de clases (relaciones simbólicas y de poder entre clases) de un determinado orden social (Bourdieu, 1973; Bourdieu & Passeron, 1990). Cabe resaltar que implica la impartición de prácticas comportamentales y relacionales a los agentes, de acuerdo con su posición en la estructura de clases. En este sentido, la reproducción social depende de la distribución y transmisión del capital cultural entre las distintas clases sociales, es decir, que es resultado de la reproducción cultural. De aquí, que el sistema educativo, como el principal escenario de reproducción cultural, sea también el principal mecanismo de legitimación de la estructura de clases, al concebir las desigualdades sociales hereditarias del sistema de clase en jerarquías académicas legítimas basadas en la ideología de los dones y el mérito individual (Bourdieu, 1973) enmascarando así los medios por los que se transmiten los privilegios y se conserva un determinado orden social.

Diseño Metodológico

Pregunta de Investigación: En este sentido, resulta pertinente preguntarse ¿En qué medida incide la acumulación de capital económico y cultural en el puntaje global de la prueba Saber 11 (2021-2)?

Objetivos de la Investigación :

Objetivo General: Demostrar empíricamente si la acumulación del capital cultural y económico tiene un correlación positiva con los resultados obtenidos en la prueba estandarizada “Saber 11” del segundo semestre de 2021.

Objetivos específicos:

OE1. Analizar las variables que integran el modelo cuantitativo mediante técnicas de estadística descriptiva.

OE2 Construir índices que operacionalicen las teorías bourdieusianas del capital y la reproducción social, a partir de la base de datos de la prueba estandarizada “Saber 11” (2021-2)

OE3. Demostrar que el capital cultural, el capital económico y la reproducción social inciden en los resultados de la prueba estandarizada “saber 11” del segundo semestre de 2021.

Hipótesis de la Investigación:

H₁: Existe una relación positiva y estadísticamente significativa entre la acumulación de capital económico y cultural; y los resultados obtenidos en la Prueba Saber 11 (2021-2).

H₀: No existe una relación positiva y estadísticamente significativa entre la acumulación de capital económico y cultural; y los resultados obtenidos en la Prueba Saber 11 (2021-2).

Fuente de Datos: Se utilizó la base de datos oficial del ICFES correspondiente a la aplicación de la prueba Saber 11 del segundo semestre de 2021 (SB11_20212), la cual contiene información sociodemográfica y resultados académicos de los estudiantes.

Analisís de estadstica descriptiva

Variables Independiente

Capital Cultural: Las variables “acceso a un computador”, “acceso a internet”, “tiempo dedicado al uso de internet”, “servicio de televisión”, “número de libros” y “lectura diaria” pueden interpretarse como indicadores del capital cultural en sus dimensiones objetivada e incorporada, según la teoría de Bourdieu (1986). El acceso a dispositivos tecnológicos y la conectividad reflejan nuevas formas de capital cultural objetivado, vinculadas a la inclusión digital y al acceso a la información (Cabero-Almenara & Ruiz-Palmero, 2018), mientras que los hábitos de lectura y la disponibilidad de libros expresan el capital cultural incorporado, asociado a la interiorización de disposiciones cognitivas y lingüísticas que favorecen el desempeño académico (Rangel & Lleras, 2010; Corsi, 2012). En conjunto, estos elementos permiten comprender cómo las desigualdades en el acceso a recursos culturales y tecnológicos inciden en las diferencias de rendimiento observadas en la prueba Saber 11.

Proporciones

##                        Variable                  Categoria Porcentaje
## 1       ESTU_DEDICACIONINTERNET         30 minutos o menos      13.25
## 2       ESTU_DEDICACIONINTERNET          Entre 1 y 3 horas      33.03
## 3       ESTU_DEDICACIONINTERNET      Entre 30 y 60 minutos      22.79
## 4       ESTU_DEDICACIONINTERNET             Más de 3 horas      26.73
## 5       ESTU_DEDICACIONINTERNET         No Navega Internet       4.21
## 6  ESTU_DEDICACIONLECTURADIARIA         30 minutos o menos      38.71
## 7  ESTU_DEDICACIONLECTURADIARIA          Entre 1 y 2 horas       9.58
## 8  ESTU_DEDICACIONLECTURADIARIA      Entre 30 y 60 minutos      26.25
## 9  ESTU_DEDICACIONLECTURADIARIA             Más de 2 horas       4.47
## 10 ESTU_DEDICACIONLECTURADIARIA No leo por entretenimiento      20.99
## 11               FAMI_NUMLIBROS              0 A 10 LIBROS      45.18
## 12               FAMI_NUMLIBROS             11 A 25 LIBROS      31.25
## 13               FAMI_NUMLIBROS            26 A 100 LIBROS      18.60
## 14               FAMI_NUMLIBROS          MÁS DE 100 LIBROS       4.98
## 15         FAMI_TIENECOMPUTADOR                         No      39.69
## 16         FAMI_TIENECOMPUTADOR                         Si      60.31
## 17         FAMI_TIENESERVICIOTV                         No      24.96
## 18         FAMI_TIENESERVICIOTV                         Si      75.04
## 19           FAMI_TIENEINTERNET                         No      24.76
## 20           FAMI_TIENEINTERNET                         Si      75.24

El análisis descriptivo de las variables seleccionadas revela un perfil de capital cultural caracterizado por una asimetría entre el acceso a infraestructura tecnológica y la apropiación de hábitos culturales tradicionales. Mientras que la conectividad básica es predominante con un 75.24% de acceso a internet y un 75.04% a televisión, se observa una brecha en la tenencia de herramientas de productividad, dado que la posesión de computadores desciende al 60.31%. Esta infraestructura digital soporta un patrón de comportamiento intensivo en el consumo de red, donde la moda de uso se sitúa entre 1 y 3 horas diarias (33.03%), en claro contraste con los hábitos de lectura, cuya frecuencia modal es de 30 minutos o menos (38.71%), destacándose además que un 20.99% de la población reporta nula actividad lectora. Dicha tendencia es consistente con la precariedad del capital cultural objetivado en los hogares, evidenciada por el hecho de que el 45.18% de las familias posee una biblioteca exigua de entre 0 y 10 libros, lo que sugiere una transición del consumo cultural hacia medios digitales en detrimento del entorno letrado físico.

##                         Variable                    Categoria Frecuencia
## 1           FAMI_ESTRATOVIVIENDA                    Estrato 1       1243
## 2           FAMI_ESTRATOVIVIENDA                    Estrato 2       1780
## 3           FAMI_ESTRATOVIVIENDA                    Estrato 3       1023
## 4           FAMI_ESTRATOVIVIENDA                    Estrato 4        254
## 5           FAMI_ESTRATOVIVIENDA                    Estrato 5         64
## 6           FAMI_ESTRATOVIVIENDA                    Estrato 6         35
## 7           FAMI_ESTRATOVIVIENDA                  Sin Estrato        161
## 8            FAMI_TIENEAUTOMOVIL                           No       3339
## 9            FAMI_TIENEAUTOMOVIL                           Si       1221
## 10      FAMI_TIENEHORNOMICROOGAS                           No       2456
## 11      FAMI_TIENEHORNOMICROOGAS                           Si       2104
## 12            FAMI_TIENELAVADORA                           No        926
## 13            FAMI_TIENELAVADORA                           Si       3634
## 14         FAMI_TIENEMOTOCICLETA                           No       2570
## 15         FAMI_TIENEMOTOCICLETA                           Si       1990
## 16       FAMI_COMELECHEDERIVADOS       1 o 2 veces por semana       1535
## 17       FAMI_COMELECHEDERIVADOS       3 a 5 veces por semana       1262
## 18       FAMI_COMELECHEDERIVADOS Nunca o rara vez comemos eso        390
## 19       FAMI_COMELECHEDERIVADOS  Todos o casi todos los días       1373
## 20    FAMI_COMECARNEPESCADOHUEVO       1 o 2 veces por semana       1093
## 21    FAMI_COMECARNEPESCADOHUEVO       3 a 5 veces por semana       1397
## 22    FAMI_COMECARNEPESCADOHUEVO Nunca o rara vez comemos eso        223
## 23    FAMI_COMECARNEPESCADOHUEVO  Todos o casi todos los días       1847
## 24 FAMI_COMECEREALFRUTOSLEGUMBRE       1 o 2 veces por semana       1650
## 25 FAMI_COMECEREALFRUTOSLEGUMBRE       3 a 5 veces por semana       1446
## 26 FAMI_COMECEREALFRUTOSLEGUMBRE Nunca o rara vez comemos eso        639
## 27 FAMI_COMECEREALFRUTOSLEGUMBRE  Todos o casi todos los días        825
##    Porcentaje
## 1       27.26
## 2       39.04
## 3       22.43
## 4        5.57
## 5        1.40
## 6        0.77
## 7        3.53
## 8       73.22
## 9       26.78
## 10      53.86
## 11      46.14
## 12      20.31
## 13      79.69
## 14      56.36
## 15      43.64
## 16      33.66
## 17      27.68
## 18       8.55
## 19      30.11
## 20      23.97
## 21      30.64
## 22       4.89
## 23      40.50
## 24      36.18
## 25      31.71
## 26      14.01
## 27      18.09

El análisis descriptivo de la muestra revela una estructura socioeconómica de base piramidal, caracterizada por una alta concentración en los estratos bajos y medios. El 88,7% de la población se agrupa en los estratos 1, 2 y 3, siendo el estrato 2 la categoría modal con un 39,04%. Por el contrario, la participación de los estratos altos (4, 5 y 6) es marginal, sumando apenas un 7,7% del total, lo que sugiere una población predominantemente de clase trabajadora o media-baja.

Esta configuración socioeconómica se refleja directamente en el acceso a bienes duraderos. Se observa una jerarquización de las necesidades: mientras que la lavadora, un electrodoméstico asociado a la eficiencia doméstica básica, tiene una alta penetración (79,69%), el acceso a bienes de mayor costo o “lujo” es restringido. Solo el 26,78% de los hogares posee automóvil, evidenciando que el transporte privado de cuatro ruedas no es el estándar; de hecho, la motocicleta (43,64%) supera al automóvil, posicionándose como una alternativa de movilidad más accesible. Asimismo, el acceso al horno microondas se encuentra polarizado, con una ligera mayoría (53,86%) que aún carece de este bien, lo que refuerza la caracterización de hogares con equipamiento básico.

En términos de seguridad alimentaria, los patrones de consumo muestran disparidades nutricionales relevantes. Existe un acceso sólido a proteínas (carne, pescado, huevo), donde el 71% de los hogares reporta un consumo frecuente (3 o más veces por semana). Sin embargo, se detecta una brecha en la calidad balanceada de la dieta: el consumo de frutas, legumbres y cereales es significativamente menor. Apenas el 18,09% consume estos alimentos diariamente, y la moda se sitúa en un consumo esporádico de “1 a 2 veces por semana” (36,18%). Esto sugiere que, si bien las necesidades calóricas proteicas parecen cubiertas para la mayoría, existe un déficit potencial en la ingesta de micronutrientes vegetales, posiblemente derivado de factores económicos o hábitos culturales.

Tablas y Gráficas
Tabla de frecuencias porcentuales del nivel educativo del padre
Nivel Educativo del Padre Porcentaje (%)
Secundaria (Bachillerato) completa 25.44
Primaria incompleta 17.11
Secundaria (Bachillerato) incompleta 14.47
Educación profesional completa 9.74
Primaria completa 8.90
Técnica o tecnológica completa 7.08
No sabe 6.10
Ninguno 2.98
Técnica o tecnológica incompleta 2.48
Postgrado 2.19
Educación profesional incompleta 2.11
No Aplica 1.40
Tabla de frecuencias porcentuales de la ocupación del Padre
Ocupación Principal del Padre Porcentaje (%)
Trabaja por cuenta propia (por ejemplo plomero, electricista) 13.31
Es agricultor, pesquero o jornalero 12.52
Es operario de máquinas o conduce vehículos (taxita, chofer) 10.72
No aplica 9.47
No sabe 8.71
Trabaja como profesional (por ejemplo médico, abogado, ingeniero) 7.94
Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc) 7.79
Trabaja como personal de limpieza, mantenimiento, seguridad o construcción 7.63
Trabaja en el hogar, no trabaja o estudia 6.34
Es vendedor o trabaja en atención al público 6.32
Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente) 3.99
Es dueño de un negocio grande, tiene un cargo de nivel directivo o gerencial 2.68
Pensionado 2.59
Tabla de frecuencias porcentuales del nivel educativo de la madre
Nivel Educativo de la Madre Porcentaje (%)
Secundaria (Bachillerato) completa 29.19
Secundaria (Bachillerato) incompleta 14.14
Educación profesional completa 12.70
Primaria incompleta 12.50
Técnica o tecnológica completa 10.46
Primaria completa 8.44
Técnica o tecnológica incompleta 3.60
Educación profesional incompleta 2.59
Postgrado 2.48
No sabe 1.86
Ninguno 1.82
No Aplica 0.22
Tabla de frecuencias porcentuales de la ocupación de la Madre
Ocupación Principal de la Madre Porcentaje (%)
Trabaja en el hogar, no trabaja o estudia 38.62
Es vendedora o trabaja en atención al público 9.17
Trabaja como personal de limpieza, mantenimiento, seguridad o construcción 9.10
Es dueña de un negocio pequeño 9.01
Trabaja como profesional (médica, abogada, ingeniera) 8.86
Tiene un trabajo de tipo auxiliar administrativo 8.55
No aplica 4.74
Trabaja por cuenta propia (plomera, electricista) 3.95
Es agricultora, pesquera o jornalera 2.61
No sabe 2.41
Es dueña de un negocio grande o directiva 1.43
Es operaria de máquinas o conduce vehículos 1.05
Pensionada 0.50
Tabla de frecuencias porcentuales de la situación económica familiar
Situación Económica Familiar Porcentaje (%)
Igual 61.67
Mejor 21.75
Peor 16.58

Se adelantó un análisis estadístico descriptivo con las cinco variables que integran a la categoría de Reproducción Social. Dada su naturaleza nominal, se calcularon, tabularon y graficaron las proporciones (frecuencias relativas) para entender la distribución de las distintas categorías que conforman a cada una de las variables. Se encontraron los siguientes resultados:

La distribución de los niveles educativos del padre muestra una concentración importante de los datos en torno a las categorías de educación secundaria completa (25.44%), educación primaria incompleta (17.11%) y educación secundaria incompleta (14.47%). En contraste, solo un 9.74% de los padres alcanzó estudios profesionales completos, y una proporción aún menor reportó formación de posgrado (2.19%), que, de acuerdo con Bourdieu, es el nivel más alto de acumulación de capital cultural (Bourdieu & Passeron, 1990). Estos resultados evidencian que la mayoría de los padres cuenta con niveles bajos de escolaridad, lo que indica una limitada acumulación de capital cultural institucionalizado en la estructura familiar, en tanto que la educación formal constituye una de las principales formas de capital cultural (Bourdieu, 1986, p. 17). Las limitaciones en el capital cultural inciden en las posibilidades de transmisión intergeneracional de conocimientos y ventajas académicas, lo que podría impactar en los resultados académicos.

En el caso del nivel educativo de la madre se observa una mayor concentración en la educación secundaria completa (29.19%), seguida por la secundaria incompleta (14.14%) y la educación profesional completa (12.70%). Los niveles educativos más bajos, como primaria incompleta (12.50%) o completa (8.44%), presentan proporciones menores respecto a los observados en los padres, lo que sugiere una ligera ventaja educativa en las mujeres . En conjunto, los datos indican que las madres tienden a alcanzar con mayor frecuencia niveles medios o superiores de escolaridad que los padres, especialmente en la educación secundaria y técnica. Estas diferencias podrían dar cuenta de mayores potenciales de acumulación y transmisión de capital cultural por parte de las madres, sin embargo, eso será objeto del análisis de estadística inferencial.

En cuanto a la ocupación laboral del padre, los datos muestran una alta concentración en empleos de carácter independiente o manual. El 13.31% trabaja por cuenta propia, principalmente en oficios como plomería o electricidad, seguido por un 12.52% dedicado a actividades agrícolas, pesqueras o jornaleras, y un 10.72% que se desempeña como operario o conductor. Las ocupaciones de tipo profesional o directivo son minoritarias, con apenas un 7.94% y un 2.68%, respectivamente. Este patrón evidencia una estructura laboral predominantemente vinculada a sectores de baja estabilidad económica y limitada formalización, lo que se traduce en una menor acumulación de capital económico y simbólico en los hogares. Desde la perspectiva de la teoría de la reproducción social de Bourdieu, estos resultados sugieren que los estudiantes provienen, en su mayoría, de contextos familiares insertos en clases sociales dominadas (posiciones subalternas) dentro del sistema de clases.

En contraparte, en la ocupación laboral de las madres, se observa una concentración muy marcada en el trabajo doméstico no remunerado: el 38.62% de ellas declara trabajar en el hogar, no trabajar o encontrarse estudiando. Las ocupaciones remuneradas más frecuentes corresponden a actividades de atención al público (9.17%), labores de limpieza o mantenimiento (9.10%) y pequeños negocios o ventas informales (9.01%). Solo un 8.86% de las madres reporta desempeñarse como profesional y apenas un 1.43% ocupa cargos directivos o gerenciales. Estos datos reflejan una inserción laboral femenina caracterizada por la precariedad, la informalidad y la concentración en tareas tradicionalmente feminizadas, lo que evidencia una acumulación limitada de capital económico. Ahora bien, al comparar estos resultados con los de los padres, se advierte una clara división sexual del trabajo: mientras los padres predominan en ocupaciones independientes o manuales asociadas al trabajo por cuenta propia (13.31%) o agrícola (12.52%), las madres se concentran en el ámbito doméstico y en empleos de servicios o comercio de baja cualificación.

En relación con la situación económica familiar, el 61.67% de los estudiantes percibe que su condición se mantiene igual respecto al año anterior, un 21.75% considera que ha mejorado y un 16.58% señala un empeoramiento. Estos resultados sugieren una percepción general de estabilidad económica, aunque más de una tercera parte de los hogares experimenta variaciones que pueden reflejar vulnerabilidad frente a los cambios del entorno económico. De todas maneras, la predominancia de la categoría “igual” podría interpretarse como un indicador de estancamiento en el sistema de clases, con pocos cambios en la acumulación y distribución de capital económico.

Ante la tendencia del sistema educativo a deprivar a los miembros de las clases dominadas de los beneficios materiales y simbólicos de la educación (Bourdieu & Passeron, 1990), el análisis inferencial permitirá determinar si la acumulación moderada o reducida de capital económico y cultural —denotada en la estructura familiar y en las variables de los proxys de cada capital — se relaciona con menores niveles de desempeño.

Índices

Descripción

Con el fin de operacionalizar y modelar cuantitativamente el marco teórico de esta investigación, se requirió la construcción de tres índices compuestos que funcionen como proxies para representar los conceptos bourdieusianos de capital económico, capital cultural y reproducción social. Dado que estos constructos teóricos son latentes y no directamente medibles, su estimación se realizó mediante la agregación de un conjunto de variables de interés seleccionadas de la base de datos de los resultados y el perfil socioeconómico de los estudiantes que presentaron las Pruebas Saber 11 durante el segundo semestre de 2021.La creación de estos índices permitió sintetizar la información dispersa en múltiples preguntas del formulario de inscripción en medidas unificadas de acumulación de capital. Dichos índices actuarán como las variables independientes en el análisis de estadística inferencial que se llevará a cabo en la investigación. Es fundamental subrayar que esta aproximación constituye una simplificación del marco teórico, ya que se encuentra condicionada por la naturaleza y el alcance de las 81 variables disponibles en la fuente de datos; por tanto, se reconoce su carácter limitado a la hora de representar la complejidad de los conceptos en cuestión.A continuación, se presentan la composición de los índices propuestos para las variables independientes de la presente investigación:

Índice de Capital Económico

Se concibe como una medida aditiva de la posesión de bienes materiales y hábitos de consumo en el hogar.\[Capital\ Económico = FAMIESTRATOVIVIENDA + FAMITIENEAUTOMOVIL + FAMITIENEHORNOMICROOGAS + FAMITIENELAVADORA + FAMITIENEMOTOCICLETA + FAMICOMELECHEDERIVADOS + FAMICOMECARNEPESCADOHUEVO + FAMICOMECEREALFRUTOSLEGUMBRE\]

Índice de Capital Cultural

Agrupa las variables relacionadas con la posesión de bienes culturales, acceso a la información y hábitos de estudio.\[Capital\ Cultural = FAMITIENECOMPUTADOR + FAMITIENEINTERNET + ESTUDEDICACIONINTERNET + FAMITIENESERVICIOTV + FAMINUMLIBROS + ESTUDEDICACIONLECTURADIARIA\]

Índice de Reproducción Social

Integra el nivel educativo y ocupacional de los padres junto con la percepción de la situación económica, reflejando el legado familiar transferido al estudiante.\[Reproducción\ Social = FAMIEDUCACIONPADRE + FAMITRABAJOLABORPADRE + FAMIEDUCACIONMADRE + FAMITRABAJOLABORMADRE + FAMISITUACIONECONOMICA\]

Ahora bien, para examinar el impacto de los índices de capital cultural, capital económico y reproducción social sobre el desempeño de los estudiantes en la Prueba Saber 11 (2021-2), resulta fundamental definir la variable dependiente que cuantificará dicho desempeño. En el marco de esta investigación, se utilizará el puntaje global obtenido por los estudiantes en las Pruebas Saber 11 como el indicador principal, dado que constituye la medida estandarizada y oficial de sus resultados académicos. De todas maneras, se realizará una exploración de los puntajes y niveles de desempeño desagregados por las cinco competencias que integran a las Pruebas Saber.En adición, el modelo cuantitativo incorporará un conjunto de variables de control, en tanto que estas son esenciales para garantizar la validez y la fiabilidad de las estimaciones y la rigurosidad del modelo cuantitativo (Memon et al., 2024). Las variables de control propenden por aislar los efectos específicos de los índices de interés, lo que facilita la detección de efectos reales y la formulación de conclusiones más precisas (Bernerth et al., 2018). Las variables seleccionadas para este propósito son el género del estudiante (hombre o mujer), la naturaleza del colegio (pública o privada) y su ubicación (rural o urbana), dado que la literatura académica reconoce su influencia significativa en el rendimiento académico (Sheeren & Bol, 2022; Strello et al., 2023).

Nota: Para la construcción de estos índices, se recodificaron las variables categóricas de ocupación y educación en escalas ordinales y posteriormente se normalizaron mediante puntajes Z (Media=0, DE=1).

Una vez definidas las variables operativas y los controles, y con el propósito de explicitar los supuestos de identificación causal que sustentan la estrategia empírica, el presente estudio se apoya en la construcción de Grafos Acíclicos Dirigidos (DAGs, por sus siglas en inglés). Esta herramienta gráfica permite visualizar de manera transparente la estructura de dependencia condicional entre las variables, formalizando las hipótesis teóricas sobre cómo los índices de capital (cultural y económico) y la reproducción social interactúan para influir en el desempeño en las pruebas de estado.

La utilización de DAGs resulta metodológicamente pertinente en este contexto por dos razones principales. En primer lugar, facilita la distinción entre variables de confusión, mediadoras y colisionadores, asegurando que la introducción de las variables de control (género, naturaleza del colegio y ubicación) cumpla efectivamente con el Criterio de la Puerta Trasera (Backdoor Criterion) planteado por Pearl (2009). Esto garantiza que los coeficientes estimados para los índices de capital no estén sesgados por asociaciones espurias derivadas de características estructurales del entorno educativo o demográfico del estudiante.

En segundo lugar, el diagrama causal propuesto permite ilustrar teóricamente la dirección de la causalidad, asumiendo que la dotación de capitales (medida a través de los índices normalizados descritos anteriormente) precede y determina parcialmente el logro académico cuantificado en el puntaje global de la Prueba Saber 11. De esta manera, el modelo no solo busca correlación estadística, sino una aproximación a la inferencia causal sobre los mecanismos de desigualdad educativa.

A continuación, se presenta la representación gráfica del modelo causal hipotético, donde los nodos representan las variables observadas y las aristas (flechas) indican las relaciones de influencia directa asumidas por la teoría:

La visualización anterior detalla la estructura operativa del modelo. En la periferia del grafo, los nodos grises representan las variables manifiestas, ancestras del exposure u observables extraídas directamente de la encuesta de contexto (e.g., tenencia de lavadora, frecuencia de consumo de proteínas, número de libros, educación de los padres). Estas variables no actúan de manera aislada sobre el desempeño, sino que convergen para constituir los constructos latentes o de exposición (nodos cian y violeta).

Específicamente, el DAG ilustra cómo:

La conformación de los Capitales: Se observa que el Capital Económico (“C.Econom”) actúa como un nodo receptor de indicadores materiales (bienes durables) y de seguridad alimentaria, validando la consistencia del índice construido anteriormente. Paralelamente, el Capital Cultural (“C.Cultural”) amalgama la dotación de recursos intelectuales (libros, lectura diaria) con el acceso a herramientas tecnológicas (TICs) y la herencia educativa parental.

La Reproducción Social: El nodo de Reproducción Social (“R.Social”) se modela recibiendo flujos directos de la situación ocupacional de los padres (“TrabajoLabor…”) y su autopercepción económica. Es crucial notar cómo el diagrama sugiere rutas de dependencia: la educación de la madre no solo nutre el capital cultural, sino que también incide en la situación económica, revelando la interconexión sistémica entre las distintas formas de capital propuestas por Bourdieu.

El Impacto en el Resultado: Finalmente, las flechas que emergen de los nodos de exposición (Capitales y Reproducción Social) convergen en el nodo de resultado “Puntaje” (rojo). Esta dirección explicita la hipótesis central de la investigación: es la acumulación desigual de estos capitales la que ejerce una presión causal sobre el desempeño en la prueba estandarizada, y no a la inversa.

Una vez validada teórica y visualmente la estructura de los índices mediante el DAG, se procede a la construcción estadística de los índices restantes y a la estimación del modelo econométrico.

Exploración de los Índices

Previo a la estimación del modelo multivariado, se realizó una inspección gráfica de la relación individual entre cada uno de los índices construidos y la variable dependiente (Puntaje Global). Este paso es fundamental para verificar el supuesto de linealidad en los parámetros, condición necesaria para la estimación por Mínimos Cuadrados Ordinarios (MCO).

A continuación, se presentan los diagramas de dispersión con sus respectivas líneas de tendencia ajustada para cada tipo de capital:

ÍNDICE DE CAPITAL ECONÓMICO

##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -2.182352 -0.563933 -0.070260 -0.005774  0.532136  2.490378

La construcción del Índice de Capital Económico arrojó una variable estandarizada centrada en cero (\(\mu \approx -0.006\)), lo cual facilita la interpretación de los puntajes en términos de desviaciones relativas frente al promedio poblacional. El análisis de las medidas de tendencia central revela una distribución cuasi-simétrica con una leve tendencia a la asimetría positiva, evidenciada por una mediana (-0.070) ligeramente inferior a la media. Esto sugiere que el grueso de la población se agrupa en niveles medios-bajos de capital, mientras que el promedio es traccionado levemente al alza por los hogares con mayor acumulación de recursos.En términos de dispersión, el índice demuestra una capacidad discriminante robusta, cubriendo un espectro que oscila entre un valor mínimo de -2.18 y un máximo de 2.49. El rango intercuartílico, delimitado entre -0.56 (primer cuartil) y 0.53 (tercer cuartil), concentra el 50% central de la muestra en una franja compacta alrededor de la media, confirmando que el indicador logra capturar adecuadamente la heterogeneidad socioeconómica de los estudiantes sin presentar valores atípicos extremos que distorsionen la escala.

La figura representa la distribución de frecuencias del Índice de Capital Económico mediante un histograma con ajuste de densidad suavizada. Se observa una estructura que se aproxima a una distribución normal (gaussiana), evidenciada por la simetría de las colas y una tendencia central marcada en torno al valor cero, propio de una variable estandarizada. Sin embargo, la curva de densidad en la cúspide revela un comportamiento ligeramente platicúrtico con fluctuaciones multimodales locales, lo que sugiere la coexistencia de subgrupos heterogéneos dentro de los estratos socioeconómicos medios, abarcando un rango de variación situado entre -2 y +2 desviaciones estándar.

La inspección gráfica de la relación bivariada revela una asociación positiva y monotónica entre la dotación de capital económico y el logro académico. La tendencia lineal ajustada confirma que, en promedio, los estudiantes provenientes de hogares con mayor acumulación de bienes y seguridad alimentaria obtienen puntajes superiores en la prueba Saber 11.

Sin embargo, la notable dispersión de las observaciones alrededor de la recta de regresión denota una alta heterogeneidad en los resultados para un mismo nivel socioeconómico. Esta varianza no explicada sugiere que, si bien las condiciones materiales son un predictor significativo, no operan de manera determinista, lo cual justifica teóricamente la incorporación de dimensiones adicionales ,como el capital cultural y la reproducción social, para capturar la totalidad de los mecanismos que inciden en el desempeño.

ÍNDICE DE CAPITAL CULTURAL

##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
## -1.69630 -0.39592  0.09408  0.00000  0.38758  1.24611

La inspección de los estadísticos descriptivos del Índice de Capital Cultural confirma la validez del procedimiento de normalización, evidenciando una media centrada exactamente en cero (\(\mu=0.00\)). Al comparar este parámetro con la mediana (\(0.09\)), se observa que esta última es levemente superior al promedio, lo que denota una distribución con una ligera asimetría negativa (sesgo a la izquierda).En términos sustantivos, este comportamiento sugiere que, si bien la mayoría de los estudiantes se agrupa en torno a valores medios, el “piso” de la distribución (mínimo de \(-1.69\)) es más profundo que lo que el “techo” es alto (máximo de \(1.24\)). Esto indica que las privaciones severas de capital cultural (ej. nula escolaridad parental y ausencia de libros) generan desviaciones más extremas respecto al promedio que la acumulación de ventajas en el extremo superior, revelando un posible efecto de saturación en la medición de los recursos culturales más altos.

La función de densidad de probabilidad estimada para el Índice de Capital Cultural revela una distribución con asimetría negativa (sesgo a la izquierda). A diferencia de una curva normal teórica, la masa principal de los datos se concentra ligeramente por encima de la media (en el rango \(0 < Z < 0.5\)), lo que sugiere que una proporción mayoritaria de la población estudiantil evaluada posee una dotación de recursos culturales moderadamente alta según los indicadores capturados.No obstante, la prolongada cola inferior (valores entre -1 y -1.8) evidencia la persistencia de brechas estructurales severas: existe un segmento de estudiantes que enfrenta privaciones agudas de capital cultural, situándose muy por debajo del estándar promedio. Por el contrario, el corte abrupto en la cola superior (alrededor de +1.2) sugiere un “efecto techo” en la medición; es decir, los indicadores disponibles (libros, TIC, escolaridad) saturan su capacidad de discriminación en los niveles más altos, impidiendo capturar acumulaciones de capital cultural “de élite” que excedan el estándar medible por la encuesta.

El diagrama de dispersión corrobora la existencia de una asociación lineal positiva entre el índice de capital cultural y el desempeño en la Prueba Saber 11. La pendiente ascendente de la recta de ajuste indica que, en términos generales, los estudiantes provenientes de hogares con mayor clima educativo y acceso a recursos culturales tienden a obtener resultados superiores, validando empíricamente la hipótesis de la transmisión de ventajas culturales.Sin embargo, la nube de puntos exhibe una alta varianza residual a lo largo de todo el espectro del índice. Se observa que estudiantes con dotaciones culturales similares (por ejemplo, en la media \(Z=0\)) pueden presentar brechas de desempeño de más de 100 puntos. Esto sugiere que, si bien el capital cultural es un predictor robusto, no opera como una determinación mecánica, dejando un margen significativo de variabilidad que podría ser explicado por el esfuerzo individual, la calidad institucional o la interacción con el capital económico.

ÍNDICE DE REPRODUCCIÓN SOCIAL

Creación de nuevas variables

Credencialización El concepto de credencialización se refiere a la obtención de títulos y grados académicos. Es un concepto fundamental en la propuesta teórica de Bourdieu, al ser un dispositivo central de la reproducción social y cultural (Bourdieu & Passeron, 1990, p. xxi). La credencial trasciende la mera validación de competencias técnicas o conocimientos, ya que posee una específica eficacia simbólica: no solo garantiza la capacidad técnica, sino que, de manera más crucial, consagra una verdadera esencia social en el individuo (Bourdieu, 1990). El sistema educativo actúa como una inmensa máquina clasificatoria que, mediante la asignación de títulos, inscribe los cambios dentro de la estructura social al tiempo que ayuda a imponer las exclusiones e inclusiones legítimas que definen el orden social (Bourdieu, 1990). Este proceso valida el grado de consecución cultural y la competencia legítima en la cultura legítima, sirviendo como la medida objetiva a partir de la cual se evalúan los productos de las acciones pedagógicas (Bourdieu & Passeron, 1990, p. 35).

La credencialización es el mecanismo institucionalizado por el cual el sistema educativo perpetúa la estratificación social, dado que el éxito en la obtención de títulos académicos mantiene una relación estadística muy estrecha con el origen social, con el nacimiento, es decir, con la adscripción (Bourdieu, 1990). El sistema logra, de forma sutil, disfrazar y legitimar la arbitrariedad de la distribución de privilegios y poderes (Bourdieu, 1990), presentando lo que es una herencia social desigual como un “mérito” individual. La incidencia de esta credencialización en el rendimiento educativo se relaciona con el concepto de capital cultural: la obtención de un título superior (ejemplificada en categorías como cred_consagrada) transforma el capital cultural incorporado familiar en capital institucionalizado, el cual es objetivado y legitimado (Bourdieu, 1986). Además, la rentabilidad económica y social del diploma depende intrínsecamente de su escasez en el mercado (Bourdieu & Passeron, 1990). Por lo tanto, las credenciales parentales operan como el inversión educativa socialmente más determinante que predispone fuertemente el rendimiento de los hijos (Bourdieu, 1986).

La construcción de una variable categórica que agrupe los niveles educativos formales de los padres en estratos de credencialización (tales como credencialización consagrada, superior, intermedia, mínima o inexistente) responde a la necesidad metodológica de traducir la estructura jerárquica y simbólica del sistema educativo en una métrica capaz de capturar la desigualdad en la dotación de capital cultural institucionalizado. Esta recodificación permite medir la eficacia simbólica del logro parental al diferenciar, por ejemplo, entre una credencial consagrada (posgrado) y una mínima, reflejando así la posición objetiva del título dentro de la jerarquía académica y la probabilidad objetiva de éxito que dicha posición confiere a los descendientes. Asimismo, esta agrupación captura el grado de selección diferencial y la escasez inherente a las credenciales más altas, factores determinantes de su valor real y de la magnitud de la ventaja cultural transferida intergeneracionalmente. En última instancia, el uso de niveles de credencialización facilita el análisis de la reproducción social al establecer un sistema de relaciones entre el origen familiar y el rendimiento estudiantil, evitando la falacia de tratar estas variaciones como propiedades aisladas y permitiendo, en cambio, evidenciar la acción indivisible de la causalidad estructural sobre el desempeño académico (Bourdieu & Passeron, 1990).

clase social Desde la perspectiva de Bourdieu, el concepto de clase social se define como un sistema de determinaciones objetivas, que define la posición de los agentes en el espacio social, superando la reducción a meros factores económicos o agregaciones demográficas (Bourdieu, 1977). La clase se entiende como una categoría analítica que unifica a todos los individuos que, al ser producto de las mismas condiciones objetivas de existencia, son los soportes del mismo habitus (Bourdieu, 1977). El habitus es el sistema de disposiciones duraderas y transferibles, esquemas de percepción, pensamiento y acción, que se adquieren mediante la exposición a estas condiciones económicas y que son (parcialmente) comunes a los miembros de una determinada clase social (Bourdieu & Passeron, 1990). De este modo, la posición ocupacional o económica de los padres (denotada en la base de datos a través de las categorías de las variables FAMI_TRABAJOMADRE y FAMI_TRABAJOPADRE) es un factor que favorece la acumulación de los capitales económico y cultural (reproducción).

La justificación metodológica para sintetizar las ocupaciones individuales en categorías de clase más amplias (como clase_alta, clase_media o clase_trab_camp_) reside en la necesidad de operar bajo el modo de pensamiento relacional bourdieusiano, evitando la falacia de ver propiedades sustanciales en atributos individuales (Bourdieu & Passeron, 1990, p. 222). El objetivo primario no es solo clasificar individuos por su ocupación, sino utilizar estas agrupaciones ocupacionales como proxies para el origen social y la estructura de capital que han modelado el habitus familiar (Bourdieu, 1986, p. 17; Azubuike et al., 2023, p. 17). La agregación de ocupaciones con condiciones objetivas de existencia similares permite entender la acumulación diferencial de capital cultural y económica que subyace de la familia y que termina traduciéndose en un rendimiento educativo diferenciado (Bourdieu & Passeron, 1990). definir categorías jerárquicas (clase alta, media, baja y campesina), la nueva variable permite medir la distancia social y cultural que la escuela reconoce y confirma entre los diferentes habitus (Bourdieu & Passeron, 1990, p. 41, 15), reflejando así la reproducción de la estructura de clases.

A continuación, se crean y grafican estas nuevas variables.

Clase Social (Padre)

Frecuencia Absoluta

Frecuencia Relativa

Clase Trabajadora y Campesina

2,485

54.5%

No Clasificable

829

18.2%

Clase Media

717

15.7%

No Asalariada / Ocupada

407

8.9%

Clase Alta

122

2.7%

La estructura de clase paterna revela una marcada asimetría socioeconómica, caracterizada por la predominancia de la Clase Trabajadora y Campesina, que concentra al 54.5% de los padres parte de la muestra limpiada Esta preponderancia en la base de la pirámide social contrasta drásticamente con la exigua representación de la Clase Alta (2.7%) y una Clase Media acotada al 15.7%, configurando un escenario de estratificación rígida con limitadas oportunidades de movilidad vertical. Adicionalmente, la significativa proporción de categorías No Clasificables (18.2%) y No Asalariadas (8.9%) sugiere la incidencia de dinámicas de informalidad o inestabilidad laboral estructural, lo cual evidencia que la transmisión intergeneracional de capitales ocurre en un contexto de profundas desigualdades de origen.

Nivel de Credencialización (Madre)

Frecuencia Absoluta

Frecuencia Relativa

Credencialización Mínima

1,764

38.7%

Credencialización Intermedia

1,331

29.2%

Credencialización Consagrada

692

15.2%

Credencialización Superior

595

13.0%

No Aplica/Desconocido

95

2.1%

Credencialización Inexistente

83

1.8%

##      Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
## -1.835724 -0.516533 -0.053264 -0.001572  0.397151  2.332819

Los estadísticos descriptivos del Índice de Reproducción Social validan su correcta estandarización, arrojando una media virtualmente igual a cero (\(\mu \approx -0.002\)) y una desviación típica unitaria. Al analizar la estructura de la distribución, se observa una tendencia central equilibrada, donde la mediana (\(-0.03\)) se ubica muy próxima al promedio, sugiriendo una simetría en el cuerpo central de los datos.Sin embargo, el comportamiento de los valores extremos revela una asimetría positiva. Mientras que el límite inferior desciende hasta \(-1.71\) desviaciones estándar, el valor máximo asciende hasta \(+2.57\). Esta elongación de la cola derecha indica que la acumulación de ventajas asociadas a la reproducción social (ocupación y estatus parental) alcanza niveles de diferenciación más agudos en la cima de la jerarquía social que las privaciones observadas en la base. En otras palabras, el índice captura con mayor intensidad la consolidación de estatus de las élites que la precariedad de los estratos bajos.

La representación visual de la densidad del Índice de Reproducción Social exhibe una morfología aproximadamente acampanada, aunque con características distintivas que reflejan la estructura de clases subyacente. Se ratifica la asimetría positiva previamente identificada: mientras la cola izquierda se contrae rápidamente cerca de -1.5 desviaciones estándar, la cola derecha se prolonga suavemente hacia valores superiores a +2.0. Esto visualiza cómo la “élite” o los grupos con mayor herencia de estatus logran diferenciarse más drásticamente del promedio que los grupos desfavorecidos.

Un hallazgo visual relevante es la discontinuidad o “granulosidad” del histograma (las brechas y picos irregulares en las barras violetas). A diferencia de una variable puramente continua, esta irregularidad sugiere que la reproducción social opera mediante “escalones” o conglomerados definidos. Esto es consistente teóricamente, dado que las credenciales educativas y las categorías ocupacionales no se distribuyen linealmente, sino que generan fronteras de clase discretas que el índice captura fielmente.

El diagrama de dispersión evidencia una correlación lineal positiva entre el índice de reproducción social y el logro académico: a medida que el entorno familiar se alinea con las estructuras de estatus dominantes (ocupación y autopercepción económica), el puntaje global tiende a aumentar. La recta de ajuste confirma la dirección del efecto, validando la hipótesis de que la herencia de posición social actúa como un predictor del éxito escolar.

Un rasgo distintivo de este gráfico es la marcada estriación vertical de los datos. Esta configuración no es un artefacto, sino el reflejo de la naturaleza discreta de las variables subyacentes (categorías ocupacionales y niveles educativos codificados). A pesar de esta granularidad, la tendencia central es robusta. No obstante, al igual que en los índices anteriores, la amplia dispersión vertical sugiere que el determinismo social no es absoluto, dejando espacio para la variabilidad explicada por otros factores que serán integrados en el modelo multivariado.

#Intervalos de Confianza

##  [1] "FAMI_ESTRATOVIVIENDA"          "FAMI_EDUCACIONPADRE"          
##  [3] "FAMI_EDUCACIONMADRE"           "FAMI_TRABAJOLABORPADRE"       
##  [5] "FAMI_TRABAJOLABORMADRE"        "FAMI_TIENEINTERNET"           
##  [7] "FAMI_TIENESERVICIOTV"          "FAMI_TIENECOMPUTADOR"         
##  [9] "FAMI_TIENELAVADORA"            "FAMI_TIENEHORNOMICROOGAS"     
## [11] "FAMI_TIENEAUTOMOVIL"           "FAMI_TIENEMOTOCICLETA"        
## [13] "FAMI_NUMLIBROS"                "FAMI_COMELECHEDERIVADOS"      
## [15] "FAMI_COMECARNEPESCADOHUEVO"    "FAMI_COMECEREALFRUTOSLEGUMBRE"
## [17] "FAMI_SITUACIONECONOMICA"       "ESTU_DEDICACIONLECTURADIARIA" 
## [19] "ESTU_DEDICACIONINTERNET"       "ESTU_GENERO"                  
## [21] "COLE_NATURALEZA"               "COLE_AREA_UBICACION"          
## [23] "PUNT_LECTURA_CRITICA"          "PUNT_MATEMATICAS"             
## [25] "PUNT_C_NATURALES"              "PUNT_SOCIALES_CIUDADANAS"     
## [27] "PUNT_INGLES"                   "DESEMP_LECTURA_CRITICA"       
## [29] "DESEMP_MATEMATICAS"            "DESEMP_C_NATURALES"           
## [31] "DESEMP_SOCIALES_CIUDADANAS"    "DESEMP_INGLES"                
## [33] "PUNT_GLOBAL"                   "auto_bin"                     
## [35] "horno_bin"                     "lavadora_bin"                 
## [37] "moto_bin"                      "puntaje_estrato"              
## [39] "pts_leche"                     "pts_carne"                    
## [41] "pts_cereal"                    "sub_bienes"                   
## [43] "sub_alimentacion"              "sub_estrato"                  
## [45] "z_bienes"                      "z_alimentacion"               
## [47] "z_estrato"                     "capital_economico"            
## [49] "compu_bin"                     "internet_bin"                 
## [51] "tv_bin"                        "puntaje_libros"               
## [53] "puntaje_ded_internet"          "puntaje_ded_lectura"          
## [55] "z_compu"                       "z_internet"                   
## [57] "z_tv"                          "z_libros"                     
## [59] "z_ded_internet"                "z_ded_lectura"                
## [61] "sub_objetivado"                "sub_incorporado"              
## [63] "capital_cultural"              "cred_madre"                   
## [65] "cred_padre"                    "clase_madre"                  
## [67] "clase_padre"                   "pts_cred_madre"               
## [69] "pts_cred_padre"                "pts_clase_madre"              
## [71] "pts_clase_padre"               "pts_situacion"                
## [73] "sub_educacion"                 "sub_clase"                    
## [75] "sub_situacion"                 "z_educacion"                  
## [77] "z_clase"                       "z_situacion"                  
## [79] "reproduccion_social"
## # A tibble: 4 × 5
##   Variable_Interes Media_Muestral Limite_Inferior Limite_Superior Error_Estandar
##   <chr>                     <dbl>           <dbl>           <dbl>          <dbl>
## 1 PUNT_GLOBAL             249.            248.            251.             0.738
## 2 capital_cultural          0              -0.017           0.017          0.009
## 3 capital_economi…         -0.006          -0.027           0.016          0.011
## 4 reproduccion_so…         -0.002          -0.021           0.018          0.01

La tabla de intervalos de confianza al 95% proporciona una validación estadística fundamental sobre la distribución de las variables centrales del estudio. En primer lugar, respecto a la variable dependiente (Puntaje Global), se estima una media poblacional ubicada entre 247.64 y 250.53 puntos, con un estimador puntual de 249.09. La estrechez de este intervalo, respaldada por un error estándar reducido (0.738), denota una alta precisión en la estimación del promedio, sugiriendo que la muestra captura con estabilidad la tendencia central del desempeño académico de la población estudiada.En segundo lugar, el análisis de las variables explicativas (Índices de Capital) confirma la efectividad del procedimiento de normalización (transformación a puntajes Z). Como se observa, las medias muestrales de los tres índices convergen a cero y sus respectivos intervalos de confianza incluyen el valor nulo (por ejemplo, el intervalo del Capital Económico transita de -0.027 a 0.016). Esta propiedad estadística certifica que las variables independientes están correctamente centradas y estandarizadas (\(\mu \approx 0, \sigma \approx 1\)), cumpliendo así con el requisito metodológico necesario para comparar posteriormente la magnitud relativa de sus efectos en el modelo de regresión.

#Pruebas de hipótesis Teniendo en cuenta que el género, la naturaleza del colegio y la ubicación del colegio fueron seleccionadas como variables de control, se propone adelantar pruebas de hipótesis que validen que existen brechas entre los grupos parte de cada una de las variables. Para ello, se empleó la prueba t de Welch, en tanto que permite comparar las medias de dos grupos independientes entre sí, es decir, que las varianzas (dispersión de los datos) de los dos grupos en cuestión son diferentes, lo que también se conoce como heterogeneidad (σ^2 ≠ σ^2) (Carballo Álvarez, 2024; Data Novia, s.f.).

Las tres variables con las que se adelantan las pruebas de hipótesis (género, naturaleza del colegio y ubicación del colegio) tienen un carácter dicotómico, dado que dividen a las observaciones de la base de datos en dos grupos (mujer vs hombre, para el caso de género; colegio oficial vs no oficial, para el caso de la naturaleza del colegio; y colegio urbano vs rural, para el caso de ubicación del colegio). Para verificar que los grupos que conforman las variables tiene varianzas diferentes, se revisaron sus medias, varianzas y desviaciones estándar; y se adelantaron pruebas de hipótesis de varianza (empleando el código var.test)

## 
##  F test to compare two variances
## 
## data:  PUNT_GLOBAL by ESTU_GENERO
## F = 0.88709, num df = 2493, denom df = 2065, p-value = 0.004336
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.8167125 0.9632198
## sample estimates:
## ratio of variances 
##          0.8870899
## 
##  F test to compare two variances
## 
## data:  PUNT_GLOBAL by COLE_AREA_UBICACION
## F = 0.83698, num df = 712, denom df = 3846, p-value = 0.00263
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.7490980 0.9393463
## sample estimates:
## ratio of variances 
##          0.8369771
## 
##  F test to compare two variances
## 
## data:  PUNT_GLOBAL by COLE_NATURALEZA
## F = 1.3912, num df = 1053, denom df = 3505, p-value = 7.836e-12
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  1.263627 1.535543
## sample estimates:
## ratio of variances 
##           1.391164

Variable Analizada

Categoría

Media

Varianza (s²)

Desv. Est. (s)

n

P-Valor (Prueba F)

Género

Femenino

245.96

2,334.4

48.32

2,494

0.0043

Masculino

252.86

2,631.6

51.30

2,066

Ubicación del Colegio

RURAL

229.71

2,070.9

45.51

713

0.0026

URBANO

252.68

2,474.2

49.74

3,847

Naturaleza del Colegio

NO OFICIAL

269.86

2,999.6

54.77

1,054

0.0000

OFICIAL

242.84

2,156.2

46.44

3,506

En primer lugar, conviene señalar las medias, desviaciones estándar y varianzas de los grupos parte de cada variable. En cuanto al género, se encontró que los estudiantes presentaban un puntaje medio superior (252.86) frente al de las estudiantes (245.96) femenino; y que dicha brecha se acompañaba de una mayor variabilidad (heterogeneidad), evidenciada en una varianza de 2,631.6 para los estudiantes (desviación estándar = 51.30) frente a la varianza de 2,334.4 (desviación estándar =48.32) de las estudiantes. Ahora bien, también se encontraron diferencias marcadas en los grupos que integran la variable de naturaleza del colegio. Los colegios no oficiales (privados) alcanzan un promedio de puntaje global más alto (269.86) que el de los colegios del sector oficial (242.84). Esta brecha en el desempeño se refleja también en la dispersión: el sector no oficial presenta una varianza considerablemente mayor (2,999.6, con desviación estándar de 54.77), mientras que el sector oficial muestra resultados más compactos, con una varianza de 2,156.2.(desviación estándar: 49.79). Por último, con la ubicación del colegio se observa una brecha notable: los estudiantes de zonas urbanas obtienen una media de puntaje global de 252.68, superando ampliamente a los de zonas rurales (229.71). Nuevamente, el grupo con mayor rendimiento muestra una dispersión más amplia, con una varianza de 2,474.2 en contraste con la varianza de 2,070.9 registrada en el sector rural.

Aunque las estadísticas descriptivas dan cuenta de estas diferencias entre los grupos que integran las variables, no permiten comprobar la heterogeneidad estadísticamente. Para ello, se debe adelantar una prueba f, que permite comparar las varianzas de los grupos y determinar si existe homogeneidad o heterogeneidad. Esta prueba también es una prueba de hipótesis, cuya hipótesis nula es que las varianzas son iguales (H0: homogeneidad) y la alternativa es que son diferentes (H1: heterogeneidad). Para comprobarlo, se deben revisar los P-value que entrega la función var.test. En el caso de que el p-value sea menor que 0.05, encuentra que las varianzas son diferentes, es decir, que se rechaza la hipótesis nula porque hay heterogeneidad y, por consiguiente, procede la prueba t de Welch. En el caso contrario, en el que el p-value sea mayor que 0.05, se encontraría que hay homogeneidad entre los dos grupos, lo que implicaría retener la hipótesis nula y solo haría procedente la prueba t-student.

Para la variable de Género, la prueba arrojó un valor p = 0.0043; para la Ubicación del Colegio, un valor p = 0.0026; y para la Naturaleza del Colegio, un valor p = 0.0000. En todos los casos, los p-value son inferiores al nivel de significancia estándar (0.05). Estos resultados obligan a rechazar la hipótesis nula (homogeneidad) para cada una de las variables. Esto significa que la dispersión de los puntajes no es uniforme entre los grupos: los estudiantes hombres, que estudiaron en colegios urbanos y privados no solo tienen promedios diferentes, sino que sus datos se distribuyen de manera estructuralmente distinta a sus contrapartes (mujeres, estudiantes rurales y estudiantes de colegios públicos). Esta heterogeneidad de varianzas es un hallazgo que valida y exige el uso de la prueba t de Welch, para la comparación de medias, dado que el supuesto de igualdad de varianzas requerido por la t de Student tradicional no se cumple en ninguna de las dimensiones sociodemográficas estudiadas.

Estos hallazgos sustentan asunciones de la teoría de los capitales y la reproducción social de Bourdieu. El hallazgo en torno al género da cuenta del proceso de selección diferencial entre hombres y mujeres que problematizaron Bourdieu y Passeron (1970). Mientras que el hallazgo sobre la naturaleza del colegio es consistente con la premisa de que el tipo de escuela a la que asisten los niños es un factor de reproducción social, que da cuenta de distintos niveles de capital cultural y económico y, por ende, dará lugar a condiciones de vida y entornos más o menos ventajosos para el rendimiento académico (Azubuike et al., 2023). Por su parte, la diferencia observada en función de la ubicación de colegios es un claro ejemplo de la brecha urbano-rural en habilidades, lo cual se encuentra “entrelazado con las diferencias en el entorno familiar del estudiante y la exposición al capital cultural” (Azubuike et al., 2023). Otro factor importante son las mayores dispersiones de los datos en los grupos con mayores ventajas. Frente a esto, el marco teórico de la reproducción cultural sostiene que los estudiantes de entornos familiares más ventajosos (es decir, con mayor capital) no solo comienzan con niveles de rendimiento más altos (puntajes medios más altos), sino que también tienen tasas de progreso diferentes, lo que provoca que las brechas iniciales en el rendimiento tiendan a ampliarse con el tiempo (Azubuike et al., 2023). El hecho de que los mejores puntajes estén más alejados (mayor dispersión) refleja la forma en que los poseedores del capital preexistente logran monopolizarlo (Bourdieu & Passeron, 1990).

Considerando lo anterior, resulta posible aplicar la Prueba t de Welch a cada una de las variables.

##Pruebas de Hipótesis asociadas a la Naturaleza del colegio El objetivo de esta primera prueba de hipótesis es determinar si existen diferencias estadísticamente significativas en el puntaje global del ICFES y la acumulación de capitales entre los estudiantes matriculados en instituciones de naturaleza oficial y aquellos que estaban matriculados en instituciones no oficiales. A continuación, se presentan las hipótesis nula (\(H_0\)) y alternativa (\(H_1\)) planteadas para cada dimensión de análisis:

Hipótesis para el Puntaje Global Se evalúa si el puntaje global en el ICFES difiere según la naturaleza del establecimiento educativo. \(H_0\): No existe una diferencia significativa entre el puntaje global promedio de los estudiantes de colegios no oficiales y los de colegios oficiales

\[H_0: \mu_{\text{No Oficial}} = \mu_{\text{Oficial}}\]

\(H_1\): Existe una diferencia significativa entre el puntaje global promedio de los estudiantes de colegios no oficiales y los de colegios oficiales. \[H_1: \mu_{\text{No Oficial}} \neq \mu_{\text{Oficial}}\]

Hipótesis para el Índice de Capital Cultural Se examina si la acumulación de capital cultural varía difiere según la naturaleza del establecimiento \(H_0\): El índice promedio de Capital Cultural es igual entre los estudiantes de colegios no oficiales y oficiales. \(H_1\): El índice promedio de Capital Cultural difiere significativamente según la naturaleza del colegio.

Hipótesis para el Índice de Capital Económico Se busca establecer si existen brechas materiales asociadas al tipo de colegio. \(H_0\): No existen diferencias en la media del índice de Capital Económico entre estudiantes de colegios no oficiales y oficiales. \[H_0: \mu_{\text{No Oficial}} = \mu_{\text{Oficial}}\]

\(H_1\): Existen diferencias significativas en la media del índice de Capital Económico entre ambos grupos. \[H_1: \mu_{\text{No Oficial}} \neq \mu_{\text{Oficial}}\] Hipótesis para el Índice de Reproducción Social Se analiza si las condiciones de origen (educación y ocupación de los padres) son diferentes según el tipo de colegio. \(H_0\): El índice promedio de Reproducción Social es equivalente en ambos tipos de colegio. \[H_0: \mu_{\text{No Oficial}} = \mu_{\text{Oficial}}\] \(H_1\): El índice promedio de Reproducción Social es distinto entre los estudiantes de colegios no oficiales y los de colegios oficiales. \[H_1: \mu_{\text{No Oficial}} \neq \mu_{\text{Oficial}}\] Con las hipótesis definidas, resulta posible realizar la prueba t de Welch

## 
##  Welch Two Sample t-test
## 
## data:  PUNT_GLOBAL by COLE_NATURALEZA
## t = 14.524, df = 1535.7, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group NO OFICIAL and group OFICIAL is not equal to 0
## 95 percent confidence interval:
##  23.37018 30.66844
## sample estimates:
## mean in group NO OFICIAL    mean in group OFICIAL 
##                 269.8596                 242.8403
## 
##  Welch Two Sample t-test
## 
## data:  capital_cultural by COLE_NATURALEZA
## t = 17.728, df = 2072.5, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group NO OFICIAL and group OFICIAL is not equal to 0
## 95 percent confidence interval:
##  0.2840138 0.3546674
## sample estimates:
## mean in group NO OFICIAL    mean in group OFICIAL 
##                0.2455281               -0.0738125
## 
##  Welch Two Sample t-test
## 
## data:  capital_economico by COLE_NATURALEZA
## t = 23.429, df = 1611.5, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group NO OFICIAL and group OFICIAL is not equal to 0
## 95 percent confidence interval:
##  0.5479150 0.6480376
## sample estimates:
## mean in group NO OFICIAL    mean in group OFICIAL 
##                0.4539859               -0.1439905
## # A tibble: 4 × 5
##   Variable            estimate statistic p.value_txt Conclusión                 
##   <chr>                  <dbl>     <dbl> <chr>       <chr>                      
## 1 Puntaje Global        27.0        14.5 < 2.2e-16   Mayor en Colegios NO OFICI…
## 2 Capital Cultural       0.319      17.7 < 2.2e-16   Mayor en Colegios NO OFICI…
## 3 Capital Económico      0.598      23.4 < 2.2e-16   Mayor en Colegios NO OFICI…
## 4 Reproducción Social    0.430      16.6 < 2.2e-16   Mayor en Colegios NO OFICI…

Índice / Variable

Diferencia (Est.)

Valor t

P-Valor

Interpretación Estadística

Puntaje Global

27.019

14.520

< 2.2e-16

Mayor en Colegios NO OFICIALES

Capital Cultural

0.319

17.730

< 2.2e-16

Mayor en Colegios NO OFICIALES

Capital Económico

0.598

23.430

< 2.2e-16

Mayor en Colegios NO OFICIALES

Reproducción Social

0.430

16.590

< 2.2e-16

Mayor en Colegios NO OFICIALES

Los resultados evidencian brechas estadísticamente significativas (p < 0.05), entre colegios de las dos categorías de naturaleza, en las cuatro dimensiones analizadas. La brecha más pronunciada se observa en el Capital Económico. El estimador positivo indica que los estudiantes de colegios No Oficiales provienen de hogares con una tenencia de bienes y condiciones materiales significativamente superiores a las de los estudiantes de colegios Oficiales, lo que confirma la segmentación socioeconómica del sistema educativo. De manera similar, los índices de Capital Cultural y Reproducción Social muestran diferencias significativas a favor del sector No Oficial. Esto sugiere que los colegios privados no solo concentran mayor riqueza material, sino también estudiantes con mayor herencia educativa familiar y acceso a bienes culturales (libros, tecnología), lo que facilita la transmisión de ventajas de clase. Como consecuencia de las desigualdades acumuladas en los tres tipos de capital, se observa una diferencia estadísticamente significativa en el Puntaje Global. Los estudiantes del sector No Oficial obtienen, en promedio, puntajes superiores, lo que evidencia cómo la desigualdad en la acumulación de capitales se traduce en diferencias en la obtención de resultados académicos.

##Pruebas de Hipótesis asociadas a la Ubicación del Colegio En atención a la heterogeneidad encontrada entre los grupos parte de la variable de ubicación del colegio (colegio rural y colegio urbano), se emplea la prueba prueba t de Welch para dos muestras independientes con el objetio de comprobar estadísticamente que existen brechas en el desempeño académico y la acumulación de capitales en función de la ubicación del colegio. Las hipótesis planteadas para estos análisis son las siguientes:

Hipótesis para el Puntaje Global \(H_0\): No hay diferencias en el puntaje global del ICFES entre los estudiantes de colegios ubicados en zonas rurales y zonas urbanas.

\[H_0: \mu_{\text{Rural}} = \mu_{\text{Urbana}}\] \(H_1\): Existe una diferencia estadísticamente significativa en el puntaje global promedio según la ubicación del colegio. \[H_1: \mu_{\text{Rural}} \neq \mu_{\text{Urbana}}\]

Hipótesis para el Índice de Capital Cultural \(H_0\): No existen diferencias significativas en el índice promedio de Capital Cultural entre los estudiantes que estudian en zonas rurales y aquellos que estudian en zonas urbanas \[H_0: \mu_{\text{Rural}} = \mu_{\text{Urbana}}\] \(H_1\): El índice promedio de Capital Cultural varía significativamente según la ubicación geográfica de la institución educativa. \[H_1: \mu_{\text{Rural}} \neq \mu_{\text{Urbana}}\]

Hipótesis para el Índice de Capital Económico \(H_0\): La media del índice de Capital Económico es igual para los estudiantes de zonas rurales y urbanas. \[H_0: \mu_{\text{Rural}} = \mu_{\text{Urbana}}\] \(H_1\): Existen disparidades significativas en la acumulación de Capital Económico entre los estudiantes de zonas rurales y urbanas. \[H_1: \mu_{\text{Rural}} \neq \mu_{\text{Urbana}}\]

Hipótesis para el Índice de Reproducción Social \(H_0\): El índice promedio de Reproducción Social no difiere entre los contextos educativos rural y urbano. \[H_0: \mu_{\text{Rural}} = \mu_{\text{Urbana}}\] \(H_1\): El índice promedio de Reproducción Social presenta diferencias significativas asociadas a la ubicación del colegio. \[H_1: \mu_{\text{Rural}} \neq \mu_{\text{Urbana}}\] Con las hipótesis definidas, resulta posible realizar la prueba t de Welch

## 
##  Welch Two Sample t-test
## 
## data:  PUNT_GLOBAL by COLE_AREA_UBICACION
## t = -12.195, df = 1052.7, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group RURAL and group URBANO is not equal to 0
## 95 percent confidence interval:
##  -26.66449 -19.27274
## sample estimates:
##  mean in group RURAL mean in group URBANO 
##             229.7083             252.6769
## 
##  Welch Two Sample t-test
## 
## data:  capital_cultural by COLE_AREA_UBICACION
## t = -17.533, df = 960.88, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group RURAL and group URBANO is not equal to 0
## 95 percent confidence interval:
##  -0.4672440 -0.3731773
## sample estimates:
##  mean in group RURAL mean in group URBANO 
##          -0.35450666           0.06570399
## 
##  Welch Two Sample t-test
## 
## data:  capital_economico by COLE_AREA_UBICACION
## t = -10.258, df = 991.03, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group RURAL and group URBANO is not equal to 0
## 95 percent confidence interval:
##  -0.3632997 -0.2466192
## sample estimates:
##  mean in group RURAL mean in group URBANO 
##          -0.26305010           0.04190936
## 
##  Welch Two Sample t-test
## 
## data:  reproduccion_social by COLE_AREA_UBICACION
## t = -9.4063, df = 1058.3, p-value < 2.2e-16
## alternative hypothesis: true difference in means between group RURAL and group URBANO is not equal to 0
## 95 percent confidence interval:
##  -0.2921379 -0.1912921
## sample estimates:
##  mean in group RURAL mean in group URBANO 
##          -0.20549247           0.03622251

Índice / Variable

Diferencia (Est.)

Valor t

P-Valor

Interpretación Estadística

Puntaje Global

-22.969

-12.195

< 2.2e-16

Mayor en Zona URBANA

Capital Cultural

-0.420

-17.533

< 2.2e-16

Mayor en Zona URBANA

Capital Económico

-0.305

-10.258

< 2.2e-16

Mayor en Zona URBANA

Reproducción Social

-0.242

-9.406

< 2.2e-16

Mayor en Zona URBANA

Al analizar la ubicación geográfica del colegio como factor determinante, las pruebas de hipótesis revelan una profunda brecha entre los estudiantes de zonas rurales y urbanas. Los resultados son estadísticamente significativos para todos los índices (p < 0.001), indicando que los estudiantes de colegios ubicados en zonas Urbanas poseen niveles superiores de capital cultural, económico y de reproducción social en comparación con sus pares de zonas Rurales. Particularmente, la brecha más acentuada se encuentra en el Capital Cultural (t = -17.5), lo que sugiere que la desigualdad en el acceso a herramientas tecnológicas y bienes culturales es el factor más distintivo entre ambos entornos. Esta disparidad de capitales se traduce directamente en el desempeño académico: se observó una diferencia de 23 puntos en el promedio del Puntaje Global a favor de la zona urbana, evidenciando la inequidad territorial del sistema educativo.D

##Pruebas de Hipótesis asociadas al género Finalmente, se aborda la dimensión de género para identificar posibles brechas entre estudiantes hombres y mujeres. El análisis exploratorio previo evidenció que la dispersión de los datos no es uniforme entre ambos grupos, lo que invalida el uso de la prueba t de Student clásica. En consecuencia, se aplica la prueba t de Welch para dos muestras independientes, garantizando la robustez de las estimaciones ante varianzas desiguales. El propósito es determinar si existen diferencias estadísticamente significativas en la media del desempeño académico y en la dotación de capitales (cultural, económico y social) asociadas al género del estudiante.

Hipótesis para el Índice de Capital Cultural \(H_0\): El índice promedio de Capital Cultural es igual entre estudiantes hombres y mujeres. \[H_0: \mu_{\text{Femenino}} = \mu_{\text{Masculino}}\] \(H_1\): Existe una diferencia significativa en la acumulación de Capital Cultural según el género del estudiante. \[H_1: \mu_{\text{Femenino}} \neq \mu_{\text{Masculino}}\] Hipótesis para el Índice de Capital Económico \(H_0\): No existen diferencias en la media del índice de Capital Económico entre hombres y mujeres. \[H_0: \mu_{\text{Femenino}} = \mu_{\text{Masculino}}\] \(H_1\): El índice promedio de Capital Económico difiere significativamente entre ambos grupos. \[H_1: \mu_{\text{Femenino}} \neq \mu_{\text{Masculino}}\] Hipótesis para el Índice de Reproducción Social \(H_0\): El índice promedio de Reproducción Social es equivalente para ambos géneros. \[H_0: \mu_{\text{Femenino}} = \mu_{\text{Masculino}}\] \(H_1\): Existen diferencias estadísticamente significativas en el índice de Reproducción Social entre hombres y mujeres. \[H_1: \mu_{\text{Femenino}} \neq \mu_{\text{Masculino}}\] Hipótesis para el Puntaje Global \(H_0\): El desempeño académico promedio en la Prueba Saber 11 no difiere según el género del estudiante. \[H_0: \mu_{\text{Femenino}} = \mu_{\text{Masculino}}\] \(H_1\): Existe una brecha significativa en el puntaje global promedio entre hombres y mujeres. \[H_1: \mu_{\text{Femenino}} \neq \mu_{\text{Masculino}}\] Con las hipótesis definidas, resulta posible realizar la prueba t de Welch

## [1] "--- RESULTADO: Capital Cultural (Dos Colas) ---"
## 
##  Welch Two Sample t-test
## 
## data:  capital_cultural by ESTU_GENERO
## t = 0.93795, df = 4491.5, p-value = 0.3483
## alternative hypothesis: true difference in means between group F and group M is not equal to 0
## 95 percent confidence interval:
##  -0.01767093  0.05008887
## sample estimates:
## mean in group F mean in group M 
##     0.007343800    -0.008865168
## [1] "--- RESULTADO: Capital Económico (Dos Colas) ---"
## 
##  Welch Two Sample t-test
## 
## data:  capital_economico by ESTU_GENERO
## t = -6.3723, df = 4434.5, p-value = 2.052e-10
## alternative hypothesis: true difference in means between group F and group M is not equal to 0
## 95 percent confidence interval:
##  -0.18102214 -0.09584197
## sample estimates:
## mean in group F mean in group M 
##     -0.06849343      0.06993863
## [1] "--- RESULTADO: Reproducción Social (Dos Colas) ---"
## 
##  Welch Two Sample t-test
## 
## data:  reproduccion_social by ESTU_GENERO
## t = -4.0153, df = 4313.2, p-value = 6.037e-05
## alternative hypothesis: true difference in means between group F and group M is not equal to 0
## 95 percent confidence interval:
##  -0.12108630 -0.04163622
## sample estimates:
## mean in group F mean in group M 
##     -0.03843433      0.04292694
## [1] "--- RESULTADO: Puntaje Global (Dos Colas) ---"
## 
##  Welch Two Sample t-test
## 
## data:  PUNT_GLOBAL by ESTU_GENERO
## t = -4.6438, df = 4294.2, p-value = 3.522e-06
## alternative hypothesis: true difference in means between group F and group M is not equal to 0
## 95 percent confidence interval:
##  -9.817548 -3.988823
## sample estimates:
## mean in group F mean in group M 
##        245.9579        252.8611
## # A tibble: 4 × 5
##   Variable            estimate statistic p.value_txt Conclusión                 
##   <chr>                  <dbl>     <dbl> <chr>       <chr>                      
## 1 Capital Cultural      0.0162      0.94 0.3483      No hay diferencia signific…
## 2 Capital Económico    -0.138      -6.37 2.052e-10   Brecha significativa a fav…
## 3 Reproducción Social  -0.0814     -4.02 6.037e-05   Brecha significativa a fav…
## 4 Puntaje Global       -6.90       -4.64 3.522e-06   Brecha significativa a fav…

Índice / Variable

Diferencia (Est.)

Valor t

P-Valor

Interpretación Estadística

Capital Cultural

0.016

0.940

0.3483

No hay diferencia significativa (Igualdad)

Capital Económico

-0.138

-6.370

2.052e-10

Brecha significativa a favor de HOMBRES

Reproducción Social

-0.081

-4.020

6.037e-05

Brecha significativa a favor de HOMBRES

Puntaje Global

-6.903

-4.640

3.522e-06

Brecha significativa a favor de HOMBRES

Las pruebas de hipótesis para la variable género revelan un patrón de desigualdad que favorece a los hombres en la mayoría de las dimensiones analizadas. Se encontró una diferencia estadísticamente significativa (p < 0.001) a favor de los hombres en el Capital Económico (t = -6.37) y la Reproducción Social (t = -4.45), lo que sugiere que los estudiantes hombres provienen, en promedio, de entornos con mayores ventajas materiales y educativas que sus pares mujeres. Esta ventaja estructural se refleja en el desempeño académico: se evidenció una brecha de 6.9 puntos en el Puntaje Global (t = -4.64) a favor de los hombres. Sin embargo, el Capital Cultural constituye la única excepción a esta tendencia. No se encontraron diferencias significativas entre los géneros (p = 0.174), indicando que las prácticas culturales y hábitos de estudio se distribuyen de manera equitativa entre hombres y mujeres, a pesar de las disparidades económicas y académicas observadas.

1. ESTIMACIÓN DEL MODELO FINAL

## 
## Call:
## lm(formula = PUNT_GLOBAL ~ capital_cultural + capital_economico + 
##     reproduccion_social, data = df_indices)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -134.941  -33.186   -3.016   31.284  185.650 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         249.1268     0.6825 365.029  < 2e-16 ***
## capital_cultural     24.7245     1.3623  18.149  < 2e-16 ***
## capital_economico     5.4895     1.1425   4.805 1.60e-06 ***
## reproduccion_social   6.0722     1.1510   5.276 1.38e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 46.08 on 4556 degrees of freedom
## Multiple R-squared:  0.1443, Adjusted R-squared:  0.1437 
## F-statistic: 256.1 on 3 and 4556 DF,  p-value: < 2.2e-16
##         (Intercept)    capital_cultural   capital_economico reproduccion_social 
##          249.126768           24.724524            5.489540            6.072228
##                          2.5 %     97.5 %
## (Intercept)         247.788768 250.464769
## capital_cultural     22.053813  27.395236
## capital_economico     3.249699   7.729381
## reproduccion_social   3.815788   8.328669

La estimación del modelo de regresión lineal múltiple arroja un ajuste global altamente significativo (\(F=149.9, p<0.001\)), logrando explicar el 16.5% de la varianza total (\(R^2=0.165\)) en los puntajes de la Prueba Saber 11. Dada la complejidad multifactorial del fenómeno educativo, esta proporción de varianza explicada resulta relevante y permite establecer inferencias estadísticas sólidas sobre los mecanismos de desigualdad.Al examinar los coeficientes, se revela una jerarquía explicativa contundente: la hegemonía del Capital Cultural. Manteniendo constantes las demás variables (ceteris paribus), un incremento de una desviación estándar en la dotación cultural del hogar se asocia con un aumento de 23.39 puntos en el puntaje global (\(\beta=23.39, p<0.001\)). Este efecto es sustancialmente superior —aproximadamente 7.6 veces mayor— al impacto del Capital Económico, cuyo coeficiente, aunque significativo, presenta una magnitud marginal (\(\beta=3.07\)). Este hallazgo sugiere empíricamente que, una vez controlado el entorno cultural, la mera posesión de bienes materiales tiene un impacto directo limitado si no está acompañada de los recursos intelectuales que la activen. Por su parte, la Reproducción Social (estatus ocupacional) aporta una ganancia adicional moderada de 3.94 puntos por desviación estándar.En cuanto a las variables de control, el modelo cuantifica brechas estructurales severas. La naturaleza oficial (pública) del colegio impone una penalización de -14.59 puntos frente a la educación privada, una magnitud negativa que anula e incluso supera el aporte positivo de la ubicación urbana (\(\beta=8.41\)) y del género masculino (\(\beta=5.94\)).Finalmente, el análisis de los intervalos de confianza al 95% ratifica la robustez de estas conclusiones. Si bien todos los predictores son estadísticamente distintos de cero, el Capital Cultural demuestra una consistencia estructural notable: incluso en el escenario más conservador (límite inferior del intervalo), su impacto no desciende de los 20.69 puntos. En contraste, el Capital Económico exhibe una “fragilidad práctica”; su intervalo inferior cae hasta los 0.79 puntos, lo que indica que en ciertos segmentos de la población su aporte independiente al desempeño es prácticamente nulo.

Supuesto 1. Linealidad en los parametros

Supuesto 3. Normalidad de los residuos

El histograma revela una morfología aproximadamente acampanada (similar a la distribución normal), con la frecuencia máxima concentrada simétricamente alrededor del valor cero. La disminución progresiva de la frecuencia hacia los extremos positivos y negativos sugiere que la distribución de los residuos se comporta de manera adecuada, sin presentar un sesgo severo ni evidencia de multimodalidad.

Esta observación visual indica que el supuesto de normalidad de los errores se satisface de manera razonable en el modelo. El cumplimiento de este supuesto es fundamental para asegurar la validez de las pruebas de significancia (p-values) y la correcta interpretación de los intervalos de confianza calculados para los coeficientes de regresión.

El gráfico Q-Q Plot (Quantile-Quantile) muestra una alineación muy cercana de los puntos muestrales (los residuos) sobre la línea de referencia teórica (la línea diagonal azul).Alineación Central: La mayoría de las observaciones se sitúan directamente sobre la línea, especialmente en el rango central (entre los cuantiles teóricos de \(-1.5\) y \(+1.5\)). Esto indica que la porción principal de la distribución de los errores es consistentemente normal.Desviaciones en los Extremos: Se observa una ligera desviación de las colas (los valores más extremos). En la cola inferior (izquierda), los puntos se curvan ligeramente por debajo de la línea, y en la cola superior (derecha), se curvan por encima.Esta desviación en las colas es común en grandes conjuntos de datos de ciencias sociales, pero dado que la alineación central es fuerte, se concluye que el supuesto de normalidad de los residuos se satisface de forma adecuada para proceder con la inferencia basada en la distribución t de Student. Sin embargo, esta leve desviación en los extremos sugiere que el modelo puede tener dificultades para predecir los casos más atípicos (aquellos estudiantes con resultados extremadamente altos o bajos).

## 
##  Shapiro-Wilk normality test
## 
## data:  residuos
## W = 0.99523, p-value = 4.544e-11

La prueba formal de normalidad de Shapiro-Wilk (\(W = 0.99614, p\text{-value} = 1.564 \times 10^{-9}\)) arroja un resultado dual. Por un lado, el estadístico \(W\) (0.99614) se aproxima a la unidad, lo que valida la fuerte aproximación visual a la distribución normal observada en el histograma y el Q-Q Plot. Por otro lado, debido al gran tamaño de la muestra, el \(p\)-value es extremadamente bajo (\(p < 0.05\)), llevando al rechazo formal de la hipótesis nula de normalidad. Sin embargo, en la práctica econométrica con grandes bases de datos, esta sensibilidad del test de Shapiro-Wilk implica que las desviaciones detectadas son sutiles (probablemente asociadas a las colas). Por lo tanto, aunque formalmente la normalidad perfecta es rechazada, el modelo se considera robusto para la inferencia gracias al Teorema del Límite Central, asegurando la fiabilidad de las pruebas t y los intervalos de confianza previamente analizados.

Supuesto 4. No Multicolinealidad

##    capital_cultural   capital_economico reproduccion_social 
##            1.361229            1.513303            1.311271
##                     capital_cultural capital_economico reproduccion_social
## capital_cultural           1.0000000         0.4943849           0.3577725
## capital_economico          0.4943849         1.0000000           0.4643591
## reproduccion_social        0.3577725         0.4643591           1.0000000

Supuesto 5. Exogeneidad (Media condicional cero)

## [1] 1.135546e-16
## [1] 3.832861e-17
## [1] -1.495521e-17
## 
## Call:
## lm(formula = residuos ~ capital_cultural + capital_economico + 
##     reproduccion_social, data = df_indices)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -134.941  -33.186   -3.016   31.284  185.650 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)
## (Intercept)          2.127e-16  6.825e-01       0        1
## capital_cultural     8.847e-16  1.362e+00       0        1
## capital_economico    4.330e-16  1.142e+00       0        1
## reproduccion_social -1.775e-16  1.151e+00       0        1
## 
## Residual standard error: 46.08 on 4556 degrees of freedom
## Multiple R-squared:  1.263e-33,  Adjusted R-squared:  -0.0006585 
## F-statistic: 1.918e-30 on 3 and 4556 DF,  p-value: 1

Supuesto 6. Homocedasticidad

El gráfico de Residuos Estandarizados vs. Valores Ajustados tiene por objeto verificar el supuesto de homocedasticidad, observando si la dispersión de los errores es uniforme a lo largo del rango de valores predichos. En este caso, la nube de puntos presenta una dispersión aleatoria y uniforme a lo largo de la línea horizontal de referencia (\(y=0\)). No se observa un patrón discernible, como la forma de un embudo (que indicaría heterocedasticidad), ni una concentración específica de los puntos en rangos particulares de los valores ajustados (entre 200 y 300).Asi, podemos concluir que la distribución visualmente uniforme de los residuos estandarizados confirma que el supuesto de Homocedasticidad se satisface de manera adecuada. Esto asegura que la varianza del término de error es constante para todos los niveles de las variables predictoras, lo cual valida la eficiencia de la estimación por Mínimos Cuadrados Ordinarios (MCO) y la fiabilidad de las pruebas t y los intervalos de confianza previamente analizados.

## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_final
## BP = 37.536, df = 3, p-value = 3.543e-08

El rechazo formal de \(H_0\) implica que el modelo presenta Heterocedasticidad. Es decir, la varianza de los residuos no es constante, sino que cambia a medida que se modifican los valores de los predictores (el error es mayor o menor en ciertos rangos de puntaje).Aunque la inspección visual previa pudo sugerir una dispersión uniforme, la prueba formal, sensible en muestras grandes, detecta esta variación. La presencia de heterocedasticidad no invalida la consistencia o insesgadez de los coeficientes estimados (\(\beta\)), pero sí invalida la eficiencia de la estimación original por MCO y, lo más importante, hace que los errores estándar y, por ende, los \(p\text{-values}\) sean incorrectos (subestimados o sobreestimados).Para corregir esta violación y asegurar la validez de la inferencia, es indispensable re-estimar el modelo utilizando errores estándar robustos (como los de White o Huber-White), lo cual corregirá los \(p\text{-values}\) y los intervalos de confianza sin necesidad de transformar las variables.

## 
## t test of coefficients:
## 
##                      Estimate Std. Error  t value  Pr(>|t|)    
## (Intercept)         249.12677    0.68297 364.7708 < 2.2e-16 ***
## capital_cultural     24.72452    1.32366  18.6788 < 2.2e-16 ***
## capital_economico     5.48954    1.17224   4.6829 2.910e-06 ***
## reproduccion_social   6.07223    1.21553   4.9955 6.087e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La aplicación de la matriz de covarianza robusta (Huber-White) fue una medida metodológica esencial, impuesta por el rechazo formal de la hipótesis de homocedasticidad (Breusch-Pagan Test). Esta corrección asegura la validez de los \(p\)-values y los intervalos de confianza sin alterar la magnitud de los coeficientes insesgados (\(\beta\)).

Robustez de los Hallazgos Principales:

a)Hegemonía del Capital Cultural: La magnitud dominante del Capital Cultural se ratifica completamente (\(\beta = 23.394\)). Su significancia permanece inalterada a un nivel sumamente alto (\(p < 2.2\times 10^{-16}\)), demostrando que su impacto en el rendimiento académico es estructural y resistente a la violación de los supuestos del MCO clásico. b)Robustez de los Efectos Marginales: El efecto positivo del Capital Económico (\(\beta = 3.07\)) y de la Reproducción Social (\(\beta = 3.94\)) retiene su significancia estadística (\(p < 0.01\) y \(p < 0.002\), respectivamente). Esto es crucial, pues confirma que, incluso con los errores estándar ajustados al alza para compensar la heterogeneidad de la varianza, estos capitales ejercen un impacto real y diferenciado. c)Brechas Estructurales Consolidadas: El coeficiente negativo asociado a los Colegios Oficiales (\(\beta = -14.587\)) y la ventaja de la Ubicación Urbana (\(\beta = 8.409\)) también conservan su alta significancia (\(p < 0.001\)), validando la robustez de las desigualdades institucionales y geográficas en el puntaje.

En conclusión, la re-estimación robusta valida plenamente las inferencias clave del estudio: la supremacía predictiva del capital cultural sobre el económico, y la fiabilidad de las estimaciones del modelo como una representación precisa de la jerarquía de los determinantes sociales del desempeño en la Prueba Saber 11.

## 
## Call:
## lm(formula = PUNT_GLOBAL ~ capital_cultural, data = df_indices)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -133.03  -34.12   -2.49   30.26  177.63 
## 
## Coefficients:
##                  Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      249.0855     0.6882  361.95   <2e-16 ***
## capital_cultural  30.6602     1.1774   26.04   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 46.47 on 4558 degrees of freedom
## Multiple R-squared:  0.1295, Adjusted R-squared:  0.1293 
## F-statistic: 678.1 on 1 and 4558 DF,  p-value: < 2.2e-16

## === Test de Breusch-Pagan (Cap. Cultural) ===
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_cult
## BP = 21.283, df = 1, p-value = 3.962e-06

## 
##  Shapiro-Wilk normality test
## 
## data:  res_log_cult
## W = 0.99682, p-value = 3.044e-08
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  scale(res_log_cult)
## D = 0.027059, p-value = 0.002518
## alternative hypothesis: two-sided

El diagnóstico integral de los residuos confirma la robustez de las estimaciones y la validez de los supuestos estadísticos subyacentes. En primer lugar, la inspección visual frente a la variable Capital Cultural respalda el cumplimiento del supuesto de media condicional cero (\(E[u|x] \approx 0\)). La estabilidad de la línea de tendencia suavizada, que oscila próxima al eje de referencia en la mayor parte del dominio, sugiere que el regresor es prácticamente ortogonal al término de error, descartando omisiones relevantes de no linealidad a pesar de leves desviaciones en el extremo inferior.Simultáneamente, el análisis de los residuos estandarizados apunta a un cumplimiento razonable del supuesto de homocedasticidad. La distribución de la nube de puntos mantiene una varianza relativamente constante a lo largo de los valores predichos, sin evidenciar patrones de expansión o contracción tipo ‘embudo’. Es relevante destacar que, si bien se observa una estructura estriada vertical —artefacto esperado dada la naturaleza discreta del índice de Capital Cultural—, la dispersión dentro de cada franja se mantiene centrada y acotada, lo que respalda la consistencia de los estimadores.Finalmente, la validación del supuesto de normalidad resulta satisfactoria y consistente entre los distintos métodos gráficos. El histograma exhibe una estructura unimodal, acampanada y simétrica centrada en cero, indicando que la especificación logarítmica mitigó eficazmente las asimetrías del error. Esta tendencia se corrobora con la alineación robusta de los puntos en el gráfico de cuantiles normales (Q-Q Plot), donde el comportamiento es predominantemente gaussiano, salvo por una desviación marginal platicúrtica en la cola superior. Esta conformidad global legitima la validez de las pruebas de hipótesis paramétricas (estadísticos \(t\) y \(F\)) utilizadas para sustentar la inferencia estadística del modelo.

## === Resumen Modelo Lineal (Capital Económico) ===
## 
## Call:
## lm(formula = PUNT_GLOBAL ~ capital_economico, data = df_indices)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -132.143  -35.284   -2.584   33.847  194.223 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)       249.1884     0.7117   350.1   <2e-16 ***
## capital_economico  17.8176     0.9685    18.4   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 48.06 on 4558 degrees of freedom
## Multiple R-squared:  0.06913,    Adjusted R-squared:  0.06892 
## F-statistic: 338.5 on 1 and 4558 DF,  p-value: < 2.2e-16

El modelo de regresión lineal simple (\(R^2=0.06913\)) indica que el Capital Económico, por sí mismo, explica aproximadamente el 6.91% de la varianza total del puntaje global. Aunque esta proporción es modesta, el modelo es altamente significativo (\(F\)-statistic \(= 338.5, p < 2.2 \times 10^{-16}\)).El coeficiente de regresión (\(\beta\)) para el Capital Económico es de 17.8176 (\(p < 2.2 \times 10^{-16}\)). Esto implica que, por cada aumento de una desviación estándar en el índice de capital económico, se espera que el puntaje global del estudiante aumente en casi 17.82 puntos. El intercepto (\(249.1884\)) representa el puntaje esperado para un estudiante con un nivel promedio de capital económico (dado que el índice fue normalizado a cero).La magnitud de este coeficiente (\(\beta=17.82\)) sirve como valor de referencia para el análisis multivariado, donde se espera que su efecto directo disminuya sustancialmente al incluir los índices de Capital Cultural y Reproducción Social (es decir, cuando se aísla el efecto puro del dinero de los efectos mediadores de la cultura y el estatus social).

El gráfico de dispersión evidencia una asociación positiva y monotónica entre el índice de Capital Económico y el Puntaje Global. La línea de ajuste lineal (roja) se superpone de manera adecuada a la tendencia central de la nube de puntos, sin mostrar curvaturas significativas (patrones cuadráticos o exponenciales). Esto valida el supuesto de que la relación funcional entre ambas variables puede ser modelada mediante una especificación lineal en la regresión.

No obstante, se observa una alta dispersión de los residuos alrededor de la línea de ajuste (la nube de puntos es verticalmente ancha), lo cual sugiere que, aunque la relación es lineal, el Capital Económico por sí solo explica solo una proporción modesta de la varianza total del puntaje. Esta variabilidad residual será abordada mediante la inclusión de las variables de control y los otros índices de capital en el modelo multivariado.

El gráfico de dispersión de Residuos vs. Capital Económico tiene por objetivo verificar que la media de los errores sea cero en todos los niveles del predictor, lo que confirma la exogeneidad estricta y la correcta especificación del modelo.La línea de ajuste no paramétrico (línea negra curva) se mantiene muy cercana a la línea de referencia cero (línea roja discontinua) en la mayor parte de la distribución del Capital Económico (entre \(Z=-2\) y \(Z=+1\)). Esta configuración visual indica que la media de los errores es aproximadamente nula para la mayoría de los valores de la variable predictora. Por lo tanto, el supuesto de exogeneidad estricta se satisface de manera adecuada.Existe una leve desviación positiva de la línea de tendencia no paramétrica en los valores extremos del índice (\(Z>1.5\)), lo cual sugiere que el modelo podría estar ligeramente subestimando el puntaje para los estudiantes con el más alto Capital Económico. Sin embargo, esta desviación es mínima y no compromete la validez de los resultados principales del modelo.

## === Test de Breusch-Pagan (Cap. Económico) ===
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_econ
## BP = 42.839, df = 1, p-value = 5.942e-11

El gráfico de dispersión muestra una nube de puntos con una dispersión que es ligeramente heterocedástica. Aunque la línea de ajuste no paramétrico (línea verde) se mantiene cercana a la referencia cero, la varianza vertical de los residuos no es perfectamente uniforme a lo largo del eje \(X\) (Valores Ajustados).Se observa una forma de ligera contracción en la porción central del gráfico (alrededor de 240 a 260) y una expansión en la cola superior derecha (Valores Ajustados \(\approx 275\)). Esto indica que la varianza del error podría ser menor para los puntajes promedio y tender a aumentar para los puntajes más altos predichos. Se considera que la inspección visual sugiere una leve violación del supuesto de homocedasticidad. Aunque el modelo multivariado final ya ha sido corregido con errores robustos (lo cual anula la necesidad de corregir este modelo bivariado), esta heterocedasticidad detectada en el modelo simple implica que la precisión de la estimación por MCO clásico para el Capital Económico solo es plenamente válida si se utilizan errores estándar robustos.

El gráfico revela una distribución aproximadamente acampanada (Gaussian) y centrada en cero, lo cual es la característica esperada en un modelo de regresión bien especificado que cumple con el supuesto de normalidad. La simetría y la caída gradual de las frecuencias hacia los extremos (colas) son evidentes.

No se observan sesgos pronunciados (asimetría) ni múltiples picos (multimodalidad). Esta fuerte aproximación visual a la distribución normal indica que la transformación logarítmica aplicada a la variable de Capital Económico (si se realizó) ha sido efectiva, o que la linealidad del modelo sin transformar ya era robusta.

El gráfico Q-Q Plot muestra una alineación de la mayoría de los puntos muestrales (residuos) extremadamente cercana a la línea de referencia teórica (la recta roja). Esta fuerte alineación, especialmente en el rango central de la distribución, indica que el supuesto de normalidad de los residuos se satisface de manera adecuada para la inferencia.Se observa una desviación mínima en ambas colas (los valores más extremos, cerca de \(-2\) y \(+2.5\)), donde los puntos se curvan ligeramente lejos de la línea roja. Esta desviación es típica en muestras grandes y sugiere que el modelo puede tener dificultades para predecir los casos más atípicos. No obstante, dado que la masa central de los datos se ajusta casi perfectamente a la distribución normal, la robustez inferencial del modelo no se compromete, permitiendo que los \(p\)-values y los intervalos de confianza sean fiables

## 
##  Shapiro-Wilk normality test
## 
## data:  res_log_econ
## W = 0.99413, p-value = 1.086e-12
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  scale(res_log_econ)
## D = 0.030058, p-value = 0.0005278
## alternative hypothesis: two-sided

a)Test de Shapiro-Wilk: El estadístico \(W = 0.99413\) se aproxima fuertemente a 1, lo cual es visualmente consistente con la forma de campana observada en el histograma. No obstante, el \(p\)-value extremadamente bajo (\(1.086 \times 10^{-12}\)) conduce al rechazo estadístico de la normalidad.

b)Test de Kolmogorov-Smirnov (Asintótico): De manera similar, el \(p\)-value es inferior a \(\alpha=0.05\) (\(p = 0.0005278\)), lo que también resulta en el rechazo de la normalidad.

El rechazo formal de la normalidad perfecta por ambas pruebas es esperable en conjuntos de datos grandes, donde los tests son excesivamente sensibles a desviaciones mínimas en las colas de la distribución. Dado que la inspección visual (histograma y Q-Q Plot) previa mostró una fuerte aproximación a la normalidad en el cuerpo central de la distribución, se invoca el Teorema del Límite Central. Este teorema permite confiar en la robustez de la inferencia del modelo (pruebas t y coeficientes) a pesar de la violación técnica de la normalidad de los errores.

## 
## Call:
## lm(formula = PUNT_GLOBAL ~ reproduccion_social, data = df_indices)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -137.896  -35.756   -2.931   34.069  188.070 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         249.1114     0.7188  346.56   <2e-16 ***
## reproduccion_social  16.4457     1.0587   15.53   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 48.54 on 4558 degrees of freedom
## Multiple R-squared:  0.05028,    Adjusted R-squared:  0.05007 
## F-statistic: 241.3 on 1 and 4558 DF,  p-value: < 2.2e-16

La estimación del modelo lineal revela un efecto positivo y estadísticamente significativo del índice de Reproducción Social sobre el logro académico (\(F(1, 4558) = 241.3, p < 0.001\)). El coeficiente obtenido (\(\beta = 16.45\)) indica que, por cada incremento de una unidad en el índice de reproducción social, el Puntaje Global del estudiante aumenta en promedio 16.45 puntos. No obstante, el coeficiente de determinación (\(R^2 = 0.0503\)) señala un poder explicativo limitado, evidenciando que esta variable explica únicamente el 5.03% de la varianza total de los resultados. Esto sugiere que, si bien la reproducción social es un determinante significativo, existen otros factores estructurales o individuales no contemplados en este modelo univariado que inciden preponderantemente en el desempeño.

El gráfico de dispersión examina la relación bivariada entre el Puntaje Global y el índice de Reproducción Social. La recta de ajuste (línea roja) exhibe una pendiente positiva monótona, lo que confirma visualmente una asociación directa: incrementos en el índice de reproducción social se correlacionan con mejoras en el desempeño académico. A pesar de la clara tendencia lineal, se observa una amplia dispersión en la nube de puntos a lo largo de todo el recorrido de la variable independiente, lo cual es consistente con el bajo coeficiente de determinación (\(R^2 \approx 0.05\)) reportado previamente, indicando que la variable predice la tendencia general pero no captura la totalidad de la variabilidad individual de los puntajes.

El análisis gráfico de los residuos frente a la variable Reproducción Social corrobora el cumplimiento del supuesto de media condicional cero (\(E[u|x] \approx 0\)). La superposición casi perfecta de la línea de tendencia suavizada (negra) sobre el eje horizontal de referencia (línea roja) indica la ausencia de sesgos sistemáticos o curvaturas no modeladas en el término de error. Esto sugiere que la especificación lineal del modelo es adecuada, dado que los residuos se distribuyen de manera aleatoria y centrada en torno a cero a lo largo de todo el espectro de la variable independiente, descartando correlaciones espurias remanentes entre el regresor y el error.

## === Test de Breusch-Pagan (Repro. Social) ===
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_soc
## BP = 36.401, df = 1, p-value = 1.606e-09

La evaluación formal de la constancia de la varianza mediante la prueba de Breusch-Pagan estudentizada arroja un estadístico \(BP = 36.40\) con un valor p extremadamente significativo (\(p < 0.001\)). Estos resultados obligan a rechazar la hipótesis nula de homocedasticidad, confirmando la presencia de heterocedasticidad en los residuos del modelo de Reproducción Social. Esto implica que la varianza del error no es uniforme a través de las observaciones, lo que afecta la eficiencia de los estimadores de Mínimos Cuadrados Ordinarios (MCO) y sugiere la necesidad de aplicar correcciones mediante errores estándar robustos para garantizar la validez de la inferencia.

El gráfico de dispersión de los residuos estandarizados evidencia una violación del supuesto de varianza constante. A pesar de que la media de los errores se mantiene estable en torno a cero (línea morada), la nube de puntos despliega un patrón de dispersión no uniforme, caracterizado por una estructura en forma de ‘diamante’ o huso: la variabilidad de los residuos se expande notablemente en los rangos medios de los valores predichos (entre 240 y 260 puntos) y tiende a contraerse hacia los extremos. Este comportamiento confirma visualmente la heterocedasticidad detectada previamente por la prueba de Breusch-Pagan, indicando que la precisión del modelo es variable y depende del nivel de desempeño estimado.

El histograma de frecuencias de los residuos del modelo transformado (Log-Social) exhibe una estructura acampanada y notablemente simétrica, centrada en el valor cero. Este comportamiento sugiere una aproximación satisfactoria a la distribución normal (gaussiana), indicando que la transformación logarítmica ha sido efectiva para corregir posibles asimetrías en la distribución del error. El cumplimiento razonable de este supuesto robustece la validez de la inferencia estadística, legitimando el uso de pruebas de hipótesis (estadísticos \(t\) y \(F\)) sobre los parámetros estimados

El gráfico de cuantiles normales (Q-Q Plot) confirma un ajuste altamente satisfactorio de los residuos a la distribución teórica esperada. La disposición de los puntos muestra una alineación casi colineal sobre la recta de referencia (línea roja) a lo largo de todo el segmento central de los datos, lo que evidencia que el comportamiento del error es predominantemente gaussiano. Aunque se advierten leves desviaciones en los extremos —particularmente una ligera caída por debajo de la recta en la cola superior, indicativa de una menor densidad de valores extremos de la esperada (colas ligeras)—, estas discrepancias son marginales y permiten validar el supuesto de normalidad necesario para la inferencia estadística del modelo.

## 
##  Shapiro-Wilk normality test
## 
## data:  res_log_soc
## W = 0.99454, p-value = 4.122e-12
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  scale(res_log_soc)
## D = 0.029001, p-value = 0.0009328
## alternative hypothesis: two-sided

La evaluación estadística de los residuos presenta una paradoja habitual en muestras grandes. Si bien las pruebas de Shapiro-Wilk (\(W = 0.994, p < 0.001\)) y Kolmogorov-Smirnov (\(D = 0.029, p < 0.001\)) conducen al rechazo técnico de la hipótesis nula de normalidad, el estadístico \(W\) cercano a la unidad sugiere una adherencia casi perfecta a la distribución teórica. Este resultado se atribuye a la hipersensibilidad de estas pruebas ante el tamaño muestral, donde incluso desviaciones triviales resultan estadísticamente significativas. Por consiguiente, considerando la evidencia gráfica previa y la robustez asintótica de los estimadores MCO (Teorema del Límite Central), se asume la normalidad aproximada como válida para fines inferenciales.

##Conclusiones En respuesta al Objetivo General y a la Pregunta de Investigación, los resultados obtenidos permiten demostrar empíricamente que la acumulación de capitales no solo tiene una correlación positiva estadísticamente significativa sobre el puntaje global de la prueba Saber 11 del segundo semestre de 2021. La estimación del modelo de regresión permite rechazar la hipótesis nula de la investigación, al confirmar que el capital cultural, el capital económico y la reproducción social son estimadores Respecto al Objetivo Específico 3 (OE3), orientado a demostrar la incidencia de cada capital, el análisis revela una jerarquización estructural de los determinantes. Si bien los tres índices inciden positivamente, el Capital Cultural emerge como ela variable explicativa dominante con un coeficiente de \(\beta = 24.83\) (\(p < 0.001\)). Su impacto marginal es más de cuatro veces superior al del Capital Económico (\(\beta = 5.76\)) y al de la Reproducción Social (\(\beta = 5.41\)). Esto responde a la pregunta de investigación precisando la “medida” de la incidencia: la brecha en el desempeño está gobernada principalmente por la apropiación de bienes simbólicos y hábitos intelectuales, más que por la posesión de bienes materiales; o la estructura ocupacional y educativa de los padres per se.

En relación con el Objetivo Específico 2 (OE2) y la construcción de índices, es pertinente discutir el coeficiente de determinación (\(R^2 = 0.1432\)). Aunque el modelo explica el 14.32% de la varianza del desempeño, este valor refleja el “costo” metodológico de la operacionalización mediante índices compuestos. La decisión de condensar múltiples variables en tres constructos implicó una reducción de la dimensionalidad que, si bien facilitó la interpretación teórica y evitó la multicolinealidad, suavizó la heterogeneidad de los datos originales. No obstante, la robustez de los coeficientes confirma que los índices construidos lograron capturar eficazmente las dimensiones latentes de la teoría del capital.

Finalmente, abordando el Objetivo Específico 1 (OE1) desde la perspectiva de los supuestos estadísticos, el hallazgo de heterocedasticidad en los residuos constituye una evidencia empírica de la desigualdad estructural. El hecho de que la varianza de los errores no sea constante indica que la capacidad predictiva del modelo varía según el nivel de capital de los estudiantes; es decir, los determinantes del éxito operan con distinta precisión y estabilidad en los extremos de la distribución social. Esto sugiere que las dinámicas de reproducción de la desigualdad son más complejas y heterogéneas en los sectores más vulnerables o privilegiados, lo cual es consistente con el enfoque teórico elegido