El capital simbólico es cualquier propiedad (cualquier especie de capital, físico, económico, cultural, social) cuando es percibida por agentes sociales cuyas categorías de percepción son tales que están en condiciones de conocerla (de percibirla) y de reconocerla, de concederle valor (Fernández, 2012)
Según Bourdieu, el capital económico entiende como “la forma de trabajo acumulado que posee características únicas respecto a su convertibilidad e institucionalización, y que determina la posición de los agentes en la estructura social.” (Bourdieau, 1986).
¿Qué se entiende por nivel socioeconómico?
El nivel socioeconómico se define como “una medida total que combina la parte económica y sociológica de la preparación laboral de una persona y de la posición económica y social individual o familiar en relación con otras personas” (Romero & Romero. 2013)
¿Qué se entiende por condiciones materiales de existencia?
Condiciones materiales en las que vivan los sujetos son las que les
van a permitir disfrutar, o les van a imposibilitar hacerlo, de la
autonomía adecuada compatible con el desarrollo de las capacidades
humanas básicas (Ribotta, 2021).
¿Qué se entiende por seguridad alimentaria?
Cuando todas las personas tienen acceso en todo momento, ya sea físico, social, y económico, a alimentos suficientes, seguros y nutritivos para cubrir sus necesidades nutricionales y las preferencias culturales para una vida sana y activa” (Bianchi & Szpak, 2016, p. 7).
El capital cultural es un concepto desarrollado por Pierre Bourdieu (1986), para describir el conjunto de conocimientos, habilidades, disposiciones, valores y competencias culturales que los individuos adquieren a través de la socialización, especialmente en el contexto familiar y educativo. Este tipo de capital actúa como un recurso simbólico que puede influir en las oportunidades sociales y educativas de las personas, y que contribuye a la reproducción de las desigualdades sociales. Bourdieu distingue tres formas de capital cultural:
Incorporado (embodied): los conocimientos, hábitos, lenguaje y disposiciones duraderas adquiridas por medio de la educación y la experiencia.
Objetivado (objectified): los bienes materiales que expresan cultura (libros, obras de arte, instrumentos, etc.).
Institucionalizado (institutionalized): los títulos académicos o certificaciones que legitiman el capital cultural adquirido.
El rendimiento académico de los estudiantes en Colombia, medido a través de la prueba Saber 11, se encuentra profundamente condicionado por factores de tipo familiar, socioeconómico, institucional y cultural. En primer lugar, el entorno familiar constituye un elemento determinante, dado que el nivel educativo de los padres, el estrato socioeconómico y los recursos culturales disponibles en el hogar, como la presencia de libros o el acceso a dispositivos tecnológicos, inciden directamente en el desempeño estudiantil (García-González & Skrita, 2019). En concordancia, Cruz Castro et al. (2016) destacan que los niveles socioeconómicos y culturales familiares, sintetizados mediante índices compuestos, se correlacionan positivamente con los puntajes obtenidos en las pruebas Saber 11. A su vez, la heterogeneidad regional y la naturaleza de las instituciones educativas también repercuten significativamente: existen brechas notorias entre los resultados de colegios públicos y privados, explicadas principalmente por las diferencias en los recursos escolares y por las condiciones sociales de los estudiantes (Tobar Bedoya et al., 2016). Estas desigualdades se expresan de manera más amplia a nivel regional, donde factores estructurales como las necesidades básicas insatisfechas, la desigualdad económica y el producto interno bruto territorial se asocian con la calidad de la educación media (Fajardo Ortiz et al., 2021).
Por otro lado, estudios longitudinales entre 2014 y 2019 han evidenciado que el dominio del idioma inglés se constituye como un componente relevante del capital cultural y un factor con alta influencia en el desempeño académico general (Collazos Valenzuela et al., 2021). Asimismo, la combinación entre capital cultural y género incide en las trayectorias educativas, reproduciendo desigualdades en el acceso y permanencia en la educación superior, en correspondencia con las tesis de la reproducción social planteadas por Bourdieu y Passeron (Rodríguez, 2022).
En los años más recientes, la pandemia de COVID-19 agudizó las brechas preexistentes en materia de aprendizaje, generando una disminución en los puntajes de las pruebas Saber 11 y una ampliación de las desigualdades entre estudiantes de distintos contextos socioeconómicos. Entre los principales factores explicativos se destacan la falta de acceso a internet, la precariedad tecnológica y la menor disponibilidad de espacios adecuados para el estudio en el hogar (Marín Llanes et al., 2023; Alvarado et al., 2023; Mejía Castaño, et al., 2020; Moreno Lizarazo, 2023). En suma, la evidencia empírica muestra que el capital económico, social y cultural de las familias, junto con la infraestructura educativa y tecnológica disponible, determina en gran medida las oportunidades de éxito académico y la continuidad en la educación superior en el contexto colombiano (Rangel & Lleras, 2010; Corsi, 2012).
En este sentido, resulta pertinente preguntarse ¿Cómo se relacionan la acumulación de capital económico y cultural de los estudiantes con los resultados obtenidos en la prueba estandarizada “Saber 11”?
Demostrar empíricamente si la acumulación del capital cultural y económico tiene un correlación positiva con los resultados obtenidos en la prueba estandarizada “Saber 11” del segundo semestre de 2021.#
OE1. Construir un modelo cuantitativo que operacionalice las teorías bourdieusianas del capital y la reproducción social, a partir de la base de datos de la prueba estandarizada “Saber 11” (2021-2)#
OE2. Analizar las variables que integran el modelo cuantitativo mediante técnicas de estadística descriptiva.#
OE3. Demostrar que la reproducción social y cultural incide en los resultados de la prueba estandarizada “saber 11” del segundo semestre de 2021.#
H₁: Existe una relación positiva y estadísticamente significativa entre la acumulación de capital económico y cultural; y los resultados obtenidos en la Prueba Saber 11 (2021-2).#
H₀: No existe una relación positiva y estadísticamente significativa entre la acumulación de capital económico y cultural; y los resultados obtenidos en la Prueba Saber 11 (2021-2).#
Limpeza base de datos:
#PASO 1: Cargar la base de datos##
#Attach base de datos
SB11_20212 <- read.csv("~/PROJECTOF/SB11_20212.txt", sep=";")
View(SB11_20212)
attach(SB11_20212)
length(SB11_20212)
## [1] 82
attach(SB11_20212)
## The following objects are masked from SB11_20212 (pos = 3):
##
## COLE_AREA_UBICACION, COLE_BILINGUE, COLE_CALENDARIO, COLE_CARACTER,
## COLE_COD_DANE_ESTABLECIMIENTO, COLE_COD_DANE_SEDE,
## COLE_COD_DEPTO_UBICACION, COLE_COD_MCPIO_UBICACION,
## COLE_CODIGO_ICFES, COLE_DEPTO_UBICACION, COLE_GENERO, COLE_JORNADA,
## COLE_MCPIO_UBICACION, COLE_NATURALEZA, COLE_NOMBRE_ESTABLECIMIENTO,
## COLE_NOMBRE_SEDE, COLE_SEDE_PRINCIPAL, DESEMP_C_NATURALES,
## DESEMP_INGLES, DESEMP_LECTURA_CRITICA, DESEMP_MATEMATICAS,
## DESEMP_SOCIALES_CIUDADANAS, ESTU_COD_DEPTO_PRESENTACION,
## ESTU_COD_MCPIO_PRESENTACION, ESTU_COD_RESIDE_DEPTO,
## ESTU_COD_RESIDE_MCPIO, ESTU_CONSECUTIVO, ESTU_DEDICACIONINTERNET,
## ESTU_DEDICACIONLECTURADIARIA, ESTU_DEPTO_PRESENTACION,
## ESTU_DEPTO_RESIDE, ESTU_ESTADOINVESTIGACION, ESTU_ESTUDIANTE,
## ESTU_FECHANACIMIENTO, ESTU_GENERACION.E, ESTU_GENERO,
## ESTU_HORASSEMANATRABAJA, ESTU_INSE_INDIVIDUAL,
## ESTU_MCPIO_PRESENTACION, ESTU_MCPIO_RESIDE, ESTU_NACIONALIDAD,
## ESTU_NSE_ESTABLECIMIENTO, ESTU_NSE_INDIVIDUAL, ESTU_PAIS_RESIDE,
## ESTU_PRIVADO_LIBERTAD, ESTU_TIENEETNIA, ESTU_TIPODOCUMENTO,
## ESTU_TIPOREMUNERACION, FAMI_COMECARNEPESCADOHUEVO,
## FAMI_COMECEREALFRUTOSLEGUMBRE, FAMI_COMELECHEDERIVADOS,
## FAMI_CUARTOSHOGAR, FAMI_EDUCACIONMADRE, FAMI_EDUCACIONPADRE,
## FAMI_ESTRATOVIVIENDA, FAMI_NUMLIBROS, FAMI_PERSONASHOGAR,
## FAMI_SITUACIONECONOMICA, FAMI_TIENEAUTOMOVIL, FAMI_TIENECOMPUTADOR,
## FAMI_TIENECONSOLAVIDEOJUEGOS, FAMI_TIENEHORNOMICROOGAS,
## FAMI_TIENEINTERNET, FAMI_TIENELAVADORA, FAMI_TIENEMOTOCICLETA,
## FAMI_TIENESERVICIOTV, FAMI_TRABAJOLABORMADRE,
## FAMI_TRABAJOLABORPADRE, PERCENTIL_C_NATURALES,
## PERCENTIL_ESPECIAL_GLOBAL, PERCENTIL_GLOBAL, PERCENTIL_INGLES,
## PERCENTIL_LECTURA_CRITICA, PERCENTIL_MATEMATICAS,
## PERCENTIL_SOCIALES_CIUDADANAS, PERIODO, PUNT_C_NATURALES,
## PUNT_GLOBAL, PUNT_INGLES, PUNT_LECTURA_CRITICA, PUNT_MATEMATICAS,
## PUNT_SOCIALES_CIUDADANAS
View(SB11_20212)
#PASO 2: Conteo y proporción de observaciones faltantes (NA) en cada variable de la base original##
#Conteo de la cantidad de observaciones faltantes
colSums(is.na(SB11_20212))
## ESTU_TIPODOCUMENTO ESTU_NACIONALIDAD
## 0 0
## ESTU_GENERO ESTU_FECHANACIMIENTO
## 1 0
## PERIODO ESTU_CONSECUTIVO
## 0 0
## ESTU_ESTUDIANTE ESTU_PAIS_RESIDE
## 0 0
## ESTU_TIENEETNIA ESTU_DEPTO_RESIDE
## 3 1
## ESTU_COD_RESIDE_DEPTO ESTU_MCPIO_RESIDE
## 1 1
## ESTU_COD_RESIDE_MCPIO FAMI_ESTRATOVIVIENDA
## 1 290
## FAMI_PERSONASHOGAR FAMI_CUARTOSHOGAR
## 149 159
## FAMI_EDUCACIONPADRE FAMI_EDUCACIONMADRE
## 270 271
## FAMI_TRABAJOLABORPADRE FAMI_TRABAJOLABORMADRE
## 155 152
## FAMI_TIENEINTERNET FAMI_TIENESERVICIOTV
## 277 283
## FAMI_TIENECOMPUTADOR FAMI_TIENELAVADORA
## 153 162
## FAMI_TIENEHORNOMICROOGAS FAMI_TIENEAUTOMOVIL
## 168 170
## FAMI_TIENEMOTOCICLETA FAMI_TIENECONSOLAVIDEOJUEGOS
## 159 174
## FAMI_NUMLIBROS FAMI_COMELECHEDERIVADOS
## 415 332
## FAMI_COMECARNEPESCADOHUEVO FAMI_COMECEREALFRUTOSLEGUMBRE
## 285 298
## FAMI_SITUACIONECONOMICA ESTU_DEDICACIONLECTURADIARIA
## 176 281
## ESTU_DEDICACIONINTERNET ESTU_HORASSEMANATRABAJA
## 293 161
## ESTU_TIPOREMUNERACION COLE_CODIGO_ICFES
## 170 0
## COLE_COD_DANE_ESTABLECIMIENTO COLE_NOMBRE_ESTABLECIMIENTO
## 0 0
## COLE_GENERO COLE_NATURALEZA
## 0 0
## COLE_CALENDARIO COLE_BILINGUE
## 0 916
## COLE_CARACTER COLE_COD_DANE_SEDE
## 200 0
## COLE_NOMBRE_SEDE COLE_SEDE_PRINCIPAL
## 0 0
## COLE_AREA_UBICACION COLE_JORNADA
## 0 0
## COLE_COD_MCPIO_UBICACION COLE_MCPIO_UBICACION
## 0 0
## COLE_COD_DEPTO_UBICACION COLE_DEPTO_UBICACION
## 0 0
## ESTU_PRIVADO_LIBERTAD ESTU_COD_MCPIO_PRESENTACION
## 0 0
## ESTU_MCPIO_PRESENTACION ESTU_DEPTO_PRESENTACION
## 0 0
## ESTU_COD_DEPTO_PRESENTACION PUNT_LECTURA_CRITICA
## 0 0
## PERCENTIL_LECTURA_CRITICA DESEMP_LECTURA_CRITICA
## 0 0
## PUNT_MATEMATICAS PERCENTIL_MATEMATICAS
## 0 0
## DESEMP_MATEMATICAS PUNT_C_NATURALES
## 0 0
## PERCENTIL_C_NATURALES DESEMP_C_NATURALES
## 0 0
## PUNT_SOCIALES_CIUDADANAS PERCENTIL_SOCIALES_CIUDADANAS
## 0 0
## DESEMP_SOCIALES_CIUDADANAS PUNT_INGLES
## 0 41
## PERCENTIL_INGLES DESEMP_INGLES
## 41 41
## PUNT_GLOBAL PERCENTIL_GLOBAL
## 0 41
## PERCENTIL_ESPECIAL_GLOBAL ESTU_INSE_INDIVIDUAL
## 5172 143
## ESTU_NSE_INDIVIDUAL ESTU_NSE_ESTABLECIMIENTO
## 143 0
## ESTU_ESTADOINVESTIGACION ESTU_GENERACION.E
## 0 0
#Proporción de la cantidad de observaciones faltantes en cada variable
porcentaje_na <- colMeans(is.na(SB11_20212)) * 100
sort(porcentaje_na, decreasing = TRUE)
## PERCENTIL_ESPECIAL_GLOBAL COLE_BILINGUE
## 97.05385626 17.18896603
## FAMI_NUMLIBROS FAMI_COMELECHEDERIVADOS
## 7.78757741 6.23006193
## FAMI_COMECEREALFRUTOSLEGUMBRE ESTU_DEDICACIONINTERNET
## 5.59204354 5.49821730
## FAMI_ESTRATOVIVIENDA FAMI_COMECARNEPESCADOHUEVO
## 5.44192156 5.34809533
## FAMI_TIENESERVICIOTV ESTU_DEDICACIONLECTURADIARIA
## 5.31056483 5.27303434
## FAMI_TIENEINTERNET FAMI_EDUCACIONMADRE
## 5.19797335 5.08538187
## FAMI_EDUCACIONPADRE COLE_CARACTER
## 5.06661663 3.75304935
## FAMI_SITUACIONECONOMICA FAMI_TIENECONSOLAVIDEOJUEGOS
## 3.30268343 3.26515294
## FAMI_TIENEAUTOMOVIL ESTU_TIPOREMUNERACION
## 3.19009195 3.19009195
## FAMI_TIENEHORNOMICROOGAS FAMI_TIENELAVADORA
## 3.15256146 3.03996998
## ESTU_HORASSEMANATRABAJA FAMI_CUARTOSHOGAR
## 3.02120473 2.98367424
## FAMI_TIENEMOTOCICLETA FAMI_TRABAJOLABORPADRE
## 2.98367424 2.90861325
## FAMI_TIENECOMPUTADOR FAMI_TRABAJOLABORMADRE
## 2.87108275 2.85231751
## FAMI_PERSONASHOGAR ESTU_INSE_INDIVIDUAL
## 2.79602177 2.68343029
## ESTU_NSE_INDIVIDUAL PUNT_INGLES
## 2.68343029 0.76937512
## PERCENTIL_INGLES DESEMP_INGLES
## 0.76937512 0.76937512
## PERCENTIL_GLOBAL ESTU_TIENEETNIA
## 0.76937512 0.05629574
## ESTU_GENERO ESTU_DEPTO_RESIDE
## 0.01876525 0.01876525
## ESTU_COD_RESIDE_DEPTO ESTU_MCPIO_RESIDE
## 0.01876525 0.01876525
## ESTU_COD_RESIDE_MCPIO ESTU_TIPODOCUMENTO
## 0.01876525 0.00000000
## ESTU_NACIONALIDAD ESTU_FECHANACIMIENTO
## 0.00000000 0.00000000
## PERIODO ESTU_CONSECUTIVO
## 0.00000000 0.00000000
## ESTU_ESTUDIANTE ESTU_PAIS_RESIDE
## 0.00000000 0.00000000
## COLE_CODIGO_ICFES COLE_COD_DANE_ESTABLECIMIENTO
## 0.00000000 0.00000000
## COLE_NOMBRE_ESTABLECIMIENTO COLE_GENERO
## 0.00000000 0.00000000
## COLE_NATURALEZA COLE_CALENDARIO
## 0.00000000 0.00000000
## COLE_COD_DANE_SEDE COLE_NOMBRE_SEDE
## 0.00000000 0.00000000
## COLE_SEDE_PRINCIPAL COLE_AREA_UBICACION
## 0.00000000 0.00000000
## COLE_JORNADA COLE_COD_MCPIO_UBICACION
## 0.00000000 0.00000000
## COLE_MCPIO_UBICACION COLE_COD_DEPTO_UBICACION
## 0.00000000 0.00000000
## COLE_DEPTO_UBICACION ESTU_PRIVADO_LIBERTAD
## 0.00000000 0.00000000
## ESTU_COD_MCPIO_PRESENTACION ESTU_MCPIO_PRESENTACION
## 0.00000000 0.00000000
## ESTU_DEPTO_PRESENTACION ESTU_COD_DEPTO_PRESENTACION
## 0.00000000 0.00000000
## PUNT_LECTURA_CRITICA PERCENTIL_LECTURA_CRITICA
## 0.00000000 0.00000000
## DESEMP_LECTURA_CRITICA PUNT_MATEMATICAS
## 0.00000000 0.00000000
## PERCENTIL_MATEMATICAS DESEMP_MATEMATICAS
## 0.00000000 0.00000000
## PUNT_C_NATURALES PERCENTIL_C_NATURALES
## 0.00000000 0.00000000
## DESEMP_C_NATURALES PUNT_SOCIALES_CIUDADANAS
## 0.00000000 0.00000000
## PERCENTIL_SOCIALES_CIUDADANAS DESEMP_SOCIALES_CIUDADANAS
## 0.00000000 0.00000000
## PUNT_GLOBAL ESTU_NSE_ESTABLECIMIENTO
## 0.00000000 0.00000000
## ESTU_ESTADOINVESTIGACION ESTU_GENERACION.E
## 0.00000000 0.00000000
#Interpretación: Se observa que, en ninguna de las variables de interés, las observaciones faltantes superan el 30% del total de observaciones. Por tanto, no resulta necesario aplicar procedimientos de imputación, ya que su eliminación no compromete el poder estadístico ni la representatividad de la muestra.
##PASO 3: seleccionar las variables de interés##
variables_de_interes <- c("FAMI_ESTRATOVIVIENDA", "FAMI_EDUCACIONPADRE", "FAMI_EDUCACIONMADRE", "FAMI_TRABAJOLABORPADRE", "FAMI_TRABAJOLABORMADRE", "FAMI_TIENEINTERNET", "FAMI_TIENESERVICIOTV", "FAMI_TIENECOMPUTADOR", "FAMI_TIENELAVADORA", "FAMI_TIENEHORNOMICROOGAS", "FAMI_TIENEAUTOMOVIL", "FAMI_TIENEMOTOCICLETA", "FAMI_NUMLIBROS", "FAMI_COMELECHEDERIVADOS", "FAMI_COMECARNEPESCADOHUEVO", "FAMI_COMECEREALFRUTOSLEGUMBRE", "FAMI_SITUACIONECONOMICA", "ESTU_DEDICACIONLECTURADIARIA", "ESTU_DEDICACIONINTERNET", "ESTU_GENERO", "COLE_NATURALEZA", "COLE_AREA_UBICACION", "PUNT_LECTURA_CRITICA", "PUNT_MATEMATICAS", "PUNT_C_NATURALES", "PUNT_SOCIALES_CIUDADANAS", "PUNT_INGLES", "DESEMP_LECTURA_CRITICA", "DESEMP_MATEMATICAS", "DESEMP_C_NATURALES", "DESEMP_SOCIALES_CIUDADANAS", "DESEMP_INGLES", "PUNT_GLOBAL")
nueva_base <- SB11_20212[, variables_de_interes]
View(nueva_base)
head(nueva_base)
dim(nueva_base)
## [1] 5329 33
class(nueva_base)
## [1] "data.frame"
#PASO 4: Limpieza de la base de datos
#creación de la base limpia (sin datos faltantes)
nueva_base_limpia <- na.omit(nueva_base)
# Comparación de las dimensones para ver cuántas filas se eliminaron, en virtud de los datos faltantes
cat("Dimensiones antes de limpiar:", dim(nueva_base), "\n")
## Dimensiones antes de limpiar: 5329 33
cat("Dimensiones después de limpiar:", dim(nueva_base_limpia), "\n")
## Dimensiones después de limpiar: 4560 33
#Proporción de la cantidad de valores faltantes en cada variable
obs_originales <- nrow(nueva_base) #filas de cada base
obs_finales <- nrow(nueva_base_limpia) #filas de cada base
obs_eliminadas <- obs_originales - obs_finales #cantidad de filas eliminadas
proporcion <- (obs_eliminadas / obs_originales *100) #proporción de las filas eliminadas
# Verificación de que ya no hay datos faltantes en la base limpia
colSums(is.na(nueva_base_limpia))
## FAMI_ESTRATOVIVIENDA FAMI_EDUCACIONPADRE
## 0 0
## FAMI_EDUCACIONMADRE FAMI_TRABAJOLABORPADRE
## 0 0
## FAMI_TRABAJOLABORMADRE FAMI_TIENEINTERNET
## 0 0
## FAMI_TIENESERVICIOTV FAMI_TIENECOMPUTADOR
## 0 0
## FAMI_TIENELAVADORA FAMI_TIENEHORNOMICROOGAS
## 0 0
## FAMI_TIENEAUTOMOVIL FAMI_TIENEMOTOCICLETA
## 0 0
## FAMI_NUMLIBROS FAMI_COMELECHEDERIVADOS
## 0 0
## FAMI_COMECARNEPESCADOHUEVO FAMI_COMECEREALFRUTOSLEGUMBRE
## 0 0
## FAMI_SITUACIONECONOMICA ESTU_DEDICACIONLECTURADIARIA
## 0 0
## ESTU_DEDICACIONINTERNET ESTU_GENERO
## 0 0
## COLE_NATURALEZA COLE_AREA_UBICACION
## 0 0
## PUNT_LECTURA_CRITICA PUNT_MATEMATICAS
## 0 0
## PUNT_C_NATURALES PUNT_SOCIALES_CIUDADANAS
## 0 0
## PUNT_INGLES DESEMP_LECTURA_CRITICA
## 0 0
## DESEMP_MATEMATICAS DESEMP_C_NATURALES
## 0 0
## DESEMP_SOCIALES_CIUDADANAS DESEMP_INGLES
## 0 0
## PUNT_GLOBAL
## 0
#ver base de datos limpia
View(nueva_base_limpia)
Con el fin de operacionalizar y modelar cuantitativamente el marco teórico de esta investigación, se construyeron tres indicadores proxy para representar los conceptos bourdieusianos de capital económico, capital cultural y reproducción social. Dado que estos constructos teóricos no son directamente medibles, su estimación se realizó a partir de un conjunto de variables de interés seleccionadas de la base de datos de los resultados y el perfil socioeconómico de los estudiantes que presentaron las Pruebas Saber 11 durante el segundo semestre de 2021. Dichos indicadores actuarán como las variables independientes en el análisis de estadística inferencial que se llevará a cabo en la investigación. Es fundamental subrayar que esta aproximación constituye una simplificación del marco teórico, ya que se encuentra condicionada por la naturaleza y el alcance de las 81 variables disponibles en la fuente de datos, por tanto, se reconoce su carácter limitado a la hora de representar los conceptos en cuestión. A continuación, se presentan los proxy propuestos para la variable independiente de la presente investigación
Capital Económico=FAMIESTRATOVIVIENDA+FAMITIENEAUTOMOVIL+FAMITIENEHORNOMICROOGAS+FAMITIENELAVADORA+FAMITIENEMOTOCICLETA+ FAMICOMELECHEDERIVADOS+FAMICOMECARNEPESCADOHUEVO+FAMICOMECEREALFRUTOSLEGUMBRE
Capital Cultural=FAMITIENECOMPUTADOR+FAMITIENEINTERNET+ESTUDEDICACIONINTERNET+ FAMITIENESERVICIOTV+FAMINUMLIBROS+ESTUDEDICACIONLECTURADIARIA
Reproducción Social=FAMIEDUCACIONPADRE+FAMITRABAJOLABORPADRE+FAMIEDUCACIONMADRE+ FAMITRABAJOLABORMADRE+FAMISITUACIONECONOMICA
Ahora bien, para examinar el impacto del capital cultural, el capital económico y la reproducción social sobre el desempeño de los estudiantes en la Prueba Saber 11 (2021-2), resulta fundamental definir la variable dependiente que cuantificará dicho desempeño. En el marco de esta investigación, se utilizará el puntaje global obtenido por los estudiantes en las Pruebas Saber 11 como el indicador principal, dado que constituye la medida estandarizada y oficial de sus resultados académicos. De todas maneras, se realizará una exploración de los puntajes y niveles de desempeño desagregados por las cinco competencias que integran a las Pruebas Saber. En adición, el modelo cuantitativo incorporará un conjunto de variables de control, en tanto que estas son esenciales para garantizar la validez y la fiabilidad de las estimaciones; y la rigurosidad del modelo cuantitativo (Memon et al., 2024). Las variables de control propenden por aislar los efectos específicos de las variables de interés, lo que facilita la detección de efectos reales y la formulación de conclusiones más precisas (Bernerth et al., 2018). Las variables de la muestra seleccionadas para este propósito son el género del estudiante (hombre o mujer), la naturaleza del colegio (pública o privada) y su ubicación (rural o urbana), dado que la literatura académica reconoce su influencia significativa en el rendimiento académico (Sheeren & Bol, 2022; Strello et al., 2023).
Por último, debe mencionarse que en las siguientes tablas se presentan un resumen de las variables de interés de la presente investigación
#Datos Generales de la Base de Datos Limpia
length(nueva_base_limpia)
## [1] 33
n <- nrow(nueva_base_limpia) # numero de registros
p <- ncol(nueva_base_limpia) # numero de variables
##PASO 6: Organización de variables de acuerdo al márco Teórico (modelo cuantitativo)##
#p6.1.1. Capital Económico
vars_capital_economico <- c(
"FAMI_ESTRATOVIVIENDA", "FAMI_TIENEAUTOMOVIL", "FAMI_TIENEHORNOMICROOGAS",
"FAMI_TIENELAVADORA", "FAMI_TIENEMOTOCICLETA", "FAMI_COMELECHEDERIVADOS",
"FAMI_COMECARNEPESCADOHUEVO", "FAMI_COMECEREALFRUTOSLEGUMBRE")
print(vars_capital_economico)
## [1] "FAMI_ESTRATOVIVIENDA" "FAMI_TIENEAUTOMOVIL"
## [3] "FAMI_TIENEHORNOMICROOGAS" "FAMI_TIENELAVADORA"
## [5] "FAMI_TIENEMOTOCICLETA" "FAMI_COMELECHEDERIVADOS"
## [7] "FAMI_COMECARNEPESCADOHUEVO" "FAMI_COMECEREALFRUTOSLEGUMBRE"
#p6.1.2. Capital Cultural
vars_capital_cultural <- c(
"FAMI_TIENECOMPUTADOR", "FAMI_TIENEINTERNET", "ESTU_DEDICACIONINTERNET",
"FAMI_TIENESERVICIOTV", "FAMI_NUMLIBROS", "ESTU_DEDICACIONLECTURADIARIA")
print(vars_capital_cultural)
## [1] "FAMI_TIENECOMPUTADOR" "FAMI_TIENEINTERNET"
## [3] "ESTU_DEDICACIONINTERNET" "FAMI_TIENESERVICIOTV"
## [5] "FAMI_NUMLIBROS" "ESTU_DEDICACIONLECTURADIARIA"
# 6.1.3. Modelo de Reproducción Social
vars_reproduccion_social <- c(
"FAMI_EDUCACIONPADRE", "FAMI_TRABAJOLABORPADRE", "FAMI_EDUCACIONMADRE",
"FAMI_TRABAJOLABORMADRE", "FAMI_SITUACIONECONOMICA")
print(vars_reproduccion_social)
## [1] "FAMI_EDUCACIONPADRE" "FAMI_TRABAJOLABORPADRE"
## [3] "FAMI_EDUCACIONMADRE" "FAMI_TRABAJOLABORMADRE"
## [5] "FAMI_SITUACIONECONOMICA"
#6.1. VARIABLES INDEPENDIENTES
variables_independientes <- c(
vars_capital_economico,
vars_capital_cultural,
vars_reproduccion_social
)
print(variables_independientes)
## [1] "FAMI_ESTRATOVIVIENDA" "FAMI_TIENEAUTOMOVIL"
## [3] "FAMI_TIENEHORNOMICROOGAS" "FAMI_TIENELAVADORA"
## [5] "FAMI_TIENEMOTOCICLETA" "FAMI_COMELECHEDERIVADOS"
## [7] "FAMI_COMECARNEPESCADOHUEVO" "FAMI_COMECEREALFRUTOSLEGUMBRE"
## [9] "FAMI_TIENECOMPUTADOR" "FAMI_TIENEINTERNET"
## [11] "ESTU_DEDICACIONINTERNET" "FAMI_TIENESERVICIOTV"
## [13] "FAMI_NUMLIBROS" "ESTU_DEDICACIONLECTURADIARIA"
## [15] "FAMI_EDUCACIONPADRE" "FAMI_TRABAJOLABORPADRE"
## [17] "FAMI_EDUCACIONMADRE" "FAMI_TRABAJOLABORMADRE"
## [19] "FAMI_SITUACIONECONOMICA"
#6.2. VARIABLES DE CONTROL
vars_control <- c(
"ESTU_GENERO", "COLE_NATURALEZA", "COLE_AREA_UBICACION")
print(vars_control)
## [1] "ESTU_GENERO" "COLE_NATURALEZA" "COLE_AREA_UBICACION"
#6.3. VARIABLE DEPENDIENTE
var_dependiente <- c(
"DESEMP_LECTURA_CRITICA", "DESEMP_MATEMATICAS", "DESEMP_C_NATURALEZA",
"DESEMP_SOCIALES_CIUDADANAS", "DESEMP_INGLES", "PUNT_LECTURA_CRITICA",
"PUNT_MATEMATICAS", "PUNT_C_NATURALES", "PUNT_SOCIALES_CIUDADANAS",
"PUNT_INGLES", "PUNT_GLOBAL")
print(var_dependiente )
## [1] "DESEMP_LECTURA_CRITICA" "DESEMP_MATEMATICAS"
## [3] "DESEMP_C_NATURALEZA" "DESEMP_SOCIALES_CIUDADANAS"
## [5] "DESEMP_INGLES" "PUNT_LECTURA_CRITICA"
## [7] "PUNT_MATEMATICAS" "PUNT_C_NATURALES"
## [9] "PUNT_SOCIALES_CIUDADANAS" "PUNT_INGLES"
## [11] "PUNT_GLOBAL"
##PASO 7: Tablas de Marco TeóricO
library(knitr)
library(kableExtra)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following object is masked from 'package:kableExtra':
##
## group_rows
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#7.1. Variable independiente, Data Frame
tabla_independientes <- data.frame(Bloque = c(rep("Capital económico", 8), rep("Capital cultural", 6), rep("Reproducción social", 5)), Variable = c("Estrato Vivienda", "Automóvil", "Horno", "Lavadora", "Motocicleta", "Leche", "Proteínas", "Frutas + Cereales + Legumbres", "Acceso a un computador", "Acceso a internet", "Tiempo dedicado al uso de internet", "Servicio de Televisión", "Número de libros", "Lectura Diaria", "Educación del Padre", "Trabajo del Padre", "Educación de la Madre", "Trabajo de la Madre", "Situación Económica"), Codigo = c("FAMI_ESTRATOVIVIENDA", "FAMI_TIENEAUTOMOVIL", "FAMI_TIENEHORNOMICROOGAS", "FAMI_TIENELAVADORA", "FAMI_TIENEMOTOCICLETA", "FAMI_COMELECHEDERIVADOS", "FAMI_COMECARNEPESCADOHUEVO", "FAMI_COMECEREALFRUTOSLEGUMBRE", "FAMI_TIENECOMPUTADOR", "FAMI_TIENEINTERNET", "ESTU_DEDICACIONINTERNET", "FAMI_TIENESERVICIOTV", "FAMI_NUMLIBROS", "ESTU_DEDICACIONLECTURADIARIA", "FAMI_EDUCACIONPADRE", "FAMI_TRABAJOLABORPADRE", "FAMI_EDUCACIONMADRE", "FAMI_TRABAJOLABORMADRE", "FAMI_SITUACIONECONOMICA"))
tabla_final_independientes <- kable( tabla_independientes, caption = "Tabla 1. Variables Independientes", align = "l") %>% kable_styling( bootstrap_options = c("striped", "hover", "condensed"), full_width = FALSE, position = "center" ) %>%
row_spec(0, background = "#2480ab", color = "white") %>% collapse_rows(columns = 1:2, valign = "top")
View(tabla_independientes)
print(tabla_independientes)
## Bloque Variable
## 1 Capital económico Estrato Vivienda
## 2 Capital económico Automóvil
## 3 Capital económico Horno
## 4 Capital económico Lavadora
## 5 Capital económico Motocicleta
## 6 Capital económico Leche
## 7 Capital económico Proteínas
## 8 Capital económico Frutas + Cereales + Legumbres
## 9 Capital cultural Acceso a un computador
## 10 Capital cultural Acceso a internet
## 11 Capital cultural Tiempo dedicado al uso de internet
## 12 Capital cultural Servicio de Televisión
## 13 Capital cultural Número de libros
## 14 Capital cultural Lectura Diaria
## 15 Reproducción social Educación del Padre
## 16 Reproducción social Trabajo del Padre
## 17 Reproducción social Educación de la Madre
## 18 Reproducción social Trabajo de la Madre
## 19 Reproducción social Situación Económica
## Codigo
## 1 FAMI_ESTRATOVIVIENDA
## 2 FAMI_TIENEAUTOMOVIL
## 3 FAMI_TIENEHORNOMICROOGAS
## 4 FAMI_TIENELAVADORA
## 5 FAMI_TIENEMOTOCICLETA
## 6 FAMI_COMELECHEDERIVADOS
## 7 FAMI_COMECARNEPESCADOHUEVO
## 8 FAMI_COMECEREALFRUTOSLEGUMBRE
## 9 FAMI_TIENECOMPUTADOR
## 10 FAMI_TIENEINTERNET
## 11 ESTU_DEDICACIONINTERNET
## 12 FAMI_TIENESERVICIOTV
## 13 FAMI_NUMLIBROS
## 14 ESTU_DEDICACIONLECTURADIARIA
## 15 FAMI_EDUCACIONPADRE
## 16 FAMI_TRABAJOLABORPADRE
## 17 FAMI_EDUCACIONMADRE
## 18 FAMI_TRABAJOLABORMADRE
## 19 FAMI_SITUACIONECONOMICA
#7.2. variables de control
#data frame
tabla_control <- data.frame(Variable = c("Género", "Naturaleza del Colegio (oficial / no oficial)", "Ubicación (Rural / Urbano)"), Codigo = c("ESTU_GENERO", "COLE_NATURALEZA", "COLE_AREA_UBICACION"))
#diseño
tabla_final_control <- kable(
tabla_control,
caption = "Tabla 2. Variables de Control",
align = "l"
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"),
full_width = FALSE,
position = "center"
) %>% row_spec(0, background = "#2480ab", color = "white")
View(tabla_control)
print(tabla_final_control)
## <table class="table table-striped table-hover table-condensed" style="color: black; width: auto !important; margin-left: auto; margin-right: auto;">
## <caption>Tabla 2. Variables de Control</caption>
## <thead>
## <tr>
## <th style="text-align:left;color: white !important;background-color: rgba(36, 128, 171, 255) !important;"> Variable </th>
## <th style="text-align:left;color: white !important;background-color: rgba(36, 128, 171, 255) !important;"> Codigo </th>
## </tr>
## </thead>
## <tbody>
## <tr>
## <td style="text-align:left;"> Género </td>
## <td style="text-align:left;"> ESTU_GENERO </td>
## </tr>
## <tr>
## <td style="text-align:left;"> Naturaleza del Colegio (oficial / no oficial) </td>
## <td style="text-align:left;"> COLE_NATURALEZA </td>
## </tr>
## <tr>
## <td style="text-align:left;"> Ubicación (Rural / Urbano) </td>
## <td style="text-align:left;"> COLE_AREA_UBICACION </td>
## </tr>
## </tbody>
## </table>
#7.3 variable dependiente
#data frame
tabla_dependientes <- data.frame(Bloque = c(rep("Niveles de Desempeño", 5), rep("Puntajes Individuales y Global", 6)), Variable = c("Nivel de desempeño Lectura", "Nivel de desempeño Matemáticas", "Nivel de desempeño C. Naturales", "Nivel de desempeño C. Sociales y Ciudadanas", "Nivel de desempeño Inglés", "Puntaje Lectura", "Puntaje Matemáticas", "Puntaje C. Naturales", "Puntaje C. Sociales", "Puntaje Inglés", "Puntaje Global"), Codigo = c("DESEMP_LECTURA_CRITICA", "DESEMP_MATEMATICAS", "DESEMP_C_NATURALES", "DESEMP_SOCIALES_CIUDADANAS", "DESEMP_INGLES", "PUNT_LECTURA_CRITICA", "PUNT_MATEMATICAS", "PUNT_C_NATURALES", "PUNT_SOCIALES_CIUDADANAS", "PUNT_INGLES", "PUNT_GLOBAL"))
#diseño
tabla_final_dependientes <- kable(
tabla_dependientes,
caption = "Tabla 3. Variables Dependientes",
align = "l"
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"),
full_width = FALSE,
position = "center"
) %>%
row_spec(0, background = "#2480ab", color = "white") %>%
collapse_rows(
columns = 1,
valign = "top"
)
View(tabla_dependientes)
print(tabla_final_dependientes)
## <table class="table table-striped table-hover table-condensed" style="color: black; width: auto !important; margin-left: auto; margin-right: auto;">
## <caption>Tabla 3. Variables Dependientes</caption>
## <thead>
## <tr>
## <th style="text-align:left;color: white !important;background-color: rgba(36, 128, 171, 255) !important;"> Bloque </th>
## <th style="text-align:left;color: white !important;background-color: rgba(36, 128, 171, 255) !important;"> Variable </th>
## <th style="text-align:left;color: white !important;background-color: rgba(36, 128, 171, 255) !important;"> Codigo </th>
## </tr>
## </thead>
## <tbody>
## <tr>
## <td style="text-align:left;vertical-align: top !important;" rowspan="5"> Niveles de Desempeño </td>
## <td style="text-align:left;"> Nivel de desempeño Lectura </td>
## <td style="text-align:left;"> DESEMP_LECTURA_CRITICA </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Nivel de desempeño Matemáticas </td>
## <td style="text-align:left;"> DESEMP_MATEMATICAS </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Nivel de desempeño C. Naturales </td>
## <td style="text-align:left;"> DESEMP_C_NATURALES </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Nivel de desempeño C. Sociales y Ciudadanas </td>
## <td style="text-align:left;"> DESEMP_SOCIALES_CIUDADANAS </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Nivel de desempeño Inglés </td>
## <td style="text-align:left;"> DESEMP_INGLES </td>
## </tr>
## <tr>
## <td style="text-align:left;vertical-align: top !important;" rowspan="6"> Puntajes Individuales y Global </td>
## <td style="text-align:left;"> Puntaje Lectura </td>
## <td style="text-align:left;"> PUNT_LECTURA_CRITICA </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Puntaje Matemáticas </td>
## <td style="text-align:left;"> PUNT_MATEMATICAS </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Puntaje C. Naturales </td>
## <td style="text-align:left;"> PUNT_C_NATURALES </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Puntaje C. Sociales </td>
## <td style="text-align:left;"> PUNT_SOCIALES_CIUDADANAS </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Puntaje Inglés </td>
## <td style="text-align:left;"> PUNT_INGLES </td>
## </tr>
## <tr>
##
## <td style="text-align:left;"> Puntaje Global </td>
## <td style="text-align:left;"> PUNT_GLOBAL </td>
## </tr>
## </tbody>
## </table>
Las variables “acceso a un computador”, “acceso a internet”, “tiempo dedicado al uso de internet”, “servicio de televisión”, “número de libros” y “lectura diaria” pueden interpretarse como indicadores del capital cultural en sus dimensiones objetivada e incorporada, según la teoría de Bourdieu (1986). El acceso a dispositivos tecnológicos y la conectividad reflejan nuevas formas de capital cultural objetivado, vinculadas a la inclusión digital y al acceso a la información (Cabero-Almenara & Ruiz-Palmero, 2018), mientras que los hábitos de lectura y la disponibilidad de libros expresan el capital cultural incorporado, asociado a la interiorización de disposiciones cognitivas y lingüísticas que favorecen el desempeño académico (Rangel & Lleras, 2010; Corsi, 2012). En conjunto, estos elementos permiten comprender cómo las desigualdades en el acceso a recursos culturales y tecnológicos inciden en las diferencias de rendimiento observadas en la prueba Saber 11. ## Proporciones
prop.table(table(nueva_base_limpia$ESTU_DEDICACIONINTERNET))
##
## 30 minutos o menos Entre 1 y 3 horas Entre 30 y 60 minutos
## 0.13245614 0.33026316 0.22785088
## Más de 3 horas No Navega Internet
## 0.26732456 0.04210526
prop.table(table(nueva_base_limpia$ESTU_DEDICACIONINTERNET))*100 #Porcentajes
##
## 30 minutos o menos Entre 1 y 3 horas Entre 30 y 60 minutos
## 13.245614 33.026316 22.785088
## Más de 3 horas No Navega Internet
## 26.732456 4.210526
prop.table(table(nueva_base_limpia$ESTU_DEDICACIONLECTURADIARIA))
##
## 30 minutos o menos Entre 1 y 2 horas
## 0.38706140 0.09583333
## Entre 30 y 60 minutos Más de 2 horas
## 0.26250000 0.04473684
## No leo por entretenimiento
## 0.20986842
prop.table(table(nueva_base_limpia$ESTU_DEDICACIONLECTURADIARIA))*100 #Porcentajes
##
## 30 minutos o menos Entre 1 y 2 horas
## 38.706140 9.583333
## Entre 30 y 60 minutos Más de 2 horas
## 26.250000 4.473684
## No leo por entretenimiento
## 20.986842
prop.table(table(nueva_base_limpia$FAMI_NUMLIBROS))
##
## 0 A 10 LIBROS 11 A 25 LIBROS 26 A 100 LIBROS MÁS DE 100 LIBROS
## 0.4517544 0.3125000 0.1859649 0.0497807
prop.table(table(nueva_base_limpia$FAMI_NUMLIBROS))*100 #Porcentajes
##
## 0 A 10 LIBROS 11 A 25 LIBROS 26 A 100 LIBROS MÁS DE 100 LIBROS
## 45.17544 31.25000 18.59649 4.97807
prop.table(table(nueva_base_limpia$FAMI_TIENECOMPUTADOR))
##
## No Si
## 0.3969298 0.6030702
prop.table(table(nueva_base_limpia$FAMI_TIENECOMPUTADOR))*100 #Porcentajes
##
## No Si
## 39.69298 60.30702
prop.table(table(nueva_base_limpia$FAMI_TIENESERVICIOTV))
##
## No Si
## 0.2495614 0.7504386
prop.table(table(nueva_base_limpia$FAMI_TIENESERVICIOTV))*100 #Porcentajes
##
## No Si
## 24.95614 75.04386
prop.table(table(nueva_base_limpia$FAMI_TIENEINTERNET))
##
## No Si
## 0.2475877 0.7524123
prop.table(table(nueva_base_limpia$FAMI_TIENEINTERNET))*100 #Porcentajes
##
## No Si
## 24.75877 75.24123
prop.table(table(nueva_base_limpia$FAMI_TIENEINTERNET))
##
## No Si
## 0.2475877 0.7524123
prop.table(table(nueva_base_limpia$FAMI_TIENEINTERNET))*100 #Porcentajes
##
## No Si
## 24.75877 75.24123
#Dedicación a la lectura diaria
tabla_lectura=prop.table(table(nueva_base_limpia$ESTU_DEDICACIONLECTURADIARIA)) * 100
barplot(tabla_lectura, main = "Dedicación a la lectura diaria", ylab = "Porcentaje (%)", xlab = "Tiempo de lectura", col = "skyblue", las = 1, cex.names = 0.45)
#Número de libros en el hogar
tabla_libros <- prop.table(table(nueva_base_limpia$FAMI_NUMLIBROS)) *100
barplot(tabla_libros, main = "Número de libros en el hogar", ylab = "Porcentaje (%)", xlab = "Categorías de libros", col = "lightgreen", las = 1,cex.names = 0.5)
# Disponibilidad de computador en el hogar
tabla_pc <- prop.table(table(nueva_base_limpia$FAMI_TIENECOMPUTADOR)) * 100
barplot(tabla_pc, main = "Disponibilidad de computador en el hogar", ylab = "Porcentaje (%)", xlab = "Tiene computador", col = "orange", las = 1)
#Servicio de televisión en el hogar
tabla_tv <- prop.table(table(nueva_base_limpia$FAMI_TIENESERVICIOTV)) * 100
barplot(tabla_tv, main = "Servicio de televisión en el hogar", ylab = "Porcentaje (%)", xlab = "Tiene servicio de TV", col = "lightcoral", las = 1)
# Acceso a Internet en el hogar
tabla_internet <- prop.table(table(nueva_base_limpia$FAMI_TIENEINTERNET)) * 100
barplot(tabla_internet, main = "Acceso a Internet en el hogar", ylab = "Porcentaje (%)", xlab = "Tiene Internet", col = "mediumpurple", las = 1)
Interpretacion de las proporciones
Los resultados descriptivos del conjunto de variables asociadas al capital cultural familiar evidencian diferencias significativas en los recursos y prácticas que conforman las condiciones educativas de los estudiantes. En cuanto al uso de Internet, la mayoría dedica entre una y tres horas diarias (33 %), seguida por un 26,7 % que navega más de tres horas y un 22,78 % que lo hace entre 30 y 60 minutos; solo un 13,24 % presenta un uso muy limitado y un 4,2 % no utiliza Internet. Este patrón refleja un alto nivel de conectividad, aunque con diferencias en la intensidad de uso que podrían estar vinculadas con la disponibilidad de dispositivos y la calidad del acceso, aspectos que configuran el capital tecnológico, una extensión del capital cultural objetivado planteado por Bourdieu (1986).
Respecto a la dedicación a la lectura diaria, el 38,7 % de los estudiantes lee 30 minutos o menos y un 26,73 % entre 30 y 60 minutos, mientras que solo un 9,58 % lee entre una y dos horas y un 4,5 % más de dos horas; además, un 21 % no lee por entretenimiento. Estos resultados reflejan un bajo hábito lector, indicador del capital cultural incorporado, que puede limitar el desarrollo de competencias verbales y de comprensión crítica. De manera complementaria, el número de libros en el hogar muestra que el 45,2 % de los estudiantes vive en hogares con entre 0 y 10 libros, un 31,3 % posee entre 11 y 25, un 18,6 % entre 26 y 100 y solo un 5 % supera los 100, lo que evidencia una concentración del capital cultural objetivado en una minoría y desigualdades en el acceso a bienes simbólicos. En cuanto a los recursos tecnológicos, el 60,3 % de los hogares dispone de computador y el 75,2 % cuenta con Internet, mientras que el 75 % tiene servicio de televisión.
Si bien estos porcentajes sugieren una modernización de los medios de acceso a la información, la persistencia de hogares sin computador ni conexión digital (39,7 % y 24,8 %, respectivamente) revela una brecha tecnológica que puede repercutir en las oportunidades de aprendizaje. En conjunto, estas proporciones muestran que, aunque la mayoría de los estudiantes posee ciertos recursos materiales y tecnológicos, persisten limitaciones en las prácticas culturales, especialmente en los hábitos lectores y en la disponibilidad de libros, lo cual refleja desigualdades en la distribución del capital cultural familiar. Desde la perspectiva bourdieusiana, tales diferencias inciden en el rendimiento académico y contribuyen a la reproducción de las desigualdades sociales a través del sistema educativo, al favorecer a quienes cuentan con un entorno familiar más provisto de recursos culturales y tecnológicos.
colSums(is.na(SB11_20212))
## ESTU_TIPODOCUMENTO ESTU_NACIONALIDAD
## 0 0
## ESTU_GENERO ESTU_FECHANACIMIENTO
## 1 0
## PERIODO ESTU_CONSECUTIVO
## 0 0
## ESTU_ESTUDIANTE ESTU_PAIS_RESIDE
## 0 0
## ESTU_TIENEETNIA ESTU_DEPTO_RESIDE
## 3 1
## ESTU_COD_RESIDE_DEPTO ESTU_MCPIO_RESIDE
## 1 1
## ESTU_COD_RESIDE_MCPIO FAMI_ESTRATOVIVIENDA
## 1 290
## FAMI_PERSONASHOGAR FAMI_CUARTOSHOGAR
## 149 159
## FAMI_EDUCACIONPADRE FAMI_EDUCACIONMADRE
## 270 271
## FAMI_TRABAJOLABORPADRE FAMI_TRABAJOLABORMADRE
## 155 152
## FAMI_TIENEINTERNET FAMI_TIENESERVICIOTV
## 277 283
## FAMI_TIENECOMPUTADOR FAMI_TIENELAVADORA
## 153 162
## FAMI_TIENEHORNOMICROOGAS FAMI_TIENEAUTOMOVIL
## 168 170
## FAMI_TIENEMOTOCICLETA FAMI_TIENECONSOLAVIDEOJUEGOS
## 159 174
## FAMI_NUMLIBROS FAMI_COMELECHEDERIVADOS
## 415 332
## FAMI_COMECARNEPESCADOHUEVO FAMI_COMECEREALFRUTOSLEGUMBRE
## 285 298
## FAMI_SITUACIONECONOMICA ESTU_DEDICACIONLECTURADIARIA
## 176 281
## ESTU_DEDICACIONINTERNET ESTU_HORASSEMANATRABAJA
## 293 161
## ESTU_TIPOREMUNERACION COLE_CODIGO_ICFES
## 170 0
## COLE_COD_DANE_ESTABLECIMIENTO COLE_NOMBRE_ESTABLECIMIENTO
## 0 0
## COLE_GENERO COLE_NATURALEZA
## 0 0
## COLE_CALENDARIO COLE_BILINGUE
## 0 916
## COLE_CARACTER COLE_COD_DANE_SEDE
## 200 0
## COLE_NOMBRE_SEDE COLE_SEDE_PRINCIPAL
## 0 0
## COLE_AREA_UBICACION COLE_JORNADA
## 0 0
## COLE_COD_MCPIO_UBICACION COLE_MCPIO_UBICACION
## 0 0
## COLE_COD_DEPTO_UBICACION COLE_DEPTO_UBICACION
## 0 0
## ESTU_PRIVADO_LIBERTAD ESTU_COD_MCPIO_PRESENTACION
## 0 0
## ESTU_MCPIO_PRESENTACION ESTU_DEPTO_PRESENTACION
## 0 0
## ESTU_COD_DEPTO_PRESENTACION PUNT_LECTURA_CRITICA
## 0 0
## PERCENTIL_LECTURA_CRITICA DESEMP_LECTURA_CRITICA
## 0 0
## PUNT_MATEMATICAS PERCENTIL_MATEMATICAS
## 0 0
## DESEMP_MATEMATICAS PUNT_C_NATURALES
## 0 0
## PERCENTIL_C_NATURALES DESEMP_C_NATURALES
## 0 0
## PUNT_SOCIALES_CIUDADANAS PERCENTIL_SOCIALES_CIUDADANAS
## 0 0
## DESEMP_SOCIALES_CIUDADANAS PUNT_INGLES
## 0 41
## PERCENTIL_INGLES DESEMP_INGLES
## 41 41
## PUNT_GLOBAL PERCENTIL_GLOBAL
## 0 41
## PERCENTIL_ESPECIAL_GLOBAL ESTU_INSE_INDIVIDUAL
## 5172 143
## ESTU_NSE_INDIVIDUAL ESTU_NSE_ESTABLECIMIENTO
## 143 0
## ESTU_ESTADOINVESTIGACION ESTU_GENERACION.E
## 0 0
porcentaje_na <- colMeans(is.na(SB11_20212)) * 100
sort(porcentaje_na, decreasing = TRUE)
## PERCENTIL_ESPECIAL_GLOBAL COLE_BILINGUE
## 97.05385626 17.18896603
## FAMI_NUMLIBROS FAMI_COMELECHEDERIVADOS
## 7.78757741 6.23006193
## FAMI_COMECEREALFRUTOSLEGUMBRE ESTU_DEDICACIONINTERNET
## 5.59204354 5.49821730
## FAMI_ESTRATOVIVIENDA FAMI_COMECARNEPESCADOHUEVO
## 5.44192156 5.34809533
## FAMI_TIENESERVICIOTV ESTU_DEDICACIONLECTURADIARIA
## 5.31056483 5.27303434
## FAMI_TIENEINTERNET FAMI_EDUCACIONMADRE
## 5.19797335 5.08538187
## FAMI_EDUCACIONPADRE COLE_CARACTER
## 5.06661663 3.75304935
## FAMI_SITUACIONECONOMICA FAMI_TIENECONSOLAVIDEOJUEGOS
## 3.30268343 3.26515294
## FAMI_TIENEAUTOMOVIL ESTU_TIPOREMUNERACION
## 3.19009195 3.19009195
## FAMI_TIENEHORNOMICROOGAS FAMI_TIENELAVADORA
## 3.15256146 3.03996998
## ESTU_HORASSEMANATRABAJA FAMI_CUARTOSHOGAR
## 3.02120473 2.98367424
## FAMI_TIENEMOTOCICLETA FAMI_TRABAJOLABORPADRE
## 2.98367424 2.90861325
## FAMI_TIENECOMPUTADOR FAMI_TRABAJOLABORMADRE
## 2.87108275 2.85231751
## FAMI_PERSONASHOGAR ESTU_INSE_INDIVIDUAL
## 2.79602177 2.68343029
## ESTU_NSE_INDIVIDUAL PUNT_INGLES
## 2.68343029 0.76937512
## PERCENTIL_INGLES DESEMP_INGLES
## 0.76937512 0.76937512
## PERCENTIL_GLOBAL ESTU_TIENEETNIA
## 0.76937512 0.05629574
## ESTU_GENERO ESTU_DEPTO_RESIDE
## 0.01876525 0.01876525
## ESTU_COD_RESIDE_DEPTO ESTU_MCPIO_RESIDE
## 0.01876525 0.01876525
## ESTU_COD_RESIDE_MCPIO ESTU_TIPODOCUMENTO
## 0.01876525 0.00000000
## ESTU_NACIONALIDAD ESTU_FECHANACIMIENTO
## 0.00000000 0.00000000
## PERIODO ESTU_CONSECUTIVO
## 0.00000000 0.00000000
## ESTU_ESTUDIANTE ESTU_PAIS_RESIDE
## 0.00000000 0.00000000
## COLE_CODIGO_ICFES COLE_COD_DANE_ESTABLECIMIENTO
## 0.00000000 0.00000000
## COLE_NOMBRE_ESTABLECIMIENTO COLE_GENERO
## 0.00000000 0.00000000
## COLE_NATURALEZA COLE_CALENDARIO
## 0.00000000 0.00000000
## COLE_COD_DANE_SEDE COLE_NOMBRE_SEDE
## 0.00000000 0.00000000
## COLE_SEDE_PRINCIPAL COLE_AREA_UBICACION
## 0.00000000 0.00000000
## COLE_JORNADA COLE_COD_MCPIO_UBICACION
## 0.00000000 0.00000000
## COLE_MCPIO_UBICACION COLE_COD_DEPTO_UBICACION
## 0.00000000 0.00000000
## COLE_DEPTO_UBICACION ESTU_PRIVADO_LIBERTAD
## 0.00000000 0.00000000
## ESTU_COD_MCPIO_PRESENTACION ESTU_MCPIO_PRESENTACION
## 0.00000000 0.00000000
## ESTU_DEPTO_PRESENTACION ESTU_COD_DEPTO_PRESENTACION
## 0.00000000 0.00000000
## PUNT_LECTURA_CRITICA PERCENTIL_LECTURA_CRITICA
## 0.00000000 0.00000000
## DESEMP_LECTURA_CRITICA PUNT_MATEMATICAS
## 0.00000000 0.00000000
## PERCENTIL_MATEMATICAS DESEMP_MATEMATICAS
## 0.00000000 0.00000000
## PUNT_C_NATURALES PERCENTIL_C_NATURALES
## 0.00000000 0.00000000
## DESEMP_C_NATURALES PUNT_SOCIALES_CIUDADANAS
## 0.00000000 0.00000000
## PERCENTIL_SOCIALES_CIUDADANAS DESEMP_SOCIALES_CIUDADANAS
## 0.00000000 0.00000000
## PUNT_GLOBAL ESTU_NSE_ESTABLECIMIENTO
## 0.00000000 0.00000000
## ESTU_ESTADOINVESTIGACION ESTU_GENERACION.E
## 0.00000000 0.00000000
variables_de_interes <- c("FAMI_ESTRATOVIVIENDA", "FAMI_EDUCACIONPADRE", "FAMI_EDUCACIONMADRE", "FAMI_TRABAJOLABORPADRE", "FAMI_TRABAJOLABORMADRE", "FAMI_TIENEINTERNET", "FAMI_TIENESERVICIOTV", "FAMI_TIENECOMPUTADOR", "FAMI_TIENELAVADORA", "FAMI_TIENEHORNOMICROOGAS", "FAMI_TIENEAUTOMOVIL", "FAMI_TIENEMOTOCICLETA", "FAMI_NUMLIBROS", "FAMI_COMELECHEDERIVADOS", "FAMI_COMECARNEPESCADOHUEVO", "FAMI_COMECEREALFRUTOSLEGUMBRE", "FAMI_SITUACIONECONOMICA", "ESTU_DEDICACIONLECTURADIARIA", "ESTU_DEDICACIONINTERNET", "ESTU_GENERO", "COLE_NATURALEZA", "COLE_AREA_UBICACION", "PUNT_LECTURA_CRITICA", "PUNT_MATEMATICAS", "PUNT_C_NATURALES", "PUNT_SOCIALES_CIUDADANAS", "PUNT_INGLES", "DESEMP_LECTURA_CRITICA", "DESEMP_MATEMATICAS", "DESEMP_C_NATURALES", "DESEMP_SOCIALES_CIUDADANAS", "DESEMP_INGLES", "PUNT_GLOBAL")
nueva_base <- SB11_20212[, variables_de_interes]
View(nueva_base)
head(nueva_base)
dim(nueva_base)
## [1] 5329 33
class(nueva_base)
## [1] "data.frame"
nueva_base_limpia <- na.omit(nueva_base)
# Comparación de las dimensones para ver cuántas filas se eliminaron, en virtud de los datos faltantes
cat("Dimensiones antes de limpiar:", dim(nueva_base), "\n")
## Dimensiones antes de limpiar: 5329 33
cat("Dimensiones después de limpiar:", dim(nueva_base_limpia), "\n")
## Dimensiones después de limpiar: 4560 33
#Proporción de la cantidad de valores faltantes en cada variable
obs_originales <- nrow(nueva_base) #filas de cada base
obs_finales <- nrow(nueva_base_limpia) #filas de cada base
obs_eliminadas <- obs_originales - obs_finales #cantidad de filas eliminadas
proporcion <- (obs_eliminadas / obs_originales *100) #proporción de las filas eliminadas
cat("Se eliminaron", obs_eliminadas, "de", obs_originales, "observaciones.\n")
## Se eliminaron 769 de 5329 observaciones.
cat("Es decir, se eliminó el", round(proporcion, 2), "% de los datos.\n")
## Es decir, se eliminó el 14.43 % de los datos.
colSums(is.na(nueva_base_limpia))
## FAMI_ESTRATOVIVIENDA FAMI_EDUCACIONPADRE
## 0 0
## FAMI_EDUCACIONMADRE FAMI_TRABAJOLABORPADRE
## 0 0
## FAMI_TRABAJOLABORMADRE FAMI_TIENEINTERNET
## 0 0
## FAMI_TIENESERVICIOTV FAMI_TIENECOMPUTADOR
## 0 0
## FAMI_TIENELAVADORA FAMI_TIENEHORNOMICROOGAS
## 0 0
## FAMI_TIENEAUTOMOVIL FAMI_TIENEMOTOCICLETA
## 0 0
## FAMI_NUMLIBROS FAMI_COMELECHEDERIVADOS
## 0 0
## FAMI_COMECARNEPESCADOHUEVO FAMI_COMECEREALFRUTOSLEGUMBRE
## 0 0
## FAMI_SITUACIONECONOMICA ESTU_DEDICACIONLECTURADIARIA
## 0 0
## ESTU_DEDICACIONINTERNET ESTU_GENERO
## 0 0
## COLE_NATURALEZA COLE_AREA_UBICACION
## 0 0
## PUNT_LECTURA_CRITICA PUNT_MATEMATICAS
## 0 0
## PUNT_C_NATURALES PUNT_SOCIALES_CIUDADANAS
## 0 0
## PUNT_INGLES DESEMP_LECTURA_CRITICA
## 0 0
## DESEMP_MATEMATICAS DESEMP_C_NATURALES
## 0 0
## DESEMP_SOCIALES_CIUDADANAS DESEMP_INGLES
## 0 0
## PUNT_GLOBAL
## 0
#Activar Paquetes
library("tidyverse")
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ readr 2.1.5
## ✔ ggplot2 4.0.0 ✔ stringr 1.5.2
## ✔ lubridate 1.9.4 ✔ tibble 3.3.0
## ✔ purrr 1.1.0 ✔ tidyr 1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::group_rows() masks kableExtra::group_rows()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library("readxl")
library("stringr")
library("readr")
Tabla_NSE<-table(nueva_base_limpia$FAMI_ESTRATOVIVIENDA)
View(Tabla_NSE)
prop.table(Tabla_NSE)
##
## Estrato 1 Estrato 2 Estrato 3 Estrato 4 Estrato 5 Estrato 6
## 0.272587719 0.390350877 0.224342105 0.055701754 0.014035088 0.007675439
## Sin Estrato
## 0.035307018
Tabla_NSE<- as.data.frame(Tabla_NSE)
colnames(Tabla_NSE) <- c("Estrato", "n")
ggplot(Tabla_NSE, aes(x = Estrato, y = n, fill = Estrato)) +
geom_col() +
labs(
title = "Distribución por Estrato Socioeconómico",
x = "Estrato de la vivienda",
y = "Frecuencia"
) +
theme_minimal()
Analísis La distribución por estrato muestra una clara concentración en
los niveles bajos y medios. Estrato 2 reúne el 39,0% (1.780) de los
casos y es el más frecuente, seguido de Estrato 1 con 27,3% (1.243) y
Estrato 3 con 22,4% (1.023). En conjunto, los estratos 1–3 representan
66,3% de la población. Los niveles altos tienen una presencia menor:
Estrato 4 aporta 5,6% (254), Estrato 5 1,4% (64) y Estrato 6 0,8% (35),
lo que suma 7,7% para los estratos 4–6. Además, existe un 3,5% (161) de
registros “sin estrato”
##Condiciones materiales de existencia.
#Personas que tienen automovil
Tabla_AU<-table(nueva_base_limpia$FAMI_TIENEAUTOMOVIL)
View(Tabla_AU)
prop.table(Tabla_AU)
##
## No Si
## 0.7322368 0.2677632
# Convertir la tabla a data frame
Tabla_AU<- as.data.frame(Tabla_AU)
colnames(Tabla_AU) <- c("Tiene_Automovil", "Frecuencia")
ggplot(Tabla_AU, aes(x = Tiene_Automovil, y = Frecuencia, fill = Tiene_Automovil)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.3, size = 5) +
labs(
title = "Personas que tienen automóvil",
x = "¿Tiene automóvil?",
y = "Número de personas"
) +
theme_minimal()
La mayoría de los hogares no tiene automóvil: 73,22% (3.339 hogares). Solo 26,78% (1.221 hogares) reporta sí tener. En términos simples, 3 de cada 4 hogares carecen de carro y apenas 1 de cada 3,7 dispone de uno.
#Personas que tienen horno microhondas
Tabla_MH<-table(nueva_base_limpia$FAMI_TIENEHORNOMICROOGAS)
View(Tabla_MH)
prop.table(Tabla_MH)
##
## No Si
## 0.5385965 0.4614035
Tabla_MH<- as.data.frame(Tabla_MH)
colnames(Tabla_MH) <- c("Tiene_HornoMicrohondas", "Frecuencia")
ggplot(Tabla_MH, aes(x = Tiene_HornoMicrohondas, y = Frecuencia, fill = Tiene_HornoMicrohondas)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.3, size = 5) +
labs(
title = "Personas que tienen microhondas",
x = "¿Tiene microhondas?",
y = "Número de personas"
) +
theme_minimal()
La mayoría de los hogares no cuenta con horno microondas: 53,86% (2.456 hogares). El 46,14% (2.104 hogares) sí dispone de este electrodoméstico. En términos simples, hay 1,17 hogares sin microondas por cada hogar que sí tiene.
#Personas que tienen lavadora
Tabla_LAV<-table(nueva_base_limpia$FAMI_TIENELAVADORA)
View(Tabla_LAV)
prop.table(Tabla_LAV)
##
## No Si
## 0.2030702 0.7969298
# Convertir la tabla a data frame
Tabla_LAV<- as.data.frame(Tabla_LAV)
colnames(Tabla_LAV) <- c("Tiene_Lavadora", "Frecuencia")
ggplot(Tabla_LAV, aes(x = Tiene_Lavadora, y = Frecuencia, fill = Tiene_Lavadora)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.3, size = 5) +
labs(
title = "Personas que tienen Lavadora",
x = "¿Tiene_Lavadora?",
y = "Número de personas"
) +
theme_minimal()
#Personas que tienen lavadora
Tabla_MT<-table(nueva_base_limpia$FAMI_TIENEMOTOCICLETA)
View(Tabla_MT)
prop.table(Tabla_MT)
##
## No Si
## 0.5635965 0.4364035
La gran mayoría de los hogares sí tiene lavadora: 79,69% (≈ 3.634 hogares), mientras que 20,31% (926 hogares) no cuenta con este electrodoméstico. En términos simples, hay casi 4 hogares con lavadora por cada 1 sin lavadora.
Tabla_LD<-table(nueva_base_limpia$FAMI_COMELECHEDERIVADOS)
View(Tabla_LD)
prop.table(Tabla_LD)
##
## 1 o 2 veces por semana 3 a 5 veces por semana
## 0.33662281 0.27675439
## Nunca o rara vez comemos eso Todos o casi todos los días
## 0.08552632 0.30109649
Tabla_LD<- as.data.frame(Tabla_LD)
colnames(Tabla_LD) <- c("Cuantas_veces_come_lacteosyderivados", "Frecuencia")
ggplot(Tabla_LD, aes(x =Cuantas_veces_come_lacteosyderivados, y = Frecuencia, fill = Cuantas_veces_come_lacteosyderivados)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.3, size = 5) +
labs(
title = "Frecuencia de consumo de lacteos y derivados",
x = "¿Frecuencia de consumo?",
y = "Número de personas"
) +
theme_minimal()
El patrón de consumo muestra una preferencia moderada-alta por los lácteos. Todos o casi todos los días consumen 30,11% (1.373 hogares) y 3 a 5 veces por semana lo hace 27,68% (1.262 hogares); en conjunto, 57,8% consume ≥3 veces por semana. Un 33,66% (1.535 hogares) lo hace 1 o 2 veces por semana, mientras que 8,55% (390 hogares) nunca o rara vez consume estos alimentos.
Tabla_PROT<-table(nueva_base_limpia$FAMI_COMECARNEPESCADOHUEVO)
View(Tabla_PROT)
prop.table(Tabla_PROT)
##
## 1 o 2 veces por semana 3 a 5 veces por semana
## 0.23969298 0.30635965
## Nunca o rara vez comemos eso Todos o casi todos los días
## 0.04890351 0.40504386
Tabla_PROT<- as.data.frame(Tabla_PROT)
colnames(Tabla_PROT) <- c("Cuantas_veces_come_proteína", "Frecuencia")
ggplot(Tabla_PROT, aes(x =Cuantas_veces_come_proteína, y = Frecuencia, fill = Cuantas_veces_come_proteína)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.5, size = 3) +
labs(
title = "Frecuencia de consumo de proteína",
x = "¿Frecuencia de consumo?",
y = "Número de personas"
) +
theme_minimal()
El consumo es alto y bastante regular: “todos o casi todos los días”
alcanza 40,50% (1.847 hogares) y “3 a 5 veces por semana” 30,64% (1.397
hogares). En conjunto, 71,1% consume ≥3 veces por semana. Un 23,97%
(1.093 hogares) lo hace 1–2 veces por semana, mientras que 4,89% (223
hogares) nunca o rara vez consume estos alimentos.
Tabla_FYL<-table(nueva_base_limpia$FAMI_COMECEREALFRUTOSLEGUMBRE)
View(Tabla_FYL)
prop.table(Tabla_FYL)
##
## 1 o 2 veces por semana 3 a 5 veces por semana
## 0.3618421 0.3171053
## Nunca o rara vez comemos eso Todos o casi todos los días
## 0.1401316 0.1809211
Tabla_FYL<- as.data.frame(Tabla_FYL)
colnames(Tabla_FYL) <- c("Cuantas_veces_comes_frutasylegumbres", "Frecuencia")
ggplot(Tabla_FYL, aes(x=Cuantas_veces_comes_frutasylegumbres, y = Frecuencia, fill = Cuantas_veces_comes_frutasylegumbres)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.3, size = 5) +
labs(
title = "Frecuencia de consumo de frutas y legumbres",
x = "¿Frecuencia de consumo?",
y = "Número de personas"
) +
theme_minimal()
Frecuencia de consumo de frutas y verduras (N = 4.560) El consumo es
moderado con margen de mejora. 1–2 veces por semana concentra el grupo
más grande con 36,18% (1.650 hogares), seguido de 3–5 veces por semana
con 31,71% (1.446 hogares). Solo 18,09% (825 hogare) consume todos o
casi todos los días, mientras que 14,01% (639 hogares) nunca o rara vez
incluye estos alimentos.
#Reproducción social y cultural
##Definición de Variables
Con el objetivo de abordar el concepto bourdieusiano de reproducción social en la presente investigación, se ha creado un proxy empleando las variables de interés parte de la base de datos de los resultados de las Pruebas Saber 11 del segundo semestre de 2021. Como se mencionó anteriormente, la reproducción social se materializa primariamente a través de la transferencia de capital desde el ámbito familiar hacia el sistema educativo. De aquí, que las variables de la base de datos que representan el capital económico y cultural de los padres sirvan para aproximarse al concepto de reproducción social.
Desde la perspectiva de Bourdieu, el rendimiento educativo de un individuo está intrínsecamente ligado al capital cultural invertido previamente por su familia, es decir, el nivel alcanzado de credencialización (estudios) por los integrantes de la estructura familiar (Bourdieu, 1973; 1986; Zwier et al., 2021). En este sentido, las variables “educación del padre” y “educación de la madre” operan como un indicativo del acervo cultural familiar, lo que permitiría aproximarse al capital cultural transmitido mediante la acción pedagógica familiar (Bourdieau & Passeron, 1990, p. 43). La acción pedagógica familiar se constituye como la fase más temprana de la crianza y una forma de socialización primaria, que tiene como función esencial la inculcación de un habitus durable que genera prácticas compatibles con el principio cultural arbitrario del sistema educativo (Bourdieu, 1986, p. 31). De esta forma, el habitus familiar así constituido sienta las bases para la adecuada recepción y asimilación del mensaje transmitido en el aula. Según Zwier et al. (2021) las familias en donde hay un mayor nivel de credencialización, suelen valorar la educación como estrategia de mantenimiento del capital económico y social. De aquí, que los niños que han crecido estructuras familiares con altos niveles de credencialización suelan recibir mayor educación (en calidad y cantidad), lo que incide positivamente en su desempeño académico (Flecha, 2012)
Por otro lado, la ocupación laboral del padre y de la madre; y la situación económico de la familia operan como indicadores de la posesión de capital económico (recursos traducibles en dinero) y simbólico (estatus) de la estructura familiar, lo que, a su vez, marca el origen de clase. El origen de clase determina el potencial de acumulación de los capitales, en tanto que delimita las posibilidades de transmisión y de adquisición en espacios de socialización secundaria. Bourdieu aduce que las familias, en particular las de las clases sociales dominantes, propenden por evitar la movilidad de clase descendiente, dando lugar a un énfasis en la transmisión de capital cultural (conocimientos, lenguaje y cultura) entre padres e hijos para retener las posibilidades de acumulación de capital económico y simbólico (Van De Werfhorst and Hofstede, 2007). La literatura ha estudiado esta relación entre clase social (entendida como nivel socioeconómico) y resultados académicos, encontrando que los niños y jóvenes que provienen de estructuras familiares más adineradas tienden a obtener mejores resultados educativos (Blanden, 2004; Naoi et al., 2021; Strello, 2023). Esto se sustenta en que las familias de clases sociales dominantes (mejor situación socioeconómica) tienen mayores posibilidades de inversión en cantidad y calidad de la educación (Zwier, 2023); y en que las condiciones de existencia inciden en los resultados económicos (Naoi, et al., 2021), lo que se traduce en un mejor desempeño académico. En síntesis, las variables del proxy de reproducción social permiten capturar la articulación de las características del entorno familiar que son determinantes en la modelación del habitus y las prácticas que permiten la acumulación y transmisión de capitales. Dichas posibilidades, de acuerdo con la literatura, dan lugar a diversas concepciones y posibilidades en torno a la educación, lo que podría incidir en los resultados académicos.
En la siguiente tabla, se resumen las variables parte de este proxy.
# 6.1.3. Modelo de Reproducción Social
vars_reproduccion_social <- c(
"FAMI_EDUCACIONPADRE", "FAMI_TRABAJOLABORPADRE", "FAMI_EDUCACIONMADRE",
"FAMI_TRABAJOLABORMADRE", "FAMI_SITUACIONECONOMICA")
print(vars_reproduccion_social)
## [1] "FAMI_EDUCACIONPADRE" "FAMI_TRABAJOLABORPADRE"
## [3] "FAMI_EDUCACIONMADRE" "FAMI_TRABAJOLABORMADRE"
## [5] "FAMI_SITUACIONECONOMICA"
##PASO 8: Proporciones variable de reproducción social##
#8.1. Identificación las posibles respuestas de cada variable parte del modelo de reproducción social
unique(nueva_base_limpia$FAMI_EDUCACIONPADRE)
## [1] "Secundaria (Bachillerato) completa"
## [2] "Ninguno"
## [3] "Técnica o tecnológica completa"
## [4] "Técnica o tecnológica incompleta"
## [5] "Primaria completa"
## [6] "Primaria incompleta"
## [7] "No sabe"
## [8] "Secundaria (Bachillerato) incompleta"
## [9] "Educación profesional completa"
## [10] "Postgrado"
## [11] "Educación profesional incompleta"
## [12] "No Aplica"
unique(nueva_base_limpia$FAMI_TRABAJOLABORPADRE)
## [1] "Es agricultor, pesquero o jornalero"
## [2] "Trabaja como personal de limpieza, mantenimiento, seguridad o construcción"
## [3] "Trabaja en el hogar, no trabaja o estudia"
## [4] "Es operario de máquinas o conduce vehículos (taxita, chofer)"
## [5] "Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)"
## [6] "Trabaja como profesional (por ejemplo médico, abogado, ingeniero)"
## [7] "No sabe"
## [8] "Trabaja por cuenta propia (por ejemplo plomero, electricista)"
## [9] "No aplica"
## [10] "Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc"
## [11] "Es vendedor o trabaja en atención al público"
## [12] "Es dueño de un negocio grande, tiene un cargo de nivel directivo o gerencial"
## [13] "Pensionado"
unique(nueva_base_limpia$FAMI_EDUCACIONMADRE)
## [1] "Técnica o tecnológica completa"
## [2] "Ninguno"
## [3] "Técnica o tecnológica incompleta"
## [4] "Secundaria (Bachillerato) completa"
## [5] "Primaria completa"
## [6] "Secundaria (Bachillerato) incompleta"
## [7] "Primaria incompleta"
## [8] "Educación profesional completa"
## [9] "Postgrado"
## [10] "Educación profesional incompleta"
## [11] "No sabe"
## [12] "No Aplica"
unique(nueva_base_limpia$FAMI_TRABAJOLABORMADRE)
## [1] "Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)"
## [2] "Trabaja en el hogar, no trabaja o estudia"
## [3] "Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc"
## [4] "Es vendedor o trabaja en atención al público"
## [5] "Trabaja por cuenta propia (por ejemplo plomero, electricista)"
## [6] "No aplica"
## [7] "Trabaja como personal de limpieza, mantenimiento, seguridad o construcción"
## [8] "Trabaja como profesional (por ejemplo médico, abogado, ingeniero)"
## [9] "Es dueño de un negocio grande, tiene un cargo de nivel directivo o gerencial"
## [10] "Es agricultor, pesquero o jornalero"
## [11] "No sabe"
## [12] "Es operario de máquinas o conduce vehículos (taxita, chofer)"
## [13] "Pensionado"
unique(nueva_base_limpia$FAMI_SITUACIONECONOMICA)
## [1] "Mejor" "Igual" "Peor"
#8.2. proporciones de los distintos niveles de educación del padre
# a. Conteo de las la frecuencia de cada categoría en la columna FAMI_EDUCACIONPADRE
frecuencias_educacion_padre <- table(nueva_base_limpia$FAMI_EDUCACIONPADRE)
# b. Conversión de las frecuencias a proporciones (en porcentaje)
porcentajes_educacion_padre <- prop.table(frecuencias_educacion_padre) * 100
# c. Redondear a 2 decimales
porcentajes_educacion_padre_redondeado <- round(porcentajes_educacion_padre, 2)
print(sort(porcentajes_educacion_padre_redondeado, decreasing = TRUE))
##
## Secundaria (Bachillerato) completa Primaria incompleta
## 25.44 17.11
## Secundaria (Bachillerato) incompleta Educación profesional completa
## 14.47 9.74
## Primaria completa Técnica o tecnológica completa
## 8.90 7.08
## No sabe Ninguno
## 6.10 2.98
## Técnica o tecnológica incompleta Postgrado
## 2.48 2.19
## Educación profesional incompleta No Aplica
## 2.11 1.40
#8.2. proporciones de los distintos niveles de educación del padre
# a. Conteo de la frecuencia de cada categoría en la columna FAMI_EDUCACIONPADRE
frecuencias_educacion_padre <- table(nueva_base_limpia$FAMI_EDUCACIONPADRE)
# b. Conversión de las frecuencias a proporciones (en porcentaje)
porcentajes_educacion_padre <- prop.table(frecuencias_educacion_padre) * 100
# c. Redondear a 2 decimales
porcentajes_educacion_padre_redondeado <- round(porcentajes_educacion_padre, 2)
print(sort(porcentajes_educacion_padre_redondeado, decreasing = TRUE))
##
## Secundaria (Bachillerato) completa Primaria incompleta
## 25.44 17.11
## Secundaria (Bachillerato) incompleta Educación profesional completa
## 14.47 9.74
## Primaria completa Técnica o tecnológica completa
## 8.90 7.08
## No sabe Ninguno
## 6.10 2.98
## Técnica o tecnológica incompleta Postgrado
## 2.48 2.19
## Educación profesional incompleta No Aplica
## 2.11 1.40
#8.3. Proporciones de la situación laboral del padre
# a. Conteo de la frecuencia de cada categoría en la columna FAMI_TRABAJOLABORPADRE
frecuencias_trabajo_padre <- table(nueva_base_limpia$FAMI_TRABAJOLABORPADRE)
# b. Conversión de las frecuencias a proporciones (en porcentaje)
porcentajes_trabajo_padre <- prop.table(frecuencias_trabajo_padre) * 100
# c. Redondear a 2 decimales
porcentajes_trabajo_padre_redondeado <- round(porcentajes_trabajo_padre, 2)
print(sort(porcentajes_trabajo_padre_redondeado, decreasing = TRUE))
##
## Trabaja por cuenta propia (por ejemplo plomero, electricista)
## 13.31
## Es agricultor, pesquero o jornalero
## 12.52
## Es operario de máquinas o conduce vehículos (taxita, chofer)
## 10.72
## No aplica
## 9.47
## No sabe
## 8.71
## Trabaja como profesional (por ejemplo médico, abogado, ingeniero)
## 7.94
## Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc
## 7.79
## Trabaja como personal de limpieza, mantenimiento, seguridad o construcción
## 7.63
## Trabaja en el hogar, no trabaja o estudia
## 6.34
## Es vendedor o trabaja en atención al público
## 6.32
## Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)
## 3.99
## Es dueño de un negocio grande, tiene un cargo de nivel directivo o gerencial
## 2.68
## Pensionado
## 2.59
#8.4. Proporciones de los distintos niveles de educación de la madre
# a. Conteo de la frecuencia de cada categoría en la columna FAMI_EDUCACIONMADRE
frecuencias_educacion_madre <- table(nueva_base_limpia$FAMI_EDUCACIONMADRE)
# b. Conversión de las frecuencias a proporciones (en porcentaje)
porcentajes_educacion_madre <- prop.table(frecuencias_educacion_madre) * 100
# c. Redondear a 2 decimales
porcentajes_educacion_madre_redondeado <- round(porcentajes_educacion_madre, 2)
print(sort(porcentajes_educacion_madre_redondeado, decreasing = TRUE))
##
## Secundaria (Bachillerato) completa Secundaria (Bachillerato) incompleta
## 29.19 14.14
## Educación profesional completa Primaria incompleta
## 12.70 12.50
## Técnica o tecnológica completa Primaria completa
## 10.46 8.44
## Técnica o tecnológica incompleta Educación profesional incompleta
## 3.60 2.59
## Postgrado No sabe
## 2.48 1.86
## Ninguno No Aplica
## 1.82 0.22
#8.5. Proporciones de la situación laboral de la madre
# a. Conteo de la frecuencia de cada categoría en la columna FAMI_TRABAJOLABORMADRE
frecuencias_trabajo_madre <- table(nueva_base_limpia$FAMI_TRABAJOLABORMADRE)
# b. Conversión de las frecuencias a proporciones (en porcentaje)
porcentajes_trabajo_madre <- prop.table(frecuencias_trabajo_madre) * 100
# c. Redondear a 2 decimales
porcentajes_trabajo_madre_redondeado <- round(porcentajes_trabajo_madre, 2)
print(sort(porcentajes_trabajo_madre_redondeado, decreasing = TRUE))
##
## Trabaja en el hogar, no trabaja o estudia
## 38.62
## Es vendedor o trabaja en atención al público
## 9.17
## Trabaja como personal de limpieza, mantenimiento, seguridad o construcción
## 9.10
## Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc
## 9.01
## Trabaja como profesional (por ejemplo médico, abogado, ingeniero)
## 8.86
## Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)
## 8.55
## No aplica
## 4.74
## Trabaja por cuenta propia (por ejemplo plomero, electricista)
## 3.95
## Es agricultor, pesquero o jornalero
## 2.61
## No sabe
## 2.41
## Es dueño de un negocio grande, tiene un cargo de nivel directivo o gerencial
## 1.43
## Es operario de máquinas o conduce vehículos (taxita, chofer)
## 1.05
## Pensionado
## 0.50
#8.6. Proporciones de la situación económica familiar
# a. Conteo de la frecuencia de cada categoría en la columna FAMI_SITUACIONECONOMICA
frecuencias_situacion_economica <- table(nueva_base_limpia$FAMI_SITUACIONECONOMICA)
# b. Conversión de las frecuencias a proporciones (en porcentaje)
porcentajes_situacion_economica <- prop.table(frecuencias_situacion_economica) * 100
# c. Redondear a 2 decimales
porcentajes_situacion_economica_redondeado <- round(porcentajes_situacion_economica, 2)
print(sort(porcentajes_situacion_economica_redondeado, decreasing = TRUE))
##
## Igual Mejor Peor
## 61.67 21.75 16.58
##Tablas y Gráficas
#data.frame
#9.2. Tabla de frecuencias porcentuales: nivel educativo del padre
tabla_educacion_padre <- data.frame(Nivel_Educativo_Padre = c("Secundaria (Bachillerato) completa", "Primaria incompleta", "Secundaria (Bachillerato) incompleta", "Educación profesional completa", "Primaria completa", "Técnica o tecnológica completa", "No sabe", "Ninguno", "Técnica o tecnológica incompleta", "Postgrado", "Educación profesional incompleta", "No Aplica"), Porcentaje = c(25.44, 17.11, 14.47, 9.74, 8.90, 7.08, 6.10, 2.98, 2.48, 2.19, 2.11, 1.40))
#diseño
kable(
tabla_educacion_padre,
col.names = c("Nivel Educativo del Padre", "Porcentaje (%)"),
caption = "Tabla de frecuencias porcentuales del nivel educativo del padre",
digits = 2,
align = "lc",
row.names = FALSE # Oculta los números de fila automáticos
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"), # Estilos de la tabla
full_width = FALSE,
position = "center"
) %>%
row_spec(0, background = "lightblue", color = "black") # Colorea la fila del encabezado
Nivel Educativo del Padre | Porcentaje (%) |
---|---|
Secundaria (Bachillerato) completa | 25.44 |
Primaria incompleta | 17.11 |
Secundaria (Bachillerato) incompleta | 14.47 |
Educación profesional completa | 9.74 |
Primaria completa | 8.90 |
Técnica o tecnológica completa | 7.08 |
No sabe | 6.10 |
Ninguno | 2.98 |
Técnica o tecnológica incompleta | 2.48 |
Postgrado | 2.19 |
Educación profesional incompleta | 2.11 |
No Aplica | 1.40 |
#9.3. Tabla de frecuencias porcentuales: Ocupación del padre
tabla_ocupacion_padre <- data.frame(Ocupacion_Padre = c("Trabaja por cuenta propia (por ejemplo plomero, electricista)", "Es agricultor, pesquero o jornalero", "Es operario de máquinas o conduce vehículos (taxita, chofer)", "No aplica", "No sabe", "Trabaja como profesional (por ejemplo médico, abogado, ingeniero)", "Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc)", "Trabaja como personal de limpieza, mantenimiento, seguridad o construcción", "Trabaja en el hogar, no trabaja o estudia", "Es vendedor o trabaja en atención al público", "Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente)", "Es dueño de un negocio grande, tiene un cargo de nivel directivo o gerencial", "Pensionado"), Porcentaje = c(13.31, 12.52, 10.72, 9.47, 8.71, 7.94, 7.79, 7.63, 6.34, 6.32, 3.99, 2.68, 2.59))
#diseño
kable(
tabla_ocupacion_padre,
col.names = c("Ocupación Principal del Padre", "Porcentaje (%)"),
caption = "Tabla de frecuencias porcentuales de la ocupación del Padre",
digits = 2,
align = "lc",
row.names = FALSE # Oculta los números de fila automáticos
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"), # Estilos de la tabla
full_width = FALSE,
position = "center"
) %>%
row_spec(0, background = "lightblue", color = "black") # Colorea la fila del encabezado
Ocupación Principal del Padre | Porcentaje (%) |
---|---|
Trabaja por cuenta propia (por ejemplo plomero, electricista) | 13.31 |
Es agricultor, pesquero o jornalero | 12.52 |
Es operario de máquinas o conduce vehículos (taxita, chofer) | 10.72 |
No aplica | 9.47 |
No sabe | 8.71 |
Trabaja como profesional (por ejemplo médico, abogado, ingeniero) | 7.94 |
Es dueño de un negocio pequeño (tiene pocos empleados o no tiene, por ejemplo tienda, papelería, etc) | 7.79 |
Trabaja como personal de limpieza, mantenimiento, seguridad o construcción | 7.63 |
Trabaja en el hogar, no trabaja o estudia | 6.34 |
Es vendedor o trabaja en atención al público | 6.32 |
Tiene un trabajo de tipo auxiliar administrativo (por ejemplo, secretario o asistente) | 3.99 |
Es dueño de un negocio grande, tiene un cargo de nivel directivo o gerencial | 2.68 |
Pensionado | 2.59 |
#9.4. Tabla de frecuencias porcentuales: Nivel educativo de la madre
tabla_educacion_madre <- data.frame(Nivel_Educativo_Madre = c("Secundaria (Bachillerato) completa", "Secundaria (Bachillerato) incompleta", "Educación profesional completa", "Primaria incompleta", "Técnica o tecnológica completa", "Primaria completa", "Técnica o tecnológica incompleta", "Educación profesional incompleta", "Postgrado", "No sabe", "Ninguno", "No Aplica"), Porcentaje = c(29.19, 14.14, 12.70, 12.50, 10.46, 8.44, 3.60, 2.59, 2.48, 1.86, 1.82, 0.22))
#diseño
kable(
tabla_educacion_madre,
col.names = c("Nivel Educativo de la Madre", "Porcentaje (%)"),
caption = "Tabla de frecuencias porcentuales del nivel educativo de la madre",
digits = 2,
align = "lc",
row.names = FALSE # Oculta los números de fila automáticos
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"), # Estilos de la tabla
full_width = FALSE,
position = "center"
) %>%
row_spec(0, background = "lightblue", color = "black") # Colorea la fila del encabezado
Nivel Educativo de la Madre | Porcentaje (%) |
---|---|
Secundaria (Bachillerato) completa | 29.19 |
Secundaria (Bachillerato) incompleta | 14.14 |
Educación profesional completa | 12.70 |
Primaria incompleta | 12.50 |
Técnica o tecnológica completa | 10.46 |
Primaria completa | 8.44 |
Técnica o tecnológica incompleta | 3.60 |
Educación profesional incompleta | 2.59 |
Postgrado | 2.48 |
No sabe | 1.86 |
Ninguno | 1.82 |
No Aplica | 0.22 |
#data.frame
#9.5 Tabla de frecuencias porcentuales: situación laboral de la madre
tabla_ocupacion_madre <- data.frame(Ocupacion_Madre = c("Trabaja en el hogar, no trabaja o estudia", "Es vendedora o trabaja en atención al público", "Trabaja como personal de limpieza, mantenimiento, seguridad o construcción", "Es dueña de un negocio pequeño", "Trabaja como profesional (médica, abogada, ingeniera)", "Tiene un trabajo de tipo auxiliar administrativo", "No aplica", "Trabaja por cuenta propia (plomera, electricista)", "Es agricultora, pesquera o jornalera", "No sabe", "Es dueña de un negocio grande o directiva", "Es operaria de máquinas o conduce vehículos", "Pensionada"), Porcentaje = c(38.62, 9.17, 9.10, 9.01, 8.86, 8.55, 4.74, 3.95, 2.61, 2.41, 1.43, 1.05, 0.50))
#diseño
kable(
tabla_ocupacion_madre,
col.names = c("Ocupación Principal de la Madre", "Porcentaje (%)"),
caption = "Tabla de frecuencias porcentuales de la ocupación de la Madre",
digits = 2,
align = "lc",
row.names = FALSE # Oculta los números de fila automáticos
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"), # Estilos de la tabla
full_width = FALSE,
position = "center"
) %>%
row_spec(0, background = "lightblue", color = "black") # Colorea la fila del encabezado
Ocupación Principal de la Madre | Porcentaje (%) |
---|---|
Trabaja en el hogar, no trabaja o estudia | 38.62 |
Es vendedora o trabaja en atención al público | 9.17 |
Trabaja como personal de limpieza, mantenimiento, seguridad o construcción | 9.10 |
Es dueña de un negocio pequeño | 9.01 |
Trabaja como profesional (médica, abogada, ingeniera) | 8.86 |
Tiene un trabajo de tipo auxiliar administrativo | 8.55 |
No aplica | 4.74 |
Trabaja por cuenta propia (plomera, electricista) | 3.95 |
Es agricultora, pesquera o jornalera | 2.61 |
No sabe | 2.41 |
Es dueña de un negocio grande o directiva | 1.43 |
Es operaria de máquinas o conduce vehículos | 1.05 |
Pensionada | 0.50 |
#9.6 Tabla de frecuencias porcentuales: situación económica familiar
#data.frame
tabla_situacion_economica <- data.frame(Situacion_Economica = c("Igual", "Mejor", "Peor"), Porcentaje = c(61.67, 21.75, 16.58))
#diseño
kable(
tabla_situacion_economica,
col.names = c("Situación Económica Familiar", "Porcentaje (%)"),
caption = "Tabla de frecuencias porcentuales de la situación económica familiar",
digits = 2,
align = "lc",
row.names = FALSE # Oculta los números de fila automáticos
) %>%
kable_styling(
bootstrap_options = c("striped", "hover", "condensed"), # Estilos de la tabla
full_width = FALSE,
position = "center"
) %>%
row_spec(0, background = "lightblue", color = "black") # Colorea la fila del encabezado
Situación Económica Familiar | Porcentaje (%) |
---|---|
Igual | 61.67 |
Mejor | 21.75 |
Peor | 16.58 |
#9.7. Grafico de pastel: situación económica familiar
#Etiquetas
grafico_pastel_situacion_economica <- tabla_situacion_economica %>%
arrange(desc(Situacion_Economica)) %>%
mutate(ypos = cumsum(Porcentaje) - 0.5 * Porcentaje)
#Diseño
ggplot(grafico_pastel_situacion_economica, aes(x = "", y = Porcentaje, fill = Situacion_Economica)) +
# a. Crea la barra apilada base
geom_bar(stat = "identity", width = 1, color = "black") +
# b. Convierte la barra en un círculo (gráfico de pastel)
coord_polar("y", start = 0) +
# c. Añade las etiquetas de porcentaje dentro de cada porción
geom_text(aes(y = ypos, label = paste0(Porcentaje, "%")), color = "black", size = 5) +
# d. Define la nueva paleta de colores claros
scale_fill_manual(values = c(
"Mejor" = "#A5D6A7", # Verde claro
"Igual" = "#FFF59D", # Amarillo claro
"Peor" = "#EF9A9A" # Rojo claro/rosa
)) +
# e. Añade el título
labs(
title = "Percepción de la Situación Económica Familiar",
fill = "Situación Económica" # Título de la leyenda
) +
# f. Aplica un tema visual limpio
theme_void() +
# g. Ajustes finos al tema
theme(
plot.title = element_text(hjust = 0.5, face = "bold", size = 16),
legend.position = "top"
)
View(grafico_pastel_situacion_economica)
Se adelantó un análisis estadístico descriptivo con las cinco variables que integran a la categoría de Reproducción Social. Dada su naturaleza nominal, se calcularon, tabularon y graficaron las proporciones (frecuencias relativas) para entender la distribución de las distintas categorías que conforman a cada una de las variables. Se encontraron los siguientes resultados:
La distribución de los niveles educativos del padre muestra una concentración importante de los datos en torno a las categorías de educación secundaria completa (25.44%), educación primaria incompleta (17.11%) y educación secundaria incompleta (14.47%). En contraste, solo un 9.74% de los padres alcanzó estudios profesionales completos, y una proporción aún menor reportó formación de posgrado (2.19%), que, de acuerdo con Bourdieu, es el nivel más alto de acumulación de capital cultural (Bourdieu & Passeron, 1990). Estos resultados evidencian que la mayoría de los padres cuenta con niveles bajos de escolaridad, lo que indica una limitada acumulación de capital cultural institucionalizado en la estructura familiar, en tanto que la educación formal constituye una de las principales formas de capital cultural (Bourdieu, 1986, p. 17). Las limitaciones en el capital cultural inciden en las posibilidades de transmisión intergeneracional de conocimientos y ventajas académicas, lo que podría impactar en los resultados académicos.
En el caso del nivel educativo de la madre se observa una mayor concentración en la educación secundaria completa (29.19%), seguida por la secundaria incompleta (14.14%) y la educación profesional completa (12.70%). Los niveles educativos más bajos, como primaria incompleta (12.50%) o completa (8.44%), presentan proporciones menores respecto a los observados en los padres, lo que sugiere una ligera ventaja educativa en las mujeres . En conjunto, los datos indican que las madres tienden a alcanzar con mayor frecuencia niveles medios o superiores de escolaridad que los padres, especialmente en la educación secundaria y técnica. Estas diferencias podrían dar cuenta de mayores potenciales de acumulación y transmisión de capital cultural por parte de las madres, sin embargo, eso será objeto del análisis de estadística inferencial.
En cuanto a la ocupación laboral del padre, los datos muestran una alta concentración en empleos de carácter independiente o manual. El 13.31% trabaja por cuenta propia, principalmente en oficios como plomería o electricidad, seguido por un 12.52% dedicado a actividades agrícolas, pesqueras o jornaleras, y un 10.72% que se desempeña como operario o conductor. Las ocupaciones de tipo profesional o directivo son minoritarias, con apenas un 7.94% y un 2.68%, respectivamente. Este patrón evidencia una estructura laboral predominantemente vinculada a sectores de baja estabilidad económica y limitada formalización, lo que se traduce en una menor acumulación de capital económico y simbólico en los hogares. Desde la perspectiva de la teoría de la reproducción social de Bourdieu, estos resultados sugieren que los estudiantes provienen, en su mayoría, de contextos familiares insertos en clases sociales dominadas (posiciones subalternas) dentro del sistema de clases.
En contraparte, en la ocupación laboral de las madres, se observa una concentración muy marcada en el trabajo doméstico no remunerado: el 38.62% de ellas declara trabajar en el hogar, no trabajar o encontrarse estudiando. Las ocupaciones remuneradas más frecuentes corresponden a actividades de atención al público (9.17%), labores de limpieza o mantenimiento (9.10%) y pequeños negocios o ventas informales (9.01%). Solo un 8.86% de las madres reporta desempeñarse como profesional y apenas un 1.43% ocupa cargos directivos o gerenciales. Estos datos reflejan una inserción laboral femenina caracterizada por la precariedad, la informalidad y la concentración en tareas tradicionalmente feminizadas, lo que evidencia una acumulación limitada de capital económico. Ahora bien, al comparar estos resultados con los de los padres, se advierte una clara división sexual del trabajo: mientras los padres predominan en ocupaciones independientes o manuales asociadas al trabajo por cuenta propia (13.31%) o agrícola (12.52%), las madres se concentran en el ámbito doméstico y en empleos de servicios o comercio de baja cualificación.
En relación con la situación económica familiar, el 61.67% de los estudiantes percibe que su condición se mantiene igual respecto al año anterior, un 21.75% considera que ha mejorado y un 16.58% señala un empeoramiento. Estos resultados sugieren una percepción general de estabilidad económica, aunque más de una tercera parte de los hogares experimenta variaciones que pueden reflejar vulnerabilidad frente a los cambios del entorno económico. De todas maneras, la predominancia de la categoría “igual” podría interpretarse como un indicador de estancamiento en el sistema de clases, con pocos cambios en la acumulación y distribución de capital económico.
Ante la tendencia del sistema educativo a deprivar a los miembros de las clases dominadas de los beneficios materiales y simbólicos de la educación (Bourdieu & Passeron, 1990), el análisis inferencial permitirá determinar si la acumulación moderada o reducida de capital económico y cultural —denotada en la estructura familiar y en las variables de los proxys de cada capital — se relaciona con menores niveles de desempeño.
Tabla_Genero <- table(nueva_base_limpia$ESTU_GENERO)|> as.data.frame()
colnames(Tabla_Genero) <- c("Genero", "n")
library(ggplot2)
# Graficar distribución
ggplot(Tabla_Genero, aes(x = Genero, y = n, fill = Genero)) +
geom_col(width = 0.6, color = "black") +
labs(
title = "Distribución por Género de los Estudiantes",
x = "Género del estudiante",
y = "Frecuencia"
) +
theme_minimal(base_size = 13) +
theme(
plot.title = element_text(face = "bold", hjust = 0.5),
legend.position = "none"
)
En la muestra total (N = 4.560), la distribución por género muestra una mayoría femenina: mujeres 54,69% (≈ 2.494) y hombres 45,31% (≈ 2.066). En términos simples, hay 1,21 mujeres por cada hombre.
Tabla_RoU<-table(nueva_base_limpia$COLE_AREA_UBICACION)
View(Tabla_RoU)
prop.table(Tabla_RoU)
##
## RURAL URBANO
## 0.1563596 0.8436404
Tabla_RoU<- as.data.frame(Tabla_RoU)
colnames(Tabla_RoU) <- c("Naturalezadelcolegio", "Frecuencia")
ggplot(Tabla_RoU, aes(x=Naturalezadelcolegio, y = Frecuencia, fill = Naturalezadelcolegio)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.3, size = 5) +
labs(
title = "NaturalezadelColegio",
x = "NaturalezadelColegio",
y = "Número de personas"
) +
theme_minimal()
La muestra es mayoritariamente urbana: 84,36% (3.847 casos) frente a
15,64% (713 casos) rurales. La relación es de ≈5,4 urbanos por cada
rural.
Tabla_NC<-table(nueva_base_limpia$COLE_NATURALEZA)
View(Tabla_NC)
prop.table(Tabla_NC)
##
## NO OFICIAL OFICIAL
## 0.2311404 0.7688596
Tabla_NC<- as.data.frame(Tabla_NC)
colnames(Tabla_NC) <- c("NaturalezadelColegio", "Frecuencia")
library(ggplot2)
ggplot(Tabla_NC, aes(x=NaturalezadelColegio, y = Frecuencia, fill = NaturalezadelColegio)) +
geom_col() +
geom_text(aes(label = Frecuencia),
vjust = -0.3, size = 5) +
labs(
title = "NaturalezadelColegio",
x = "NaturalezadelColegio",
y = "LugardelColegio"
) +
theme_minimal()
La muestra está dominada por el sector oficial: 76,89% (3.506 casos)
frente a 23,11% (1.054 casos) en el sector no oficial. En términos de
razón, hay 3,33 instituciones oficiales por cada no oficial.
##Analisis de medias
#Puntaje de lectura
mean_pdl= mean(nueva_base_limpia$PUNT_LECTURA_CRITICA, na.rm = TRUE)
sd_pdl= sd(nueva_base_limpia$PUNT_LECTURA_CRITICA,na.rm=TRUE)
# Puntaje de Matematicas
mean_pdm= mean(nueva_base_limpia$PUNT_MATEMATICAS, na.rm = TRUE)
sd_pdm= sd(nueva_base_limpia$PUNT_MATEMATICAS,na.rm=TRUE)
# Puntaje ciencias naturales
mean_pcn= mean(nueva_base_limpia$PUNT_C_NATURALES, na.rm = TRUE)
sd_pcn= sd(nueva_base_limpia$PUNT_C_NATURALES,na.rm=TRUE)
# Puntaje de ciencias sociales y ciudadanas
mean_psc= mean(nueva_base_limpia$PUNT_SOCIALES_CIUDADANAS, na.rm = TRUE)
sd_psc= sd(nueva_base_limpia$PUNT_SOCIALES_CIUDADANAS,na.rm=TRUE)
# Puntaje de ingles
mean_pdi= mean(nueva_base_limpia$PUNT_INGLES, na.rm = TRUE)
sd_pdi= sd(nueva_base_limpia$PUNT_INGLES,na.rm=TRUE)
# Puntaje Global
mean_pg= mean(nueva_base_limpia$PUNT_GLOBAL, na.rm = TRUE)
sd_pg= sd(nueva_base_limpia$PUNT_GLOBAL,na.rm=TRUE)
Tras aplicar el análisis descriptivo de los puntajes obtenidos en la Prueba Saber 11 del segundo semestre de 2021, se revela un rendimiento diferenciado entre las competencias evaluadas. La competencia de Lectura Crítica se destaca como la competencia con el mejor rendimiento promedio (52.91) y la segunda menor desviación estándar (10.47), lo que sugiere que fue una habilidad consolidada y relativamente homogénea en dicho cohorte de la prueba estandarizada. En contraste, la competencia de Sociales y Ciudadanas exhibe el promedio más bajo (47.31), acompañado de una alta variabilidad en los resultados (11.91). Esta combinación indica no solo un menor nivel de desempeño y de desarrollo de las habilidades propias de dicha competencia, sino también una brecha significativa entre los estudiantes con mayor y menor desempeño. Es particularmente notable el caso de Inglés, que, a pesar de tener un rendimiento promedio intermedio (49.58), registra la desviación estándar más alta de todas las áreas (12.79). Esto refleja una heterogeneidad pronunciada en el dominio del idioma, donde coexisten niveles de competencia muy dispares. Por su parte, las competencias de Ciencias Naturales y Matemáticas presentan niveles de desempeño intermedios (48.82 y 50.35, respectivamente). Cabe destacar que Ciencias Naturales es la competencia con los resultados más consistentes, al registrar la menor desviación estándar (9.78) de dicho año, sugiriendo una base de conocimiento más uniforme entre los estudiantes.
table(SB11_20212$DESEMP_LECTURA_CRITICA)
##
## 1 2 3 4
## 280 2096 2336 617
prop_deslec1= 280/nrow(SB11_20212)
prop_deslec2= 2087/nrow(SB11_20212)
prop_deslec3= 2333/nrow(SB11_20212)
prop_deslec4= 616/nrow(SB11_20212)
# nivel de desempeño mate
table(SB11_20212$DESEMP_MATEMATICAS)
##
## 1 2 3 4
## 636 2179 2323 191
prop_desmat1= 632/nrow(SB11_20212)
prop_desmat2= 2173/nrow(SB11_20212)
prop_desmat3= 2320/nrow(SB11_20212)
prop_desmat4= 191/nrow(SB11_20212)
# nivel de desempeño ciencias naturales
table(SB11_20212$DESEMP_C_NATURALES)
##
## 1 2 3 4
## 1274 2803 1173 79
prop_descn1= 1268/nrow(SB11_20212)
prop_descn2= 2797/nrow(SB11_20212)
prop_descn3= 1172/nrow(SB11_20212)
prop_descn4= 79/nrow(SB11_20212)
# Desempeño sociales y ciudadanas
table(SB11_20212$DESEMP_SOCIALES_CIUDADANAS)
##
## 1 2 3 4
## 1834 2172 1192 131
prop_dessyc1= 1827/nrow(SB11_20212)
prop_dessyc2= 2168/nrow(SB11_20212)
prop_dessyc3= 1190/nrow(SB11_20212)
prop_dessyc4= 131/nrow(SB11_20212)
# nivel de desempeño ingles
table(SB11_20212$DESEMP_INGLES)
##
## A- A1 A2 B+ B1
## 2632 1438 730 105 383
prop_ingNA= 13/nrow(SB11_20212)
prop_ingA = 2622/nrow(SB11_20212)
prop_ingA1= 1435/nrow(SB11_20212)
prop_inA2= 730/nrow(SB11_20212)
prop_ingB = 105/nrow(SB11_20212)
prop_ingB1 = 383/nrow(SB11_20212)
# Tabla - Desempeño numérico
tabla_desnum <- data.frame(
Nivel = c("1", "2", "3", "4"),
Lectura = c(prop_deslec1, prop_deslec2, prop_deslec3, prop_deslec4),
Matematicas = c(prop_desmat1, prop_desmat2, prop_desmat3, prop_desmat4),
Naturales = c(prop_descn1, prop_descn2, prop_descn3, prop_descn4),
Socyciu = c(prop_dessyc1, prop_dessyc2, prop_dessyc3, prop_dessyc4)
)
tabla_desnum
# Tabla - Desempeño Inglés
tabla_desingles <- data.frame(
Nivel = c("NA", "A-", "A1", "A2", "B+", "B1"),
prop_desempeño = c(prop_ingNA, prop_ingA, prop_ingA1, prop_inA2, prop_ingB, prop_ingB1)
)
tabla_desingles
# Tabla - Medias y Desviaciones
tabla_varnum = data.frame(
puntajes = c("mean", "sd"),
cienciasnat = c(mean_pcn, sd_pcn),
Matematicas = c(mean_pdm, sd_pdm),
lectura = c(mean_pdl,sd_pdl),
Socyciu = c(mean_psc, sd_psc),
ingles = c(mean_pdi, sd_pdi)
)
tabla_varnum
#Histogramas individuales datos completos
hist(nueva_base_limpia$PUNT_SOCIALES_CIUDADANAS, main = "Histograma - Sociales", col = "lightgreen", border = "white")
hist(nueva_base_limpia$PUNT_LECTURA_CRITICA, main = "Histograma - Lectura", col = "lavender", border = "white")
hist(nueva_base_limpia$PUNT_C_NATURALES, main = "Histograma - Ciencias", col = "lightyellow", border = "white")
hist(nueva_base_limpia$PUNT_INGLES, main = "Histograma - Inglés", col = "lightpink", border = "white")
hist(nueva_base_limpia$PUNT_MATEMATICAS, main = "Histograma - Matematicas", col = "lightgreen", border = "white")
# Histograma superpuesto datos completos
# Histograma combinado con todas las materias superpuestas
hist(nueva_base_limpia$PUNT_MATEMATICAS, breaks = 20, col = rgb(0.4,0.4,1,0.4),
xlab = "Puntaje",
main = "Distribución de puntajes por materia",
freq = FALSE,
border = "white",
xlim = c(0, 100))
hist(nueva_base_limpia$PUNT_SOCIALES_CIUDADANAS, breaks = 20, col = rgb(0.4,1,0.4,0.4),
add = TRUE, border = "white")
hist(nueva_base_limpia$PUNT_LECTURA_CRITICA, breaks = 20, col = rgb(1,0.4,1,0.4),
add = TRUE, border = "white")
hist(nueva_base_limpia$PUNT_C_NATURALES, breaks = 20, col = rgb(1,1,0.4,0.4),
add = TRUE, border = "white")
hist(nueva_base_limpia$PUNT_INGLES, breaks = 20, col = rgb(1,0.4,0.4,0.4),
add = TRUE, border = "white")
legend("topright",
legend = c("Matemáticas", "Sociales", "Lectura", "Ciencias", "Inglés"),
fill = c(rgb(0.4,0.4,1,0.4),
rgb(0.4,1,0.4,0.4),
rgb(1,0.4,1,0.4),
rgb(1,1,0.4,0.4),
rgb(1,0.4,0.4,0.4)),
border = NA)
# Gráfico de medias y desviación estándar
# Crear un data frame con tus datos
tabla_varnum <- data.frame(
puntajes = c("mean", "sd"),
cienciasnat = c(48.82319, 9.783137),
Matematicas = c(50.34945, 11.38582),
lectura = c(52.90593, 10.46561),
Socyciu = c(47.31538, 11.91411),
ingles = c(49.59802, 12.79063)
)
print(tabla_varnum)
## puntajes cienciasnat Matematicas lectura Socyciu ingles
## 1 mean 48.823190 50.34945 52.90593 47.31538 49.59802
## 2 sd 9.783137 11.38582 10.46561 11.91411 12.79063
# Extraer las medias y desviaciones
medias <- as.numeric(tabla_varnum[1, 2:6])
desv <- as.numeric(tabla_varnum[2, 2:6])
materias <- names(tabla_varnum)[2:6]
# Gráfico de barras con barras de error
barplot(medias,
names.arg = materias,
col = "lightpink",
main = "Promedio de puntajes por materia",
ylab = "Puntaje promedio",
ylim = c(0, 60))
# Añadir las barras de desviación estándar
arrows(x0 = 1:5, y0 = medias - desv,
x1 = 1:5, y1 = medias + desv,
angle = 90, code = 3, length = 0.1)
# Gráfico de desempeño
barplot(
as.matrix(t(tabla_desnum[, -1])),
beside = TRUE,
col = rainbow(4),
names.arg = tabla_desnum$Nivel,
main = "Proporciones por Nivel y Asignatura",
xlab = "Nivel",
ylab = "Proporción"
)
legend(
"topright",
legend = colnames(tabla_desnum[-1]),
fill = rainbow(4)
)
Los resultados evidencian una distribución desigual de los niveles de logro entre las diferentes áreas evaluadas, lo cual refleja la heterogeneidad del capital académico de los estudiantes y las posibles brechas derivadas de las condiciones culturales y educativas de origen. En Ciencias Naturales, más de la mitad de los estudiantes (52,5 %) se ubica en el nivel 2 y un 23,8 % en el nivel 1, mientras que el 22 % alcanza el nivel 3 y solo el 1,5 % llega al nivel 4. Esta concentración en los niveles medios evidencia un dominio parcialmente bajo de las competencias científicas, probablemente asociado a limitaciones en los recursos pedagógicos o en las condiciones de aprendizaje en el hogar. En Inglés, el 49,2 % de los estudiantes se encuentra en el nivel A– (básico), un 26,9 % en A1, un 13,7 % en A2 y apenas el 7,2 % y 2,0 % alcanzan los niveles B1 y B+, respectivamente. Esta distribución muestra un bajo dominio general del idioma extranjero, lo que podría relacionarse con las diferencias en la oferta educativa y en el acceso a contextos bilingües, componentes vinculados al capital cultural institucionalizado (Bourdieu, 1986).
En Lectura Crítica, el 43,8 % de los estudiantes se ubica en el nivel 3 y un 39,2 % en el nivel 2, mientras que solo el 11,6 % logra el nivel 4 y un 5,3 % permanece en el nivel 1. Estos resultados son relativamente más equilibrados y sugieren una mejor formación en competencias interpretativas, aunque con una minoría que alcanza niveles de comprensión avanzada. En Matemáticas, la mayor parte de los estudiantes se concentra también en los niveles intermedios: el 43,5 % en el nivel 3 y el 40,8 % en el nivel 2, con un 11,9 % en el nivel 1 y apenas un 3,6 % en el nivel 4. Esta distribución evidencia que, aunque hay avances en el razonamiento matemático, persiste una escasa presencia de desempeños sobresalientes.
Por último, en Sociales y Ciudadanas, el 40,7 % de los estudiantes se ubica en el nivel 2, un 34,3 % en el nivel 1, un 22,3 % en el nivel 3 y solo un 2,5 % alcanza el nivel 4. Este patrón sugiere debilidades en el desarrollo del pensamiento crítico y la formación ciudadana, posiblemente relacionadas con un bajo capital cultural incorporado y una menor exposición a espacios de debate o reflexión social.
En conjunto, las proporciones revelan que los desempeños académicos se concentran mayoritariamente en niveles medios y bajos, con una reducida proporción de estudiantes en los niveles de excelencia. Desde la perspectiva del capital cultural de Bourdieu (1986), esta tendencia puede interpretarse como el reflejo de desigualdades en la transmisión y apropiación de recursos culturales y educativos, donde las condiciones familiares, como la disponibilidad de libros, el acceso a Internet y los hábitos lectores, inciden directamente en la formación de competencias académicas y, por ende, en la posición de los estudiantes dentro del sistema educativo.
# Gráfico de desempeño Inglés
barplot(
tabla_desingles$prop_desempeño,
names.arg = tabla_desingles$Nivel,
col = rainbow(length(tabla_desingles$Nivel)),
main = "Proporción de Desempeño en Inglés",
xlab = "Nivel",
ylab = "Proporción"
)