Nuestra base de datos recopila la información obtenida durante las pruebas ICFES del año 2019, incluyendo el desempeño en las diferentes áreas calificadas, como matemáticas y lectura crítica. Además, también se recopilan datos de encuestas socioeconómicas realizadas al final de las pruebas.
mediante este proyecto podremos encontrar cuales son los factores socioeconómicos mas relevantes en los estudiantes para aumentar o disminuir su desempeño en el área de matemáticas, para así poder generar soluciones que ayuden a mejorar estas características y por consecuente aumentar el desempeño matemático de los estudiantes que presentan las pruebas ICFES.
Es de vital importancia llevar a cabo un riguroso procedimiento de filtrado y depuración de la base de datos antes de comenzar cualquier análisis. Esto se debe a que es común encontrar campos vacíos, datos inconsistentes o incluso errores en la información recopilada, lo que podría afectar significativamente los resultados del estudio y comprometer su validez. Para evitar estos problemas, se implementaron ciertos filtros y criterios de selección para restringir el alcance de la investigación y garantizar que solo se utilicen datos confiables y precisos en el análisis.
Disponemos de una base de datos obtenida directamente de entidades gubernamentales que ya han realizado la correspondiente limpieza de datos. Por lo tanto, no esperamos encontrar datos anómalos o incorrectos en la base de datos. Con respecto al proceso de filtración, decidimos utilizar la totalidad de los datos para garantizar una mayor precisión en el análisis y evitar la pérdida de información. Además, contamos con la capacidad de procesamiento de nuestros equipos para llevar a cabo esta tarea con todos los datos de la base de datos.
Existe la creencia común de que a medida que aumenta el estrato socioeconómico, se logra un mejor desempeño en las pruebas debido a las mayores oportunidades y facilidades de estudio. Por lo tanto, en este punto realizaremos un análisis para comprobar o refutar esta hipótesis.
## Frequencies
## prueba_base_de_datos$FAMI_ESTRATOVIVIENDA
## Type: Character
##
## Freq % Valid % Total
## ----------- -------- ---------- ----------
## - 34481 6.3131 6.3128
## 1 159977 29.2898 29.2884
## 2 188314 34.4780 34.4764
## 3 108692 19.9002 19.8992
## 4 25810 4.7255 4.7253
## 5 8024 1.4691 1.4690
## 6 3711 0.6794 0.6794
## Sin 17177 3.1449 3.1447
## <NA> 26 0.0048
## Total 546212 100.0000 100.0000
La tabla de frecuencias revela que la mayoría de las personas que presentaron el examen ICFES pertenecen a los estratos 1, 2 y 3, lo que se relaciona con la estadística que indica que la mayoría de los colombianos viven en estos estratos. A continuación, analizaremos la relación entre el estrato socioeconómico de los estudiantes y su desempeño en el área de matemáticas.
##
## Descriptive statistics by group
## group: -
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 34481 45.14 12.03 44 44.82 13.34 0 100 100 0.25 -0.32 0.06
## ------------------------------------------------------------
## group: 1
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 159977 48.66 11.06 49 48.6 11.86 15 100 85 0.07 -0.24
## se
## X1 0.03
## ------------------------------------------------------------
## group: 2
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 188314 51.47 11.28 52 51.53 11.86 15 100 85 -0.02 -0.21
## se
## X1 0.03
## ------------------------------------------------------------
## group: 3
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 108692 53.71 11.97 54 53.88 11.86 16 100 84 -0.08 -0.17
## se
## X1 0.04
## ------------------------------------------------------------
## group: 4
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 25810 55.17 14.05 56 55.47 14.83 17 100 83 -0.11 -0.4
## se
## X1 0.09
## ------------------------------------------------------------
## group: 5
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 8024 54.11 15.12 55 54.28 17.79 17 100 83 -0.05 -0.68 0.17
## ------------------------------------------------------------
## group: 6
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 3711 50.55 16.07 50 50.2 19.27 17 100 83 0.21 -0.75 0.26
## ------------------------------------------------------------
## group: Sin
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 17177 42.15 10.65 41 41.67 10.38 0 100 100 0.45 0.1 0.08
El análisis de la media de los puntajes en matemáticas según el estrato socioeconómico muestra que el estrato 4 tiene la media más alta con 55.17, seguido por el estrato 5 con una media de 54.28. Los estratos 3 y 2 les siguen en el ranking, y el estrato 6 ocupa el quinto lugar en cuanto a la media. Esto demuestra que, a pesar de ser el estrato más alto en Colombia, el estrato 6 no supera a la mayoría de los estratos inferiores en términos de desempeño en matemáticas. Es importante destacar que el único estrato con una nota mínima de 0 puntos es el estrato 0, aunque este valor se encuentra dentro de los datos típicos y se puede visualizar en el boxplot.
Con el boxplot podemos observar que los estratos 5 y 6 son los únicos donde se obtuvo un puntaje en matemáticas mayor a 85 de manera no típica. En los demás estratos, aunque hay casos donde se dan puntajes mayores a 100, estos son datos atípicos que se encuentran por fuera de los percentiles y se representan como puntos fuera del boxplot.
Además, se puede observar que el estrato que presentó en promedio mejores notas en matemáticas no es el estrato 6 como se podría pensar a primera vista, sino el estrato 5. En el estrato 5, el 50% de las notas están entre más de 50 puntos y 100, y las notas más bajas se encuentran más o menos en el promedio, teniendo como mínimo 17 puntos.
También se puede apreciar que el estrato 6 no sale tan bien parado de esta comparativa frente a los estratos 1, 2 y 3. Estos últimos tienen límites inferiores más altos que el estrato 6, fuera de los datos atípicos, y límites superiores más altos, además de tener una dispersión de datos menor, lo que significa que los datos se concentran más dentro de estos límites. La única ventaja del estrato 6 es que su último cuartil tiene como límite superior 100 puntos, no solo datos atípicos que se encuentren con este puntaje.
Debido a la naturaleza de los datos y al análisis que se ha llevado a cabo hasta el momento, no se ha encontrado ningún patrón evidente en la relación entre los datos y el estrato. Por lo tanto, no es pertinente realizar una tabla de dispersión para esta variable en particular. Es importante tener en cuenta que el análisis de los datos es un proceso iterativo y dinámico, por lo que en futuros estudios se podrían explorar variables que permitan obtener resultados más significativos. Es posible que al examinar otras variables, como el acceso a recursos educativos, el apoyo familiar o la motivación, se puedan encontrar patrones que permitan entender mejor la relación entre el estrato y el desempeño en matemáticas. Por lo tanto, se debe continuar con la exploración de los datos y la búsqueda de patrones relevantes para entender de manera más completa la compleja relación entre los factores socioeconómicos y el rendimiento académico en Colombia.
Junto con la creencia de que a mayor estrato se puede obtener un mejor desempeño academico esta que los colegio oficiales o publicos tienden a tener un desempeño menor que los colegios privados o no oficieales con el siguiente analizas podresmos darnos una idea si este sesgo es verdadero.
## Frequencies
## prueba_base_de_datos$COLE_NATURALEZA
## Type: Character
##
## Freq % Valid % Total
## ---------------- -------- --------- ---------
## NO OFICIAL 130201 23.84 23.84
## OFICIAL 416011 76.16 76.16
## <NA> 0 0.00
## Total 546212 100.00 100.00
En primer lugar, al analizar la tabla de frecuencias se puede observar que la cantidad de colegios públicos es significativamente mayor que la de colegios privados, ya que los primeros representan el 76.16% del total, mientras que los segundos solo el 23.84%. Además, este hecho está relacionado con el porcentaje de personas que presentaron el ICFES en 2019 y que pertenecían al estrato socioeconómico igual o mayor a 4, el cual fue bastante bajo en comparación con los demás estratos.
Al analizar el boxplot, se puede notar una tendencia que sugiere que los colegios no oficiales tienen un mejor desempeño en el área de matemáticas en comparación con los colegios oficiales en las pruebas ICFES. Esto se puede observar en el hecho de que el límite superior del puntaje en matemáticas para los colegios no oficiales es más alto que el límite superior para los colegios oficiales. Aunque ambos tipos de colegios presentan datos atípicos que llegan al puntaje máximo de 100, lo que indica que hay estudiantes sobresalientes en ambos tipos de instituciones.
Sin embargo, es importante destacar que el límite inferior del
puntaje para los colegios oficiales es ligeramente más alto que el de
los colegios no oficiales. Además, se observa que los datos de los
colegios oficiales están menos dispersos que los de los colegios no
oficiales en cuanto al puntaje obtenido en matemáticas. Esto sugiere
que, aunque los colegios no oficiales pueden tener mejores resultados en
promedio, los colegios oficiales pueden ser más consistentes en su
desempeño en esta área.
### Descripción estadística
##
## Descriptive statistics by group
## group: NO OFICIAL
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 130201 53.8 13.2 54 53.97 14.83 0 100 100 -0.06 -0.32 0.04
## ------------------------------------------------------------
## group: OFICIAL
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 416011 49.61 11.41 50 49.62 11.86 0 100 100 0.02 -0.29
## se
## X1 0.02
Después de realizar un análisis detallado de los datos y al comparar las estadísticas, podemos concluir que el tipo de colegio al que asiste un estudiante tiene una relación significativa con su desempeño en las pruebas de matemáticas del ICFES. En efecto, los estudiantes de colegios privados obtienen puntajes más altos en promedio (53.8) en comparación con los estudiantes de colegios oficiales (49.61).
Esta diferencia en los puntajes promedio puede deberse a una serie de factores, como la calidad de la enseñanza, el nivel de preparación del profesorado y la infraestructura escolar. Es importante destacar que, si bien los puntajes en matemáticas son más altos en los colegios privados, esto no significa necesariamente que estos colegios ofrezcan una educación general superior.
Además, es importante mencionar que mientras que los colegios privados tienen una mayor media en los puntajes de matemáticas, también presentan una mayor variabilidad en sus resultados. Por otro lado, los colegios oficiales tienen una menor variabilidad en sus puntajes, lo que indica que en promedio los estudiantes de colegios oficiales tienen un desempeño más homogéneo.
En Colombia y en otros países del mundo, los colegios ofrecen diferentes horarios para adaptarse a las diversas necesidades de los estudiantes. Se busca determinar cuál de estos horarios es más efectivo para mejorar el rendimiento académico en el área de matemáticas.
antes de empezar con el analisis de la tabla quiero pasar a explicar en que consiste cada una de las jornadas para asi poder tener un mejor entendimiento de la variable: 1. Jornada única: La jornada única es un modelo de jornada escolar que busca concentrar la educación de los estudiantes en una sola jornada diaria de 8 horas. Esto significa que los estudiantes reciben todas sus clases y actividades en un solo turno, permitiéndoles tener más tiempo libre para realizar otras actividades en el resto del día. Este modelo de jornada escolar es implementado principalmente en colegios públicos.
Jornada completa: La jornada completa es un modelo de jornada escolar en el que los estudiantes reciben sus clases y actividades durante un horario que comprende la mañana y la tarde, con una hora de descanso para el almuerzo. Este modelo de jornada escolar permite a los estudiantes tener más tiempo para recibir una educación integral y participar en actividades extracurriculares, pero también puede resultar agotador para algunos estudiantes.
Jornada sabatina: La jornada sabatina es un modelo de jornada escolar en el que los estudiantes asisten a clases solo los días sábados. Este modelo de jornada escolar es implementado principalmente en colegios privados y en algunos colegios públicos en zonas rurales donde no se cuenta con la disponibilidad de transporte durante la semana.
Jornada nocturna: La jornada nocturna es un modelo de jornada escolar que se imparte en la noche y está dirigido a personas mayores de edad que trabajan o tienen responsabilidades durante el día. Este modelo de jornada escolar permite a las personas que no tienen la posibilidad de asistir a clases en el día, completar su educación secundaria.
Jornada de la tarde: La jornada de la tarde es un modelo de jornada escolar que se imparte en horarios que van desde la una de la tarde hasta las seis de la tarde. Este modelo de jornada escolar permite a los estudiantes tener más tiempo para realizar actividades en la mañana o asistir a trabajos y, al mismo tiempo, recibir una educación integral.
## Frequencies
## prueba_base_de_datos$COLE_JORNADA
## Type: Character
##
## Freq % Valid % Total
## -------------- -------- --------- ---------
## COMPLETA 89520 16.39 16.39
## MAÑANA 257060 47.06 47.06
## NOCHE 34124 6.25 6.25
## SABATINA 39098 7.16 7.16
## TARDE 59049 10.81 10.81
## UNICA 67361 12.33 12.33
## <NA> 0 0.00
## Total 546212 100.00 100.00
El análisis estadístico revela que la mayoría de los estudiantes presentaron el ICFES en el año 2019 en una jornada de mañana, representando un 47.06% del total, lo cual indica que esta es la jornada escolar más popular en Colombia. En segundo lugar, se encuentran los colegios de jornada completa, con un 16.39% del total de estudiantes, seguida por la jornada tarde con un 10.81%. En contraste, la jornada sabatina representa el menor porcentaje del total, con solo un 7.16%.
Es importante destacar que la baja representatividad de la jornada sabatina puede deberse al hecho de que la mayoría de las instituciones educativas que ofrecen esta jornada son de nivelación
Al observar el boxplot, se puede ver que la jornada completa tiene una clara superioridad en cuanto a los puntajes de matemáticas de sus estudiantes. Esta jornada presenta una dispersión menor que las demás, lo que indica que los puntajes de los estudiantes están más concentrados en un rango estrecho. Además, los límites inferior y superior no atípicos son más altos que los de las otras jornadas, lo que significa que la mayoría de los estudiantes de la jornada completa tienen puntajes más altos que los de las otras jornadas.
Por otro lado, la jornada de la mañana también presenta buenos resultados, con un 50% de los estudiantes que obtuvieron notas por encima de 51 puntos. En contraste, las jornadas nocturna y sabatina tienen medianas de 41 puntos y límites inferiores y superiores no atípicos de entre 15 y 75 puntos, lo que indica que los estudiantes en estas jornadas tienen puntajes más bajos en general. Es importante considerar que estas jornadas suelen estar destinadas a estudiantes que trabajan o tienen otras responsabilidades, lo que puede afectar su disponibilidad para estudiar y prepararse para el examen.
##
## Descriptive statistics by group
## group: COMPLETA
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 89520 56.68 12.01 57 56.94 11.86 0 100 100 -0.13 0
## se
## X1 0.04
## ------------------------------------------------------------
## group: MAÑANA
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 257060 50.86 11.43 51 50.87 11.86 0 100 100 0.03 -0.19
## se
## X1 0.02
## ------------------------------------------------------------
## group: NOCHE
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 34124 41.28 9.96 41 41.01 10.38 0 100 100 0.25 -0.25 0.05
## ------------------------------------------------------------
## group: SABATINA
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 39098 41.26 9.8 41 41.05 10.38 0 84 84 0.21 -0.29 0.05
## ------------------------------------------------------------
## group: TARDE
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 59049 50.29 11.03 50 50.28 11.86 15 100 85 0.04 -0.18 0.05
## ------------------------------------------------------------
## group: UNICA
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 67361 51.97 10.89 52 52.08 11.86 17 100 83 -0.06 -0.22
## se
## X1 0.04
El análisis estadístico de las diferentes jornadas escolares en relación al desempeño en matemáticas muestra patrones interesantes. Según la descripción analítica, la jornada completa es la que tiene una media más alta, con 56.68 puntos, seguida por la jornada mañana con 50.86 puntos. Esto sugiere que los estudiantes que asisten a estas jornadas tienen una mayor probabilidad de obtener una puntuación más alta en matemáticas que en las otras jornadas.
Un aspecto curioso que se encontró en el análisis es que los estudiantes de las jornadas tarde y única son los únicos cuyo límite inferior de nota es mayor a cero, siendo de 15 y 17 puntos, respectivamente. Esto podría indicar que los estudiantes de estas jornadas tienen una menor variabilidad en sus puntuaciones y que, en general, obtienen resultados más altos en matemáticas.
En cuanto a las posibles causas de estas diferencias entre las jornadas, una hipótesis preliminar es que la cantidad de tiempo que los estudiantes dedican al estudio podría estar relacionada con el tipo de jornada. Por ejemplo, los estudiantes de jornada única y mañana podrían dedicar más horas al estudio dentro de la institución educativa, en comparación con los estudiantes de jornada sabatina o nocturna, quienes pueden tener responsabilidades laborales o personales adicionales que limitan el tiempo que pueden dedicar al estudio. Es importante mencionar que se requiere una investigación más exhaustiva para confirmar esta hipótesis y determinar si hay otros factores que influyen en el desempeño en matemáticas en las diferentes jornadas escolares.
El acceso a internet puede ser un factor determinante en el rendimiento académico de los estudiantes, especialmente en el área de matemáticas, donde las herramientas en línea pueden ser de gran ayuda, puede ser una herramienta valiosa para aquellos estudiantes que saben cómo utilizarlo de manera efectiva para mejorar su aprendizaje en matemáticas. Por ejemplo, pueden utilizar plataformas de aprendizaje en línea, recursos educativos abiertos y tutoriales en video para reforzar su comprensión de los conceptos matemáticos.
Sin embargo, también existe el riesgo de que los estudiantes se distraigan fácilmente por las redes sociales y otras distracciones en línea, lo que puede disminuir su concentración y en última instancia, afectar su rendimiento académico. Por lo tanto, es importante que los estudiantes aprendan a utilizar internet de manera responsable y productiva para maximizar su rendimiento académico.
## Frequencies
## prueba_base_de_datos$FAMI_TIENEINTERNET
## Type: Character
##
## Freq % Valid % Total
## ----------- -------- --------- ---------
## - 22634 4.21 4.14
## No 201199 37.41 36.84
## Si 314042 58.39 57.49
## <NA> 8337 1.53
## Total 546212 100.00 100.00
Se puede apreciar que en la actualidad, un mayor número de estudiantes tienen acceso a internet que los que no, lo cual es un avance significativo en cuanto a la conectividad y el acceso al conocimiento. Esto demuestra el desarrollo tecnológico del país, ya que el 58.39% de las personas que presentaron el ICFES en 2019 contaban con acceso a internet, mientras que el 37.41% no. El porcentaje restante corresponde a personas que no respondieron a la pregunta sobre acceso a internet en la encuesta. Es importante ahora analizar si el acceso a internet influye positiva o negativamente en el desempeño académico de los estudiantes en el área de matemáticas.
Podemos observar cómo el acceso a Internet tiene un efecto positivo en la obtención de puntajes más altos en matemáticas, según lo evidencian los diagramas de caja (boxplot). En comparación con los estudiantes que no tienen acceso a Internet, aquellos que sí lo tienen muestran límites inferiores y superiores más altos, incluso teniendo en cuenta los valores atípicos. Además, hay una menor dispersión en los datos, lo que sugiere que Internet desempeña un papel significativo en la mejora de los resultados académicos en matemáticas.
##
## Descriptive statistics by group
## group: -
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 22634 45.19 12.13 44 44.84 13.34 0 100 100 0.25 -0.39 0.08
## ------------------------------------------------------------
## group: No
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 201199 47.37 11.02 47 47.23 11.86 0 100 100 0.13 -0.28
## se
## X1 0.02
## ------------------------------------------------------------
## group: Si
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 314042 53.25 11.88 54 53.38 11.86 15 100 85 -0.05 -0.12
## se
## X1 0.02
En este sentido, es importante destacar que el acceso a internet es una de las herramientas que puede tener una gran influencia en el desempeño académico de los estudiantes. Al analizar los datos de los estudiantes que tienen acceso a internet y los que no, podemos destacar que la media de los estudiantes que tienen acceso es significativamente mayor, lo que sugiere que el acceso a internet puede ser un factor determinante en la obtención de mejores resultados académicos.
Además, es importante mencionar que ninguno de los estudiantes con acceso a internet obtuvo un puntaje inferior a 15 puntos, mientras que los estudiantes sin acceso sí presentaron casos atípicos de notas de 0. Esto sugiere que el acceso a internet puede ser una herramienta que ayuda a reducir las brechas académicas entre personas de menor estrato con las que más, ya que el acceso a internet puede proporcionar a los estudiantes una fuente de información y recursos educativos más amplia y diversa.
## Frequencies
## prueba_base_de_datos$COLE_AREA_UBICACION
## Type: Character
##
## Freq % Valid % Total
## ------------ -------- --------- ---------
## RURAL 85745 15.70 15.70
## URBANO 460467 84.30 84.30
## <NA> 0 0.00
## Total 546212 100.00 100.00
A pesar de que Colombia es principalmente un país agrícola, podemos observar que en la actualidad la mayoría de los colegios se encuentran ubicados en zonas rurales. Esta situación nos plantea dos posibles conclusiones, pero no podemos llegar a un veredicto definitivo debido a la falta de datos en nuestra base que permitan un análisis concluyente. Sin embargo, dos hipótesis podrían explicar por qué la mayoría de los colegios cuyos estudiantes presentan el ICFES se encuentran en zonas urbanas en lugar de rurales.
La primera hipótesis sugiere que el avance industrial y económico del país ha provocado la migración de las poblaciones a zonas urbanas, lo que ha llevado a la concentración de colegios en esas áreas. Este mayor desarrollo económico y social en las zonas urbanas podría brindar más oportunidades educativas para los estudiantes.
La segunda hipótesis plantea que la marginalidad que lamentablemente afecta a nuestros municipios rurales podría ser la causa de que la mayoría de las poblaciones en estas áreas no tengan acceso a la educación o que no existan suficientes instituciones educativas que ofrezcan un nivel académico de bachillerato. En este sentido, tanto la falta de acceso como la insuficiencia de instituciones podrían ser factores determinantes.
Durante el análisis, hemos observado una correlación entre una mayor capacidad económica y un mejor desempeño en el área de matemáticas. Sin embargo, es importante destacar que esta variable no es la única responsable, ya que las instituciones educativas ubicadas en zonas rurales y sus estudiantes suelen enfrentar desafíos relacionados con un menor nivel adquisitivo y acceso limitado a oportunidades educativas.
Al analizar el boxplot, podemos observar que los cuartiles y sus límites inferiores y superiores son más altos en los colegios urbanos. En contraste, los colegios rurales muestran límites inferiores más bajos en cada cuartil en comparación con los colegios urbanos. Aunque los datos de los colegios rurales presentan menos dispersión, el hecho de que los límites inferiores estén más bajos indica que los puntajes de los estudiantes en colegios rurales tienden a estar más concentrados en notas inferiores en comparación con los colegios urbanos.
Además, se observa en el boxplot que los puntajes en colegios rurales cercanos a 80 puntos o superiores son considerados datos atípicos, mientras que en los colegios urbanos, incluso puntajes un poco más altos que 80 puntos siguen siendo considerados datos típicos dentro de los cuartiles. Lo mismo ocurre en relación a los límites inferiores: en los colegios urbanos, es atípico que un estudiante tenga un puntaje igual o inferior a aproximadamente 17 puntos, mientras que en los colegios rurales, puntajes alrededor de los 15 puntos se consideran normales dentro de los cuartiles.
##
## Descriptive statistics by group
## group: RURAL
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 85745 46.54 11.41 46 46.3 11.86 0 100 100 0.22 -0.2 0.04
## ------------------------------------------------------------
## group: URBANO
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 460467 51.36 11.95 52 51.39 11.86 0 100 100 0.02 -0.22
## se
## X1 0.02
Para complementar el análisis realizado en el boxplot, realizaremos un estudio de la descripción estadística de los datos en R. Esto nos proporcionará una visión más completa de las diferencias entre los colegios rurales y urbanos en el área de matemáticas.
Al calcular la media de los puntajes en matemáticas, encontramos que un estudiante de colegio rural tiene una puntuación promedio de 46.54, mientras que un estudiante de colegio urbano tiene una puntuación promedio de 51.36. Esta diferencia de puntajes considerable refuerza aún más la idea de que la calidad de la educación en sectores rurales, al menos en el área de matemáticas, es inferior a la de los sectores urbanos.
Además, al examinar la desviación estándar de los puntajes en matemáticas, se observa que tanto los colegios rurales como los urbanos presentan una desviación estándar muy similar, siendo de 11.41 para los colegios rurales y 11.95 para los colegios urbanos. Esto indica que la variabilidad en los puntajes es relativamente similar en ambos tipos de colegios.
Es importante destacar que, a pesar de esta similitud en la variación de los datos, los colegios urbanos siguen demostrando una “superioridad” en términos de las notas obtenidas por sus estudiantes en las pruebas ICFES. Esto se evidencia en la diferencia en las medias de puntajes mencionada anteriormente. Los colegios urbanos muestran un rendimiento más consistente y en general obtienen mejores resultados en matemáticas en comparación con los colegios rurales, a pesar de la similitud en la dispersión de los puntajes.
Cabe mencionar que, aunque se han observado casos aislados de estudiantes de colegios urbanos con puntajes de 0 en matemáticas y estudiantes de colegios rurales con puntajes de 100, estos casos excepcionales requerirían un análisis individual más profundo para comprender las razones detrás de estas discrepancias y determinar si son representativos de un patrón generalizado.
Aunque se ha establecido que las capacidades intelectuales entre hombres y mujeres son iguales, hemos decidido realizar un análisis más detallado de esta variable en el marco de nuestro proyecto. Nuestra intención es explorar posibles datos interesantes que puedan surgir, ya sea en relación a las condiciones sociales asociadas a cada género o a la existencia de alguna predisposición hacia un mejor rendimiento en el área de matemáticas en uno de los géneros.
Este enfoque de análisis nos permitirá obtener una visión más completa de la diversidad y complejidad de los datos, así como de las posibles relaciones entre el género y otros factores relevantes en nuestro estudio. Comprendemos que existen múltiples influencias y variables que pueden afectar el rendimiento académico y las condiciones sociales, y es por eso que consideramos necesario incluir el análisis del género como parte de nuestra investigación.
Al explorar la posible relación entre el género y las condiciones sociales, buscamos descubrir si existen disparidades significativas en términos de acceso a recursos educativos, oportunidades laborales, niveles de ingresos u otros indicadores socioeconómicos relevantes. Estos hallazgos podrían aportar información valiosa sobre la igualdad de género y resaltar la importancia de abordar cualquier desigualdad existente.
Además, al examinar si hay alguna predisposición hacia un mejor rendimiento en el área de matemáticas en uno de los géneros, estamos interesados en comprender si existen diferencias en la forma en que hombres y mujeres se relacionan con esta materia. Si encontramos alguna evidencia de patrones consistentes, esto podría llevar a un mayor análisis sobre los factores subyacentes, como las expectativas sociales, las diferencias de oportunidades o incluso las habilidades cognitivas específicas.
## Frequencies
## prueba_base_de_datos$ESTU_GENERO
## Type: Character
##
## Freq % Valid % Total
## ----------- -------- --------- ---------
## - 121 0.022 0.022
## F 295994 54.190 54.190
## M 250097 45.788 45.788
## <NA> 0 0.000
## Total 546212 100.000 100.000
##
## Descriptive statistics by group
## group: -
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 121 51.6 11.6 52 51.63 11.86 27 80 53 -0.04 -0.6 1.05
## ------------------------------------------------------------
## group: F
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 295994 48.96 11.69 49 48.84 11.86 0 100 100 0.11 -0.27
## se
## X1 0.02
## ------------------------------------------------------------
## group: M
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 250097 52.56 12.06 53 52.66 11.86 0 100 100 -0.03 -0.16
## se
## X1 0.02
## Frequencies
## prueba_base_de_datos$ESTU_TIENEETNIA
## Type: Character
##
## Freq % Valid % Total
## ----------- -------- --------- ---------
## - 377 0.069 0.069
## No 506074 92.652 92.652
## Si 39761 7.279 7.279
## <NA> 0 0.000
## Total 546212 100.000 100.000
##
## Descriptive statistics by group
## group: -
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 377 52.04 12.08 51 51.87 11.86 19 100 81 0.18 0.05 0.62
## ------------------------------------------------------------
## group: No
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 506074 51.11 11.91 51 51.11 11.86 0 100 100 0.04 -0.22
## se
## X1 0.02
## ------------------------------------------------------------
## group: Si
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 39761 44.16 11.26 43 43.8 11.86 0 100 100 0.31 -0.18 0.06
Analizando la relación entre el estrato y el tipo de colegio, se puede observar que los colegios oficiales tienen una mayor cantidad de estudiantes que pertenecen a los estratos más bajos, específicamente los estratos 0, 1, 2 y 3. Sin embargo, se debe destacar que existe una población reducida de estudiantes de los estratos 4, 5 y 6, donde se encontró que los estudiantes de estrato 4 y 5 presentaron un mejor rendimiento en el área de matemáticas.
Esto sugiere que el hecho de que los colegios no oficiales tengan una población de estudiantes de mayor estrato puede ser un factor que contribuye a que estos colegios se perciban como superiores a los oficiales. No obstante, también se debe resaltar que existe una gran población de estudiantes de estratos 2 y 3 en los colegios no oficiales y una presencia moderada de estudiantes de estratos más bajos.
Es importante destacar que el hecho de que los colegios privados tengan una mejor financiación podría implicar que brinden un mejor servicio de educación. Sin embargo, debido a los datos analizados, no podemos afirmar con certeza si este es el caso. Por lo tanto, se requiere de más investigación y análisis para determinar cómo influye el financiamiento de los colegios en el rendimiento académico de los estudiantes.
la relación entre el tipo de colegio y la jornada es una de las variables más relevantes a la hora de analizar el desempeño en matemáticas de los estudiantes. En los datos se evidencia que la mayoría de los colegios no oficiales ofrecen jornadas completas y de mañana, las cuales fueron las que presentaron los mejores resultados en la prueba. Esto puede deberse a que los estudiantes que asisten a estas jornadas tienen una mayor disponibilidad de tiempo para dedicarse al estudio, tanto dentro como fuera de la institución.
Asimismo, es importante tener en cuenta que factores económicos pueden influir en el tipo de jornada que los estudiantes eligen. Aquellos que estudian por la noche o en jornadas sabatinas suelen hacerlo por motivos laborales.
Como se evidencia en los datos, el acceso a internet es un factor clave que influye en el desempeño académico de los estudiantes en matemáticas. En ese sentido, se puede observar que existe una clara relación entre el acceso a internet y el tipo de colegio al que asisten los estudiantes, siendo los colegios privados los que tienen un mayor porcentaje de estudiantes con acceso a internet.
Es importante destacar que el acceso a internet no solo se relaciona con el tipo de colegio, sino que también tiene una clara relación con el estrato socioeconómico. Como se mencionó previamente, los estudiantes de estratos más altos tienden a asistir a colegios privados, y esto se relaciona directamente con el acceso a internet, ya que estos estudiantes tienen una mayor probabilidad de contar con esta herramienta en sus hogares.
El acceso a internet puede tener un impacto significativo en el rendimiento académico, ya que los estudiantes pueden aprovechar esta herramienta para obtener información adicional, resolver dudas y trabajar en actividades interactivas y prácticas que les permitan reforzar sus conocimientos. En este sentido, es posible que los estudiantes que tienen acceso a internet tengan una mayor facilidad para comprender y aplicar los conceptos matemáticos.
Este análisis muestra la influencia que tanto la jornada como el estrato social tienen sobre el rendimiento académico de los estudiantes en el campo de las matemáticas. Podemos ver que los estudiantes con un estrato socioeconómico más alto tienen más probabilidades de estudiar en colegios privados con jornadas completas o de mañana, lo cual les proporciona más tiempo y herramientas para dedicarse al estudio de manera efectiva.
Es importante destacar que la disponibilidad de tiempo y herramientas no solo está limitada por el tipo de colegio y la jornada que se estudia, sino que también está influenciada por otros factores, como la disponibilidad de recursos económicos y tecnológicos en el hogar. Estos factores pueden tener un impacto significativo en el desempeño académico de un estudiante.
Como se observa en los datos, el acceso a internet es una variable que está directamente relacionada con el estrato socioeconómico de los estudiantes. Los resultados indican que los estudiantes de estratos bajos, especialmente los estratos 0 y 1, tienen menos acceso a internet en comparación con los estratos más altos. Esta situación se puede deber a que las personas de bajos recursos económicos no pueden permitirse la contratación de servicios de internet, lo que limita sus oportunidades educativas.
Por otro lado, se puede observar que los estudiantes de estratos 2 y 3 tienen en su mayoría acceso a internet, lo que sugiere que esta herramienta puede contribuir a reducir la brecha educativa y la desventaja económica. Además, como se demostró anteriormente, el acceso a internet puede influir significativamente en el desempeño académico, especialmente en el área de matemáticas.
Es importante resaltar que el acceso a internet no solo proporciona recursos educativos adicionales a los estudiantes, sino que también les brinda la posibilidad de comunicarse con sus profesores, compañeros de clase y acceder a información actualizada y relevante. Además, el acceso a internet puede ser una herramienta valiosa para la formación de habilidades digitales, que son cada vez más importantes en el mercado laboral actual.
Al analizar los diversos factores socioeconómicos que pueden afectar el rendimiento en matemáticas de los estudiantes en las pruebas ICFES, se puede concluir que existe una fuerte correlación entre el acceso a recursos y el éxito académico. El estrato, el tipo de colegio, la jornada y el acceso a internet son factores que pueden determinar la calidad y cantidad de recursos a los que un estudiante tiene acceso y, por lo tanto, su capacidad para mejorar en matemáticas.
Sin embargo, también se puede observar que las creencias comunes sobre la relación entre el estrato socioeconómico y el rendimiento académico no siempre son precisas. Los resultados indican que los estudiantes de estratos más bajos pueden tener éxito académico en matemáticas, siempre y cuando tengan acceso a los recursos necesarios para mejorar su aprendizaje.
Además, es importante destacar que la cantidad y calidad de tiempo que un estudiante dedica al estudio también es un factor clave en su desempeño en matemáticas. Por lo tanto, el fomento de hábitos de estudio efectivos y la creación de entornos de aprendizaje enriquecedores pueden ser igual de importantes que el acceso a recursos materiales.
Es importante destacar que el acceso a Internet puede ser una herramienta poderosa para reducir las brechas académicas entre estudiantes de diferentes estratos socioeconómicos. El acceso a la información y a recursos educativos en línea puede ayudar a los estudiantes a superar las limitaciones impuestas por la falta de recursos físicos y económicos. Por lo tanto, invertir en tecnología y en la promoción del acceso a Internet para todos los estudiantes puede ser una estrategia eficaz para mejorar el desempeño académico y reducir las desigualdades educativas en Colombia.