#install.packages(“summarytools”) #install.packages(“ggplot2”)

library(“summarytools”) library(“ggplot2”)

1. Problema

El ICFES (Instituto Colombiano para la evaluación de la educación) es el organismo encargado de administrar el examen estandarizado que evalúa el desempeño académico de los estudiantes en Colombia. Este examen, conocido como el “ICFES”, se lleva a cabo semestralmente y es requisito para ingresar a las instituciones de educación de segundo nivel como el SENA, programas técnicos y universidades para obtener títulos certificados. El examen está dividido en seis áreas de conocimiento: matemáticas, ciencias naturales, lenguaje y competencias ciudadanas. Cada una de estas áreas se evalúa a través de preguntas de opción múltiple y preguntas abiertas que buscan medir la comprensión, análisis, síntesis y aplicación de los conceptos evaluados.

A través de la página de servicios e información del estado colombiano (www.gov.co), logramos obtener una base de datos gratuita del promedio de las ICFES (2019-2) discriminado por departamentos. Esta base de datos nos da la facilidad de acceder al resultado de más de 54 mil estudiantes, filtrados por género, estrato social, edad, municipio, entre otras variables. De acuerdo con lo anterior, se decidió tomar una muestra no representativa del valle del cauca para el proyecto de estadística aplicada.

El proyecto de estadística aplicada tiene como objetivo realizar inferencias de acuerdo con el comportamiento de Colombia en cuanto a los resultados del ICFES del periodo 2019-2 para el país; tomando como muestra al valle del cauca; para así llegar a un análisis de diferentes variables como el género, el puntaje en la prueba inglés y si pertenecen a un colegio bilingüe, entre otras.

Se plantea esta investigación debido a que se ha observado una variación significativa en los resultados obtenidos en los diferentes filtros, y se busca identificar las posibles causas detrás de estas diferencias.

El proyecto requerirá la recolección y análisis de información sobre el género de los estudiantes, si pertenecen a un colegio bilingüe y su puntaje en la prueba inglés. Una vez recopilados estos datos, se utilizarán técnicas estadísticas para analizar las diferencias en los resultados del ICFES 2019-2, con el fin de determinar en qué medida pueden influir los diferentes factores en el resultado de las pruebas.

2. Objetivo general

Realizar inferencias de acuerdo con el comportamiento de los estudiantes colombianos en cuanto a los resultados del ICFES del periodo 2019-2. Tomando como muestra el valle del cauca y así llegar a un análisis de diferentes variables.

3. Objetivos específicos

3.1 Analizar e interpretar los resultados del ICFES (2019-2) en función de la variable género.

3.2 Analizar la relación entre el desempeño en la prueba de inglés y la pertenencia a un colegio bilingüe, con el fin de determinar qué influencia puede tener el resultado de la prueba al haber recibido formación en un colegio bilingüe.

3.3 Determinar en qué medida un mayor puntaje en la prueba de inglés influye en el resultado del puntaje en la prueba global.

Variables

  1. Variable cuantitativa: Resultado ICFES

    Variable cualitativa: Género

  2. Variable cualitativa 1: Desempeño prueba ingles

    Variable cualitativa 2: Colegio bilingue

  3. Variable cuantitativa continua: Resultado inglés

    Variable cuantitativa continua: Puntaje Global

4. Metodología

4.1 Con el fin de comparar los resultados del ICFES según el género, se han seleccionado diferentes gráficos comparativos para evidenciar las diferencias en las distintas áreas y analizar las disparidades entre los géneros.

4.2 Para abordar el segundo objetivo planteado, que considera la relación entre el desempeño en la sección de inglés y la pertenencia a un colegio bilingüe, se utilizará un diagrama de barras compuesto. Este gráfico permitirá comparar el nivel de inglés de los examinados y visualizar la posible influencia de la formación en un colegio bilingüe en el puntaje del ICFES.

4.3 Con el propósito de abordar el último objetivo, se empleará un gráfico de dispersión para comparar los resultados entre la sección de inglés y el puntaje global. Se buscará identificar el tipo de relación existente entre ambas variables mediante el uso de una línea de tendencia.

5. Resultados

5.1

Gráfico #1: Puntaje Global Icfes 2019-2 vs. Genero

## New names:
## • `` -> `...18`
## • `` -> `...19`
## • `` -> `...20`
##   Género Cuartil_1 Mediana Cuartil_3 Máximo Mínimo
## 1      F       202     235       272    417      0
## 2      M       211     247       284    457     28

Tabla #1: Resumen estadístico del gráfico de cajas y bigotes

El gráfico de cajas y bigotes anterior tiene como objetivo comparar el género de las personas que realizaron la prueba ICFES 2019-2 con su puntaje global correspondiente. A través del gráfico, podemos visualizar las diferencias entre los puntajes de hombres y mujeres, y podemos concluir lo siguiente:

Como puntaje mínimo, los hombres obtuvieron 28 puntos, mientras que las mujeres obtuvieron 0 puntos. En cuanto al percentil 25, el 25% de los hombres tienen un puntaje igual o inferior a 211 puntos, mientras que las mujeres tienen un puntaje igual o inferior a 202 puntos. En el percentil 50, el 50% de los hombres tienen un puntaje superior a 247 puntos, mientras que el 50% de las mujeres tienen un puntaje superior a 235 puntos. En el percentil 75, el 75% de los hombres obtuvieron un puntaje igual o inferior a 284 puntos, mientras que el 75% de las mujeres obtuvieron un puntaje igual o inferior a 272 puntos. Por último, el puntaje máximo asignado a los hombres es de 457 puntos, mientras que para las mujeres es de 417 puntos.

Además, después de realizar los cálculos correspondientes, se obtienen los límites inferiores y superiores. Los límites inferiores son puntajes de 101.5 y 97 para hombres y mujeres, respectivamente, mientras que los límites superiores son puntajes de 393.5 y 377 para hombres y mujeres. Sin embargo, se observa la presencia de datos atípicos, que son valores que se encuentran fuera de estos límites y que pueden distorsionar el análisis estadístico y el modelo de predicción para valores futuros.

Asimismo, se puede observar que las cajas y bigotes de los resultados entre hombres y mujeres son simétricos, lo que indica que los datos están distribuidos de manera uniforme alrededor de la mediana (Q2).

En conclusión, con base en los resultados del puntaje global del ICFES 2019-2 según el género en el Valle del Cauca, el gráfico de cajas y bigotes no proporciona una medida de comparación exacta para determinar si el género influye en el puntaje global de la prueba. Por lo tanto, se utilizarán otros gráficos comparativos para analizar mejor ambas variables.

## New names:
## • `` -> `...18`
## • `` -> `...19`
## • `` -> `...20`

Gráfico #2: Polígono comparativo de frecuencia por género

En el gráfico de polígono de frecuencia por género, se puede observar la distribución de frecuencia en distintos intervalos en los que los datos están agrupados. A continuación, se describe la interpretación del gráfico:

El primer intervalo, que va desde 0 hasta 100 puntos, muestra una frecuencia de cero para ambos géneros, lo que significa que no se tienen datos en ese rango de puntajes.

En el segundo intervalo (100-200 puntos), se observa un aumento en la frecuencia de puntajes globales, y es notable que las mujeres tienen una frecuencia más alta que los hombres en esta categoría.

En el tercer intervalo (200-300 puntos), se alcanza la frecuencia máxima para ambos géneros, aproximadamente alrededor de los 250 puntos. A partir de este punto, la frecuencia comienza a disminuir.

En el intervalo final (400-500 puntos), se vuelve a una frecuencia relativa de cero, lo que indica que no se tienen datos en ese rango de puntajes.

Además, se menciona que el gráfico muestra una ligera asimetría positiva para ambos géneros, lo que significa que la mayoría de los datos están sesgados hacia el inicio de la gráfica.

En resumen, el gráfico de polígono de frecuencia por género proporciona una visualización de cómo se distribuyen los puntajes globales en distintos intervalos para hombres y mujeres. También se destaca la asimetría positiva en la distribución de los datos.

## New names:
## • `` -> `...18`
## • `` -> `...19`
## • `` -> `...20`

Gráfico #3: Ojiva de frecuencia relativa acumulada, por género

El gráfico presentado anteriormente representa una ojiva comparativa que muestra la diferencia en puntajes globales entre el género femenino y masculino, teniendo en cuenta la frecuencia relativa acumulada de cada género. A continuación, se proporciona una interpretación del gráfico:

Al observar el inicio de la ojiva, se puede notar que tanto el género femenino como el masculino tienen resultados similares. A partir del puntaje global de 150, se observa que la función de las mujeres crece con más rapidez, lo cual significa que hay una mayor cantidad de datos. La mayor pendiente, es decir, la mayor inclinación hacia la verticalidad, corresponde al intervalo con mayor concentración de datos.

A partir del gráfico se puede deducir directamente que el 25% de las mujeres obtuvieron un valor menor o igual a 200 puntos en la prueba ICFES. Asimismo, se observa que más del 25% de los hombres obtuvieron un puntaje ligeramente mayor que el 25% de las mujeres. Además, se puede leer en la gráfica que el 50% de los hombres obtuvieron un valor alrededor de 250 puntos en la prueba ICFES, y este valor es mayor que el puntaje logrado por el 50% de las mujeres.

Hay una mayor concentración de datos para las mujeres en los intervalos de 150 puntos hasta 300. Esto significa que hay más datos registrados de mujeres obteniendo puntajes entre 150 y 300 puntos que hombres.

Basándonos en los resultados mostrados en este gráfico, se puede concluir que existe una ligera diferencia en los resultados entre los géneros femenino y masculino. Las mujeres tienen una mayor concentración de puntajes en un intervalo (150-300), pero los hombres lograron obtener puntajes más altos que las mujeres en la prueba ICFES 2019-2 para el Valle del Cauca.

5.2

## New names:
## • `` -> `...18`
## • `` -> `...19`
## • `` -> `...20`

Gráfico #4: Desempeño en Inglés vs. Cantidad de estudiantes

En el gráfico de barras presentado anteriormente, se puede observar la relación entre el desempeño en la prueba de inglés y la pertenencia a un colegio bilingüe. A continuación, se proporciona una interpretación del gráfico:

En el eje x del gráfico se encuentran los niveles de inglés, que van desde el más bajo hasta el más alto. Cada barra del gráfico está clasificada para tener una distribución correcta de los datos. La barra de color azul representa a los estudiantes que pertenecen a un colegio bilingüe, la barra roja representa a los estudiantes que no pertenecen a un colegio bilingüe, y la barra amarilla representa a los estudiantes que no especifican si pertenecen o no a un colegio bilingüe. En el eje y se encuentra la cantidad de estudiantes participantes en la prueba.

Es notable que en cada nivel de inglés, desde el más bajo hasta el más alto, hay una falta de estudiantes provenientes de colegios bilingües. Esto se puede observar al ver las barras de color azul, siendo el nivel de inglés más bajo (A-) el que tiene la mayor cantidad de estudiantes (+15,000). A medida que se avanza en los niveles de inglés, se puede observar cómo la cantidad de estudiantes disminuye. Es decir, existe una tendencia de que a mayor nivel de inglés, menor cantidad de estudiantes de colegios no bilingües participan en la prueba.

Si se tienen en cuenta los tres primeros niveles de inglés, se puede evidenciar el alto número de estudiantes que no pertenecen a un colegio bilingüe, como se muestra en el gráfico de barras compuesto. Además, es importante destacar que en los dos niveles de inglés más altos no se observa una claridad en cuanto a si pertenecen o no a un colegio bilingüe, ya que sus barras no se muestran con mayor precisión que las barras de los tres primeros niveles de inglés. Esto se debe a que hay un número muy pequeño de personas que sí pertenecen a un colegio bilingüe.

En conclusión, se puede afirmar que la mayoría de los estudiantes que presentaron la prueba ICFES 2019-2 en el Valle del Cauca no pertenecen a un colegio bilingüe, lo cual tiene repercusiones en su nivel de desempeño en la prueba. Es muy probable que un gran porcentaje de los estudiantes que marcaron “No especifica” pertenezcan a colegios con un bajo desempeño en inglés, ya que los indicadores de nivel bajo son altos, mientras que hay muy pocos estudiantes que sí forman parte de un colegio que enseña inglés.

Considerando el objeto de estudio, que es la prueba ICFES 2019-2, se puede afirmar que existe una tendencia en los datos. Como se mencionó anteriormente, a menor desempeño en la prueba de inglés, mayor es la cantidad de estudiantes que pertenecen a colegios no bilingües.

5.3

## [1] 0.4331186

Gráfico #5:Puntaje Global vs. Puntaje Inglés

En el gráfico de dispersión presentado anteriormente, se muestra la relación entre el resultado de inglés y el puntaje global de los estudiantes que realizaron la prueba ICFES 2019-2 en el Valle del Cauca.

Observando el gráfico, es evidente que a medida que los estudiantes obtienen un resultado más alto en la prueba de inglés, también tienden a obtener un puntaje global más alto en la prueba. Sin embargo, debido a la gran variabilidad en los datos y a la dispersión de puntos en relación con la línea de tendencia, se puede observar que no existe una relación proporcional directa entre ambas variables.

Para tener una medida más clara de la correlación entre estas dos variables, se calculó el coeficiente de correlación (cor). Este coeficiente proporciona una medida de la fuerza y dirección de la relación entre dos variables. En este caso, al calcular el coeficiente de correlación, se obtuvo un valor de 0.4. Una correlación de 0.4 en una gráfica de dispersión indica una relación positiva moderada entre las dos variables que se están comparando. A medida que los valores de una variable aumentan, los valores de la otra variable tienden a aumentar también, pero no de manera perfectamente proporcional, no se puede asegurar que obtener un puntaje global alto garantice necesariamente un puntaje alto en la prueba de inglés, y viceversa.

En resumen, aunque existe una correlación positiva entre el resultado de inglés y el puntaje global en la prueba ICFES 2019-2, esta correlación es baja y no proporciona una relación proporcional clara entre ambas variables.

6. Conclusiones

Basándonos en el análisis de los resultados del ICFES 2019-2 para la muestra del Valle del Cauca y considerando los diferentes géneros, así como la relación entre el puntaje global y el puntaje de inglés, se pueden extraer las siguientes conclusiones:

En cuanto a los resultados promedio del ICFES 2019-2 según los diferentes géneros, se encontraron algunas diferencias. Se observaron variaciones en los puntajes obtenidos por hombres y mujeres, lo cual indica que el género puede tener cierta influencia en el resultado del puntaje global de la prueba.

Teniendo en cuenta la relación entre el puntaje global y el puntaje de inglés, se encontró una correlación positiva moderada entre ambas variables. Esto sugiere que existe una tendencia general de que los estudiantes que obtienen mejores resultados en la prueba de inglés también obtengan puntajes más altos en el puntaje global. Sin embargo, esta correlación no es lo suficientemente fuerte como para afirmar que el puntaje de inglés es el único factor determinante en el resultado de las pruebas.

Otro aspecto relevante al desempeño en la prueba de inglés es la influencia de la pertenencia a un colegio bilingüe. Se observó que la mayoría de los estudiantes que realizaron la prueba no pertenecen a un colegio bilingüe, lo que puede afectar su nivel de competencia en inglés y, por ende, su puntaje en la prueba. Esto sugiere que la formación desde un colegio bilingüe puede desempeñar un papel importante en el resultado de las pruebas de inglés.

En resumen, los resultados del ICFES 2019-2 indican que el género, la pertenencia a un colegio bilingüe y el desempeño en la prueba de inglés son variables relevantes a considerar. Aunque se encontraron diferencias según el género y una correlación positiva moderada entre el puntaje global y el puntaje de inglés, otros factores también pueden influir tanto en los resultados de las pruebas de inglés como en los resultados de la prueba general.En un estudio realizado por la Universidad Pedagógica y Tecnológica de Colombia en 2016, se identificaron algunos factores que influyen en los resultados de las pruebas estandarizadas como el ICFES [3]. Se destaca la influencia de los padres en el rendimiento académico de los hijos y las condiciones socioeconómicas externas de los estudiantes, las cuales impactan el acceso a recursos y formación. Asimismo, los factores institucionales, como el currículo y las políticas de planeación de las instituciones educativas, desempeñan un papel significativo. Además, es relevante considerar los aspectos socioeconómicos y educativos relacionados con el desempeño académico según el nivel de formación y género, así como el área de ubicación, donde generalmente se observa un mejor rendimiento en el área urbana. También es importante tener en cuenta el contexto, incluyendo la etnia, y su influencia en el rendimiento académico. Otros factores para considerar son la violencia entre estudiantes y los diferentes enfoques pedagógicos, los cuales pueden tener implicaciones en los resultados de las pruebas. Es necesario realizar un análisis más exhaustivo y considerar estos aspectos como los mencionados anteriormente, para comprender en mayor profundidad las variables que afectan el resultado de las pruebas de inglés en el contexto específico del ICFES 2019-2.

7. Referencias

[1]“PUNTAJE ICFES POR DEPARTAMENTO”, Datos Abiertos Colombia, 2020. Disponible:https://www.datos.gov.co/Educaci-n/PUNTAJE-ICFES-POR-DEPARTAMENTOS/x9vi-iv8c>

[2]RStudio Team, “RStudio Cloud”, Posit Cloud, 2019. Disponible en: https://rstudio.cloud/

[3]D. F. Meza , “Algunos factores que influyen en los resultados de las pruebas estandarizadas y censales”, Universidad Pedagógica y Tecnológica de Colombia, marzo de 2016, Disponible en: https://dialnet.unirioja.es/descarga/articulo/6064449.pdf

[4]A. Santana, C. N. Hernández, D. de Matemáticas, y ULPGC, “Gráficos en R: introducción”, Ulpgc.es. [En línea]. Disponible en: https://estadistica-dma.ulpgc.es/cursoR4ULPGC/9a-graf-Intro.html.