Introducción

El MEN (2016) define la educación como un proceso de formación permanente, personal cultural y social que se fundamenta en una concepción integral de la persona humana, de su dignidad, de sus derechos y de sus deberes. Las características educativas en Colombia y el desarrollo económico, político, social y cultural, permiten que la calidad educativa tenga excelentes perspectivas; aunque la educación actualmente no ha desarrollado el potencial requerido, y su futuro dependerá de la voluntad y empeño en que avancen en el proceso de su modernización. La educación debe estar apuntada a la construcción de una sociedad más equitativa, basada en la equidad y la solidaridad. En este orden de ideas, se entiende que la educación desde el punto de vista critico es una plataforma que permite la transformación social a partir de cuestionar las dinámicas políticas de determinada sociedad, puesto que esta misma influye de manera determinante en las desigualdades y fruto de esto es la fragmentación social. Uno de los objetivos de la educación s enfrentar la condición del subdesarrollo, los efectos que produce sobre los individuos sobre sus relaciones, enfocando de manera directa la cuestión del poder y las posibilidades de transformación de las situaciones de desigualdad e injusticia.

A lo anterior nace la discusión sobre la parametrización de las pruebas saber, dichas se encuentran estandarizadas, midiendo la población juvenil que se encuentra a portas de culminar sus estudios secundarios y su futuro estará marcado según el puntaje que obtengan en la prueba saber PRO, ya que estas no relacionan el contexto de muchos jóvenes, presentando desventaja la población rural y la urbana que se ubican en los estratos 1 y 2. Por ello, centramos el presente trabajo en realizar un análisis de los puntajes obtenidos en el 2023.

Planteamiento del problema

La Institución Educativa El Limonar se encuentra en la comuna 6 de Neiva, por ende sus estudiantes se encuentran en los estratos 1 y 2. En los últimos tres años la Institución Educativa se ha ubicado el puesto 20 según el ranking del ICFES de los colegios públicos de la ciudad con un puntaje de índice total de 0,6773, ubicándose en el último escalón de la categoría B. Por ello, decidimos tomar los puntajes obtenidos en el año 2023 por los estudiantes de ambas jornadas, en donde se clasificará la población con sus puntajes por género, para luego realizar su respectivo análisis.

Metodología

Para el presente trabajo de investigación se tendrá en cuenta el enfoque cuantitativo, en el cual se realizará el estudio del análisis estadístico de los resultados obtenidos por los estudiantes de la jornada mañana como de la jornada tarde de la Institución Educativa El Limonar de la ciudad de Neiva. En dicho estudio se observarán los datos y se hará un análisis comparativo según el género y así mismo poder determinar si existen diferencias significativas, dicha información será suministrada de la página PRISMA del ICFES.

Población

Se tendrá en cuenta los 59 estudiantes distribuidos de la siguiente forma: 31 hombres y 28 mujeres de los grados once de las jornadas mañana y tarde de la Institución Educativa El Limonar de la ciudad de Neiva.

Hipótesis

H_0= No existen diferencias significativas en el promedio de los puntajes obtenidos en la prueba saber PRO 2023 según el género.

H_a= Existen diferencias significativas en el promedio de los puntajes obtenidos en la prueba saber PRO 2023 según el género.

Descripción de los datos

La base de datos que se va trabajar son los puntajes Saber PRO 2023 de la Institución Educativa El Limonar de Neiva. La siguiente línea muestra cómo se importa dicha información:

# Importar base de datos

BD <- read.delim("C:\\Users\\Usuario\\Documents\\Pruebas Saber PRO I.E. El Limonar Neiva.txt", comment.char="#", header = TRUE)
names(BD)
## [1] "HOMBRES"         "PUNTAJEGLOBAL_H" "MUJERES"         "PUNTAJEGLOBAL_M"

Como se puede ver la Base de Datos consta de 4 variables: Género (“Hombres”, “Mujeres”) y Puntajes Saber PRO (“Puntaje Global_H”, Puntaje Global_M).

# Puntaje total género masculino
PUNTAJESH <- BD$PUNTAJEGLOBAL_H; 
PUNTAJESH
##  [1] 286 307 250 265 241 272 205 342 278 273 312 222 297 177 228 190 332 295 278
## [20] 266 273 260 253 247 257 225 260 250 198 256 292

Se muestran 31 observaciones que corresponden a los puntajes totales de las pruebas saber PRO del género masculino.

# Puntaje total género femenino
PUNTAJESM <- BD$PUNTAJEGLOBAL_M 
PUNTAJESM
##  [1] 213 300 244 255 275 198 238 213 284 203 256 251 301 163 263 194 292 250 233
## [20] 304 248 285 291 198 163 185 205 257  NA  NA  NA

Se muestran 28 observaciones que corresponden a los puntajes totales de las pruebas saber PRO del género femenino.

Medidas de resúmen

summary(BD)
##     HOMBRES     PUNTAJEGLOBAL_H    MUJERES      PUNTAJEGLOBAL_M
##  Min.   : 1.0   Min.   :177.0   Min.   : 1.00   Min.   :163.0  
##  1st Qu.: 8.5   1st Qu.:244.0   1st Qu.: 7.75   1st Qu.:204.5  
##  Median :16.0   Median :260.0   Median :14.50   Median :249.0  
##  Mean   :16.0   Mean   :260.9   Mean   :14.50   Mean   :241.5  
##  3rd Qu.:23.5   3rd Qu.:282.0   3rd Qu.:21.25   3rd Qu.:277.2  
##  Max.   :31.0   Max.   :342.0   Max.   :28.00   Max.   :304.0  
##                                 NA's   :3       NA's   :3

Se presenta un resumen descriptivo de las variables en donde se arrojan las medias de 260.9 para los hombres y 241.5 para las mujeres.

Pruebas de normalidad

Gráfico Q-Q plot

En estadística, un gráfico de Q-Q (quantile-quantile) es un gráfico de probabilidad que consiste en un método gráfico para comparar dos distribuciones de probabilidad al trazar sus cuantiles uno contra el otro.En este caso, lo ideal es que los puntos se acerquen a una recta diagonal.

A continuación presentamos la prueba gráfica Q-Q plot de validación de normalidad para cada una de los géneros.

# Q-Q Plot puntajes globales Hombres

H<-qqnorm(BD$PUNTAJEGLOBAL_H, 
       main = "Puntajes Hombres pruebas Saber PRO 2023 I.E. El Limonar")
qqline(BD$PUNTAJEGLOBAL_H, col = 2)

# Q-Q Plot Puntajes Globales mujeres

M<-qqnorm(BD$PUNTAJEGLOBAL_M, 
       main = "Puntajes Mujeres pruebas Saber PRO 2023 I.E. El Limonar")
qqline(BD$PUNTAJEGLOBAL_M, col = 2)

Los puntos del Q-Q plot en ambos gráficos se ajustan aproximadamente a la línea diagonal, por lo tanto los puntajes siguen una distribución normal.

Test de normalidad (Shapiro-Wilk)

En este caso, la hipótesis nula del test Shapiro-Wilk es que la población representa una distribución normal.

# Prueba de Shapiro-Wilk Hombres

shapiro.test(PUNTAJESH)
## 
##  Shapiro-Wilk normality test
## 
## data:  PUNTAJESH
## W = 0.98393, p-value = 0.9101
# Prueba de Shapiro-Wilk Mujeres
shapiro.test(PUNTAJESM)
## 
##  Shapiro-Wilk normality test
## 
## data:  PUNTAJESM
## W = 0.9496, p-value = 0.1936

Por lo tanto, el p-value = 0.9101 del género masculino y el p-value = 0.1936 del género femenino son mayores al nivel de significancia (p > 0.05), en consecuencia no se rechaza la hipótesis nula de normalidad.

Análisis de normalidad por métodos gráficos

Histogramas

par(mfrow = c(1, 2))
hist(BD$PUNTAJEGLOBAL_H, main = "Puntajes Saber PRO Hombres", col = "lightblue", border = "blue")
hist(BD$PUNTAJEGLOBAL_M, main = "Puntajes Saber PRO Mujeres", col = "pink", border = "red")

Los histogramas muestran una distribución normal de los datos.

Prueba de hipótesis

Después de realizar la prueba Shapiro-Wilk en la que nos muestra que los datos presentan una distribución normal, a lo anterior se realiza la prueba de hipótesis paramétrica empleando el t de Student con el fin de comparar las medias.

Paramétricas - Prueba t de Student

# Prueba t de dos muestras
Resultado_Pruebas <- t.test(PUNTAJESH, PUNTAJESM)
print(Resultado_Pruebas)
## 
##  Welch Two Sample t-test
## 
## data:  PUNTAJESH and PUNTAJESM
## t = 1.8267, df = 55.135, p-value = 0.07316
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.879381 40.621316
## sample estimates:
## mean of x mean of y 
##   260.871   241.500

En la prueba t de student de los dos géneros sugiere que no hay una diferencia significativa en los puntajes totales de las pruebas Saber PRO 2023, con un intervalo de confianza del 95% para la diferencia de medias que no incluye cero. El valor p-value = 0.07316 indica una fuerte evidencia a favor de la hipótesis nula de que las medias son iguales.

Conclusiones

Recomendaciones

Referncias