Presentación

Título MINERÍA DE DATOS EDUCATIVOS: Modelado de datos basado en procesamiento de lenguaje natural para el análisis de los factores, conceptos y competencias que influyen en el desempeño en las pruebas saber de los estudiantes de grado 11 de los colegios asociados a la fundación Jesús de la buena esperanza Malambo - Atlántico
Estudiantes Juan Jacob Moisés Daza Giraldo - Martin Jose Morales Jimenez
Asesor Jairo Andres Díaz Rodriguez
Seminario de Profundización II Proyecto Final de Profundización
Programa Maestría en estadística Aplicada
Institución Universidad del Norte, Barranquilla, Colombia.

Introducción

Objetivo General

Aplicar técnicas de minería de datos para inferir una estructura latente de tópicos, presente en las preguntas de las pruebas saber 11°que permita determinar los conceptos y habilidades que influyen en los desempeños y resultados de los estudiantes de la Fundación Jesús de la Buena Esperanza

Objetivos Específicos

  • Clasificar la información estadística referente a los resultados simulacros de exámenes de estado aplicados al grado 11 de las instituciones educativas de la Fundación Buena Esperanza.

  • Aplicar un modelado de tópicos para determinar los conceptos y habilidades más influyentes que se requieren desarrollar en los estudiantes para resolver una pregunta dada en las pruebas saber.

  • Transformar los datos en insight para extraer conclusiones que nos hablen de resolución, resultado y decisión, en aras a tomar las acciones más adecuadas para mejorar los resultados en las pruebas saber por parte de las instituciones educativas en estudio.

Planteamiento del problema

¿Cuáles son los conceptos y temáticas más influyentes que se requieren desarrollar en los estudiantes para resolver una pregunta dada en una prueba estandarizada, de tal forma que se puedan encontrar patrones que puedan relacionarse con el puntaje de los módulos de lectura crítica, ciencias sociales, competencias ciudadanas, matemáticas, ciencias naturales e inglés?

Metodología

Column

Modelado de tópicos

Diagrama de bloques LDA

Diagrama de bloques LDA

Datos

Tokenización

Stopwords

Homogenización

Diagnóstico del K(Número de tópicos)

Discusión y resultados

Column

Tópicos con probabilidad de ocurrencia

Tópico 1
Tópico 2
Tópico 3
Tópico 4
Tópico 5
Tópico 6
Tópico 7
Tópico 8
Tópico 9
Tópico 10
Palabra Prob Palabra Prob Palabra Prob Palabra Prob Palabra Prob Palabra Prob Palabra Prob Palabra Prob Palabra Prob Palabra Prob
producto 0.12 centro 0.13 punto 0.10 área 0.27 ecuación 0.13 correlación 0.10 raíz 0.11 decimal 0.13 polígono 0.16 típico 0.10
unidad 0.09 medida 0.08 ángulo 0.05 base 0.27 problema 0.13 graficar 0.06 distancia 0.11 medida 0.04 transformado 0.15 desviación 0.09
cantidad 0.07 plano 0.06 segmento 0.04 triangulo 0.07 solución 0.10 intervalo 0.05 calcular 0.08 porcentaje 0.04 eje 0.07 estándar 0.08
porcentaje 0.04 cartesiano 0.02 forma 0.04 altura 0.04 resolver 0.08 positiva 0.05 punto 0.05 probabilidad 0.04 cuadrante 0.05 dato 0.08
relativa 0.04 lado 0.02 eje 0.04 valor 0.01 medida 0.03 negativa 0.02 expresión 0.05 cantidad 0.02 perímetro 0.05 ajustado 0.05

Clasificación por preguntas

Gráfica

Clasificación de preguntas por tópico

Tópico Pregunta Probabilidad %Tópico
1 16 0.990 0.19
19 0.989
20 0.991
29 0.995
30 0.994
31 0.994
2 8 0.997 0.06
10 0.994
3 11 0.989 0.19
15 0.975
23 0.996
24 0.995
25 0.996
26 0.964
4 22 0.998 0.03
5 28 0.998
6 2 0.991 0.13
3 0.994
12 0.998
13 0.994
7 17 0.989 0.10
21 0.981
27 0.996
8 5 0.991
6 0.995
9 0.995
9 1 0.998 0.06
4 0.997
10 7 0.998 0.10
14 0.964
18 0.997

Valoración por tópicos

Gráfica

Nivel de dificultad de acuerdo al modelado

Tabla 1

Nivel de dificultad por Preguntas
Difícil Medio Facil
22 17, 21, 27, 7, 14 y 18 5, 6 y 9
11, 15, 23, 24, 25 y 26 8, 10 y 28
1 y 14 16, 19, 20, 29, 30, 31, 2, 3, 12, y 13

Tabla 2

Nivel de dificultad por Tópico
Difícil Medio Facil
4 7-10 8
9 2-5
3 1-6

Tabla 3

Nivel de dificultad por Conceptos
Difícil Medio Facil
Conceptos de área, base, triángulos y altura concepto de distancia, los términos raíz, desviación estándar Conceptos de medida, porcentaje, cantidad
trasformación de figuras en el plano cartesiano ubicación de una circunferencia en el plano cartesiano
Conceptos y aplicaciones de Ángulo, punto, segmento y forma Concepto de reconocimiento de los números expresados en diferentes contextos y correlación

Conclusiones

Column

Diagrama

Arquitectura de estrategias

Arquitectura de estrategias