Preguntas:
1. Explicar el problema (Para la construcción del
problema puede apoyarse en responder las siguientes preguntas ¿Cuál es
el problema para analizar?, ¿Cuál es la importancia?).
2. Plantee un objetivo general y tres objetivos
específicos.
3. Clasificar las variables más
relevantes de la base de datos, especialmente aquellas relacionadas con
los objetivos y el problema planteado.
4. Realice
una primera exploración de la base para conocer su estado, es decir,
identificar la presencia de datos inconsistentes, datos faltantes,
etc.
Respuesta:
Punto 1
El problema consiste en averiguar como
las actividades y acciones que los estudiantes toman fuera del horario
de estudio afectan a las calificaciones en las distintas materias que
estan cursando.
Punto 2.
Objetivo
general: Analizar cómo las actividades extracurriculares y
acciones realizadas por los estudiantes fuera del horario de estudio
influyen en su desempeño académico en las distintas materias que
cursan.
Objetivos especificos:
1.Analizar la relación entre las horas de autoestudio
semanales y las calificaciones obtenidas en las materias escolares
2.Determinar si la realización de actividades
extracurriculares y trabajos de medio tiempo tienen un impacto positivo
o negativo en el rendimiento académico según el tipo de materia.
3.Identificar patrones en la carrera soñada de los
estudiantes con las notas finales de cada materia de
estudio
Punto 3
Realización de
actividades extracurriculares:
-Cualitativo
-Nominal
Realización de trabajo a medio tiempo:
-Cualitativo
-Nominal
Carrera aspiracional:
-Cualitativo
-Nomimal
Horas de autoestudio
semanales:
-Cuantitativo
-continua
Puntaje
de matematicas:
-Cuantitativo
-continua
Puntaje de Historia:
-Cuantitativo
-continua
Puntaje de fisica:
-Cuantitativo
-continua
Puntaje de quimica:
-Cuantitativo
-continua
Puntaje de biologia:
-Cuantitativo
-continua
Puntaje de ingles:
-Cuantitativo
-continua
Puntaje de
geografia:
-Cuantitativo
-continua
Punto 4:
Al momento de realizar una primera
exploración de la base de datos, pudimos encontrar algunas pequeñas
inconsistencias, por ejemplo, en la base de datos explorada existe una
variable denominada “dias de ausencia” el cual puede ser un factor muy
importante para ayudar a cumplir los objetivos, sin embargo, esta
variable no especifica el rango de los días, es decir, no se sabe si
esos días de falta se realizaron durante el año lectivo, durante el mes
o durante la semana, por lo que es una variable incompleta que no
podemos usar. por otra parte, en los datos de la variable de “carrera
aspiracional”, se repite mucho la carrera de “dueño de empresa” el cual
abarca muchas posibilidades, ya que ser dueño de una empresa no es una
carrera como tal, tambien aparece “desconocido” en alguno de los
estudiantes, dejando asi un espacio incompleto en las carreras, a su
vez, .
La tabla de datos se extrajo de la siguente seccion de la
pagina oficial de Kaggle: “https://www.kaggle.com/datasets/markmedhat/student-scores”