Preguntas:

1. Explicar el problema (Para la construcción del problema puede apoyarse en responder las siguientes preguntas ¿Cuál es el problema para analizar?, ¿Cuál es la importancia?).
2. Plantee un objetivo general y tres objetivos específicos.
3. Clasificar las variables más relevantes de la base de datos, especialmente aquellas relacionadas con los objetivos y el problema planteado.
4. Realice una primera exploración de la base para conocer su estado, es decir, identificar la presencia de datos inconsistentes, datos faltantes, etc.

Respuesta:

Punto 1
El problema consiste en averiguar como las actividades y acciones que los estudiantes toman fuera del horario de estudio afectan a las calificaciones en las distintas materias que estan cursando.

Punto 2.
Objetivo general: Analizar cómo las actividades extracurriculares y acciones realizadas por los estudiantes fuera del horario de estudio influyen en su desempeño académico en las distintas materias que cursan.
Objetivos especificos:
1.Analizar la relación entre las horas de autoestudio semanales y las calificaciones obtenidas en las materias escolares
2.Determinar si la realización de actividades extracurriculares y trabajos de medio tiempo tienen un impacto positivo o negativo en el rendimiento académico según el tipo de materia.
3.Identificar patrones en la carrera soñada de los estudiantes con las notas finales de cada materia de estudio

Punto 3
Realización de actividades extracurriculares:
-Cualitativo
-Nominal
Realización de trabajo a medio tiempo:
-Cualitativo
-Nominal
Carrera aspiracional:
-Cualitativo
-Nomimal
Horas de autoestudio semanales:
-Cuantitativo
-continua
Puntaje de matematicas:
-Cuantitativo
-continua
Puntaje de Historia:
-Cuantitativo
-continua
Puntaje de fisica:
-Cuantitativo
-continua
Puntaje de quimica:
-Cuantitativo
-continua
Puntaje de biologia:
-Cuantitativo
-continua
Puntaje de ingles:
-Cuantitativo
-continua
Puntaje de geografia:
-Cuantitativo
-continua

Punto 4:
Al momento de realizar una primera exploración de la base de datos, pudimos encontrar algunas pequeñas inconsistencias, por ejemplo, en la base de datos explorada existe una variable denominada “dias de ausencia” el cual puede ser un factor muy importante para ayudar a cumplir los objetivos, sin embargo, esta variable no especifica el rango de los días, es decir, no se sabe si esos días de falta se realizaron durante el año lectivo, durante el mes o durante la semana, por lo que es una variable incompleta que no podemos usar. por otra parte, en los datos de la variable de “carrera aspiracional”, se repite mucho la carrera de “dueño de empresa” el cual abarca muchas posibilidades, ya que ser dueño de una empresa no es una carrera como tal, tambien aparece “desconocido” en alguno de los estudiantes, dejando asi un espacio incompleto en las carreras, a su vez, .

La tabla de datos se extrajo de la siguente seccion de la pagina oficial de Kaggle: “https://www.kaggle.com/datasets/markmedhat/student-scores