Introducción

En este informe se presenta un análisis detallado de cómo las actividades extracurriculares y el trabajo a medio tiempo influyen en el rendimiento académico de los estudiantes. Se utilizaron datos de una base de Kaggle que contiene información sobre calificaciones, horas de autoestudio, participación en actividades extracurriculares y trabajo a medio tiempo, con 2.000 registros en una encuesta de la cual no especifica si son datos reales o simulados, pero para efectos de este análisis, se consideran reales y un comportamiento normal de una academia ubicada en California, Estados Unidos. A continuación, se presentan los resultados organizados por los tres objetivos específicos planteados en el Avance 1 de este proyecto.

Tabla inicial: Medias y desviaciones estándar generales por materia

# Cargar los datos
data <- read.csv(file.choose())  # Seleccionar el archivo CSV manualmente

# Calcular medias y desviaciones estándar generales por materia
general_stats <- data %>%
  summarise(
    mean_math = mean(math_score, na.rm = TRUE),
    sd_math = sd(math_score, na.rm = TRUE),
    mean_history = mean(history_score, na.rm = TRUE),
    sd_history = sd(history_score, na.rm = TRUE),
    mean_physics = mean(physics_score, na.rm = TRUE),
    sd_physics = sd(physics_score, na.rm = TRUE),
    mean_chemistry = mean(chemistry_score, na.rm = TRUE),
    sd_chemistry = sd(chemistry_score, na.rm = TRUE),
    mean_biology = mean(biology_score, na.rm = TRUE),
    sd_biology = sd(biology_score, na.rm = TRUE),
    mean_english = mean(english_score, na.rm = TRUE),
    sd_english = sd(english_score, na.rm = TRUE),
    mean_geography = mean(geography_score, na.rm = TRUE),
    sd_geography = sd(geography_score, na.rm = TRUE)
  )

# Mostrar la tabla con bordes usando kableExtra
general_stats %>%
  kable("html", caption = "Medias y desviaciones estándar generales por materia") %>%
  kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
Medias y desviaciones estándar generales por materia
mean_math sd_math mean_history sd_history mean_physics sd_physics mean_chemistry sd_chemistry mean_biology sd_biology mean_english sd_english mean_geography sd_geography
83.452 13.22491 80.332 12.73605 81.3365 12.53945 79.995 12.7779 79.5815 13.72219 81.2775 12.02709 80.888 11.6377

Interpretación de la Tabla inicial: La tabla muestra las medias y desviaciones estándar generales de las calificaciones en cada materia. Por ejemplo, en matemáticas, el promedio general es de 83.452 con una desviación estándar de 13.2249062. Estos valores servirán como punto de comparación para los análisis posteriores de cada objetivo específico.


Objetivo 1: Examinar la relación entre las horas semanales de autoestudio y las calificaciones obtenidas en cada materia, diferenciando entre áreas de conocimiento como ciencias, humanidades y lenguas.

En esta sección, se analizó cómo las horas de autoestudio se relacionan con las calificaciones en distintas materias. Para ello, se dividieron las horas de autoestudio en quintiles y se calcularon estadísticas básicas para cada materia.

Tabla 1: Estadísticas de calificaciones por quintiles de horas de autoestudio

# Crear quintiles de horas de autoestudio
data <- data %>%
  mutate(autoestudio_quintil = ntile(weekly_self_study_hours, 5))

# Calcular estadísticas por quintil
quintil_stats <- data %>%
  group_by(autoestudio_quintil) %>%
  summarise(
    mean_math = mean(math_score, na.rm = TRUE),
    sd_math = sd(math_score, na.rm = TRUE),
    mean_history = mean(history_score, na.rm = TRUE),
    sd_history = sd(history_score, na.rm = TRUE),
    mean_physics = mean(physics_score, na.rm = TRUE),
    sd_physics = sd(physics_score, na.rm = TRUE),
    mean_chemistry = mean(chemistry_score, na.rm = TRUE),
    sd_chemistry = sd(chemistry_score, na.rm = TRUE),
    mean_biology = mean(biology_score, na.rm = TRUE),
    sd_biology = sd(biology_score, na.rm = TRUE),
    mean_english = mean(english_score, na.rm = TRUE),
    sd_english = sd(english_score, na.rm = TRUE),
    mean_geography = mean(geography_score, na.rm = TRUE),
    sd_geography = sd(geography_score, na.rm = TRUE)
  )

# Mostrar la tabla con bordes
quintil_stats %>%
  kable("html", caption = "Estadísticas de calificaciones por quintiles de horas de autoestudio") %>%
  kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
Estadísticas de calificaciones por quintiles de horas de autoestudio
autoestudio_quintil mean_math sd_math mean_history sd_history mean_physics sd_physics mean_chemistry sd_chemistry mean_biology sd_biology mean_english sd_english mean_geography sd_geography
1 75.0325 17.014558 75.635 14.38503 78.3825 13.98912 77.7450 13.80549 77.0875 13.43582 77.3075 13.83370 79.810 11.57990
2 79.2075 14.164074 78.200 12.98775 80.1800 12.60853 77.7775 13.47412 78.4200 13.15699 79.6375 12.00798 79.535 11.46942
3 87.0925 9.710545 80.680 11.99530 80.7050 11.76687 79.7925 11.94387 78.3675 13.98038 81.6825 10.83329 80.220 11.48505
4 86.9525 9.294418 81.465 11.33534 81.6550 11.86499 80.4025 11.82074 79.6025 14.12048 82.3800 11.07258 79.850 11.71262
5 88.9750 7.756920 85.680 10.38833 85.7600 11.11987 84.2575 11.62127 84.4300 12.73895 85.3800 10.60314 85.025 11.05078

Interpretación de la Tabla 1: La tabla muestra que, a medida que aumenta el tiempo dedicado al autoestudio (de quintil 1 a quintil 5), las calificaciones en todas las materias tienden a mejorar, como comportamiento general. Por ejemplo, en matemáticas, el promedio pasa de 75.0325 en el quintil 1 a 88.975 en el quintil 5. Esto sugiere una relación directamente proporcional entre las horas de autoestudio y el rendimiento académico, por lo menos en el indicador específico de las notas obtenidas en cada materia. A continuación, se presentan gráficos que relacionan los resultados de cada quintil en Matemáticas, Física e Inglés

Gráfico 1: Relación entre horas de autoestudio y calificaciones en matemáticas

ggplot(data, aes(x = weekly_self_study_hours, y = math_score)) +
  geom_point(color = "blue", alpha = 0.5) +
  geom_smooth(method = "lm", color = "red") +
  labs(title = "Relación entre horas de autoestudio y calificaciones en matemáticas",
       x = "Horas de autoestudio",
       y = "Calificación en matemáticas")
## `geom_smooth()` using formula = 'y ~ x'

Discusión del Gráfico 1: El gráfico muestra una tendencia positiva entre las horas de autoestudio y las calificaciones en matemáticas. La línea de regresión (en rojo) indica que, en general, a mayor dedicación al autoestudio, mejores son las calificaciones en Matemáticas.

Gráfico 2: Relación entre horas de autoestudio y calificaciones en física

ggplot(data, aes(x = weekly_self_study_hours, y = physics_score)) +
  geom_point(color = "green", alpha = 0.5) +
  geom_smooth(method = "lm", color = "red") +
  labs(title = "Relación entre horas de autoestudio y calificaciones en física",
       x = "Horas de autoestudio",
       y = "Calificación en física")
## `geom_smooth()` using formula = 'y ~ x'

Discusión del Gráfico 2: Similar al gráfico anterior, este gráfico muestra una tendencia positiva entre las horas de autoestudio y las calificaciones en física. Esto sugiere que el autoestudio también tiene un impacto positivo en el rendimiento en Física.

Gráfico 3: Relación entre horas de autoestudio y calificaciones en inglés

ggplot(data, aes(x = weekly_self_study_hours, y = english_score)) +
  geom_point(color = "purple", alpha = 0.5) +
  geom_smooth(method = "lm", color = "red") +
  labs(title = "Relación entre horas de autoestudio y calificaciones en inglés",
       x = "Horas de autoestudio",
       y = "Calificación en inglés")
## `geom_smooth()` using formula = 'y ~ x'

Discusión del Gráfico 3: Este gráfico muestra una tendencia positiva entre las horas de autoestudio y las calificaciones en inglés, al igual que en los dos gráficos anteriores, y aunque la relación no es tan fuerte como en estas materias, sigue siendo significativa.

Gráfico 4: Distribución de calificaciones en matemáticas por quintil de horas de autoestudio

ggplot(data, aes(x = factor(autoestudio_quintil), y = math_score)) +
  geom_boxplot(fill = "orange") +
  labs(title = "Distribución de calificaciones en matemáticas por quintil de horas de autoestudio",
       x = "Quintil de horas de autoestudio",
       y = "Calificación en matemáticas")

Discusión del Gráfico 4: El gráfico muestra que los estudiantes en el quintil 5 (más horas de autoestudio) tienen calificaciones más altas en matemáticas que los del quintil 1. Esto respalda los resultados de la Tabla 1 y Gráfico 1.

Gráfico 5: Distribución de calificaciones en física por quintil de horas de autoestudio

ggplot(data, aes(x = factor(autoestudio_quintil), y = physics_score)) +
  geom_boxplot(fill = "lightblue") +
  labs(title = "Distribución de calificaciones en física por quintil de horas de autoestudio",
       x = "Quintil de horas de autoestudio",
       y = "Calificación en física")

Discusión del Gráfico 5: Similar al gráfico anterior, este gráfico muestra que los estudiantes en el quintil 5 tienen calificaciones más altas en física que los del quintil 1, respaldando el Gráfico 2.

Gráfico 6: Distribución de calificaciones en inglés por quintil de horas de autoestudio

ggplot(data, aes(x = factor(autoestudio_quintil), y = english_score)) +
  geom_boxplot(fill = "pink") +
  labs(title = "Distribución de calificaciones en inglés por quintil de horas de autoestudio",
       x = "Quintil de horas de autoestudio",
       y = "Calificación en inglés")

Discusión del Gráfico 6: Este gráfico muestra que los estudiantes en el quintil 5 tienen calificaciones más altas en inglés que los del quintil 1, aunque la diferencia no es tan pronunciada como en matemáticas o física, lo que respalda el análisis del Gráfico 3.

Discusión del Objetivo 1:

Como se pudo evidenciar en los análisis de la Tabla 1 y Gráficos de 1 a 6, se demuestra una relación directamente proporcional entre las horas de autoestudio y las calificaciones obtenidas en las distintas materias. Esto sirve como una introducción al análisis de los efectos que pueden tener actividades extracurriculares o trabajo a medio tiempo en las calificaciones, ya que estas actividades disminuyen el tiempo que tienen los estudiantes para decicarle al estudio por fuera del horario de actividades escolares.


Objetivo 2: Determinar si la realización de actividades extracurriculares y trabajos de medio tiempo tienen un impacto positivo o negativo en el rendimiento académico según el tipo de materia.

En esta sección, se analizó cómo la combinación de actividades extracurriculares y trabajo a medio tiempo afecta el rendimiento académico en distintas materias, teniendo en cuenta que en los datos, tanto para actividades extracurriculares como trabajo, la información es verdadera o falsa, unos valores binarios, de los cuales no se obtienen indicadores estadísticos como promedio o desviación estándar. Es por esto que se decidió separar la información en 4 posibles categorías, las combinaciones de verdadero y falso para estas variables. Teniendo esta separación se hizo el análisis estadístico de las calificaciones obtenidas.

Tabla 2: Medias de calificaciones por combinación de actividades extracurriculares y trabajo a medio tiempo

# Calcular medias por combinación de part_time_job y extracurricular_activities
combinacion_stats <- data %>%
  group_by(part_time_job, extracurricular_activities) %>%
  summarise(
    mean_math = mean(math_score, na.rm = TRUE),
    sd_math = sd(math_score, na.rm = TRUE),
    mean_history = mean(history_score, na.rm = TRUE),
    sd_history = sd(history_score, na.rm = TRUE),
    mean_physics = mean(physics_score, na.rm = TRUE),
    sd_physics = sd(physics_score, na.rm = TRUE),
    mean_chemistry = mean(chemistry_score, na.rm = TRUE),
    sd_chemistry = sd(chemistry_score, na.rm = TRUE),
    mean_biology = mean(biology_score, na.rm = TRUE),
    sd_biology = sd(biology_score, na.rm = TRUE),
    mean_english = mean(english_score, na.rm = TRUE),
    sd_english = sd(english_score, na.rm = TRUE),
    mean_geography = mean(geography_score, na.rm = TRUE),
    sd_geography = sd(geography_score, na.rm = TRUE)
  )
## `summarise()` has grouped output by 'part_time_job'. You can override using the
## `.groups` argument.
# Mostrar la tabla con bordes
combinacion_stats %>%
  kable("html", caption = "Medias de calificaciones por combinación de actividades extracurriculares y trabajo a medio tiempo") %>%
  kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
Medias de calificaciones por combinación de actividades extracurriculares y trabajo a medio tiempo
part_time_job extracurricular_activities mean_math sd_math mean_history sd_history mean_physics sd_physics mean_chemistry sd_chemistry mean_biology sd_biology mean_english sd_english mean_geography sd_geography
False False 84.81016 11.80969 80.77728 12.36426 82.09342 12.15911 80.51943 12.60522 79.60688 13.77355 81.89910 11.83618 81.38490 11.51464
False True 83.37283 13.13662 81.58382 12.14861 81.68497 12.17584 80.36994 12.47591 79.60116 13.23905 81.37861 11.47719 79.71098 11.63791
True False 78.51968 16.84355 77.48032 14.20424 77.72047 13.72588 77.35433 13.11730 79.88583 13.77310 78.13386 13.07495 79.77953 12.09999
True True 74.79032 17.43196 75.41935 14.89036 77.87097 14.57877 77.40323 15.21050 77.67742 15.17847 80.17742 12.83377 81.27419 11.85177

Interpretación de la Tabla 2: La tabla muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en todas las materias. Por ejemplo, en matemáticas, este grupo tiene un promedio de 74.7903226, mientras que los estudiantes que trabajan y no participan en actividades extracurriculares tienen un promedio de 83.3728324. Esto sugiere que las actividades extracurriculares tienen un impacto positivo en el rendimiento académico, mientras que el trabajo a medio tiempo puede tener un efecto negativo.

Gráfico 7: Calificaciones en matemáticas por combinación de actividades extracurriculares y trabajo a medio tiempo

ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = math_score)) +
  geom_boxplot(fill = "purple") +
  labs(title = "Calificaciones en matemáticas por combinación de actividades extracurriculares y trabajo a medio tiempo",
       x = "Combinación de actividades",
       y = "Calificación en matemáticas")

Discusión del Gráfico 7: El gráfico muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en matemáticas. Esto respalda los resultados de la Tabla 2.

Gráfico 8: Calificaciones en historia por combinación de actividades extracurriculares y trabajo a medio tiempo

ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = history_score)) +
  geom_boxplot(fill = "green") +
  labs(title = "Calificaciones en historia por combinación de actividades extracurriculares y trabajo a medio tiempo",
       x = "Combinación de actividades",
       y = "Calificación en historia")

Discusión del Gráfico 8: Similar al gráfico anterior, este gráfico muestra que las actividades extracurriculares tienen un impacto positivo en las calificaciones de historia, mientras que el trabajo a medio tiempo puede tener un efecto negativo.

Gráfico 9: Calificaciones en geografía por combinación de actividades extracurriculares y trabajo a medio tiempo

ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = geography_score)) +
  geom_boxplot(fill = "yellow") +
  labs(title = "Calificaciones en geografía por combinación de actividades extracurriculares y trabajo a medio tiempo",
       x = "Combinación de actividades",
       y = "Calificación en geografía")

Discusión del Gráfico 9: Este gráfico muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en geografía. Esto respalda los resultados de la Tabla 2.

Gráfico 10: Calificaciones en química por combinación de actividades extracurriculares y trabajo a medio tiempo

ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = chemistry_score)) +
  geom_boxplot(fill = "lightblue") +
  labs(title = "Calificaciones en química por combinación de actividades extracurriculares y trabajo a medio tiempo",
       x = "Combinación de actividades",
       y = "Calificación en química")

Discusión del Gráfico 10: Similar a los gráficos anteriores, este gráfico muestra que las actividades extracurriculares tienen un impacto positivo en las calificaciones de química, mientras que el trabajo a medio tiempo puede tener un efecto negativo.

Gráfico 11: Calificaciones en biología por combinación de actividades extracurriculares y trabajo a medio tiempo

ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = biology_score)) +
  geom_boxplot(fill = "pink") +
  labs(title = "Calificaciones en biología por combinación de actividades extracurriculares y trabajo a medio tiempo",
       x = "Combinación de actividades",
       y = "Calificación en biología")

Discusión del Gráfico 11: Este gráfico muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en biología. Esto respalda los resultados de la Tabla 2.

Discusión del Objetivo 2:

Como se pudo evidenciar en los análisis de la Tabla 2 y Gráficos de 7 a 11, se demuestra una relación entre las actividades extracurriculares y trabajo con las calificaciones de los estudiantes en diferentes materias, indicando, en términos generales, que la realización de estas actividades tienen un impacto negativo en las notas, respaldando el análisis realizado en el Objetivo 1, en dónde se asumió que las actividades disminuyen el tiempo libre disponible de cada estudiante para estudiar y aumentar las calificaciones obtenidas.


Objetivo 3: Analizar cómo las aspiraciones profesionales de los estudiantes, agrupadas en áreas como humanidades y artes, entre otras, se relacionan con sus calificaciones en distintas materias.

En esta sección, se analizó cómo las aspiraciones profesionales de los estudiantes se relacionan con sus calificaciones en distintas materias, teniendo en cuenta la variable de carrera aspirada, en la cual hay 17 diferentes respuestas, las cuales se decidieron estudiar separadas en el análisis inicial, para agruparlas en los indicadores estadísticos de las tablas y gráficos.

Tabla 3: Medias de calificaciones por carrera aspiracional

# Calcular medias por carrera aspiracional
carrera_stats <- data %>%
  group_by(career_aspiration) %>%
  summarise(
    mean_math = mean(math_score, na.rm = TRUE),
    sd_math = sd(math_score, na.rm = TRUE),
    mean_history = mean(history_score, na.rm = TRUE),
    sd_history = sd(history_score, na.rm = TRUE),
    mean_physics = mean(physics_score, na.rm = TRUE),
    sd_physics = sd(physics_score, na.rm = TRUE),
    mean_chemistry = mean(chemistry_score, na.rm = TRUE),
    sd_chemistry = sd(chemistry_score, na.rm = TRUE),
    mean_biology = mean(biology_score, na.rm = TRUE),
    sd_biology = sd(biology_score, na.rm = TRUE),
    mean_english = mean(english_score, na.rm = TRUE),
    sd_english = sd(english_score, na.rm = TRUE),
    mean_geography = mean(geography_score, na.rm = TRUE),
    sd_geography = sd(geography_score, na.rm = TRUE)
  )

# Mostrar la tabla con bordes
carrera_stats %>%
  kable("html", caption = "Medias de calificaciones por carrera aspiracional") %>%
  kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
Medias de calificaciones por carrera aspiracional
career_aspiration mean_math sd_math mean_history sd_history mean_physics sd_physics mean_chemistry sd_chemistry mean_biology sd_biology mean_english sd_english mean_geography sd_geography
Accountant 87.35714 7.885647 79.66667 11.550238 81.43651 12.163221 81.32540 10.905286 65.68254 20.858629 78.94444 10.674310 80.01587 11.213552
Artist 80.11940 12.136250 81.10448 11.978686 80.04478 11.343711 81.11940 12.377304 82.00000 11.873066 78.58209 11.995137 81.68657 10.951974
Banker 87.08284 7.527268 81.20710 11.874280 79.16568 11.305119 79.18935 12.294487 79.39053 12.294556 86.82249 7.406028 80.22485 12.163435
Business Owner 69.64401 17.626062 73.08091 15.643240 74.36893 14.380717 74.65049 14.793410 74.42718 13.942089 75.13269 14.545892 80.08091 11.626070
Construction Engineer 89.72059 5.896737 80.98529 12.448692 90.58824 6.253919 78.61765 12.983376 83.16176 11.751926 81.05882 12.070542 80.16176 11.559851
Designer 82.35714 11.429513 78.73214 11.614241 82.82143 11.758335 79.76786 12.707895 85.58929 8.078651 82.28571 10.442421 85.28571 9.068856
Doctor 92.02521 5.401604 86.73109 10.091696 91.97479 5.674000 91.74790 5.222537 92.52941 4.869176 85.17647 10.827341 87.56303 9.952973
Game Developer 89.95238 6.284719 76.92063 12.239942 91.01587 5.771152 78.74603 11.712921 79.28571 11.048907 79.30159 11.630931 77.26984 11.678774
Government Officer 80.65574 11.494760 83.75410 10.254520 80.37705 12.062565 79.22951 11.572083 80.91803 11.374379 82.42623 11.033976 79.11475 11.284353
Lawyer 86.03623 9.134365 89.18841 5.644648 80.27536 12.267557 80.43478 11.843232 81.84783 12.370144 89.64493 5.985141 81.67391 11.383919
Real Estate Developer 76.42169 15.239647 80.04819 11.523998 81.73494 12.207639 80.08434 12.588424 78.60241 12.690442 77.96386 11.822308 80.59036 10.270769
Scientist 87.66667 7.266844 79.30769 12.471344 91.89744 5.820991 91.07692 5.810085 88.92308 6.166056 81.82051 11.984358 84.35897 9.726489
Software Engineer 92.14603 4.603821 81.35556 11.963610 81.14921 11.616481 79.84444 12.035692 79.72063 11.606529 80.86667 11.410466 80.42222 11.828774
Stock Investor 88.10959 7.463916 80.35616 11.256319 80.01370 11.687473 80.82192 11.930752 81.01370 13.127043 79.75342 12.146994 80.19178 12.242523
Teacher 78.59322 11.871610 79.11864 12.833261 79.96610 12.022918 80.08475 13.292840 79.62712 11.999854 85.38983 8.111331 81.45763 11.282153
Unknown 79.84305 12.368863 79.71300 11.834754 80.94619 11.990115 79.07175 12.305212 80.63677 12.032909 79.76682 11.677320 79.17489 12.337626
Writer 78.31250 10.798559 84.75000 9.486833 84.12500 11.891309 82.03125 11.969004 81.09375 12.817225 94.37500 3.087436 83.68750 11.374668

Interpretación de la Tabla 3: La tabla muestra que los estudiantes que aspiran a carreras en ciencias (como “Doctor” o “Ingeniero de Software”) tienden a tener calificaciones más altas en matemáticas y física, mientras que los que aspiran a carreras en humanidades (como “Artista” o “Abogado”) tienen calificaciones más altas en historia e inglés. Esto sugiere que las aspiraciones profesionales están relacionadas con el desempeño en áreas específicas.

Gráfico 12: Calificaciones en matemáticas por carrera aspiracional

ggplot(data, aes(x = career_aspiration, y = math_score)) +
  geom_boxplot(fill = "yellow") +
  labs(title = "Calificaciones en matemáticas por carrera aspiracional",
       x = "Carrera aspiracional",
       y = "Calificación en matemáticas") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Discusión del Gráfico 12: El gráfico muestra que los estudiantes que aspiran a carreras en ciencias (como “Doctor” o “Ingeniero de Software”) tienen las calificaciones más altas en matemáticas, mientras que los que aspiran a carreras en humanidades (como “Artista”) tienen calificaciones más bajas, lo que respalda gráficamente el análisis de la Tabla 3.

Gráfico 13: Calificaciones en historia por carrera aspiracional

ggplot(data, aes(x = career_aspiration, y = history_score)) +
  geom_boxplot(fill = "pink") +
  labs(title = "Calificaciones en historia por carrera aspiracional",
       x = "Carrera aspiracional",
       y = "Calificación en historia") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Discusión del Gráfico 13: Similar al gráfico anterior, este gráfico muestra que los estudiantes que aspiran a carreras en humanidades (como “Abogado”) tienen las calificaciones más altas en historia, aunque se evidencian menos patrones de comportamiento asociados a “tipos” de carrera, como el hecho de que las personas que quieren ser dueñas de negocios tienen el promedio más bajo de la materia, considerando que esta no es una carrera que se pueda agrupar en ciencias o campos similares.

Gráfico 14: Calificaciones en geografía por carrera aspiracional

ggplot(data, aes(x = career_aspiration, y = geography_score)) +
  geom_boxplot(fill = "lightgreen") +
  labs(title = "Calificaciones en geografía por carrera aspiracional",
       x = "Carrera aspiracional",
       y = "Calificación en geografía") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Discusión del Gráfico 14: Este gráfico muestra que los estudiantes que aspiran a carreras en ciencias sociales (como “Abogado”) tienen las calificaciones más altas en geografía. Adicionalmente, muestra que el comportamiento no es igual que en la materia de Historia, aunque suelan ser dos materias relacionadas entre sí, con la creencia de que las calificaciones de ambas materias van a ser similares en las mismas personas.

Gráfico 15: Calificaciones en física por carrera aspiracional

ggplot(data, aes(x = career_aspiration, y = physics_score)) +
  geom_boxplot(fill = "lightblue") +
  labs(title = "Calificaciones en física por carrera aspiracional",
       x = "Carrera aspiracional",
       y = "Calificación en física") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Discusión del Gráfico 15: Este gráfico muestra que los estudiantes que aspiran a carreras en ciencias (como “Doctor” o “Ingeniero de Software”) tienen las calificaciones más altas en física, mostrando un comportamiento similar a Matemáticas.

Discusión del Objetivo 3:

Como se pudo evidenciar en los análisis de la Tabla 3 y Gráficos de 12 a 15, se demuestra una relación entre las aspiraciones profesionales y las notas obtenidas por los estudiantes en las diferentes materias. En general, se puede ver que los estudiantes tienden a obtener mejores resultados en materias relaciondas a la carrera a la que aspiran.Sin embargo, en la carrera en la cual hay mayor frecuencia, “Dueño de negocios”, se nota una mayor variabilidad, junto con una media de nota inferior en la mayoría de las materias, lo que lleva a pensar que los estudiantes que tienen esta aspiración profesional no le dedican suficiente tiempo de estudio a las materias.


Conclusión

En este informe, se analizó cómo las actividades extracurriculares, el trabajo a medio tiempo y las aspiraciones profesionales influyen en el rendimiento académico de los estudiantes. Los resultados sugieren que las horas de autoestudio tienen un impacto positivo en las calificaciones, mientras que el trabajo a medio tiempo o actividades extracurriculares pueden tener un efecto negativo, aunque en estas segundas el comportamiento no es tan claro. Además, las aspiraciones profesionales están relacionadas con el desempeño en áreas específicas. Estos hallazgos pueden ser útiles para diseñar políticas educativas que fomenten un equilibrio adecuado entre el estudio y otras actividades, así como incentivos para que los estudiantes se comiencen a enfocar en las materias que más relevancia van a tener en su carrera profesional, sin descuidar los posibles buenos resultados en todas las materias.