En este informe se presenta un análisis detallado de cómo las actividades extracurriculares y el trabajo a medio tiempo influyen en el rendimiento académico de los estudiantes. Se utilizaron datos de una base de Kaggle que contiene información sobre calificaciones, horas de autoestudio, participación en actividades extracurriculares y trabajo a medio tiempo, con 2.000 registros en una encuesta de la cual no especifica si son datos reales o simulados, pero para efectos de este análisis, se consideran reales y un comportamiento normal de una academia ubicada en California, Estados Unidos. A continuación, se presentan los resultados organizados por los tres objetivos específicos planteados en el Avance 1 de este proyecto.
# Cargar los datos
data <- read.csv(file.choose()) # Seleccionar el archivo CSV manualmente
# Calcular medias y desviaciones estándar generales por materia
general_stats <- data %>%
summarise(
mean_math = mean(math_score, na.rm = TRUE),
sd_math = sd(math_score, na.rm = TRUE),
mean_history = mean(history_score, na.rm = TRUE),
sd_history = sd(history_score, na.rm = TRUE),
mean_physics = mean(physics_score, na.rm = TRUE),
sd_physics = sd(physics_score, na.rm = TRUE),
mean_chemistry = mean(chemistry_score, na.rm = TRUE),
sd_chemistry = sd(chemistry_score, na.rm = TRUE),
mean_biology = mean(biology_score, na.rm = TRUE),
sd_biology = sd(biology_score, na.rm = TRUE),
mean_english = mean(english_score, na.rm = TRUE),
sd_english = sd(english_score, na.rm = TRUE),
mean_geography = mean(geography_score, na.rm = TRUE),
sd_geography = sd(geography_score, na.rm = TRUE)
)
# Mostrar la tabla con bordes usando kableExtra
general_stats %>%
kable("html", caption = "Medias y desviaciones estándar generales por materia") %>%
kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
| mean_math | sd_math | mean_history | sd_history | mean_physics | sd_physics | mean_chemistry | sd_chemistry | mean_biology | sd_biology | mean_english | sd_english | mean_geography | sd_geography |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 83.452 | 13.22491 | 80.332 | 12.73605 | 81.3365 | 12.53945 | 79.995 | 12.7779 | 79.5815 | 13.72219 | 81.2775 | 12.02709 | 80.888 | 11.6377 |
Interpretación de la Tabla inicial: La tabla muestra las medias y desviaciones estándar generales de las calificaciones en cada materia. Por ejemplo, en matemáticas, el promedio general es de 83.452 con una desviación estándar de 13.2249062. Estos valores servirán como punto de comparación para los análisis posteriores de cada objetivo específico.
En esta sección, se analizó cómo las horas de autoestudio se relacionan con las calificaciones en distintas materias. Para ello, se dividieron las horas de autoestudio en quintiles y se calcularon estadísticas básicas para cada materia.
# Crear quintiles de horas de autoestudio
data <- data %>%
mutate(autoestudio_quintil = ntile(weekly_self_study_hours, 5))
# Calcular estadísticas por quintil
quintil_stats <- data %>%
group_by(autoestudio_quintil) %>%
summarise(
mean_math = mean(math_score, na.rm = TRUE),
sd_math = sd(math_score, na.rm = TRUE),
mean_history = mean(history_score, na.rm = TRUE),
sd_history = sd(history_score, na.rm = TRUE),
mean_physics = mean(physics_score, na.rm = TRUE),
sd_physics = sd(physics_score, na.rm = TRUE),
mean_chemistry = mean(chemistry_score, na.rm = TRUE),
sd_chemistry = sd(chemistry_score, na.rm = TRUE),
mean_biology = mean(biology_score, na.rm = TRUE),
sd_biology = sd(biology_score, na.rm = TRUE),
mean_english = mean(english_score, na.rm = TRUE),
sd_english = sd(english_score, na.rm = TRUE),
mean_geography = mean(geography_score, na.rm = TRUE),
sd_geography = sd(geography_score, na.rm = TRUE)
)
# Mostrar la tabla con bordes
quintil_stats %>%
kable("html", caption = "Estadísticas de calificaciones por quintiles de horas de autoestudio") %>%
kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
| autoestudio_quintil | mean_math | sd_math | mean_history | sd_history | mean_physics | sd_physics | mean_chemistry | sd_chemistry | mean_biology | sd_biology | mean_english | sd_english | mean_geography | sd_geography |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | 75.0325 | 17.014558 | 75.635 | 14.38503 | 78.3825 | 13.98912 | 77.7450 | 13.80549 | 77.0875 | 13.43582 | 77.3075 | 13.83370 | 79.810 | 11.57990 |
| 2 | 79.2075 | 14.164074 | 78.200 | 12.98775 | 80.1800 | 12.60853 | 77.7775 | 13.47412 | 78.4200 | 13.15699 | 79.6375 | 12.00798 | 79.535 | 11.46942 |
| 3 | 87.0925 | 9.710545 | 80.680 | 11.99530 | 80.7050 | 11.76687 | 79.7925 | 11.94387 | 78.3675 | 13.98038 | 81.6825 | 10.83329 | 80.220 | 11.48505 |
| 4 | 86.9525 | 9.294418 | 81.465 | 11.33534 | 81.6550 | 11.86499 | 80.4025 | 11.82074 | 79.6025 | 14.12048 | 82.3800 | 11.07258 | 79.850 | 11.71262 |
| 5 | 88.9750 | 7.756920 | 85.680 | 10.38833 | 85.7600 | 11.11987 | 84.2575 | 11.62127 | 84.4300 | 12.73895 | 85.3800 | 10.60314 | 85.025 | 11.05078 |
Interpretación de la Tabla 1: La tabla muestra que, a medida que aumenta el tiempo dedicado al autoestudio (de quintil 1 a quintil 5), las calificaciones en todas las materias tienden a mejorar, como comportamiento general. Por ejemplo, en matemáticas, el promedio pasa de 75.0325 en el quintil 1 a 88.975 en el quintil 5. Esto sugiere una relación directamente proporcional entre las horas de autoestudio y el rendimiento académico, por lo menos en el indicador específico de las notas obtenidas en cada materia. A continuación, se presentan gráficos que relacionan los resultados de cada quintil en Matemáticas, Física e Inglés
ggplot(data, aes(x = weekly_self_study_hours, y = math_score)) +
geom_point(color = "blue", alpha = 0.5) +
geom_smooth(method = "lm", color = "red") +
labs(title = "Relación entre horas de autoestudio y calificaciones en matemáticas",
x = "Horas de autoestudio",
y = "Calificación en matemáticas")
## `geom_smooth()` using formula = 'y ~ x'
Discusión del Gráfico 1: El gráfico muestra una tendencia positiva entre las horas de autoestudio y las calificaciones en matemáticas. La línea de regresión (en rojo) indica que, en general, a mayor dedicación al autoestudio, mejores son las calificaciones en Matemáticas.
ggplot(data, aes(x = weekly_self_study_hours, y = physics_score)) +
geom_point(color = "green", alpha = 0.5) +
geom_smooth(method = "lm", color = "red") +
labs(title = "Relación entre horas de autoestudio y calificaciones en física",
x = "Horas de autoestudio",
y = "Calificación en física")
## `geom_smooth()` using formula = 'y ~ x'
Discusión del Gráfico 2: Similar al gráfico anterior, este gráfico muestra una tendencia positiva entre las horas de autoestudio y las calificaciones en física. Esto sugiere que el autoestudio también tiene un impacto positivo en el rendimiento en Física.
ggplot(data, aes(x = weekly_self_study_hours, y = english_score)) +
geom_point(color = "purple", alpha = 0.5) +
geom_smooth(method = "lm", color = "red") +
labs(title = "Relación entre horas de autoestudio y calificaciones en inglés",
x = "Horas de autoestudio",
y = "Calificación en inglés")
## `geom_smooth()` using formula = 'y ~ x'
Discusión del Gráfico 3: Este gráfico muestra una tendencia positiva entre las horas de autoestudio y las calificaciones en inglés, al igual que en los dos gráficos anteriores, y aunque la relación no es tan fuerte como en estas materias, sigue siendo significativa.
ggplot(data, aes(x = factor(autoestudio_quintil), y = math_score)) +
geom_boxplot(fill = "orange") +
labs(title = "Distribución de calificaciones en matemáticas por quintil de horas de autoestudio",
x = "Quintil de horas de autoestudio",
y = "Calificación en matemáticas")
Discusión del Gráfico 4: El gráfico muestra que los estudiantes en el quintil 5 (más horas de autoestudio) tienen calificaciones más altas en matemáticas que los del quintil 1. Esto respalda los resultados de la Tabla 1 y Gráfico 1.
ggplot(data, aes(x = factor(autoestudio_quintil), y = physics_score)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Distribución de calificaciones en física por quintil de horas de autoestudio",
x = "Quintil de horas de autoestudio",
y = "Calificación en física")
Discusión del Gráfico 5: Similar al gráfico anterior, este gráfico muestra que los estudiantes en el quintil 5 tienen calificaciones más altas en física que los del quintil 1, respaldando el Gráfico 2.
ggplot(data, aes(x = factor(autoestudio_quintil), y = english_score)) +
geom_boxplot(fill = "pink") +
labs(title = "Distribución de calificaciones en inglés por quintil de horas de autoestudio",
x = "Quintil de horas de autoestudio",
y = "Calificación en inglés")
Discusión del Gráfico 6: Este gráfico muestra que los estudiantes en el quintil 5 tienen calificaciones más altas en inglés que los del quintil 1, aunque la diferencia no es tan pronunciada como en matemáticas o física, lo que respalda el análisis del Gráfico 3.
Como se pudo evidenciar en los análisis de la Tabla 1 y Gráficos de 1 a 6, se demuestra una relación directamente proporcional entre las horas de autoestudio y las calificaciones obtenidas en las distintas materias. Esto sirve como una introducción al análisis de los efectos que pueden tener actividades extracurriculares o trabajo a medio tiempo en las calificaciones, ya que estas actividades disminuyen el tiempo que tienen los estudiantes para decicarle al estudio por fuera del horario de actividades escolares.
En esta sección, se analizó cómo la combinación de actividades extracurriculares y trabajo a medio tiempo afecta el rendimiento académico en distintas materias, teniendo en cuenta que en los datos, tanto para actividades extracurriculares como trabajo, la información es verdadera o falsa, unos valores binarios, de los cuales no se obtienen indicadores estadísticos como promedio o desviación estándar. Es por esto que se decidió separar la información en 4 posibles categorías, las combinaciones de verdadero y falso para estas variables. Teniendo esta separación se hizo el análisis estadístico de las calificaciones obtenidas.
# Calcular medias por combinación de part_time_job y extracurricular_activities
combinacion_stats <- data %>%
group_by(part_time_job, extracurricular_activities) %>%
summarise(
mean_math = mean(math_score, na.rm = TRUE),
sd_math = sd(math_score, na.rm = TRUE),
mean_history = mean(history_score, na.rm = TRUE),
sd_history = sd(history_score, na.rm = TRUE),
mean_physics = mean(physics_score, na.rm = TRUE),
sd_physics = sd(physics_score, na.rm = TRUE),
mean_chemistry = mean(chemistry_score, na.rm = TRUE),
sd_chemistry = sd(chemistry_score, na.rm = TRUE),
mean_biology = mean(biology_score, na.rm = TRUE),
sd_biology = sd(biology_score, na.rm = TRUE),
mean_english = mean(english_score, na.rm = TRUE),
sd_english = sd(english_score, na.rm = TRUE),
mean_geography = mean(geography_score, na.rm = TRUE),
sd_geography = sd(geography_score, na.rm = TRUE)
)
## `summarise()` has grouped output by 'part_time_job'. You can override using the
## `.groups` argument.
# Mostrar la tabla con bordes
combinacion_stats %>%
kable("html", caption = "Medias de calificaciones por combinación de actividades extracurriculares y trabajo a medio tiempo") %>%
kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
| part_time_job | extracurricular_activities | mean_math | sd_math | mean_history | sd_history | mean_physics | sd_physics | mean_chemistry | sd_chemistry | mean_biology | sd_biology | mean_english | sd_english | mean_geography | sd_geography |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| False | False | 84.81016 | 11.80969 | 80.77728 | 12.36426 | 82.09342 | 12.15911 | 80.51943 | 12.60522 | 79.60688 | 13.77355 | 81.89910 | 11.83618 | 81.38490 | 11.51464 |
| False | True | 83.37283 | 13.13662 | 81.58382 | 12.14861 | 81.68497 | 12.17584 | 80.36994 | 12.47591 | 79.60116 | 13.23905 | 81.37861 | 11.47719 | 79.71098 | 11.63791 |
| True | False | 78.51968 | 16.84355 | 77.48032 | 14.20424 | 77.72047 | 13.72588 | 77.35433 | 13.11730 | 79.88583 | 13.77310 | 78.13386 | 13.07495 | 79.77953 | 12.09999 |
| True | True | 74.79032 | 17.43196 | 75.41935 | 14.89036 | 77.87097 | 14.57877 | 77.40323 | 15.21050 | 77.67742 | 15.17847 | 80.17742 | 12.83377 | 81.27419 | 11.85177 |
Interpretación de la Tabla 2: La tabla muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en todas las materias. Por ejemplo, en matemáticas, este grupo tiene un promedio de 74.7903226, mientras que los estudiantes que trabajan y no participan en actividades extracurriculares tienen un promedio de 83.3728324. Esto sugiere que las actividades extracurriculares tienen un impacto positivo en el rendimiento académico, mientras que el trabajo a medio tiempo puede tener un efecto negativo.
ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = math_score)) +
geom_boxplot(fill = "purple") +
labs(title = "Calificaciones en matemáticas por combinación de actividades extracurriculares y trabajo a medio tiempo",
x = "Combinación de actividades",
y = "Calificación en matemáticas")
Discusión del Gráfico 7: El gráfico muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en matemáticas. Esto respalda los resultados de la Tabla 2.
ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = history_score)) +
geom_boxplot(fill = "green") +
labs(title = "Calificaciones en historia por combinación de actividades extracurriculares y trabajo a medio tiempo",
x = "Combinación de actividades",
y = "Calificación en historia")
Discusión del Gráfico 8: Similar al gráfico anterior, este gráfico muestra que las actividades extracurriculares tienen un impacto positivo en las calificaciones de historia, mientras que el trabajo a medio tiempo puede tener un efecto negativo.
ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = geography_score)) +
geom_boxplot(fill = "yellow") +
labs(title = "Calificaciones en geografía por combinación de actividades extracurriculares y trabajo a medio tiempo",
x = "Combinación de actividades",
y = "Calificación en geografía")
Discusión del Gráfico 9: Este gráfico muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en geografía. Esto respalda los resultados de la Tabla 2.
ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = chemistry_score)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Calificaciones en química por combinación de actividades extracurriculares y trabajo a medio tiempo",
x = "Combinación de actividades",
y = "Calificación en química")
Discusión del Gráfico 10: Similar a los gráficos anteriores, este gráfico muestra que las actividades extracurriculares tienen un impacto positivo en las calificaciones de química, mientras que el trabajo a medio tiempo puede tener un efecto negativo.
ggplot(data, aes(x = interaction(part_time_job, extracurricular_activities), y = biology_score)) +
geom_boxplot(fill = "pink") +
labs(title = "Calificaciones en biología por combinación de actividades extracurriculares y trabajo a medio tiempo",
x = "Combinación de actividades",
y = "Calificación en biología")
Discusión del Gráfico 11: Este gráfico muestra que los estudiantes que no trabajan y participan en actividades extracurriculares tienen las calificaciones más altas en biología. Esto respalda los resultados de la Tabla 2.
Como se pudo evidenciar en los análisis de la Tabla 2 y Gráficos de 7 a 11, se demuestra una relación entre las actividades extracurriculares y trabajo con las calificaciones de los estudiantes en diferentes materias, indicando, en términos generales, que la realización de estas actividades tienen un impacto negativo en las notas, respaldando el análisis realizado en el Objetivo 1, en dónde se asumió que las actividades disminuyen el tiempo libre disponible de cada estudiante para estudiar y aumentar las calificaciones obtenidas.
En esta sección, se analizó cómo las aspiraciones profesionales de los estudiantes se relacionan con sus calificaciones en distintas materias, teniendo en cuenta la variable de carrera aspirada, en la cual hay 17 diferentes respuestas, las cuales se decidieron estudiar separadas en el análisis inicial, para agruparlas en los indicadores estadísticos de las tablas y gráficos.
# Calcular medias por carrera aspiracional
carrera_stats <- data %>%
group_by(career_aspiration) %>%
summarise(
mean_math = mean(math_score, na.rm = TRUE),
sd_math = sd(math_score, na.rm = TRUE),
mean_history = mean(history_score, na.rm = TRUE),
sd_history = sd(history_score, na.rm = TRUE),
mean_physics = mean(physics_score, na.rm = TRUE),
sd_physics = sd(physics_score, na.rm = TRUE),
mean_chemistry = mean(chemistry_score, na.rm = TRUE),
sd_chemistry = sd(chemistry_score, na.rm = TRUE),
mean_biology = mean(biology_score, na.rm = TRUE),
sd_biology = sd(biology_score, na.rm = TRUE),
mean_english = mean(english_score, na.rm = TRUE),
sd_english = sd(english_score, na.rm = TRUE),
mean_geography = mean(geography_score, na.rm = TRUE),
sd_geography = sd(geography_score, na.rm = TRUE)
)
# Mostrar la tabla con bordes
carrera_stats %>%
kable("html", caption = "Medias de calificaciones por carrera aspiracional") %>%
kable_styling(bootstrap_options = c("striped", "bordered"), full_width = FALSE)
| career_aspiration | mean_math | sd_math | mean_history | sd_history | mean_physics | sd_physics | mean_chemistry | sd_chemistry | mean_biology | sd_biology | mean_english | sd_english | mean_geography | sd_geography |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Accountant | 87.35714 | 7.885647 | 79.66667 | 11.550238 | 81.43651 | 12.163221 | 81.32540 | 10.905286 | 65.68254 | 20.858629 | 78.94444 | 10.674310 | 80.01587 | 11.213552 |
| Artist | 80.11940 | 12.136250 | 81.10448 | 11.978686 | 80.04478 | 11.343711 | 81.11940 | 12.377304 | 82.00000 | 11.873066 | 78.58209 | 11.995137 | 81.68657 | 10.951974 |
| Banker | 87.08284 | 7.527268 | 81.20710 | 11.874280 | 79.16568 | 11.305119 | 79.18935 | 12.294487 | 79.39053 | 12.294556 | 86.82249 | 7.406028 | 80.22485 | 12.163435 |
| Business Owner | 69.64401 | 17.626062 | 73.08091 | 15.643240 | 74.36893 | 14.380717 | 74.65049 | 14.793410 | 74.42718 | 13.942089 | 75.13269 | 14.545892 | 80.08091 | 11.626070 |
| Construction Engineer | 89.72059 | 5.896737 | 80.98529 | 12.448692 | 90.58824 | 6.253919 | 78.61765 | 12.983376 | 83.16176 | 11.751926 | 81.05882 | 12.070542 | 80.16176 | 11.559851 |
| Designer | 82.35714 | 11.429513 | 78.73214 | 11.614241 | 82.82143 | 11.758335 | 79.76786 | 12.707895 | 85.58929 | 8.078651 | 82.28571 | 10.442421 | 85.28571 | 9.068856 |
| Doctor | 92.02521 | 5.401604 | 86.73109 | 10.091696 | 91.97479 | 5.674000 | 91.74790 | 5.222537 | 92.52941 | 4.869176 | 85.17647 | 10.827341 | 87.56303 | 9.952973 |
| Game Developer | 89.95238 | 6.284719 | 76.92063 | 12.239942 | 91.01587 | 5.771152 | 78.74603 | 11.712921 | 79.28571 | 11.048907 | 79.30159 | 11.630931 | 77.26984 | 11.678774 |
| Government Officer | 80.65574 | 11.494760 | 83.75410 | 10.254520 | 80.37705 | 12.062565 | 79.22951 | 11.572083 | 80.91803 | 11.374379 | 82.42623 | 11.033976 | 79.11475 | 11.284353 |
| Lawyer | 86.03623 | 9.134365 | 89.18841 | 5.644648 | 80.27536 | 12.267557 | 80.43478 | 11.843232 | 81.84783 | 12.370144 | 89.64493 | 5.985141 | 81.67391 | 11.383919 |
| Real Estate Developer | 76.42169 | 15.239647 | 80.04819 | 11.523998 | 81.73494 | 12.207639 | 80.08434 | 12.588424 | 78.60241 | 12.690442 | 77.96386 | 11.822308 | 80.59036 | 10.270769 |
| Scientist | 87.66667 | 7.266844 | 79.30769 | 12.471344 | 91.89744 | 5.820991 | 91.07692 | 5.810085 | 88.92308 | 6.166056 | 81.82051 | 11.984358 | 84.35897 | 9.726489 |
| Software Engineer | 92.14603 | 4.603821 | 81.35556 | 11.963610 | 81.14921 | 11.616481 | 79.84444 | 12.035692 | 79.72063 | 11.606529 | 80.86667 | 11.410466 | 80.42222 | 11.828774 |
| Stock Investor | 88.10959 | 7.463916 | 80.35616 | 11.256319 | 80.01370 | 11.687473 | 80.82192 | 11.930752 | 81.01370 | 13.127043 | 79.75342 | 12.146994 | 80.19178 | 12.242523 |
| Teacher | 78.59322 | 11.871610 | 79.11864 | 12.833261 | 79.96610 | 12.022918 | 80.08475 | 13.292840 | 79.62712 | 11.999854 | 85.38983 | 8.111331 | 81.45763 | 11.282153 |
| Unknown | 79.84305 | 12.368863 | 79.71300 | 11.834754 | 80.94619 | 11.990115 | 79.07175 | 12.305212 | 80.63677 | 12.032909 | 79.76682 | 11.677320 | 79.17489 | 12.337626 |
| Writer | 78.31250 | 10.798559 | 84.75000 | 9.486833 | 84.12500 | 11.891309 | 82.03125 | 11.969004 | 81.09375 | 12.817225 | 94.37500 | 3.087436 | 83.68750 | 11.374668 |
Interpretación de la Tabla 3: La tabla muestra que los estudiantes que aspiran a carreras en ciencias (como “Doctor” o “Ingeniero de Software”) tienden a tener calificaciones más altas en matemáticas y física, mientras que los que aspiran a carreras en humanidades (como “Artista” o “Abogado”) tienen calificaciones más altas en historia e inglés. Esto sugiere que las aspiraciones profesionales están relacionadas con el desempeño en áreas específicas.
ggplot(data, aes(x = career_aspiration, y = math_score)) +
geom_boxplot(fill = "yellow") +
labs(title = "Calificaciones en matemáticas por carrera aspiracional",
x = "Carrera aspiracional",
y = "Calificación en matemáticas") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Discusión del Gráfico 12: El gráfico muestra que los estudiantes que aspiran a carreras en ciencias (como “Doctor” o “Ingeniero de Software”) tienen las calificaciones más altas en matemáticas, mientras que los que aspiran a carreras en humanidades (como “Artista”) tienen calificaciones más bajas, lo que respalda gráficamente el análisis de la Tabla 3.
ggplot(data, aes(x = career_aspiration, y = history_score)) +
geom_boxplot(fill = "pink") +
labs(title = "Calificaciones en historia por carrera aspiracional",
x = "Carrera aspiracional",
y = "Calificación en historia") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Discusión del Gráfico 13: Similar al gráfico anterior, este gráfico muestra que los estudiantes que aspiran a carreras en humanidades (como “Abogado”) tienen las calificaciones más altas en historia, aunque se evidencian menos patrones de comportamiento asociados a “tipos” de carrera, como el hecho de que las personas que quieren ser dueñas de negocios tienen el promedio más bajo de la materia, considerando que esta no es una carrera que se pueda agrupar en ciencias o campos similares.
ggplot(data, aes(x = career_aspiration, y = geography_score)) +
geom_boxplot(fill = "lightgreen") +
labs(title = "Calificaciones en geografía por carrera aspiracional",
x = "Carrera aspiracional",
y = "Calificación en geografía") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Discusión del Gráfico 14: Este gráfico muestra que los estudiantes que aspiran a carreras en ciencias sociales (como “Abogado”) tienen las calificaciones más altas en geografía. Adicionalmente, muestra que el comportamiento no es igual que en la materia de Historia, aunque suelan ser dos materias relacionadas entre sí, con la creencia de que las calificaciones de ambas materias van a ser similares en las mismas personas.
ggplot(data, aes(x = career_aspiration, y = physics_score)) +
geom_boxplot(fill = "lightblue") +
labs(title = "Calificaciones en física por carrera aspiracional",
x = "Carrera aspiracional",
y = "Calificación en física") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Discusión del Gráfico 15: Este gráfico muestra que los estudiantes que aspiran a carreras en ciencias (como “Doctor” o “Ingeniero de Software”) tienen las calificaciones más altas en física, mostrando un comportamiento similar a Matemáticas.
Como se pudo evidenciar en los análisis de la Tabla 3 y Gráficos de 12 a 15, se demuestra una relación entre las aspiraciones profesionales y las notas obtenidas por los estudiantes en las diferentes materias. En general, se puede ver que los estudiantes tienden a obtener mejores resultados en materias relaciondas a la carrera a la que aspiran.Sin embargo, en la carrera en la cual hay mayor frecuencia, “Dueño de negocios”, se nota una mayor variabilidad, junto con una media de nota inferior en la mayoría de las materias, lo que lleva a pensar que los estudiantes que tienen esta aspiración profesional no le dedican suficiente tiempo de estudio a las materias.
En este informe, se analizó cómo las actividades extracurriculares, el trabajo a medio tiempo y las aspiraciones profesionales influyen en el rendimiento académico de los estudiantes. Los resultados sugieren que las horas de autoestudio tienen un impacto positivo en las calificaciones, mientras que el trabajo a medio tiempo o actividades extracurriculares pueden tener un efecto negativo, aunque en estas segundas el comportamiento no es tan claro. Además, las aspiraciones profesionales están relacionadas con el desempeño en áreas específicas. Estos hallazgos pueden ser útiles para diseñar políticas educativas que fomenten un equilibrio adecuado entre el estudio y otras actividades, así como incentivos para que los estudiantes se comiencen a enfocar en las materias que más relevancia van a tener en su carrera profesional, sin descuidar los posibles buenos resultados en todas las materias.