Este conjunto de datos contiene información de 2000 estudiantes universitarios, recopilada mediante una encuesta de Google Forms. Incluye información sobre horas de estudio, actividades extracurriculares, sueño, socialización, actividad física, niveles de estrés y promedio general (GPA). Los datos abarcan el año académico de agosto de 2023 a mayo de 2024 y reflejan la participación de los estudiantes de Lisboa. Este conjunto de datos puede ayudar a analizar el impacto de los hábitos diarios en el rendimiento académico y el bienestar estudiantil.
Nombre del archivo: student_lifestyle_dataset_.csv Formato del archivo: CSV Número de registros: 2000 filas Número de columnas: 9 columnas Nombres de las columnas: ID del estudiante, Horas de estudio, Horas extracurriculares, Horas de sueño, Horas sociales, Horas de actividad física, Nivel de estrés, GPA, género
El nivel de estrés de cada estudiante ha sido derivado principalmente de sus horas de estudio y sueño, lo que permite explorar cómo los factores de estilo de vida influyen en el desempeño académico.
Study_Hours_Per_Day: Número de
horas que el estudiante dedica al estudio cada día.
Extracurricular_Hours_Per_Day:
Tiempo invertido en actividades extracurriculares (deportes, arte,
clubes).
Sleep_Hours_Per_Day: Cantidad de
horas que el estudiante duerme diariamente.
Social_Hours_Per_Day: Horas que el
estudiante pasa socializando (amistades, redes, eventos).
Physical_Activity_Hours_Per_Day:
Tiempo dedicado a la actividad física (ejercicio, deportes,
caminatas).
Stress_Level: Nivel de estrés del
estudiante, categorizado como Alto,
Moderado o Bajo, determinado en
función de las horas de estudio y sueño.
Gender: Sexo del estudiante
(Femenino o Masculino).
Grades: Nota promedio (GPA), usada
como medida del rendimiento académico del estudiante.
library(performance)
## Warning: package 'performance' was built under R version 4.4.3
library(effectsize)
## Warning: package 'effectsize' was built under R version 4.4.3
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.4.3
## Warning: package 'ggplot2' was built under R version 4.4.3
## Warning: package 'tibble' was built under R version 4.4.3
## Warning: package 'tidyr' was built under R version 4.4.3
## Warning: package 'readr' was built under R version 4.4.3
## Warning: package 'purrr' was built under R version 4.4.3
## Warning: package 'dplyr' was built under R version 4.4.3
## Warning: package 'stringr' was built under R version 4.4.3
## Warning: package 'forcats' was built under R version 4.4.3
## Warning: package 'lubridate' was built under R version 4.4.3
library(sjPlot)
## Warning: package 'sjPlot' was built under R version 4.4.3
library(FactoMineR)
## Warning: package 'FactoMineR' was built under R version 4.4.3
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.4.3
library(summarytools)
## Warning: package 'summarytools' was built under R version 4.4.3
library(see)
## Warning: package 'see' was built under R version 4.4.3
## Rows: 2000 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (2): Stress_Level, Gender
## dbl (7): Student_ID, Study_Hours_Per_Day, Extracurricular_Hours_Per_Day, Sle...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
## Study_Hours_Per_Day Extracurricular_Hours_Per_Day Sleep_Hours_Per_Day
## Min. : 5.000 Min. :0.00 Min. : 5.000
## 1st Qu.: 6.300 1st Qu.:1.00 1st Qu.: 6.200
## Median : 7.400 Median :2.00 Median : 7.500
## Mean : 7.476 Mean :1.99 Mean : 7.501
## 3rd Qu.: 8.700 3rd Qu.:3.00 3rd Qu.: 8.800
## Max. :10.000 Max. :4.00 Max. :10.000
## Social_Hours_Per_Day Physical_Activity_Hours_Per_Day Stress_Level
## Min. :0.000 Min. : 0.000 High :1029
## 1st Qu.:1.200 1st Qu.: 2.400 Low : 297
## Median :2.600 Median : 4.100 Moderate: 674
## Mean :2.705 Mean : 4.328
## 3rd Qu.:4.100 3rd Qu.: 6.100
## Max. :6.000 Max. :13.000
## Gender Grades
## Female: 984 Min. : 5.60
## Male :1016 1st Qu.: 7.25
## Median : 7.78
## Mean : 7.79
## 3rd Qu.: 8.32
## Max. :10.00
| No | Variable | Stats / Values | Freqs (% of Valid) | Graph | Valid | Missing | |||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | Study_Hours_Per_Day [numeric] |
|
51 distinct values | 2000 (100.0%) | 0 (0.0%) | ||||||||||||||||
| 2 | Extracurricular_Hours_Per_Day [numeric] |
|
41 distinct values | 2000 (100.0%) | 0 (0.0%) | ||||||||||||||||
| 3 | Sleep_Hours_Per_Day [numeric] |
|
51 distinct values | 2000 (100.0%) | 0 (0.0%) | ||||||||||||||||
| 4 | Social_Hours_Per_Day [numeric] |
|
61 distinct values | 2000 (100.0%) | 0 (0.0%) | ||||||||||||||||
| 5 | Physical_Activity_Hours_Per_Day [numeric] |
|
118 distinct values | 2000 (100.0%) | 0 (0.0%) | ||||||||||||||||
| 6 | Stress_Level [factor] |
|
|
2000 (100.0%) | 0 (0.0%) | ||||||||||||||||
| 7 | Gender [factor] |
|
|
2000 (100.0%) | 0 (0.0%) | ||||||||||||||||
| 8 | Grades [numeric] |
|
158 distinct values | 2000 (100.0%) | 0 (0.0%) |
Generated by summarytools 1.1.1 (R version 4.4.2)
2025-05-07
Study_Hours_Per_Day (Horas de estudio por día)Extracurricular_Hours_Per_Day (Horas
extracurriculares)Sleep_Hours_Per_Day (Horas de sueño)Physical_Activity_Hours_Per_Day (Actividad física)Stress_Level (Nivel de estrés)GenderGrades (Calificaciones)Gender vs
Stress_LevelH: Las horas de estudio no influyen significativamente
H: Las horas de estudio influyen significativamente
##
## Call:
## lm(formula = Grades ~ Study_Hours_Per_Day, data = Y)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.52580 -0.33784 -0.00321 0.34252 1.99822
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.910400 0.060603 81.03 <2e-16 ***
## Study_Hours_Per_Day 0.385166 0.007964 48.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.507 on 1998 degrees of freedom
## Multiple R-squared: 0.5393, Adjusted R-squared: 0.5391
## F-statistic: 2339 on 1 and 1998 DF, p-value: < 2.2e-16
Study_Hours_Per_Day es p < 2e-16, se
rechaza la hipótesis nula.*** reflejan que esta relación es
estadísticamente muy significativa.check_model(m)
check_normality(m)
## OK: residuals appear as normally distributed (p = 0.411).
## For confidence bands, please install `qqplotr`.
check_heteroscedasticity(m)
## OK: Error variance appears to be homoscedastic (p = 0.920).
interpret_r2(summary(m)$r.squared, rules = "cohen1988")
## [1] "substantial"
## (Rules: cohen1988)
## *The results are available in the following objects:
##
## name description
## 1 "$eig" "eigenvalues and inertia"
## 2 "$var" "Results for the variables"
## 3 "$ind" "results for the individuals"
## 4 "$quali.var" "Results for the qualitative variables"
## 5 "$quanti.var" "Results for the quantitative variables"
Gráfico 1 (Individuos con etiquetas): Las categorías de estrés (High, Moderate, Low) se distribuyen en distintas zonas del plano, mostrando que el nivel de estrés distingue bien a los estudiantes. El género se ubica cerca del centro, por lo tanto, no aporta gran diferenciación.
Gráfico 2 (Individuos sin etiquetas): Se observa una alta concentración de estudiantes cerca del centro, con algunos casos más extremos alejados, lo cual refleja diversidad moderada en los perfiles.
Gráfico 3 (Variables activas): Variables como
Study_Hours_Per_Day, Grades y
Stress_Level contribuyen más a la Dim.1.
El Gender está cerca del centro, con baja
influencia.
Gráfico 4 (Categorías cualitativas): Las categorías del estrés están bien separadas, confirmando que reflejan diferencias reales entre grupos.
Gráfico 5 (Variables cuantitativas):
Study_Hours_Per_Day y Grades apuntan en la
misma dirección → fuerte correlación positiva.
Physical_Activity_Hours_Per_Day va en sentido contrario a
las notas, lo cual sugiere una relación inversa
débil.
# Obtener autovalores
eigenvalues <- famd_pre_result %>% get_eigenvalue()
eigenvalues
## eigenvalue variance.percent cumulative.variance.percent
## Dim.1 2.5960123 28.84458 28.84458
## Dim.2 1.6048897 17.83211 46.67669
## Dim.3 1.2430168 13.81130 60.48799
## Dim.4 1.0498394 11.66488 72.15287
## Dim.5 0.9998140 11.10904 83.26191
## Dim.6 0.9434818 10.48313 93.74505
# Screeplot básico
famd_pre_result %>% fviz_screeplot()
# Screeplot con estilo personalizado
famd_pre_result %>% fviz_screeplot(addlabels = TRUE, ylim = c(0, 30),
barfill = "white", barcolor = "darkblue",
linecolor = "red")
# Análisis manual de autovalores
a <- famd_pre_result$eig
str(a)
## num [1:6, 1:3] 2.6 1.6 1.24 1.05 1 ...
## - attr(*, "dimnames")=List of 2
## ..$ : chr [1:6] "comp 1" "comp 2" "comp 3" "comp 4" ...
## ..$ : chr [1:3] "eigenvalue" "percentage of variance" "cumulative percentage of variance"
a
## eigenvalue percentage of variance cumulative percentage of variance
## comp 1 2.5960123 28.84458 28.84458
## comp 2 1.6048897 17.83211 46.67669
## comp 3 1.2430168 13.81130 60.48799
## comp 4 1.0498394 11.66488 72.15287
## comp 5 0.9998140 11.10904 83.26191
## comp 6 0.9434818 10.48313 93.74505
# Extraer los 6 primeros autovalores
b <- a[1:6, 1]
b
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6
## 2.5960123 1.6048897 1.2430168 1.0498394 0.9998140 0.9434818
# Suma total de autovalores
sum(b)
## [1] 8.437054
(b / 9) * 100
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6
## 28.84458 17.83211 13.81130 11.66488 11.10904 10.48313
(b[[1]] / 9) * 100
## [1] 28.84458
(b[[2]] / 9) * 100
## [1] 17.83211
# Normalizado respecto al total de los 6 primeros
c <- a[1:6, 2]
d <- (b / sum(b)) * 100
d
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6
## 30.76918 19.02192 14.73283 12.44320 11.85027 11.18260
cumsum(d)
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6
## 30.76918 49.79110 64.52393 76.96713 88.81740 100.00000
e <- (b / 9) * 100
e
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6
## 28.84458 17.83211 13.81130 11.66488 11.10904 10.48313
cumsum(e)
## comp 1 comp 2 comp 3 comp 4 comp 5 comp 6
## 28.84458 46.67669 60.48799 72.15287 83.26191 93.74505
# Coordenadas, cos2 y contribuciones
var_analysis <- famd_pre_result %>% get_famd_var()
var_analysis$coord
## Dim.1 Dim.2 Dim.3
## Study_Hours_Per_Day 0.8823026341 0.010647933 0.009815628
## Extracurricular_Hours_Per_Day 0.0146367838 0.176305446 0.027904951
## Sleep_Hours_Per_Day 0.0024424794 0.556850816 0.186670649
## Social_Hours_Per_Day 0.0001001889 0.064766064 0.915769180
## Physical_Activity_Hours_Per_Day 0.3716169997 0.546344699 0.066941254
## Grades 0.6947730382 0.022601762 0.005875483
## Stress_Level 0.6277975160 0.226264125 0.028424073
## Gender 0.0023426542 0.001108886 0.001615581
## Dim.4 Dim.5 Dim.6
## Study_Hours_Per_Day 0.004884500 3.073861e-05 2.275425e-03
## Extracurricular_Hours_Per_Day 0.639721365 7.556253e-03 1.278168e-01
## Sleep_Hours_Per_Day 0.102494606 7.322554e-04 1.219391e-01
## Social_Hours_Per_Day 0.011197669 5.117292e-03 3.109162e-05
## Physical_Activity_Hours_Per_Day 0.005044944 2.029327e-05 3.822158e-03
## Grades 0.008946435 2.529813e-04 1.523455e-02
## Stress_Level 0.211102858 1.386434e-01 5.915185e-01
## Gender 0.066446997 8.474608e-01 8.084424e-02
var_analysis$cos2
## Dim.1 Dim.2 Dim.3
## Study_Hours_Per_Day 7.784579e-01 1.133785e-04 9.634656e-05
## Extracurricular_Hours_Per_Day 2.142354e-04 3.108361e-02 7.786863e-04
## Sleep_Hours_Per_Day 5.965706e-06 3.100828e-01 3.484593e-02
## Social_Hours_Per_Day 1.003781e-08 4.194643e-03 8.386332e-01
## Physical_Activity_Hours_Per_Day 1.380992e-01 2.984925e-01 4.481131e-03
## Grades 4.827096e-01 5.108396e-04 3.452130e-05
## Stress_Level 1.970649e-01 2.559773e-02 4.039640e-04
## Gender 5.488029e-06 1.229628e-06 2.610102e-06
## Dim.4 Dim.5 Dim.6
## Study_Hours_Per_Day 2.385834e-05 9.448624e-10 5.177559e-06
## Extracurricular_Hours_Per_Day 4.092434e-01 5.709696e-05 1.633713e-02
## Sleep_Hours_Per_Day 1.050514e-02 5.361979e-07 1.486915e-02
## Social_Hours_Per_Day 1.253878e-04 2.618667e-05 9.666886e-10
## Physical_Activity_Hours_Per_Day 2.545146e-05 4.118166e-10 1.460889e-05
## Grades 8.003871e-05 6.399954e-08 2.320914e-04
## Stress_Level 2.228221e-02 9.610992e-03 1.749470e-01
## Gender 4.415203e-03 7.181899e-01 6.535791e-03
Cada variable está principalmente representada en una dimensión específica, lo cual facilita la interpretación temática de cada componente:
var_analysis$contrib
## Dim.1 Dim.2 Dim.3 Dim.4
## Study_Hours_Per_Day 33.986843438 0.66346818 0.7896617 0.4652616
## Extracurricular_Hours_Per_Day 0.563817968 10.98551773 2.2449376 60.9351660
## Sleep_Hours_Per_Day 0.094085818 34.69713873 15.0175484 9.7628846
## Social_Hours_Per_Day 0.003859337 4.03554603 73.6731137 1.0666078
## Physical_Activity_Hours_Per_Day 14.314916787 34.04250699 5.3853861 0.4805443
## Grades 26.763087360 1.40830622 0.4726793 0.8521718
## Stress_Level 24.183148802 14.09842191 2.2867006 20.1081102
## Gender 0.090240491 0.06909421 0.1299726 6.3292537
## Dim.5 Dim.6
## Study_Hours_Per_Day 0.003074433 0.241173163
## Extracurricular_Hours_Per_Day 0.755765852 13.547349771
## Sleep_Hours_Per_Day 0.073239156 12.924374242
## Social_Hours_Per_Day 0.511824336 0.003295412
## Physical_Activity_Hours_Per_Day 0.002029704 0.405111988
## Grades 0.025302836 1.614715379
## Stress_Level 13.866916017 62.695268528
## Gender 84.761847666 8.568711517
Cada dimensión del FAMD está bien caracterizada por un subconjunto específico de variables, lo cual permite interpretaciones temáticas claras:
famd_pre_result %>% fviz_contrib(choice = "var", axes = 1)
Dimensión 1 refleja un eje académico-psicológico, donde variables como las horas de estudio, el rendimiento académico (Grades) y el nivel de estrés tienen una gran influencia.
famd_pre_result %>% fviz_contrib(choice = "var", axes = 1:2)
El plano bidimensional está conformado tanto por las variables académicas y de estrés como por las de bienestar físico:
Esto evidencia que, además del “eje compromiso académico – carga psicológica” (horas de estudio, GPA y estrés), el eje salud física (actividad y sueño) contribuye de manera muy significativa a la estructura factorial.
famd_pre_result %>% fviz_contrib(choice = "var", axes = 1:5)
Al extender el análisis a las primeras cinco dimensiones, las aportaciones de todas las variables quedan bastante equilibradas (línea roja ≈ 12.5 %):
Esto indica que, en el subespacio de cinco factores, no solo las variables académicas y de estrés, sino también los hábitos sociales, físicos y demográficos, tienen un peso muy similar en la estructura factorial.
# Extraer coordenadas de variables cuantitativas
var_analysis_quanti <- famd_pre_result %>% get_famd_var(element = "quanti.var")
var_analysis_quanti$coord
## Dim.1 Dim.2 Dim.3 Dim.4
## Study_Hours_Per_Day 0.93930966 -0.1031888 0.09907385 -0.06988920
## Extracurricular_Hours_Per_Day 0.12098258 0.4198874 0.16704775 0.79982583
## Sleep_Hours_Per_Day 0.04942145 0.7462244 0.43205399 -0.32014779
## Social_Hours_Per_Day -0.01000944 0.2544918 -0.95695830 -0.10581904
## Physical_Activity_Hours_Per_Day -0.60960397 -0.7391513 0.25873008 -0.07102777
## Grades 0.83353047 -0.1503388 0.07665170 -0.09458560
## Dim.5 Dim.6
## Study_Hours_Per_Day -0.005544242 0.047701415
## Extracurricular_Hours_Per_Day 0.086926711 -0.357514732
## Sleep_Hours_Per_Day 0.027060217 0.349197828
## Social_Hours_Per_Day -0.071535247 -0.005575986
## Physical_Activity_Hours_Per_Day -0.004504805 -0.061823604
## Grades -0.015905386 0.123428304
var_analysis_quanti$cos2
## Dim.1 Dim.2 Dim.3 Dim.4
## Study_Hours_Per_Day 0.8823026341 0.01064793 0.009815628 0.004884500
## Extracurricular_Hours_Per_Day 0.0146367838 0.17630545 0.027904951 0.639721365
## Sleep_Hours_Per_Day 0.0024424794 0.55685082 0.186670649 0.102494606
## Social_Hours_Per_Day 0.0001001889 0.06476606 0.915769180 0.011197669
## Physical_Activity_Hours_Per_Day 0.3716169997 0.54634470 0.066941254 0.005044944
## Grades 0.6947730382 0.02260176 0.005875483 0.008946435
## Dim.5 Dim.6
## Study_Hours_Per_Day 3.073861e-05 2.275425e-03
## Extracurricular_Hours_Per_Day 7.556253e-03 1.278168e-01
## Sleep_Hours_Per_Day 7.322554e-04 1.219391e-01
## Social_Hours_Per_Day 5.117292e-03 3.109162e-05
## Physical_Activity_Hours_Per_Day 2.029327e-05 3.822158e-03
## Grades 2.529813e-04 1.523455e-02
var_analysis_quanti$contrib
## Dim.1 Dim.2 Dim.3 Dim.4
## Study_Hours_Per_Day 33.986843438 0.6634682 0.7896617 0.4652616
## Extracurricular_Hours_Per_Day 0.563817968 10.9855177 2.2449376 60.9351660
## Sleep_Hours_Per_Day 0.094085818 34.6971387 15.0175484 9.7628846
## Social_Hours_Per_Day 0.003859337 4.0355460 73.6731137 1.0666078
## Physical_Activity_Hours_Per_Day 14.314916787 34.0425070 5.3853861 0.4805443
## Grades 26.763087360 1.4083062 0.4726793 0.8521718
## Dim.5 Dim.6
## Study_Hours_Per_Day 0.003074433 0.241173163
## Extracurricular_Hours_Per_Day 0.755765852 13.547349771
## Sleep_Hours_Per_Day 0.073239156 12.924374242
## Social_Hours_Per_Day 0.511824336 0.003295412
## Physical_Activity_Hours_Per_Day 0.002029704 0.405111988
## Grades 0.025302836 1.614715379
famd_pre_result %>%
fviz_famd_var(choice = "quanti.var", col.var = "contrib",
gradient.cols = c("red","yellow","green"))
famd_pre_result %>%
fviz_famd_var(choice = "quanti.var", col.var = "contrib", axes = c(2,3),
gradient.cols = c("red","yellow","green"))
famd_pre_result %>%
fviz_famd_var(choice = "quanti.var", col.var = "cos2",
gradient.cols = c("red","yellow","green"))
var_analysis_quali <- famd_pre_result %>% get_famd_var(element = "quali.var")
var_analysis_quali
## FAMD results for qualitative variable categories
## ===================================================
## Name Description
## 1 "$coord" "Coordinates"
## 2 "$cos2" "Cos2, quality of representation"
## 3 "$contrib" "Contributions"
var_analysis_quali$coord
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## High 1.09173159 -0.58318051 -0.13899141 0.2511146 0.1251695 0.1815276
## Low -2.46616059 0.50537150 -0.11624997 0.5845166 0.6225549 1.3714141
## Moderate -0.58003280 0.66765194 0.26342493 -0.6409471 -0.4654276 -0.8814569
## Female -0.07924225 -0.04286624 0.04553572 0.2683789 -0.9353384 0.2806342
## Male 0.07674643 0.04151612 -0.04410152 -0.2599260 0.9058789 -0.2717953
var_analysis_quali$v.test
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## High 31.186524 -21.187752 -5.737913 11.28015 5.761603 8.601624
## Low -28.578885 7.448442 -1.946846 10.65155 11.625063 26.362048
## Moderate -11.475293 16.799335 7.531526 -19.94001 -14.837375 -28.926700
## Female -2.164016 -1.488846 1.797094 11.52508 -41.159133 12.712499
## Male 2.164016 1.488846 -1.797094 -11.52508 41.159133 -12.712499
Las categorías “Female” y “Male” tienen poca asociación con las dimensiones principales (Dim.1 y Dim.2), aunque presentan cierta diferenciación en dimensiones posteriores como la Dim.5 y Dim.6. Esto sugiere que el género no es una fuente principal de varianza en los primeros ejes del análisis.
aa <- var_analysis_quali$contrib
aa
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## High 9.09920903 6.79361585 0.64329075 2.943631 0.8063876 1.904600
## Low 13.40156975 1.47250764 0.12988474 4.603355 5.7576232 31.375931
## Moderate 1.68237002 5.83229841 1.51352515 12.561124 7.3029053 29.414737
## Female 0.04584217 0.03509986 0.06602608 3.215261 43.0590186 4.352905
## Male 0.04439832 0.03399435 0.06394652 3.113993 41.7028291 4.215806
str(aa)
## num [1:5, 1:6] 9.0992 13.4016 1.6824 0.0458 0.0444 ...
## - attr(*, "dimnames")=List of 2
## ..$ : chr [1:5] "High" "Low" "Moderate" "Female" ...
## ..$ : chr [1:6] "Dim.1" "Dim.2" "Dim.3" "Dim.4" ...
sum(aa[, 1]) # Suma de contribuciones a Dim.1
## [1] 24.27339
bb <- var_analysis_quali$cos2
bb
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## High 0.696427219 0.198723847 0.011288076 0.03684578 0.009154632 0.01925438
## Low 0.666606068 0.027992910 0.001481195 0.03744728 0.042479735 0.20614073
## Moderate 0.147483429 0.195406204 0.030419485 0.18008703 0.094960358 0.34059657
## Female 0.006061711 0.001773831 0.002001640 0.06953100 0.844537873 0.07602613
## Male 0.006061711 0.001773831 0.002001640 0.06953100 0.844537873 0.07602613
str(bb)
## num [1:5, 1:6] 0.69643 0.66661 0.14748 0.00606 0.00606 ...
## - attr(*, "dimnames")=List of 2
## ..$ : chr [1:5] "High" "Low" "Moderate" "Female" ...
## ..$ : chr [1:6] "Dim.1" "Dim.2" "Dim.3" "Dim.4" ...
sum(bb[5, 1:6]) # Suma de cos² para la categoría "Male" (fila 5)
## [1] 0.9999322
# Ver las dimensiones de la base de datos
dim(Y)
## [1] 2000 8
# Obtener resultados del análisis FAMD para individuos
ind_analysis <- famd_pre_result %>% get_famd_ind()
ind_analysis
## FAMD results for individuals
## ===================================================
## Name Description
## 1 "$coord" "Coordinates"
## 2 "$cos2" "Cos2, quality of representation"
## 3 "$contrib" "Contributions"
# Ver la estructura interna del objeto
str(ind_analysis)
## List of 4
## $ coord : num [1:2000, 1:6] -0.121 -2.199 -2.538 -1.325 0.94 ...
## ..- attr(*, "dimnames")=List of 2
## .. ..$ : chr [1:2000] "1" "2" "3" "4" ...
## .. ..$ : chr [1:6] "Dim.1" "Dim.2" "Dim.3" "Dim.4" ...
## $ cos2 : num [1:2000, 1:6] 0.00199 0.35883 0.38831 0.33857 0.13226 ...
## ..- attr(*, "dimnames")=List of 2
## .. ..$ : chr [1:2000] "1" "2" "3" "4" ...
## .. ..$ : chr [1:6] "Dim.1" "Dim.2" "Dim.3" "Dim.4" ...
## $ contrib: num [1:2000, 1:6] 0.000284 0.093133 0.124063 0.033793 0.017033 ...
## ..- attr(*, "dimnames")=List of 2
## .. ..$ : chr [1:2000] "1" "2" "3" "4" ...
## .. ..$ : chr [1:6] "Dim.1" "Dim.2" "Dim.3" "Dim.4" ...
## $ dist : Named num [1:2000] 2.72 3.67 4.07 2.28 2.59 ...
## ..- attr(*, "names")= chr [1:2000] "1" "2" "3" "4" ...
## - attr(*, "class")= chr [1:3] "factoextra" "famd" "famd_ind"
## - attr(*, "element")= chr "individuals"
# Coordenadas factoriales
ind_analysis$coord[1:7, ]
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## 1 -0.1213524 2.1249023 0.382731476 0.2378672 0.6082363 -1.5126605
## 2 -2.1989753 1.6778224 -0.831410264 1.8875764 -0.2231458 1.1914800
## 3 -2.5379914 1.6438981 1.108935543 1.5715733 1.8000543 0.7026617
## 4 -1.3245859 -0.1221666 0.706820560 -0.5981716 0.4982676 -1.5171210
## 5 0.9403980 -1.9205036 0.003241845 -0.9173687 0.9018923 0.2349038
## 6 -1.7885024 -0.2327332 1.766018973 -0.1769242 -1.2674563 -0.7886481
## 7 0.4657184 -1.2479709 -2.399846235 -0.6054710 0.7663724 -0.2332416
Estas puntuaciones te permiten identificar perfiles extremos y agrupar estudiantes con características similares según los factores latentes.
# Contribuciones de los primeros 10 individuos
ind_analysis$contrib[1:10, ]
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## 1 0.0002836351 0.1406704014 5.892253e-03 0.002694736 0.018501010 0.1212605115
## 2 0.0931330754 0.0877034685 2.780506e-02 0.169689989 0.002490165 0.0752332703
## 3 0.1240633655 0.0841927289 4.946587e-02 0.117629548 0.162039903 0.0261654977
## 4 0.0337927502 0.0004649755 2.009608e-02 0.017041143 0.012415837 0.1219767066
## 5 0.0170328240 0.1149092657 4.227439e-07 0.040080670 0.040678048 0.0029242634
## 6 0.0616087362 0.0016874907 1.254538e-01 0.001490807 0.080337217 0.0329611941
## 7 0.0041774389 0.0485214437 2.316647e-01 0.017459581 0.029371792 0.0028830247
## 8 0.0120096117 0.0621388452 1.800759e-02 0.001181850 0.046045313 0.0111416259
## 9 0.1087788339 0.0107471939 4.477760e-02 0.147390487 0.127428579 0.0009476525
## 10 0.0025664814 0.1235718183 1.303554e-02 0.128905832 0.113734604 0.0037716775
Estas puntuaciones te permiten identificar qué alumnos “definen” cada
factor:
- Quiénes son los más “ejemplares” del eje académico vs. físico
vs. social, etc.
# La suma debe dar aproximadamente 100
sum(ind_analysis$contrib[1:nrow(Y), 4])
## [1] 100
# Cos2 de los primeros 8 individuos
ind_analysis$cos2[1:8, ]
## Dim.1 Dim.2 Dim.3 Dim.4 Dim.5 Dim.6
## 1 0.001986447 0.609057293 1.975917e-02 0.007632192 0.049902797 0.308647782
## 2 0.358829525 0.208900485 5.129538e-02 0.264397023 0.003695088 0.105346707
## 3 0.388314239 0.162911895 7.413369e-02 0.148892320 0.195332368 0.029764292
## 4 0.338573352 0.002880035 9.640750e-02 0.069046883 0.047909069 0.444153343
## 5 0.132256285 0.551598612 1.571728e-06 0.125857978 0.121647237 0.008252261
## 6 0.366469569 0.006205481 3.573136e-01 0.003586189 0.184045366 0.071256642
## 7 0.024848031 0.178424318 6.597995e-01 0.041998310 0.067286015 0.006232425
## 8 0.145507248 0.465433131 1.044676e-01 0.005790741 0.214859015 0.049060394
Este análisis permite identificar qué estudiantes encarnan mejor cada eje factorial y cuáles quedan difusos en el espacio de factores.
# La suma no necesariamente será 1, pero debe acercarse
sum(ind_analysis$cos2[3, 1:6])
## [1] 0.9993488
La suma de cos² en las seis primeras dimensiones es ≈ 0.99935, muy cercana a 1, lo que indica que el individuo 3 está casi totalmente explicado por el espacio factorial extraído.
Este análisis integral del estilo de vida estudiantil y su impacto en el rendimiento académico arroja hallazgos claros y prácticos:
Estrés predominante:
Más de la mitad de los estudiantes (51.4%) reportan niveles altos de
estrés, sin diferencias significativas entre géneros. Esta situación es
preocupante y demanda estrategias institucionales inmediatas para
mejorar el manejo del estrés académico.
Impacto de las horas de estudio en el
rendimiento:
Existe un efecto significativo y positivo de las horas dedicadas al
estudio sobre las calificaciones (GPA). Concretamente, cada hora
adicional de estudio diario aumenta en promedio 0.39 puntos la
calificación, explicando un notable 54% de la variabilidad en el
GPA.
Factores subyacentes identificados (FAMD):
Perfiles individuales claramente
definidos:
Se han identificado estudiantes que destacan especialmente en
dimensiones particulares, permitiendo una futura segmentación
estratégica para intervenciones educativas y de bienestar.
Implicaciones y recomendaciones:
- Es fundamental equilibrar el esfuerzo académico con prácticas
saludables de descanso y ejercicio para mitigar los efectos negativos
del estrés.
- Las instituciones educativas deberían priorizar intervenciones
personalizadas y programas específicos de gestión del estrés y bienestar
físico, reconociendo la importancia de estos factores en el rendimiento
académico.
- Finalmente, estudios posteriores deberían utilizar técnicas
adicionales como análisis de conglomerados (clustering) basados en estas
dimensiones factoriales, facilitando el diseño de estrategias educativas
y sociales aún más focalizadas y efectivas.
Social_Hours_Per_Day(Horas sociales)