# Cargar librerias necesarias
library(readxl)
library(polycor)
library(psych)

# Cargar los datos
setwd("C:/Users/jorge/Downloads")
datos <- read_excel("habitos_estudio.xlsx")

PUNTO 1

(A) ¿Cuantos componentes principales son necesarios para explicar al menos el 70 % de la varianza total?

KMO(datos)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = datos)
## Overall MSA =  0.84
## MSA for each item = 
##     horas_estudio_semana         asistencia_clase      participacion_clase 
##                     0.92                     0.89                     0.91 
##           uso_biblioteca      organizacion_tiempo          calidad_apuntes 
##                     0.87                     0.94                     0.67 
##            estudio_grupo     uso_tecnicas_estudio           consulta_dudas 
##                     0.75                     0.65                     0.80 
##       promedio_academico satisfaccion_aprendizaje         estres_academico 
##                     0.90                     0.96                     0.64
# Data normalizada
data_normalized <- scale(datos)

# Matriz de correlaciones
corr_matrix <- cor(data_normalized)
corr_matrix
##                          horas_estudio_semana asistencia_clase
## horas_estudio_semana               1.00000000       0.55576723
## asistencia_clase                   0.55576723       1.00000000
## participacion_clase                0.44174142       0.58463068
## uso_biblioteca                     0.62649287       0.74153716
## organizacion_tiempo                0.53146781       0.28835065
## calidad_apuntes                    0.37266420      -0.03457655
## estudio_grupo                      0.13283643       0.05854051
## uso_tecnicas_estudio               0.36708127      -0.03298772
## consulta_dudas                     0.20294056       0.49300200
## promedio_academico                 0.68483679       0.70283991
## satisfaccion_aprendizaje           0.49358852       0.40671091
## estres_academico                  -0.08598796      -0.11837879
##                          participacion_clase uso_biblioteca organizacion_tiempo
## horas_estudio_semana              0.44174142     0.62649287          0.53146781
## asistencia_clase                  0.58463068     0.74153716          0.28835065
## participacion_clase               1.00000000     0.55744250          0.22480673
## uso_biblioteca                    0.55744250     1.00000000          0.33240965
## organizacion_tiempo               0.22480673     0.33240965          1.00000000
## calidad_apuntes                  -0.03600721    -0.01726567          0.60847134
## estudio_grupo                     0.18899028    -0.04873499          0.25378511
## uso_tecnicas_estudio             -0.03638394    -0.01445571          0.62838884
## consulta_dudas                    0.48592125     0.34641298          0.12218877
## promedio_academico                0.50880479     0.72293140          0.43926926
## satisfaccion_aprendizaje          0.30749723     0.39896560          0.35603907
## estres_academico                 -0.10210279    -0.15559540         -0.07888027
##                          calidad_apuntes estudio_grupo uso_tecnicas_estudio
## horas_estudio_semana         0.372664201    0.13283643           0.36708127
## asistencia_clase            -0.034576552    0.05854051          -0.03298772
## participacion_clase         -0.036007210    0.18899028          -0.03638394
## uso_biblioteca              -0.017265673   -0.04873499          -0.01445571
## organizacion_tiempo          0.608471344    0.25378511           0.62838884
## calidad_apuntes              1.000000000    0.39672720           0.96209326
## estudio_grupo                0.396727197    1.00000000           0.42002879
## uso_tecnicas_estudio         0.962093262    0.42002879           1.00000000
## consulta_dudas              -0.122468060    0.27809862          -0.11154334
## promedio_academico           0.213945518    0.09485780           0.22512222
## satisfaccion_aprendizaje     0.291414859    0.17910265           0.28788084
## estres_academico            -0.001553374    0.02133703           0.03334149
##                          consulta_dudas promedio_academico
## horas_estudio_semana         0.20294056          0.6848368
## asistencia_clase             0.49300200          0.7028399
## participacion_clase          0.48592125          0.5088048
## uso_biblioteca               0.34641298          0.7229314
## organizacion_tiempo          0.12218877          0.4392693
## calidad_apuntes             -0.12246806          0.2139455
## estudio_grupo                0.27809862          0.0948578
## uso_tecnicas_estudio        -0.11154334          0.2251222
## consulta_dudas               1.00000000          0.3673600
## promedio_academico           0.36735999          1.0000000
## satisfaccion_aprendizaje     0.25932889          0.4929721
## estres_academico            -0.09403489         -0.1403426
##                          satisfaccion_aprendizaje estres_academico
## horas_estudio_semana                   0.49358852     -0.085987958
## asistencia_clase                       0.40671091     -0.118378787
## participacion_clase                    0.30749723     -0.102102785
## uso_biblioteca                         0.39896560     -0.155595397
## organizacion_tiempo                    0.35603907     -0.078880274
## calidad_apuntes                        0.29141486     -0.001553374
## estudio_grupo                          0.17910265      0.021337025
## uso_tecnicas_estudio                   0.28788084      0.033341485
## consulta_dudas                         0.25932889     -0.094034893
## promedio_academico                     0.49297214     -0.140342576
## satisfaccion_aprendizaje               1.00000000     -0.059593028
## estres_academico                      -0.05959303      1.000000000
# Aplicacion del ACP
data.pca <- princomp(covmat = corr_matrix) 
summary(data.pca)
## Importance of components:
##                           Comp.1    Comp.2    Comp.3     Comp.4     Comp.5
## Standard deviation     2.1300016 1.6087961 1.0823275 0.98493767 0.80524433
## Proportion of Variance 0.3780756 0.2156854 0.0976194 0.08084185 0.05403487
## Cumulative Proportion  0.3780756 0.5937610 0.6913804 0.77222224 0.82625711
##                            Comp.6     Comp.7     Comp.8     Comp.9    Comp.10
## Standard deviation     0.70173346 0.65718471 0.58855306 0.55690454 0.49433978
## Proportion of Variance 0.04103582 0.03599098 0.02886623 0.02584522 0.02036432
## Cumulative Proportion  0.86729293 0.90328390 0.93215013 0.95799535 0.97835967
##                           Comp.11     Comp.12
## Standard deviation     0.47302272 0.189561225
## Proportion of Variance 0.01864587 0.002994455
## Cumulative Proportion  0.99700555 1.000000000

Se necesitan 4 componentes para explicar el 70% de la VT

(B) ¿Cuales son las variables que mas contribuyen a cada uno de los primeros tres componentes principales?

data.pca$loadings[, 1:3]
##                               Comp.1      Comp.2      Comp.3
## horas_estudio_semana      0.38544846  0.03569006  0.23180656
## asistencia_clase          0.35756271 -0.27428826  0.01287072
## participacion_clase       0.30364800 -0.24019439 -0.24435317
## uso_biblioteca            0.35760592 -0.25516634  0.22308609
## organizacion_tiempo       0.30953330  0.28943704  0.11119564
## calidad_apuntes           0.19766943  0.53409798  0.03342579
## estudio_grupo             0.14312861  0.25065217 -0.68594643
## uso_tecnicas_estudio      0.20032157  0.53768733  0.01240816
## consulta_dudas            0.22332544 -0.24494424 -0.55446745
## promedio_academico        0.39832629 -0.10643796  0.15294793
## satisfaccion_aprendizaje  0.30583206  0.04278740  0.02239445
## estres_academico         -0.07696981  0.08101146 -0.14538650

PC1 (Primera Componente Principal) - 37.80% de varianza

Cargas positivas altas:

promedio_academico (0.3963)

horas_estudio_semana (0.3854)

uso_biblioteca (0.3576)

asistencia_clase (0.3575)

organizacion_tiempo (0.3095)

satisfaccion_aprendizaje (0.3058)

participacion_clase (0.3036)

PC2 (Segunda Componente Principal) - 59.37% de varianza

Cargas positivas altas:

calidad_apuntes (0.5340)

uso_tecnicas_estudio (0.5376)

PC3 (Tercera Componente Principal) - 69.13% de varianza

Cargas negativas altas:

estudio_grupo (-0.6859)

consulta_dudas (-0.5544)

(C) ¿Como se pueden interpretar los primeros tres componentes principales en terminos de patrones de habitos de estudio?

PC1 -> Disciplina del estudiante

PC2 -> Organizacion del estudiante

PC3 -> Interaccion del estudiante

(D) ¿Que variables muestran mayor representatividad en el espacio reducido de componentes principales?

rowSums(data.pca$loadings[, 1:3]^2)
##     horas_estudio_semana         asistencia_clase      participacion_clase 
##               0.20357858               0.20325080               0.20960392 
##           uso_biblioteca      organizacion_tiempo          calidad_apuntes 
##               0.24275926               0.19194914               0.32545114 
##            estudio_grupo     uso_tecnicas_estudio           consulta_dudas 
##               0.55383482               0.32939036               0.41730609 
##       promedio_academico satisfaccion_aprendizaje         estres_academico 
##               0.19338595               0.09586552               0.03362444

Para las 3 componentes principales las variables estudio grupo y # consulta_dudas son aquellas que muestran mayor representatividad por encima de 0.75

PUNTO 2

(A) ¿Cuantos factores son apropiados para representar la estructura subyacente de los habitos de estudio?

library(GPArotation)

# Prueba de esfericidad de Bartlett
cortest.bartlett(corr_matrix, n = nrow(data_normalized))
## $chisq
## [1] 2310.204
## 
## $p.value
## [1] 0
## 
## $df
## [1] 66
# Determinar el número óptimo de factores
# Método 1: Autovalores > 1 (criterio de Kaiser)
eigen_values <- eigen(corr_matrix)$values
eigen_values
##  [1] 4.53690699 2.58822487 1.17143277 0.97010221 0.64841842 0.49242985
##  [7] 0.43189174 0.34639471 0.31014267 0.24437181 0.22375049 0.03593346
# Gráfico de sedimentación (scree plot)
plot(eigen_values, type = "b", main = "Gráfico de sedimentación",
     xlab = "Factor", ylab = "Valor propio")

# Método 2: Paralell Analysis (más robusto)
fa.parallel(data_normalized, fa = "fa", n.iter = 100, show.legend = TRUE,
            main = "Análisis paralelo - Determinación del número de factores")

## Parallel analysis suggests that the number of factors =  3  and the number of components =  NA

Son apropiados 3 factores para representar la estructura subyacente de los hábitos de estudio, ya que explican la mayor parte de la varianza antes de que los autovalores comiencen a estabilizarse

(B) ¿Que variables se agrupan en cada factor y como se pueden interpretar estos constructos latentes? Rotar la matriz con el metodo Varimax.

datos_cor <- cor(datos)
modelo1<-fa(datos_cor,
           nfactors = 3,
           rotate = "varimax",
           fm="ml") 

modelo1
## Factor Analysis using method =  ml
## Call: fa(r = datos_cor, nfactors = 3, rotate = "varimax", fm = "ml")
## Standardized loadings (pattern matrix) based upon correlation matrix
##                            ML2   ML1   ML3    h2    u2 com
## horas_estudio_semana      0.71  0.39 -0.01 0.659 0.341 1.5
## asistencia_clase          0.82 -0.02  0.24 0.736 0.264 1.2
## participacion_clase       0.61 -0.03  0.38 0.511 0.489 1.7
## uso_biblioteca            0.89  0.00  0.01 0.786 0.214 1.0
## organizacion_tiempo       0.36  0.64  0.06 0.544 0.456 1.6
## calidad_apuntes          -0.02  0.97  0.01 0.942 0.058 1.0
## estudio_grupo            -0.06  0.41  0.53 0.451 0.549 1.9
## uso_tecnicas_estudio     -0.02  0.99  0.03 0.983 0.017 1.0
## consulta_dudas            0.39 -0.12  0.68 0.626 0.374 1.7
## promedio_academico        0.82  0.24  0.10 0.741 0.259 1.2
## satisfaccion_aprendizaje  0.47  0.30  0.15 0.334 0.666 1.9
## estres_academico         -0.16  0.02 -0.01 0.028 0.972 1.1
## 
##                        ML2  ML1  ML3
## SS loadings           3.55 2.81 0.98
## Proportion Var        0.30 0.23 0.08
## Cumulative Var        0.30 0.53 0.61
## Proportion Explained  0.48 0.38 0.13
## Cumulative Proportion 0.48 0.87 1.00
## 
## Mean item complexity =  1.4
## Test of the hypothesis that 3 factors are sufficient.
## 
## df null model =  66  with the objective function =  7.85
## df of  the model are 33  and the objective function was  0.1 
## 
## The root mean square of the residuals (RMSR) is  0.01 
## The df corrected root mean square of the residuals is  0.02 
## 
## Fit based upon off diagonal values = 1
## Measures of factor score adequacy             
##                                                    ML2  ML1  ML3
## Correlation of (regression) scores with factors   0.96 0.99 0.81
## Multiple R square of scores with factors          0.91 0.99 0.66
## Minimum correlation of possible factor scores     0.83 0.97 0.31
modelo_varimax<-fa(datos_cor,nfactors = 3,rotate = "varimax",
              fa="minres")
par(mar = c(5, 12, 4, 2))  # un poco menos de margen izquierdo

fa.diagram(modelo_varimax,
           cex = 0.7,      # texto más compacto
           rsize = 0.6,    # cargas más discretas
           e.size = 1.0,   # tamaño de los óvalos MR
           main = "Análisis Factorial con Rotación Varimax"
)

Grupo ML1

Se compone de las variables uso_técnicas_estudio, calidad_apuntes y organización_tiempo. Representa hábitos de estudio personales o autogestión académica. Mide la forma en que el estudiante organiza su tiempo, toma apuntes y aplica técnicas efectivas para aprender.

Grupo ML2

Se compone de las variables uso_biblioteca, asistencia_clase, promedio_academico, horas_estudio_semana, participación_clase y satisfacción_aprendizaje. Refleja desempeño y compromiso académico. Indica el grado de involucramiento del estudiante con las actividades académicas formales y su satisfacción con el aprendizaje.

Grupo ML3

Se compone de las variables consulta_dudas y estudio_grupo. Representa interacción y colaboración académica. Evalúa la disposición del estudiante para trabajar en grupo y buscar apoyo cuando tiene dudas.

Notas: la variable estres_academico no pertenece claramente a ningún factor; puede ser una variable independiente o un indicador negativo general del bienestar académico.

(C) ¿Cual es la confiabilidad de cada factor identificado?

library(psych)

# Hábitos de estudio personales
factor1 <- datos[, c("uso_tecnicas_estudio", "calidad_apuntes", "organizacion_tiempo")]
alpha1 <- psych::alpha(factor1)
alpha1 <- alpha1$total$raw_alpha

# Compromiso y desempeño académico
factor2 <- datos[, c("uso_biblioteca", "asistencia_clase", "promedio_academico", "horas_estudio_semana", "participacion_clase", "satisfaccion_aprendizaje")]
alpha2 <- psych::alpha(factor2)
alpha2 <- alpha2$total$raw_alpha

# Colaboración académica
factor3 <- datos[, c("consulta_dudas", "estudio_grupo")]
alpha3 <- psych::alpha(factor3)
alpha3 <- alpha3$total$raw_alpha

# --- Mostrar resultados ---
data.frame(
  Factor = c("ML1: Hábitos personales", 
             "ML2: Compromiso académico", 
             "ML3: Colaboración académica"),
  Alpha_Cronbach = round(c(alpha1, alpha2, alpha3), 3)
)
##                        Factor Alpha_Cronbach
## 1     ML1: Hábitos personales          0.891
## 2   ML2: Compromiso académico          0.794
## 3 ML3: Colaboración académica          0.435

ML1 (0.89): Alta confiabilidad. Los ítems muestran una fuerte coherencia interna, lo que indica que las prácticas personales de organización y estudio están altamente relacionadas y miden un mismo constructo subyacente.

ML2 (0.79): Buena confiabilidad. Las variables presentan consistencia aceptable y reflejan un constructo sólido asociado al compromiso académico y la implicación del estudiante con su aprendizaje.

ML3 (0.44): Baja confiabilidad. Indica poca consistencia interna entre los ítems. Esto puede deberse a que las dos variables, aunque relacionadas con la interacción académica, podrían reflejar aspectos distintos del apoyo entre pares o tener diferencias en frecuencia o contexto de uso.

(D) ¿Que porcentaje de la varianza de cada variable es explicado por los factores comunes?

# --- Calcular las comunalidades ---
fa_result <- fa(r = cor(data_normalized), nfactors = 3, rotate = "varimax", fm = "ml")
comunalidades <- fa_result$communality
comunalidades
##     horas_estudio_semana         asistencia_clase      participacion_clase 
##               0.65916616               0.73642347               0.51091467 
##           uso_biblioteca      organizacion_tiempo          calidad_apuntes 
##               0.78571342               0.54410985               0.94226857 
##            estudio_grupo     uso_tecnicas_estudio           consulta_dudas 
##               0.45146404               0.98269837               0.62643257 
##       promedio_academico satisfaccion_aprendizaje         estres_academico 
##               0.74117070               0.33373046               0.02751862
# Porcentaje de la varianza
comunalidades_porcentaje <- comunalidades * 100
round(comunalidades_porcentaje, 2)
##     horas_estudio_semana         asistencia_clase      participacion_clase 
##                    65.92                    73.64                    51.09 
##           uso_biblioteca      organizacion_tiempo          calidad_apuntes 
##                    78.57                    54.41                    94.23 
##            estudio_grupo     uso_tecnicas_estudio           consulta_dudas 
##                    45.15                    98.27                    62.64 
##       promedio_academico satisfaccion_aprendizaje         estres_academico 
##                    74.12                    33.37                     2.75

Los resultados muestran que las variables con mayor varianza explicada por los factores comunes son uso de técnicas de estudio (98.27%), calidad de apuntes (94.23%) y uso de biblioteca (78.57%), lo que indica que están fuertemente representadas por los factores. En contraste, estrés académico (2.75%) y satisfacción con el aprendizaje (33.37%) presentan baja varianza explicada, sugiriendo que no se ajustan bien al modelo factorial y aportan poca información común con las demás variables.

PUNTO 3

(A) ¿En que se diferencian conceptualmente el ACP y el AF en su enfoque sobre la varianza?

El ACP busca resumir toda la información posible de las variables originales, tomando en cuenta toda su variación. En cambio, el AF solo se enfoca en la parte de la variación que las variables tienen en común, o sea, lo que realmente las une o las relaciona entre sí.

(B) ¿Como difieren los criterios para determinar el numero de componentes vs factores?

En el ACP, se elige el número de componentes viendo cuáles tienen más importancia (por ejemplo, los que tienen valor propio mayor que 1 o los que aparecen antes del “codo” en el gráfico). En el AF, además de eso, también se analiza cuántos factores tienen sentido según el tema del estudio y qué tanto explican las variables.

(C) ¿Que diferencias existen en la interpretacion de las cargas factoriales vs componentes?

En el ACP, las cargas indican qué tanto aporta cada variable al componente. En el AF, las cargas muestran qué tan relacionada está cada variable con el factor o idea principal que representa.

(D) ¿Cuando serıa mas apropiado usar cada tecnica?

El ACP se usa cuando queremos reducir la cantidad de variables y simplificar los datos sin perder mucha información. El AF se usa cuando queremos descubrir las ideas o factores ocultos que explican por qué las variables se relacionan entre sí.

PUNTO 4

library(factoextra)
library(GPArotation)
library(knitr)
library(yacca)
habitosX <- datos[,1:9]
habitosY <- datos[,10:12]

acc<-cca(habitosX, habitosY, standardize.scores=TRUE)
summary(acc)
## 
## Canonical Correlation Analysis - Summary
## 
## 
## Canonical Correlations:
## 
##      CV 1      CV 2      CV 3 
## 0.8351814 0.2247033 0.1697470 
## 
## Shared Variance on Each Canonical Variate:
## 
##       CV 1       CV 2       CV 3 
## 0.69752793 0.05049157 0.02881403 
## 
## Bartlett's Chi-Squared Test:
## 
##           rho^2      Chisq df  Pr(>X)    
## CV 1   0.697528 373.468240 27 < 2e-16 ***
## CV 2   0.050492  23.706590 16 0.09611 .  
## CV 3   0.028814   8.551912  7 0.28645    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## 
## Canonical Variate Coefficients:
## 
##  X Vars:
##                              CV 1        CV 2        CV 3
## horas_estudio_semana -0.030676549  0.05162680  0.02423189
## asistencia_clase     -0.028485748 -0.01146310  0.04266178
## participacion_clase  -0.017082422 -0.03632003  0.01123591
## uso_biblioteca       -0.155409105 -0.26059898 -0.14017544
## organizacion_tiempo  -0.006368456 -0.07493812 -0.20757112
## calidad_apuntes       0.003786307  0.14172877 -1.37291319
## estudio_grupo         0.018240540  0.11161602 -0.01846098
## uso_tecnicas_estudio -0.105363046  0.12103673  1.44985680
## consulta_dudas       -0.052258328  0.11834801 -0.16393254
## 
##  Y Vars:
##                                  CV 1        CV 2        CV 3
## promedio_academico       -0.101301887 -0.07540035  0.04457224
## satisfaccion_aprendizaje -0.092042983  0.47037515 -0.15606331
## estres_academico          0.009052555  0.13516016  0.41783091
## 
## 
## Structural Correlations (Loadings):
## 
##  X Vars:
##                            CV 1        CV 2        CV 3
## horas_estudio_semana -0.8450031  0.24860450  0.03458467
## asistencia_clase     -0.8428736 -0.26318258  0.07428977
## participacion_clase  -0.6138720 -0.15083576 -0.06647615
## uso_biblioteca       -0.8629431 -0.40997287 -0.07447752
## organizacion_tiempo  -0.5525066  0.31491187 -0.19480005
## calidad_apuntes      -0.2978349  0.76766988 -0.13361063
## estudio_grupo        -0.1440428  0.60901238 -0.03917623
## uso_tecnicas_estudio -0.3078083  0.76661240  0.09671129
## consulta_dudas       -0.4531029  0.04111258 -0.24122169
## 
##  Y Vars:
##                                CV 1       CV 2        CV 3
## promedio_academico       -0.9830114 -0.1673305  0.07542569
## satisfaccion_aprendizaje -0.6432792  0.7324385 -0.22299256
## estres_academico          0.1563519  0.3384583  0.92790088
## 
## 
## Fractional Variance Deposition on Canonical Variates:
## 
##  X Vars:
##                            CV 1        CV 2        CV 3
## horas_estudio_semana 0.71403017 0.061804197 0.001196099
## asistencia_clase     0.71043587 0.069265072 0.005518970
## participacion_clase  0.37683885 0.022751425 0.004419078
## uso_biblioteca       0.74467077 0.168077753 0.005546901
## organizacion_tiempo  0.30526351 0.099169484 0.037947061
## calidad_apuntes      0.08870565 0.589317042 0.017851801
## estudio_grupo        0.02074832 0.370896076 0.001534777
## uso_tecnicas_estudio 0.09474595 0.587694568 0.009353074
## consulta_dudas       0.20530225 0.001690244 0.058187903
## 
##  Y Vars:
##                                CV 1      CV 2        CV 3
## promedio_academico       0.96631146 0.0279995 0.005689035
## satisfaccion_aprendizaje 0.41380816 0.5364662 0.049725680
## estres_academico         0.02444593 0.1145540 0.861000038
## 
## 
## Canonical Communalities (Fraction of Total Variance
## Explained for Each Variable, Within Sets):
## 
##  X Vars:
## horas_estudio_semana     asistencia_clase  participacion_clase 
##            0.7770305            0.7852199            0.4040094 
##       uso_biblioteca  organizacion_tiempo      calidad_apuntes 
##            0.9182954            0.4423801            0.6958745 
##        estudio_grupo uso_tecnicas_estudio       consulta_dudas 
##            0.3931792            0.6917936            0.2651804 
## 
##  Y Vars:
##       promedio_academico satisfaccion_aprendizaje         estres_academico 
##                        1                        1                        1 
## 
## 
## Canonical Variate Adequacies (Fraction of Total Variance
## Explained by Each CV, Within Sets):
## 
## 
##  X Vars:
##       CV 1       CV 2       CV 3 
## 0.36230459 0.21896287 0.01572841 
## 
##  Y Vars:
##      CV 1      CV 2      CV 3 
## 0.4681885 0.2263399 0.3054716 
## 
## 
## Redundancy Coefficients (Fraction of Total Variance
## Explained by Each CV, Across Sets):
## 
## 
##  X | Y:
##         CV 1         CV 2         CV 3 
## 0.2527175716 0.0110557782 0.0004531988 
## 
##  Y | X:
##        CV 1        CV 2        CV 3 
## 0.326574564 0.011428256 0.008801868 
## 
## 
## Aggregate Redundancy Coefficients (Total Variance
## Explained by All CVs, Across Sets):
## 
##  X | Y: 0.2642265 
##  Y | X: 0.3468047

(A) ¿Cuantas dimensiones canonicas significativas existen entre los habitos de estudio y los resultados academicos, y que fuerza tienen estas relaciones? Use un nivel de significancia del 5 %.

De acuerdo con el test de Bartlett:

  • La primera dimensión canónica (CV1) es significativa (p < 0.001), con una correlación alta (r = 0.835).

  • La segunda (CV2) y la tercera (CV3) no son significativas (p = 0.096 y p = 0.286, respectivamente).

Solo existe una dimensión canónica significativa, lo que indica una relación fuerte entre los hábitos de estudio y los resultados académicos, concentrada principalmente en la primera combinación lineal.

(B) ¿Que combinacion lineal de habitos de estudio se relaciona mas fuertemente con que combinacion lineal de resultados academicos en la primera dimension canonica?

La primera combinación lineal de hábitos de estudio (CV1-X) se asocia principalmente con:

  • Uso de biblioteca (-0.86)

  • Asistencia a clase (-0.84)

  • Horas de estudio (-0.84)

  • Participación (-0.61)

Y está fuertemente relacionada con la primera combinación de resultados académicos (CV1-Y), dominada por:

  • Promedio académico (-0.98)

  • Satisfacción con el aprendizaje (-0.64)

Los estudiantes que estudian más horas, asisten a clase, usan la biblioteca y participan activamente tienden a tener mejores promedios académicos y mayor satisfacción con su aprendizaje.

(C) ¿Que porcentaje de la varianza de los resultados acad´emicos (Y) puede explicarse por los habitos de estudio (X), y viceversa?

  • Los hábitos de estudio (X) explican el 34.68 % de la varianza de los resultados académicos (Y).

  • Los resultados (Y) explican el 26.42 % de la varianza de los hábitos (X).

Existe una relación moderada a fuerte: los hábitos de estudio explican una parte importante del rendimiento académico, mostrando que la conducta del estudiante influye directamente en su desempeño.

(D) ¿Cual es la contribucion relativa de cada dimension canonica en la explicacion de la varianza cruzada entre conjuntos

  • Primera dimensión (CV1): 95.6% en X y 94.2% en Y

  • Segunda dimensión (CV2): 95.6% en X y 94.2% en Y

  • Tercera dimensión (CV3): 0.2% en X y 2.5 % en Y

La primera dimensión concentra casi toda la relación entre los conjuntos, por lo que resume de manera adecuada la asociación global entre hábitos y rendimiento académico.

Y_dado_X <- c(0.326574564, 0.011428256, 0.008801868)
X_dado_Y <- c(0.252717572, 0.011055778, 0.000453199)

pct_Y_dado_X <- 100 * Y_dado_X / sum(Y_dado_X)
pct_X_dado_Y <- 100 * X_dado_Y / sum(X_dado_Y)

cv_names <- paste("CV", seq_along(pct_Y_dado_X))

tabla_contribucion <- data.frame(
  Dimensión = cv_names,
  XdadoY = sprintf("%.1f%%", pct_X_dado_Y),
  YdadoX = sprintf("%.1f%%", pct_Y_dado_X)
)

knitr::kable(tabla_contribucion, align = "c",
  caption = "Contribucion relativa de cada dimension canonica en la explicacion de la varianza cruzada entre conjuntos")
Contribucion relativa de cada dimension canonica en la explicacion de la varianza cruzada entre conjuntos
Dimensión XdadoY YdadoX
CV 1 95.6% 94.2%
CV 2 4.2% 3.3%
CV 3 0.2% 2.5%