EJERICIO 1

data<- read.csv("Atencion.csv")
head(data)
##   S  E DI  C D P1 P2 P3 P4 P5 P6 P7 P8 P9
## 1 h 77 28 NO 1  3  4  3  4  4  5  1  2  2
## 2 h 88 26 NO 2  2  3  2  4  4  5  4  5  5
## 3 h 90 28 NO 3  2  2  2  4  4  5  2  3  2
## 4 h 62 19 SI 3  4  3  4  3  3  3  4  5  5
## 5 h 90 30 SI 1  5  5  5  2  2  3  3  4  5
## 6 h 63 30 NO 3  4  3  4  3  3  3  2  3  2
library(psych)
## Warning: package 'psych' was built under R version 4.3.3
datos2 <- data[,-1]
describe(datos2)
##    vars   n  mean    sd median trimmed   mad min max range  skew kurtosis   se
## E     1 100 68.64 17.52   68.5   70.15 18.53  24  94    70 -0.63    -0.08 1.75
## DI    2 100 13.31 10.03   14.0   12.92 14.83   1  30    29  0.27    -1.44 1.00
## C*    3 100  1.42  0.50    1.0    1.40  0.00   1   2     1  0.32    -1.92 0.05
## D     4 100  2.03  0.98    2.0    1.95  1.48   1   4     3  0.39    -1.11 0.10
## P1    5 100  3.50  1.17    3.5    3.51  2.22   1   5     4 -0.06    -1.36 0.12
## P2    6 100  3.29  1.09    3.0    3.24  1.48   2   5     3  0.15    -1.36 0.11
## P3    7 100  3.64  1.28    3.5    3.69  2.22   1   5     4 -0.15    -1.59 0.13
## P4    8 100  3.21  1.18    3.0    3.21  1.48   1   5     4 -0.01    -1.04 0.12
## P5    9 100  3.32  1.06    3.0    3.29  1.48   1   5     4  0.05    -1.14 0.11
## P6   10 100  3.47  1.23    3.0    3.47  1.48   1   5     4  0.20    -1.48 0.12
## P7   11 100  2.85  1.08    3.0    2.94  1.48   1   4     3 -0.18    -1.45 0.11
## P8   12 100  3.76  1.05    3.0    3.81  1.48   2   5     3  0.01    -1.45 0.10
## P9   13 100  3.62  1.50    5.0    3.65  0.00   2   5     3 -0.16    -1.99 0.15
datos<- datos2[,-3]
describe(datos)
##    vars   n  mean    sd median trimmed   mad min max range  skew kurtosis   se
## E     1 100 68.64 17.52   68.5   70.15 18.53  24  94    70 -0.63    -0.08 1.75
## DI    2 100 13.31 10.03   14.0   12.93 14.83   1  30    29  0.27    -1.44 1.00
## D     3 100  2.03  0.98    2.0    1.95  1.48   1   4     3  0.39    -1.11 0.10
## P1    4 100  3.50  1.17    3.5    3.51  2.22   1   5     4 -0.06    -1.36 0.12
## P2    5 100  3.29  1.09    3.0    3.24  1.48   2   5     3  0.15    -1.36 0.11
## P3    6 100  3.64  1.28    3.5    3.69  2.22   1   5     4 -0.15    -1.59 0.13
## P4    7 100  3.21  1.18    3.0    3.21  1.48   1   5     4 -0.01    -1.04 0.12
## P5    8 100  3.32  1.06    3.0    3.29  1.48   1   5     4  0.05    -1.14 0.11
## P6    9 100  3.47  1.23    3.0    3.48  1.48   1   5     4  0.20    -1.48 0.12
## P7   10 100  2.85  1.08    3.0    2.94  1.48   1   4     3 -0.18    -1.45 0.11
## P8   11 100  3.76  1.05    3.0    3.81  1.48   2   5     3  0.01    -1.45 0.10
## P9   12 100  3.62  1.50    5.0    3.65  0.00   2   5     3 -0.16    -1.99 0.15
R2    <-  cor(datos)

Las variables presentan diferentes rangos y distribuciones, con algunas en escalas pequeñas (como P1 a P9) y otras más amplias (como E, DI, D), mostrando en general equilibrio, aunque con ligeras asimetrías. Se ajustan los datos para calcular correlaciones y explorar relaciones entre las variables.

library(ggcorrplot)
## Loading required package: ggplot2
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
ggcorrplot(R2,type="lower",hc.order = T)

Otra Forma

cor.plot(R2,main="Mapa de calor", diag=F, show.legend = T, cex=0.5)

Prueba de esfericidad de Bartlett

cortest.bartlett(R2)
## Warning in cortest.bartlett(R2): n not specified, 100 used
## $chisq
## [1] 1080.798
## 
## $p.value
## [1] 2.295366e-183
## 
## $df
## [1] 66

La prueba de esfericidad de Bartlett arroja un valor de chi-cuadrado alto, lo que indica que las correlaciones entre las variables son lo suficientemente fuertes para realizar un análisis factorial. Esto sugiere que el modelo factorial es adecuado para identificar patrones o estructuras subyacentes en los datos.

Prueba de KMO

KMO(R2)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R2)
## Overall MSA =  0.69
## MSA for each item = 
##    E   DI    D   P1   P2   P3   P4   P5   P6   P7   P8   P9 
## 0.40 0.11 0.74 0.64 0.82 0.67 0.61 0.69 0.72 0.66 0.82 0.72
datos1 <- datos
R3    <-  cor(datos1)

cortest.bartlett(R3)
## Warning in cortest.bartlett(R3): n not specified, 100 used
## $chisq
## [1] 1080.798
## 
## $p.value
## [1] 2.295366e-183
## 
## $df
## [1] 66
KMO(R3)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R3)
## Overall MSA =  0.69
## MSA for each item = 
##    E   DI    D   P1   P2   P3   P4   P5   P6   P7   P8   P9 
## 0.40 0.11 0.74 0.64 0.82 0.67 0.61 0.69 0.72 0.66 0.82 0.72

Scree plot

scree(R3)
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect.  Try a
## different factor score estimation method.

aplicamos máxima verosimilitud

modelo_varimax2 <- fa(R3,nfactors = 2,rotate = "varimax",fa="ml")
fa.diagram(modelo_varimax2)

Método de Componentes principales

modelo     <- principal(datos1,nfactors=2,rotate="varimax")
library(ade4)
load    <- modelo$loadings[,1:2]
s.corcircle(load,grid=FALSE)

El análisis factorial muestra dos factores principales (MR1 y MR2). El primer factor (MR1) agrupa variables como P2, P3, P1, P7, P8 y D, indicando que están altamente relacionadas y podrían representar un mismo constructo, posiblemente la percepción de atención general. El segundo factor (MR2) agrupa variables como P4, P5, P6, E y DI, lo que sugiere que estas miden un aspecto diferente, como características individuales o específicas del entorno. Este modelo permite identificar patrones en las variables que pueden ser útiles para mejorar áreas específicas de atención.

EJERCICIO 2

data<- read.csv("Calificaciones.csv")
head(data)
##   Edad Grado Naturales Sociales Matematicas Espanol Ingles Deportes Humanidades
## 1   17    11        80       75          79      69     67       93          91
## 2   13     8        78       74          98      61     57       99          97
## 3   14     9        79       83          90      61     58       99          92
## 4   15     9        90       95          88      88     85       94          94
## 5   18    12        89       85          69      78     82       95          92
## 6   11     6        89       80          95      86     85       93          90
##   Etica
## 1    85
## 2    99
## 3    91
## 4    87
## 5    73
## 6   100

La edad tiene un rango más pequeño (10 a 18 años) comparado con las calificaciones, que varían más. Materias como Deportes y Ética tienen menos cambios en las notas, lo que indica que son más consistentes. En general, los datos son estables y no muestran variaciones extremas.

library(psych)
datos <- data
describe(datos)
##             vars   n  mean   sd median trimmed   mad min max range  skew
## Edad           1 100 14.44 2.51   15.0   14.50  2.97  10  18     8 -0.18
## Grado          2 100  8.99 1.98    9.0    8.99  2.97   6  12     6 -0.09
## Naturales      3 100 85.30 4.81   85.5   85.40  5.19  74  95    21 -0.17
## Sociales       4 100 85.61 6.99   85.5   85.61  8.15  70  99    29 -0.02
## Matematicas    5 100 81.62 9.24   81.5   81.46 11.12  66 100    34  0.07
## Espanol        6 100 74.75 9.00   76.0   74.76 11.12  60  90    30 -0.02
## Ingles         7 100 75.22 9.47   77.5   75.49 11.86  57  91    34 -0.19
## Deportes       8 100 94.92 3.19   95.0   94.89  4.45  90 100    10  0.11
## Humanidades    9 100 89.99 4.82   90.0   89.99  5.93  81  98    17 -0.02
## Etica         10 100 83.92 9.08   84.0   83.69 11.86  70 100    30  0.16
##             kurtosis   se
## Edad           -1.26 0.25
## Grado          -1.22 0.20
## Naturales      -0.85 0.48
## Sociales       -1.00 0.70
## Matematicas    -1.04 0.92
## Espanol        -1.35 0.90
## Ingles         -1.26 0.95
## Deportes       -1.22 0.32
## Humanidades    -1.23 0.48
## Etica          -1.26 0.91
R2    <-  cor(datos)

Las materias como Matemáticas y Ética tienen una relación moderada, lo que podría indicar que los estudiantes que destacan en una tienden a tener un desempeño similar en la otra.

library(ggcorrplot)
ggcorrplot(R2,type="lower",hc.order = T)

# Otra Forma
cor.plot(R2,main="Mapa de calor", diag=F, show.legend = T, cex=0.5)

# Prueba de esfericidad de Bartlett
cortest.bartlett(R2)
## Warning in cortest.bartlett(R2): n not specified, 100 used
## $chisq
## [1] 1534.538
## 
## $p.value
## [1] 2.760711e-292
## 
## $df
## [1] 45
# Prueba de KMO
KMO(R2)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R2)
## Overall MSA =  0.56
## MSA for each item = 
##        Edad       Grado   Naturales    Sociales Matematicas     Espanol 
##        0.48        0.48        0.51        0.99        0.51        0.94 
##      Ingles    Deportes Humanidades       Etica 
##        0.52        0.26        0.91        0.51
R3    <-  cor(datos)
cortest.bartlett(R3)
## Warning in cortest.bartlett(R3): n not specified, 100 used
## $chisq
## [1] 1534.538
## 
## $p.value
## [1] 2.760711e-292
## 
## $df
## [1] 45
KMO(R3)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R3)
## Overall MSA =  0.56
## MSA for each item = 
##        Edad       Grado   Naturales    Sociales Matematicas     Espanol 
##        0.48        0.48        0.51        0.99        0.51        0.94 
##      Ingles    Deportes Humanidades       Etica 
##        0.52        0.26        0.91        0.51
# Scree plot
scree(R3)
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect.  Try a
## different factor score estimation method.

modelo_varimax2 <- fa(R3,nfactors = 2,rotate = "varimax",fa="ml")
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect.  Try a
## different factor score estimation method.
## Warning in fac(r = r, nfactors = nfactors, n.obs = n.obs, rotate = rotate, : An
## ultra-Heywood case was detected.  Examine the results carefully
# aplicamos máxima verosimilitud
fa.diagram(modelo_varimax2)

Método de Componentes principales

modelo     <- principal(datos,nfactors=2,rotate="varimax")
library(ade4)
load    <- modelo$loadings[,1:2]
s.corcircle(load,grid=FALSE)

La gráfica muestra que el factor MR1 agrupa asignaturas como Inglés, Español, Naturales y Sociales, lo que indica que estas materias tienen una fuerte relación y posiblemente midan habilidades similares. Por otro lado, el factor MR2 está más relacionado con variables como Ética, mostrando una dimensión diferente de evaluación. Esto sugiere que las calificaciones en estas materias pueden ser explicadas por dos dimensiones principales