Ejercicio 1

data<- read.csv("Atencion.csv")
head(data)
##   S  E DI  C D P1 P2 P3 P4 P5 P6 P7 P8 P9
## 1 h 77 28 NO 1  3  4  3  4  4  5  1  2  2
## 2 h 88 26 NO 2  2  3  2  4  4  5  4  5  5
## 3 h 90 28 NO 3  2  2  2  4  4  5  2  3  2
## 4 h 62 19 SI 3  4  3  4  3  3  3  4  5  5
## 5 h 90 30 SI 1  5  5  5  2  2  3  3  4  5
## 6 h 63 30 NO 3  4  3  4  3  3  3  2  3  2
library(psych)
## Warning: package 'psych' was built under R version 4.3.3
datos2 <- data[,-1]
describe(datos2)
##    vars   n  mean    sd median trimmed   mad min max range  skew kurtosis   se
## E     1 100 68.64 17.52   68.5   70.15 18.53  24  94    70 -0.63    -0.08 1.75
## DI    2 100 13.31 10.03   14.0   12.93 14.83   1  30    29  0.27    -1.44 1.00
## C*    3 100  1.42  0.50    1.0    1.40  0.00   1   2     1  0.32    -1.92 0.05
## D     4 100  2.03  0.98    2.0    1.95  1.48   1   4     3  0.39    -1.11 0.10
## P1    5 100  3.50  1.17    3.5    3.51  2.22   1   5     4 -0.06    -1.36 0.12
## P2    6 100  3.29  1.09    3.0    3.24  1.48   2   5     3  0.15    -1.36 0.11
## P3    7 100  3.64  1.28    3.5    3.69  2.22   1   5     4 -0.15    -1.59 0.13
## P4    8 100  3.21  1.18    3.0    3.21  1.48   1   5     4 -0.01    -1.04 0.12
## P5    9 100  3.32  1.06    3.0    3.29  1.48   1   5     4  0.05    -1.14 0.11
## P6   10 100  3.47  1.23    3.0    3.48  1.48   1   5     4  0.20    -1.48 0.12
## P7   11 100  2.85  1.08    3.0    2.94  1.48   1   4     3 -0.18    -1.45 0.11
## P8   12 100  3.76  1.05    3.0    3.81  1.48   2   5     3  0.01    -1.45 0.10
## P9   13 100  3.62  1.50    5.0    3.65  0.00   2   5     3 -0.16    -1.99 0.15
datos<- datos2[,-3]
describe(datos)
##    vars   n  mean    sd median trimmed   mad min max range  skew kurtosis   se
## E     1 100 68.64 17.52   68.5   70.15 18.53  24  94    70 -0.63    -0.08 1.75
## DI    2 100 13.31 10.03   14.0   12.93 14.83   1  30    29  0.27    -1.44 1.00
## D     3 100  2.03  0.98    2.0    1.95  1.48   1   4     3  0.39    -1.11 0.10
## P1    4 100  3.50  1.17    3.5    3.51  2.22   1   5     4 -0.06    -1.36 0.12
## P2    5 100  3.29  1.09    3.0    3.24  1.48   2   5     3  0.15    -1.36 0.11
## P3    6 100  3.64  1.28    3.5    3.69  2.22   1   5     4 -0.15    -1.59 0.13
## P4    7 100  3.21  1.18    3.0    3.21  1.48   1   5     4 -0.01    -1.04 0.12
## P5    8 100  3.32  1.06    3.0    3.29  1.48   1   5     4  0.05    -1.14 0.11
## P6    9 100  3.47  1.23    3.0    3.48  1.48   1   5     4  0.20    -1.48 0.12
## P7   10 100  2.85  1.08    3.0    2.94  1.48   1   4     3 -0.18    -1.45 0.11
## P8   11 100  3.76  1.05    3.0    3.81  1.48   2   5     3  0.01    -1.45 0.10
## P9   12 100  3.62  1.50    5.0    3.65  0.00   2   5     3 -0.16    -1.99 0.15

Las variables P1 a P9 muestran valores consistentes en una escala de 1 a 5, con distribuciones simétricas y sin variaciones extremas, lo que refleja evaluaciones uniformes de la atención recibida. Por otro lado, las variables E (edad) y DI (días de ingreso) presentan mayor rango y variabilidad, indicando diferencias más marcadas entre los pacientes.

R2    <-  cor(datos)

library(ggcorrplot)
## Warning: package 'ggcorrplot' was built under R version 4.3.3
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.3
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
ggcorrplot(R2,type="lower",hc.order = T)

Esta grafica muestra que P1, P2 y P3 están muy relacionadas, mientras que E y DI no tienen mucha conexión con las demás variables. Esto sugiere que algunas variables evalúan aspectos similares de la atención y otras no están tan relacionadas.

#Prueba de esfericidad de Bartlett
cortest.bartlett(R2)
## Warning in cortest.bartlett(R2): n not specified, 100 used
## $chisq
## [1] 1080.798
## 
## $p.value
## [1] 2.295366e-183
## 
## $df
## [1] 66
#Prueba de KMO
KMO(R2)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R2)
## Overall MSA =  0.69
## MSA for each item = 
##    E   DI    D   P1   P2   P3   P4   P5   P6   P7   P8   P9 
## 0.40 0.11 0.74 0.64 0.82 0.67 0.61 0.69 0.72 0.66 0.82 0.72
datos1 <- datos
R3    <-  cor(datos1)
cortest.bartlett(R3)
## Warning in cortest.bartlett(R3): n not specified, 100 used
## $chisq
## [1] 1080.798
## 
## $p.value
## [1] 2.295366e-183
## 
## $df
## [1] 66
KMO(R3)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R3)
## Overall MSA =  0.69
## MSA for each item = 
##    E   DI    D   P1   P2   P3   P4   P5   P6   P7   P8   P9 
## 0.40 0.11 0.74 0.64 0.82 0.67 0.61 0.69 0.72 0.66 0.82 0.72
# Scree plot
scree(R3)
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect.  Try a
## different factor score estimation method.

modelo_varimax2 <- fa(R3,nfactors = 2,rotate = "varimax",fa="ml")
# aplicamos máxima verosimilitud
fa.diagram(modelo_varimax2)

# Método de Componentes principales
modelo     <- principal(datos1,nfactors=2,rotate="varimax")

library(ade4)
## Warning: package 'ade4' was built under R version 4.3.3
load    <- modelo$loadings[,1:2]
s.corcircle(load,grid=FALSE)

El análisis muestra que las variables se agrupan en dos factores principales: uno relacionado con P4, P5 y P6, y otro con P1, P2, P7 y P8, indicando que evalúan aspectos similares. Por otro lado, D, E y DI están menos conectadas con estos grupos, lo que sugiere que miden algo diferente.

Ejercicio 2

data<- read.csv("Calificaciones.csv")
head(data)
##   Edad Grado Naturales Sociales Matematicas Espanol Ingles Deportes Humanidades
## 1   17    11        80       75          79      69     67       93          91
## 2   13     8        78       74          98      61     57       99          97
## 3   14     9        79       83          90      61     58       99          92
## 4   15     9        90       95          88      88     85       94          94
## 5   18    12        89       85          69      78     82       95          92
## 6   11     6        89       80          95      86     85       93          90
##   Etica
## 1    85
## 2    99
## 3    91
## 4    87
## 5    73
## 6   100
library(psych)
datos <- data
describe(datos)
##             vars   n  mean   sd median trimmed   mad min max range  skew
## Edad           1 100 14.44 2.51   15.0   14.50  2.97  10  18     8 -0.18
## Grado          2 100  8.99 1.98    9.0    8.99  2.97   6  12     6 -0.09
## Naturales      3 100 85.30 4.81   85.5   85.40  5.19  74  95    21 -0.17
## Sociales       4 100 85.61 6.99   85.5   85.61  8.15  70  99    29 -0.02
## Matematicas    5 100 81.62 9.24   81.5   81.46 11.12  66 100    34  0.07
## Espanol        6 100 74.75 9.00   76.0   74.76 11.12  60  90    30 -0.02
## Ingles         7 100 75.22 9.47   77.5   75.49 11.86  57  91    34 -0.19
## Deportes       8 100 94.92 3.19   95.0   94.89  4.45  90 100    10  0.11
## Humanidades    9 100 89.99 4.82   90.0   89.99  5.93  81  98    17 -0.02
## Etica         10 100 83.92 9.08   84.0   83.69 11.86  70 100    30  0.16
##             kurtosis   se
## Edad           -1.26 0.25
## Grado          -1.22 0.20
## Naturales      -0.85 0.48
## Sociales       -1.00 0.70
## Matematicas    -1.04 0.92
## Espanol        -1.35 0.90
## Ingles         -1.26 0.95
## Deportes       -1.22 0.32
## Humanidades    -1.23 0.48
## Etica          -1.26 0.91

La mayoría de las materias tienen medias cercanas a 85, lo que sugiere que los estudiantes tienen un rendimiento bastante uniforme en estas áreas. Las desviaciones estándar son moderadas, indicando que hay algo de variación en las calificaciones, pero no demasiada. Las variables tienen sesgos y curtosis cercanos a 0, lo que sugiere distribuciones equilibradas y sin valores extremos significativos.

R2    <-  cor(datos)

library(ggcorrplot)

cor.plot(R2,main="Mapa de calor", diag=F, show.legend = T, cex=0.5)

La variable Grado está muy correlacionada con la Edad, lo que tiene sentido porque ambas están relacionadas directamente. De igual manera, podemos ver como Ingles esta bastante relacionada con naturales y espanol.

# Prueba de esfericidad de Bartlett
cortest.bartlett(R2)
## Warning in cortest.bartlett(R2): n not specified, 100 used
## $chisq
## [1] 1534.538
## 
## $p.value
## [1] 2.760711e-292
## 
## $df
## [1] 45
# Prueba de KMO
KMO(R2)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R2)
## Overall MSA =  0.56
## MSA for each item = 
##        Edad       Grado   Naturales    Sociales Matematicas     Espanol 
##        0.48        0.48        0.51        0.99        0.51        0.94 
##      Ingles    Deportes Humanidades       Etica 
##        0.52        0.26        0.91        0.51
R3    <-  cor(datos)
cortest.bartlett(R3)
## Warning in cortest.bartlett(R3): n not specified, 100 used
## $chisq
## [1] 1534.538
## 
## $p.value
## [1] 2.760711e-292
## 
## $df
## [1] 45
KMO(R3)
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = R3)
## Overall MSA =  0.56
## MSA for each item = 
##        Edad       Grado   Naturales    Sociales Matematicas     Espanol 
##        0.48        0.48        0.51        0.99        0.51        0.94 
##      Ingles    Deportes Humanidades       Etica 
##        0.52        0.26        0.91        0.51
# Scree plot
scree(R3)
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect.  Try a
## different factor score estimation method.

modelo_varimax2 <- fa(R3,nfactors = 2,rotate = "varimax",fa="ml")
## Warning in fa.stats(r = r, f = f, phi = phi, n.obs = n.obs, np.obs = np.obs, :
## The estimated weights for the factor scores are probably incorrect.  Try a
## different factor score estimation method.
## Warning in fac(r = r, nfactors = nfactors, n.obs = n.obs, rotate = rotate, : An
## ultra-Heywood case was detected.  Examine the results carefully
# aplicamos máxima verosimilitud
fa.diagram(modelo_varimax2)

# Método de Componentes principales
modelo     <- principal(datos,nfactors=2,rotate="varimax")

library(ade4)
load    <- modelo$loadings[,1:2]
s.corcircle(load,grid=FALSE)

Esto indica que materias académicas como Inglés y Naturales están altamente relacionadas con el factor MR1, mientras que Ética se asocia fuertemente con MR2. Variables como Humanidades y Deportes tienen una conexión más débil con ambos factores, lo que sugiere que son más independientes. Este modelo permite identificar dos grupos de materias que evalúan diferentes aspectos del rendimiento estudiantil.