Actividad

  1. Con la base troue completa, realice el acp mediante la función dudi.pca() y en el primer plano factorial grafique
  1. La nube de individuos
  2. El circulo de correlaciones
  3. El biplot (representación simultanea), cuales son los individuos suplementarios?
  4. Elabore una síntesis de los resultados, apoyándose en las contribuciones y cosenos.
  5. Es posible construir un índice? Explique!

Desarrollo

Para el desarrollo de este análisis se utilizara la técnica Análisis de Componentes Principales, para una base de datos que contiene características como el Cilindraje, potencia, velocidad, largo, longitud y peso, para 24 modelos de carros. Se tiene en cuenta las etiquetas de las variables: CILIN: Cilindraje, PUISS: Potencia, VITES: Velocidad, POIDS: Peso, LONG: Largo, LARGE: Ancho

En la Figura 1, se observa el comportamiento de las variables, donde se tiene que todas son asimétricas, el Cilindraje toma valores entre 1000 y 3000 cm3, la potencia oscila entre 48 y 200 hp, la velocidad oscila entre 120 y 240 km/h, el peso de los carros oscila entre 700 y 1600 kg, el ancho oscila entre 340 y 470 cm y el largo entre 155 y 185 cm. En la Tabla 1, se observa la matriz de correlaciones, donde se registran correlaciones altas entre Cilindraje y Potencia (0.86), también entre Potencia y Velocidad (0.89), Cilindraje con Peso (0.90), peso con Largo (0.917), Largo y Ancho (0.86)

library(ade4)
--------------------------------------------------
# Base de datos troue, acp usando dudi.pca
-------------------------------------------------
read.table("troue.txt",header=T,sep="",row.names=1)->datos
attach(datos)
data.frame(CILIN,PUISS,VITES,POIDS,LONG,LARGE)->xx
pcadatos<-dudi.pca(datos,scann=F,nf=6)
pcadatos2<-dudi.pca(xx,scann=F,nf=6)
F<-pcadatos$co ## Coordenadas Variables
G<-pcadatos$li ## Coordenadas Individuos
U<-pcadatos$c1 ## Vectores para el espacio de las variables

Figura 1

par(mfrow=c(2,3))
hist(CILIN,main="CILIN")
hist(PUISS,main="PUISS")
hist(VITES,main="VITES")
hist(POIDS,main="POIDS")
hist(LONG,main="LONG")
hist(LARGE,main="LARGE")

Tabla 1 (Matriz de Correlación)

cor(xx)
##           CILIN     PUISS     VITES     POIDS      LONG     LARGE
## CILIN 1.0000000 0.8609761 0.6933151 0.9049341 0.8642025 0.7090589
## PUISS 0.8609761 1.0000000 0.8939873 0.7460794 0.6885147 0.5522800
## VITES 0.6933151 0.8939873 1.0000000 0.4914196 0.5319080 0.3632342
## POIDS 0.9049341 0.7460794 0.4914196 1.0000000 0.9171122 0.7909150
## LONG  0.8642025 0.6885147 0.5319080 0.9171122 1.0000000 0.8638142
## LARGE 0.7090589 0.5522800 0.3632342 0.7909150 0.8638142 1.0000000

Figura 2 y Figura 3

En la Figura 2, se observa el grafico del primer plano factorial, donde se observan grupos de autos con valores similares en cuanto sus características, parece que existen 3 grupos los que tienen características promedio, los que tienen valores más altos en sus características y aquellos que tienen valores más bajos. Al analizar el circulo de correlaciones, el cual se observa en la Figura 3, se tiene que las variables están muy cercanas al círculo unitario, prácticamente todas tienen la misma magnitud desde el origen hacia al círculo, lo que indica que son representativas en el estudio, seguramente unas más que otras en algunos ejes, por ejemplo Cilindraje parece estar más cercano al eje 2, por lo que se espera que su contribución se más grande para esta variable en este eje. Algo que se observa es que en términos de variabilidad el peso y la longitud son parecidos, es decir varían de la misma forma, están relacionadas.

s.label(G,clab=0.7) ## Gráfico individuos

s.corcircle(F,clab=0.7) ## Nube de Variables

Figura 4 (Representación Simultanea)

En la Figura 4, se observa la representación simultanea donde hacia al lado el izquierdo del plano factorial se tienen los carros con los valores más altos en todas las variables, hacia el lado derecho se tendrán los carros con valores más pequeños en sus características. Por ejemplo el carro con la etiqueta vwca tiene más Ancho (Large), los carros con referencias fosc y re25 tienen mayor Cilindraje.

biplot(pcadatos)

Valores Propios

En la Tabla 2 se tienen los valores propios, la inercia el porcentaje de inercia acumulado, donde se observa que el primer plano factorial se recoge el 93% de variabilidad de la matriz de datos, es decir se reduce la dimensionalidad del estudio a dos dimensiones.

inertia.dudi(pcadatos, row.inertia = TRUE, col.inertia = TRUE)->acpI

acpI$TOT
##      inertia      cum     ratio
## 1 4.65602121 4.656021 0.7760035
## 2 0.91522148 5.571243 0.9285404
## 3 0.24043062 5.811673 0.9686122
## 4 0.10270953 5.914383 0.9857305
## 5 0.06465625 5.979039 0.9965065
## 6 0.02096090 6.000000 1.0000000

Contribucciones y Cosenos Cuadrados

En las Tablas 3, 4, 5 y 6, se tienen las contribuciones absolutas y los cosenos cuadrados tanto para variables como para individuos, Se observa que el Cilindraje tiene más contribución en el primer eje, lo cual se observa en la Figura 2, donde la variable queda más cerca de ese primer eje, se observa que la variable velocidad tiene mayor contribución en el segundo eje. Los cosenos cuadrados son la calidad de la representación, donde en el primer eje se observa que Cilindraje tiene mejor representación. Para las contribuciones de los individuos se observa que “bm530”, “re25”, “fofi”, “fiat1” son los autos con mayor contribución en el eje 1, seguramente estos autos son aquellos con valores más grandes en Cilindraje. Los autos “niva” y “vwca” son los autos con mayor contribución en la segunda componente.

print(acpI$col.abs/100) ## Contribuciones absolutas
##       Comp1 Comp2 Comp3 Comp4 Comp5 Comp6
## CILIN 19.73  0.12 16.11  0.25 63.78  0.01
## PUISS 17.18 17.74  0.16 23.98  9.40 31.53
## VITES 11.80 44.01 13.69 10.23  0.01 20.26
## POIDS 18.52  6.51 23.47  1.52 22.33 27.65
## LONG  18.51  8.74  0.19 50.67  2.75 19.13
## LARGE 14.26 22.88 46.38 13.34  1.73  1.41
print(acpI$col.rel/100) ## cosenos cuadrados
##        Comp1  Comp2  Comp3 Comp4 Comp5 Comp6 con.tra
## CILIN -91.87   0.11   3.87  0.03  4.12  0.00   16.67
## PUISS -79.99  16.24   0.04  2.46 -0.61  0.66   16.67
## VITES -54.95  40.28  -3.29 -1.05  0.00 -0.42   16.67
## POIDS -86.22  -5.96   5.64  0.16 -1.44 -0.58   16.67
## LONG  -86.17  -8.00  -0.05 -5.20 -0.18  0.40   16.67
## LARGE -66.40 -20.94 -11.15  1.37  0.11 -0.03   16.67
print(acpI$row.abs/100)
##       Axis1 Axis2 Axis3 Axis4 Axis5 Axis6
## hoci   3.66  0.47  4.88  6.73  0.90  2.41
## re19   0.54  0.08  3.38  1.84  3.28  0.00
## fiati  1.49  0.86  3.81  1.46  1.91  7.89
## p405   0.07  0.98  0.60 15.16  0.05  0.16
## re21   0.03  1.85  0.07 16.35  6.93  3.41
## cibx   0.23  0.20  0.40  7.00  0.24  6.11
## bm530 13.93  3.18  4.61  0.78  0.93  4.14
## ro827  9.13  2.71  0.00  0.00  0.14  0.84
## re25  10.59  1.69  6.84  1.51  0.42  0.33
## opom   2.01  2.74  4.54  6.52  5.69  1.58
## p405b  0.31  0.09  2.11  1.48  1.43  2.03
## fosi   0.49  0.86  0.21  4.13  0.75  0.97
## bm325  2.61  8.45 16.56  1.01  0.48  4.71
## au90   1.79  5.40  0.37  0.04 19.13  0.59
## fosc   6.99  0.07  2.58  0.08 35.39  1.00
## rees   0.76  3.59  1.17  6.42  1.47  3.20
## niva   0.00 15.09 27.02  0.37 11.78 14.71
## vwca   1.34 25.89  1.57 18.24  0.02 12.98
## fofi  10.96  3.72  0.09  0.56  0.05  6.57
## fiat1 12.64  0.00  4.47  0.83  0.34  9.89
## p205   6.14  0.78 11.06  0.00  3.88  2.80
## p205r  4.69  9.96  0.18  0.49  3.01  0.84
## seati  3.34  3.70  0.04  5.10  0.46 12.33
## ciax   6.29  7.64  3.45  3.86  1.29  0.52
print(acpI$row.rel/100)
##        Axis1  Axis2  Axis3 Axis4  Axis5 Axis6 con.tra
## hoci  -87.66  -2.19   6.03 -3.56  -0.30  0.26    3.24
## re19  -66.24   1.93  21.31  4.97  -5.56  0.00    0.64
## fiati -76.40   8.66  10.10 -1.66  -1.36  1.82    1.51
## p405  -10.70  30.81   4.96 53.31   0.11  0.11    0.49
## re21    3.36  41.83  -0.43 41.53 -11.09  1.77    0.67
## cibx  -48.26   8.17   4.32 32.70  -0.72  5.82    0.37
## bm530  93.86  -4.21  -1.60 -0.12  -0.09  0.13   11.52
## ro827  94.43  -5.51   0.00  0.00  -0.02 -0.04    7.50
## re25   93.58  -2.94   3.12 -0.30   0.05 -0.01    8.78
## opom   66.74  17.86   7.78  4.77   2.62 -0.24    2.34
## p405b  61.97  -3.69  21.92  6.58   4.00 -1.84    0.39
## fosi   63.13  21.82   1.39 11.76   1.35 -0.56    0.60
## bm325  50.37 -32.13 -16.53 -0.43   0.13 -0.41    4.01
## au90   56.97 -33.84   0.61  0.03   8.46 -0.08    2.44
## fosc   91.57   0.17  -1.74 -0.02  -6.44 -0.06    5.92
## rees   44.53  41.54   3.55 -8.33   1.20  0.85    1.32
## niva   -0.01  64.48 -30.33 -0.18   3.56  1.44    3.57
## vwca   19.18  73.04   1.16 -5.78   0.00 -0.84    5.41
## fofi  -93.36   6.24  -0.04 -0.11  -0.01 -0.25    9.11
## fiat1 -97.69   0.00  -1.79  0.14   0.04 -0.34   10.04
## p205  -88.57  -2.23  -8.24  0.00  -0.78 -0.18    5.38
## p205r -69.86 -29.16   0.14  0.16   0.62 -0.06    5.21
## seati -78.73 -17.12  -0.05 -2.65   0.15  1.31    3.30
## ciax  -77.88 -18.60   2.21 -1.06  -0.22  0.03    6.26