Para el desarrollo de este análisis se utilizara la técnica Análisis de Componentes Principales, para una base de datos que contiene características como el Cilindraje, potencia, velocidad, largo, longitud y peso, para 24 modelos de carros. Se tiene en cuenta las etiquetas de las variables: CILIN: Cilindraje, PUISS: Potencia, VITES: Velocidad, POIDS: Peso, LONG: Largo, LARGE: Ancho
En la Figura 1, se observa el comportamiento de las variables, donde se tiene que todas son asimétricas, el Cilindraje toma valores entre 1000 y 3000 cm3, la potencia oscila entre 48 y 200 hp, la velocidad oscila entre 120 y 240 km/h, el peso de los carros oscila entre 700 y 1600 kg, el ancho oscila entre 340 y 470 cm y el largo entre 155 y 185 cm. En la Tabla 1, se observa la matriz de correlaciones, donde se registran correlaciones altas entre Cilindraje y Potencia (0.86), también entre Potencia y Velocidad (0.89), Cilindraje con Peso (0.90), peso con Largo (0.917), Largo y Ancho (0.86)
library(ade4)
--------------------------------------------------
# Base de datos troue, acp usando dudi.pca
-------------------------------------------------
read.table("troue.txt",header=T,sep="",row.names=1)->datos
attach(datos)
data.frame(CILIN,PUISS,VITES,POIDS,LONG,LARGE)->xx
pcadatos<-dudi.pca(datos,scann=F,nf=6)
pcadatos2<-dudi.pca(xx,scann=F,nf=6)
F<-pcadatos$co ## Coordenadas Variables
G<-pcadatos$li ## Coordenadas Individuos
U<-pcadatos$c1 ## Vectores para el espacio de las variables
par(mfrow=c(2,3))
hist(CILIN,main="CILIN")
hist(PUISS,main="PUISS")
hist(VITES,main="VITES")
hist(POIDS,main="POIDS")
hist(LONG,main="LONG")
hist(LARGE,main="LARGE")
cor(xx)
## CILIN PUISS VITES POIDS LONG LARGE
## CILIN 1.0000000 0.8609761 0.6933151 0.9049341 0.8642025 0.7090589
## PUISS 0.8609761 1.0000000 0.8939873 0.7460794 0.6885147 0.5522800
## VITES 0.6933151 0.8939873 1.0000000 0.4914196 0.5319080 0.3632342
## POIDS 0.9049341 0.7460794 0.4914196 1.0000000 0.9171122 0.7909150
## LONG 0.8642025 0.6885147 0.5319080 0.9171122 1.0000000 0.8638142
## LARGE 0.7090589 0.5522800 0.3632342 0.7909150 0.8638142 1.0000000
En la Figura 2, se observa el grafico del primer plano factorial, donde se observan grupos de autos con valores similares en cuanto sus características, parece que existen 3 grupos los que tienen características promedio, los que tienen valores más altos en sus características y aquellos que tienen valores más bajos. Al analizar el circulo de correlaciones, el cual se observa en la Figura 3, se tiene que las variables están muy cercanas al círculo unitario, prácticamente todas tienen la misma magnitud desde el origen hacia al círculo, lo que indica que son representativas en el estudio, seguramente unas más que otras en algunos ejes, por ejemplo Cilindraje parece estar más cercano al eje 2, por lo que se espera que su contribución se más grande para esta variable en este eje. Algo que se observa es que en términos de variabilidad el peso y la longitud son parecidos, es decir varían de la misma forma, están relacionadas.
s.label(G,clab=0.7) ## Gráfico individuos
s.corcircle(F,clab=0.7) ## Nube de Variables
En la Figura 4, se observa la representación simultanea donde hacia al lado el izquierdo del plano factorial se tienen los carros con los valores más altos en todas las variables, hacia el lado derecho se tendrán los carros con valores más pequeños en sus características. Por ejemplo el carro con la etiqueta vwca tiene más Ancho (Large), los carros con referencias fosc y re25 tienen mayor Cilindraje.
biplot(pcadatos)
En la Tabla 2 se tienen los valores propios, la inercia el porcentaje de inercia acumulado, donde se observa que el primer plano factorial se recoge el 93% de variabilidad de la matriz de datos, es decir se reduce la dimensionalidad del estudio a dos dimensiones.
inertia.dudi(pcadatos, row.inertia = TRUE, col.inertia = TRUE)->acpI
acpI$TOT
## inertia cum ratio
## 1 4.65602121 4.656021 0.7760035
## 2 0.91522148 5.571243 0.9285404
## 3 0.24043062 5.811673 0.9686122
## 4 0.10270953 5.914383 0.9857305
## 5 0.06465625 5.979039 0.9965065
## 6 0.02096090 6.000000 1.0000000
En las Tablas 3, 4, 5 y 6, se tienen las contribuciones absolutas y los cosenos cuadrados tanto para variables como para individuos, Se observa que el Cilindraje tiene más contribución en el primer eje, lo cual se observa en la Figura 2, donde la variable queda más cerca de ese primer eje, se observa que la variable velocidad tiene mayor contribución en el segundo eje. Los cosenos cuadrados son la calidad de la representación, donde en el primer eje se observa que Cilindraje tiene mejor representación. Para las contribuciones de los individuos se observa que “bm530”, “re25”, “fofi”, “fiat1” son los autos con mayor contribución en el eje 1, seguramente estos autos son aquellos con valores más grandes en Cilindraje. Los autos “niva” y “vwca” son los autos con mayor contribución en la segunda componente.
print(acpI$col.abs/100) ## Contribuciones absolutas
## Comp1 Comp2 Comp3 Comp4 Comp5 Comp6
## CILIN 19.73 0.12 16.11 0.25 63.78 0.01
## PUISS 17.18 17.74 0.16 23.98 9.40 31.53
## VITES 11.80 44.01 13.69 10.23 0.01 20.26
## POIDS 18.52 6.51 23.47 1.52 22.33 27.65
## LONG 18.51 8.74 0.19 50.67 2.75 19.13
## LARGE 14.26 22.88 46.38 13.34 1.73 1.41
print(acpI$col.rel/100) ## cosenos cuadrados
## Comp1 Comp2 Comp3 Comp4 Comp5 Comp6 con.tra
## CILIN -91.87 0.11 3.87 0.03 4.12 0.00 16.67
## PUISS -79.99 16.24 0.04 2.46 -0.61 0.66 16.67
## VITES -54.95 40.28 -3.29 -1.05 0.00 -0.42 16.67
## POIDS -86.22 -5.96 5.64 0.16 -1.44 -0.58 16.67
## LONG -86.17 -8.00 -0.05 -5.20 -0.18 0.40 16.67
## LARGE -66.40 -20.94 -11.15 1.37 0.11 -0.03 16.67
print(acpI$row.abs/100)
## Axis1 Axis2 Axis3 Axis4 Axis5 Axis6
## hoci 3.66 0.47 4.88 6.73 0.90 2.41
## re19 0.54 0.08 3.38 1.84 3.28 0.00
## fiati 1.49 0.86 3.81 1.46 1.91 7.89
## p405 0.07 0.98 0.60 15.16 0.05 0.16
## re21 0.03 1.85 0.07 16.35 6.93 3.41
## cibx 0.23 0.20 0.40 7.00 0.24 6.11
## bm530 13.93 3.18 4.61 0.78 0.93 4.14
## ro827 9.13 2.71 0.00 0.00 0.14 0.84
## re25 10.59 1.69 6.84 1.51 0.42 0.33
## opom 2.01 2.74 4.54 6.52 5.69 1.58
## p405b 0.31 0.09 2.11 1.48 1.43 2.03
## fosi 0.49 0.86 0.21 4.13 0.75 0.97
## bm325 2.61 8.45 16.56 1.01 0.48 4.71
## au90 1.79 5.40 0.37 0.04 19.13 0.59
## fosc 6.99 0.07 2.58 0.08 35.39 1.00
## rees 0.76 3.59 1.17 6.42 1.47 3.20
## niva 0.00 15.09 27.02 0.37 11.78 14.71
## vwca 1.34 25.89 1.57 18.24 0.02 12.98
## fofi 10.96 3.72 0.09 0.56 0.05 6.57
## fiat1 12.64 0.00 4.47 0.83 0.34 9.89
## p205 6.14 0.78 11.06 0.00 3.88 2.80
## p205r 4.69 9.96 0.18 0.49 3.01 0.84
## seati 3.34 3.70 0.04 5.10 0.46 12.33
## ciax 6.29 7.64 3.45 3.86 1.29 0.52
print(acpI$row.rel/100)
## Axis1 Axis2 Axis3 Axis4 Axis5 Axis6 con.tra
## hoci -87.66 -2.19 6.03 -3.56 -0.30 0.26 3.24
## re19 -66.24 1.93 21.31 4.97 -5.56 0.00 0.64
## fiati -76.40 8.66 10.10 -1.66 -1.36 1.82 1.51
## p405 -10.70 30.81 4.96 53.31 0.11 0.11 0.49
## re21 3.36 41.83 -0.43 41.53 -11.09 1.77 0.67
## cibx -48.26 8.17 4.32 32.70 -0.72 5.82 0.37
## bm530 93.86 -4.21 -1.60 -0.12 -0.09 0.13 11.52
## ro827 94.43 -5.51 0.00 0.00 -0.02 -0.04 7.50
## re25 93.58 -2.94 3.12 -0.30 0.05 -0.01 8.78
## opom 66.74 17.86 7.78 4.77 2.62 -0.24 2.34
## p405b 61.97 -3.69 21.92 6.58 4.00 -1.84 0.39
## fosi 63.13 21.82 1.39 11.76 1.35 -0.56 0.60
## bm325 50.37 -32.13 -16.53 -0.43 0.13 -0.41 4.01
## au90 56.97 -33.84 0.61 0.03 8.46 -0.08 2.44
## fosc 91.57 0.17 -1.74 -0.02 -6.44 -0.06 5.92
## rees 44.53 41.54 3.55 -8.33 1.20 0.85 1.32
## niva -0.01 64.48 -30.33 -0.18 3.56 1.44 3.57
## vwca 19.18 73.04 1.16 -5.78 0.00 -0.84 5.41
## fofi -93.36 6.24 -0.04 -0.11 -0.01 -0.25 9.11
## fiat1 -97.69 0.00 -1.79 0.14 0.04 -0.34 10.04
## p205 -88.57 -2.23 -8.24 0.00 -0.78 -0.18 5.38
## p205r -69.86 -29.16 0.14 0.16 0.62 -0.06 5.21
## seati -78.73 -17.12 -0.05 -2.65 0.15 1.31 3.30
## ciax -77.88 -18.60 2.21 -1.06 -0.22 0.03 6.26