##Analisis de Componentes Principales
Esta metodologia permite analizar grandes conjuntos de datos numericos multivariados, es decir un conjunto amplio de variables e individuos.
el objetivo principal es analizar las correlaciones entre variables y similitudes entre individuos de una manera mas eficiente.
require(ade4)
require(FactoClass)
data(cafe)
cafe
## Color DA EA pH AcidezT Cafeina AcidosCl D2325 D2272 Intensidad
## ExCl 298 385.1 25 5.02 11.7 1.40 2.74 -0.101 -0.057 7.72
## C40M 361 481.3 41 5.11 6.5 0.81 1.62 -0.058 -0.038 6.02
## C40C 321 422.6 40 5.12 5.8 0.80 1.61 -0.057 -0.038 6.48
## C20M 335 444.3 33 5.05 8.8 1.10 2.20 -0.079 -0.045 6.82
## C20C 314 368.7 32 5.04 9.3 1.10 2.19 -0.080 -0.046 7.08
## ExOs 186 346.6 28 5.31 8.7 1.35 2.30 -0.049 -0.064 7.66
## O40M 278 422.6 43 5.45 4.9 0.80 1.35 -0.025 -0.037 6.18
## O40C 238 403.0 42 5.33 5.2 0.79 1.36 -0.026 -0.036 6.84
## O20M 226 368.7 36 5.33 6.7 1.10 1.83 -0.035 -0.051 6.66
## O20C 210 368.7 35 5.31 7.0 1.05 1.83 -0.040 -0.056 7.00
## Com1 221 413.3 27 5.18 9.3 1.30 2.06 -0.053 -0.065 6.48
## Com2 264 400.9 23 5.20 11.5 1.35 2.84 -0.096 -0.051 6.66
## Aroma Cuerpo Acidez Amargo Astringencia Impresion
## ExCl 7.00 6.84 5.02 5.04 5.36 7.46
## C40M 5.42 6.22 4.34 4.60 4.78 6.24
## C40C 5.98 6.44 4.58 4.82 4.80 6.12
## C20M 6.44 6.70 4.62 4.38 4.80 6.04
## C20C 6.20 6.72 4.78 4.94 4.90 6.22
## ExOs 7.42 6.98 5.12 5.18 5.22 7.40
## O40M 5.82 6.26 4.00 4.46 4.96 5.90
## O40C 6.56 6.82 4.30 4.96 4.84 6.94
## O20M 7.06 6.70 4.64 5.00 4.90 6.90
## O20C 6.70 7.04 4.60 4.88 5.18 7.16
## Com1 5.46 7.06 4.60 5.26 5.16 5.68
## Com2 6.26 7.36 4.44 5.64 5.24 6.00
## Matriz de datos de caracteristicas quimicas
cafe_quimica=cafe[,1:7]
cafe_quimica
## Color DA EA pH AcidezT Cafeina AcidosCl
## ExCl 298 385.1 25 5.02 11.7 1.40 2.74
## C40M 361 481.3 41 5.11 6.5 0.81 1.62
## C40C 321 422.6 40 5.12 5.8 0.80 1.61
## C20M 335 444.3 33 5.05 8.8 1.10 2.20
## C20C 314 368.7 32 5.04 9.3 1.10 2.19
## ExOs 186 346.6 28 5.31 8.7 1.35 2.30
## O40M 278 422.6 43 5.45 4.9 0.80 1.35
## O40C 238 403.0 42 5.33 5.2 0.79 1.36
## O20M 226 368.7 36 5.33 6.7 1.10 1.83
## O20C 210 368.7 35 5.31 7.0 1.05 1.83
## Com1 221 413.3 27 5.18 9.3 1.30 2.06
## Com2 264 400.9 23 5.20 11.5 1.35 2.84
## Matriz de Correlaciones
data.frame(round(cor(cafe_quimica),2))
## Color DA EA pH AcidezT Cafeina AcidosCl
## Color 1.00 0.73 0.27 -0.66 0.00 -0.38 -0.04
## DA 0.73 1.00 0.42 -0.27 -0.27 -0.52 -0.34
## EA 0.27 0.42 1.00 0.39 -0.95 -0.97 -0.95
## pH -0.66 -0.27 0.39 1.00 -0.58 -0.28 -0.51
## AcidezT 0.00 -0.27 -0.95 -0.58 1.00 0.90 0.98
## Cafeina -0.38 -0.52 -0.97 -0.28 0.90 1.00 0.91
## AcidosCl -0.04 -0.34 -0.95 -0.51 0.98 0.91 1.00
## Componentes principales
acp_cafe=dudi.pca(cafe_quimica,scannf= FALSE, nf=3)
acp_inertia=inertia.dudi(acp_cafe)
acp_inertia$tot.inertia
## inertia cum cum(%)
## Ax1 4.25677802 4.256778 60.81111
## Ax2 2.20488938 6.461667 92.30953
## Ax3 0.36229221 6.823960 97.48514
## Ax4 0.12971545 6.953675 99.33822
## Ax5 0.02556762 6.979243 99.70347
## Ax6 0.01436439 6.993607 99.90867
## Ax7 0.00639294 7.000000 100.00000
## Circulo de Correlaciones
s.corcircle(acp_cafe$co)
## Grafico de los Individuos
s.label(acp_cafe$li)
tipo=c("E","M","C","M","C","E","M","C","M","C","Com","Com")
tipo=as.factor(tipo)
s.class(acp_cafe$li,tipo)