En el presente documento se desarrolló cuatro ACP con variables cuantitativas, de los cuales uno solamente no tuvo variables cualitativas. Esto permitiendo comparar los cuatro ACP y escoger el mejor de ellos para realizar un análisis de clúster por medio de un algoritmo mixto (k-means y Ward). Posteriormente se realizó la contaminación de la base de datos seleccionada con el 13 % de NA’s.
El objetivo fue estudiar el rendimiento de los vehículos de acuerdo a ciertas variables observables que los caracterizan y la calificación del riesgo de seguros. Se utilizó la base de datos vehicles de la librería plsdepot, la cual cuenta con 30 observaciones y 16 variables, se describió las variables cuantitativas y excluyó las variables cualitativas diésel, turbo, two.doors, hatchback y la variable cuantitativa peak.rpm.
Al excluir las variables cualitativas, el nuevo dataset cuenta con 11 variables:
De los 30 vehículos y 11 variables no se hallaron datos faltantes. Se observa por medio de los gráficos de boxplot y la siguiente tabla resumen, que los datos no son homogéneos de acuerdo a cada una de las variables estudiadas y sus dimensiones; por ello es necesario centrar y normalizar el dataset para evitar que se presente robo de inercia y por ende, los individuos se podrán dispersar para encontrar asociaciones.
Xo<-vehicles
library(FactoMineR)
Se agregó como cualitativa suplementaria la variable 𝑠𝑦𝑚𝑏𝑜𝑙. Esta base de datos presenta 30 observaciones y 11 variables.
X<-Xo[,-c(1:4,12)] #excluyo variables
n<-nrow(X)
dim(X)
## [1] 30 11
#colnames(X) #matriz lista con una cualitativa
#PCA 1
#variable suplementaria [9]
veh.qs<-PCA(X,quali.sup = 9)
#veh.qs$call$X
#height tiene asociacion con el eje 2
Valores propios
El primer plano factorial da una buena representación puesto que representa una varianza acumulada del 87.9 % y todos los valores propios están aportando, por tanto no hay problemas de multicolinealidad ni baja frecuencia.
L.qs<-veh.qs$eig
DT::datatable(L.qs)
Los vehículos que más contribuyen al primer eje son jaguar, mercedes, audi y mercury.
La variable cualitativa 𝑠𝑦𝑚𝑏𝑜𝑙 se agregó como activa a partir de todas sus k indicadoras.
library(ade4)
Xp<-X
as.factor(Xp$symbol)
## [1] 1 1 2 0 1 1 1 0 0 0 1 -1 1 2 1 1 1 0 3 2 0 1 0 2 -1
## [26] 2 0 -2 -1 -1
## Levels: -2 -1 0 1 2 3
sym.d<-acm.disjonctif(Xp[9])
Xd<-cbind(Xp[,-9],sym.d)
Mediante el circulo de correlaciones, se puede observar que las indicadoras de la variable symbol no aportn mucha información a los ejes, por lo cual reducirán la inercia.
#ACP 2
veh.cI<-PCA(Xd,graph = TRUE)
Se realizó el summary de cada una de las categorías de la variable symbol para determinar cuales presentan baja frecuencia y se encontró que symbol -2 y symbol 3 tienen solo un valor como calificación, lo cual es bastante bajo.
Valores propios
El porcentaje de varianza acumulado es del 61.7 % en los dos primeros ejes y en comparación con el ACP anterior (1.a), el primer valor propio aumentó pero la varianza acumulada por las dos primeras componentes disminuyó a 61.7 %, reduciendo 9.58 % de varianza acumulada.
Esto se debe a que aumentaron las variables y los ejes, porque la inercia se riega en todos esos ejes. Lo que da la conclusión que introducir cualitativas al ACP perjudica la inercia, puesto que esta se irradia en todas las categorias y el plano factorial recoge menos inercia que cuando no estaba esa variable cualitativa. Se observan 30 individuos y 16 valores propios, de los cuales solo 15 aportan debido a la multicolinealidad derivada de la variable symbol.
L.cI<-veh.cI$eig #valores propios
DT::datatable(L.cI)
En este caso se debe agregar la variable cualitativa 𝑠𝑦𝑚𝑏𝑜𝑙 como activa a partir de 𝑘 − 1.
Sin reagrupar, excluyendo simbol 0
Se tendrá en cuenta todas las categorías de la variable symbol, a excepción de symbol 0, puesto que esta es la que presenta la frecuencia más baja.
#ACP 5
vehd_2<-PCA(Xd,quali.sup = 13)
Ahora se tienen 5 (k-1) indicadoras y se tienen 15 valores propios. El primer valor propio es de 7.51, el cual es menor al primer valor propio del ACP 1.b y el último valor propio es diferente de cero, lo que significa que se ha corregido la multicolinealidad. Sin embargo, como se incluyeron variables cualitativas como activas, la inercia se dispersa y el primer plano factorial disminuye, el porcentaje de varianza acumulado es del 65.73 %, el cual es mayor al del ACP de 1b en 4.01 5, pero menor al del 1a.
Valores propios
En este caso se deben generar nuevas indicadoras derivadas de corregir primero la baja frecuencia, y luego la multicolinealidad.
Reagrupando indicadoras
Se agruparon las categorías symbol -1 y symbol -2 en la variable symbol._1 y las categorías symbol 2 y symbol 3 en la variable symbol2, quedando presentes las categorías symbol 0 y symbol 1, contando con 30 observaciones y 14 variables.
En este caso se estaría corrigiendo la baja frecuencia puesto que se agruparon algunas variables que presentan baja frecuencia y se desea corregir la multicolinealidad.
symbol._1<-Xd[,11]+Xd[,12] #symbol -1 y symbol -2
symbol2<-Xd[,15]+Xd[,16] #symbol 2 y symbol 3
Xda<-cbind(Xd[,-c(11,12,15,16)],symbol._1,symbol2)
dim(Xda)
## [1] 30 14
View(Xd)
summary(Xd$symbol.0)
Min. | 1st Qu. | Median | Mean | 3rd Qu. | Max. |
---|---|---|---|---|---|
0 | 0 | 0 | 0.2666667 | 0.75 | 1 |
#ACP 3
veh.Ir<-PCA(Xda,graph = TRUE)
Valores propios
No se corrigió la multicolinealidad, pero se corregió el problema de baja frecuencia. El último valor propio es 0, no aporta nada y esto es causado por la multicolinealidad generada por las indicadoras. Esto se puede deber porque aún está activa la categoría symbol 0 que tiene un solo valor igual a 1 y 29 son 0.
El porcentaje de varianza acumulado en los dos primeros ejes es del 67.54 %, el cual es mayor al del 1c por 1.81 % y al del 1b por 5.82 %.
DT::datatable(veh.Ir$eig)
Agrupadas sin symbol 0
En este caso, donde se agruparon las categorías de symbol -2 y symbol -1 en la variable symbol._1 y las categorías symbol 2 y symbol 3 en la variable symbol2, adicionalmente se colocó symbol 0 como suplementaria.
#2c con Xda
Xda<-cbind(Xd[,-c(11,12,15,16)],symbol._1,symbol2)
dim(Xda)
## [1] 30 14
#ACP 4
veh.Irs<-PCA(Xda,quanti.sup = 11)
Valores propios
Se logró corregir la multicolinealidad puesto que el último valor propio ya no es igual a cero. El porcentaje de varianza acumulado en los dos primeros ejes en el plano factorial es de 72.58 % aproximadamente, el cual es superior al de los ítems b y c, pero inferior al del 1a en 15.34 %. El primer valor propio en este caso fue de 7.47, el cual es inferior a todos los de los ACP anteriores, pero superior al del 1a.
DT::datatable(veh.Irs$eig)
Observe los valores propios y las inercias acumuladas; identifique la mejor opción entre 1.b , 1.c y 1.d.
De acuerdo a la nota del profesor, la mejor opción después de la 1a (sin variables cualitativas), es la opción 1d en términos de concentración de inercia en el primer plano factorial, además corrige la multicolinealidad.
Se debe aplicar la función fnipalsNA() a la base 𝑣𝑒ℎ𝑖𝑐𝑙𝑒𝑠 conformada según la mejor opción 1.d, y afectada con el 13 % de NAs.
Los NA han afectado las categorías de symbol puesto que los NA se generaron por fila. Como se muestra en el resumen descriptivo a continuación, hay cuatro datos faltantes en cada una de las categorías.
Valores propios
Los valores propios después de contaminar con el 13 % de NA’s no tuvo un cambio significativo. Comparando el porcentaje de varianza acumulado fue del 68.03 % y en el ACP de 1.d fue de 72.58 % aproximadamente, presentandose una disminución de la varianza acumulada del 4.55 %. Es de destacar que los valores propios en este caso, tienen un comportamiento descendiente similar al del item 1.d.
## [1] 13
Con el objetivo de comparar los resultados del ACP de 1.d y el ACP contaminado, se calculó la correlación entre las componentes, obteniendo valores similares, es decir, las variables se parecen o son practicamente iguales, pues la correlación es aproximadamente 1.
View(cor(Cord_Ind))
Cord_Ind[,1]%*%t(Cord_Ind[,2])
alfaromeo | audi | bmw | chevrolet | dodge1 | dodge2 | honda1 | honda2 | isuzu | jaguar | mazda | mercedes | mercury | mitsubishi | nissan1 | nissan2 | plymouth | peugot | porsche | saab | subaru | toyota1 | toyota2 | toyota3 | toyota4 | volkswagen1 | volkswagen2 | volvo1 | volvo2 | volvo3 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
-1.4022182 | 0.7014997 | -0.7948974 | 0.2210463 | -0.3464677 | -0.9054912 | -0.1027615 | 0.3134172 | -0.4717378 | -1.5435295 | 0.5531154 | 1.2549265 | -0.3929246 | -0.9992375 | 0.4256346 | 0.6048783 | -0.3185000 | 1.8963847 | -4.4791034 | 0.5214023 | 0.0192554 | 0.8733074 | 0.3412920 | -1.5518729 | 1.0103858 | 0.9007992 | -0.0959146 | 1.5549394 | 0.8812294 | 1.3311426 |
-4.9462798 | 2.4745178 | -2.8039752 | 0.7797338 | -1.2221538 | -3.1940913 | -0.3624880 | 1.1055693 | -1.6640400 | -5.4447509 | 1.9510970 | 4.4267133 | -1.3860290 | -3.5247783 | 1.5014124 | 2.1336890 | -1.1234987 | 6.6894366 | -15.7998941 | 1.8392299 | 0.0679227 | 3.0805639 | 1.2038967 | -5.4741822 | 3.5641035 | 3.1775405 | -0.3383356 | 5.4849992 | 3.1085085 | 4.6955629 |
-0.1527267 | 0.0764059 | -0.0865786 | 0.0240759 | -0.0377365 | -0.0986242 | -0.0111926 | 0.0341368 | -0.0513807 | -0.1681180 | 0.0602442 | 0.1366840 | -0.0427965 | -0.1088349 | 0.0463592 | 0.0658821 | -0.0346904 | 0.2065503 | -0.4878546 | 0.0567900 | 0.0020973 | 0.0951188 | 0.0371728 | -0.1690268 | 0.1100491 | 0.0981132 | -0.0104468 | 0.1693608 | 0.0959817 | 0.1449853 |
5.5358408 | -2.7694625 | 3.1381889 | -0.8726725 | 1.3678257 | 3.5748041 | 0.4056940 | -1.2373452 | 1.8623816 | 6.0937262 | -2.1836538 | -4.9543457 | 1.5512337 | 3.9449066 | -1.6803700 | -2.3880094 | 1.2574117 | -7.4867695 | 17.6831281 | -2.0584529 | -0.0760186 | -3.4477450 | -1.3473926 | 6.1266654 | -3.9889191 | -3.5562805 | 0.3786628 | -6.1387718 | -3.4790204 | -5.2552403 |
3.2960125 | -1.6489244 | 1.8684622 | -0.5195849 | 0.8143967 | 2.1284208 | 0.2415482 | -0.7367092 | 1.1088529 | 3.6281747 | -1.3001367 | -2.9497931 | 0.9235969 | 2.3487780 | -1.0004841 | -1.4218091 | 0.7486567 | -4.4575858 | 10.5284477 | -1.2255927 | -0.0452611 | -2.0527704 | -0.8022309 | 3.6477865 | -2.3749828 | -2.1173920 | 0.2254540 | -3.6549946 | -2.0713916 | -3.1289443 |
5.2877247 | -2.6453354 | 2.9975354 | -0.8335594 | 1.3065199 | 3.4145815 | 0.3875108 | -1.1818874 | 1.7789097 | 5.8206056 | -2.0857825 | -4.7322921 | 1.4817075 | 3.7680960 | -1.6050559 | -2.2809789 | 1.2010545 | -7.1512128 | 16.8905711 | -1.9661931 | -0.0726115 | -3.2932172 | -1.2870025 | 5.8520686 | -3.8101359 | -3.3968882 | 0.3616912 | -5.8636323 | -3.3230908 | -5.0197006 |
4.6373828 | -2.3199832 | 2.6288659 | -0.7310392 | 1.1458298 | 2.9946191 | 0.3398505 | -1.0365260 | 1.5601200 | 5.1047242 | -1.8292503 | -4.1502634 | 1.2994710 | 3.3046546 | -1.4076487 | -2.0004393 | 1.0533358 | -6.2716788 | 14.8131848 | -1.7243693 | -0.0636809 | -2.8881815 | -1.1287129 | 5.1323175 | -3.3415239 | -2.9791019 | 0.3172065 | -5.1424590 | -2.9143809 | -4.4023232 |
1.1951145 | -0.5978902 | 0.6774933 | -0.1883984 | 0.2952954 | 0.7717527 | 0.0875839 | -0.2671264 | 0.4020635 | 1.3155546 | -0.4714219 | -1.0695774 | 0.3348908 | 0.8516529 | -0.3627696 | -0.5155395 | 0.2714585 | -1.6162941 | 3.8175525 | -0.4443926 | -0.0164114 | -0.7443223 | -0.2908842 | 1.3226657 | -0.8611547 | -0.7677537 | 0.0817483 | -1.3252793 | -0.7510743 | -1.1345366 |
1.6463701 | -0.8236437 | 0.9333036 | -0.2595345 | 0.4067941 | 1.0631538 | 0.1206542 | -0.3679889 | 0.5538760 | 1.8122863 | -0.6494230 | -1.4734323 | 0.4613400 | 1.1732231 | -0.4997454 | -0.7101987 | 0.3739567 | -2.2265801 | 5.2589975 | -0.6121880 | -0.0226081 | -1.0253662 | -0.4007172 | 1.8220825 | -1.1863125 | -1.0576449 | 0.1126151 | -1.8256829 | -1.0346676 | -1.5629189 |
-9.1472070 | 4.5761517 | -5.1854206 | 1.4419699 | -2.2601418 | -5.9068666 | -0.6703529 | 2.0445408 | -3.0773265 | -10.0690350 | 3.6081842 | 8.1863672 | -2.5631980 | -6.5184094 | 2.7765778 | 3.9458533 | -2.0776979 | 12.3708453 | -29.2189098 | 3.4013070 | 0.1256102 | 5.6969190 | 2.2263788 | -10.1234625 | 6.5911340 | 5.8762589 | -0.6256877 | 10.1434666 | 5.7485973 | 8.6835536 |
4.1859336 | -2.0941329 | 2.3729458 | -0.6598725 | 1.0342833 | 2.7030930 | 0.3067660 | -0.9356202 | 1.4082424 | 4.6077794 | -1.6511728 | -3.7462353 | 1.1729675 | 2.9829465 | -1.2706141 | -1.8056965 | 0.9507936 | -5.6611310 | 13.3711215 | -1.5565019 | -0.0574816 | -2.6070171 | -1.0188327 | 4.6326864 | -3.0162266 | -2.6890864 | 0.2863264 | -4.6418407 | -2.6306660 | -3.9737571 |
-9.0100409 | 4.5075304 | -5.1076631 | 1.4203470 | -2.2262501 | -5.8182907 | -0.6603006 | 2.0138821 | -3.0311808 | -9.9180457 | 3.5540780 | 8.0636093 | -2.5247618 | -6.4206632 | 2.7349418 | 3.8866837 | -2.0465420 | 12.1853394 | -28.7807603 | 3.3503031 | 0.1237266 | 5.6114914 | 2.1929934 | -9.9716571 | 6.4922973 | 5.7881420 | -0.6163052 | 9.9913611 | 5.6623947 | 8.5533402 |
-3.7097773 | 1.8559221 | -2.1030196 | 0.5848110 | -0.9166320 | -2.3956120 | -0.2718709 | 0.8291920 | -1.2480527 | -4.0836374 | 1.4633494 | 3.3200953 | -1.0395407 | -2.6436318 | 1.1260798 | 1.6002958 | -0.8426393 | 5.0171687 | -11.8501360 | 1.3794475 | 0.0509430 | 2.3104649 | 0.9029390 | -4.1057113 | 2.6731262 | 2.3831987 | -0.2537563 | 4.1138242 | 2.3314237 | 3.5217362 |
5.7037340 | -2.8534559 | 3.2333651 | -0.8991392 | 1.4093097 | 3.6832222 | 0.4179980 | -1.2748719 | 1.9188646 | 6.2785391 | -2.2498805 | -5.1046030 | 1.5982801 | 4.0645492 | -1.7313330 | -2.4604339 | 1.2955470 | -7.7138312 | 18.2194290 | -2.1208824 | -0.0783242 | -3.5523095 | -1.3882568 | 6.3124774 | -4.1098966 | -3.6641368 | 0.3901471 | -6.3249509 | -3.5845335 | -5.4146233 |
3.8643777 | -1.9332654 | 2.1906604 | -0.6091823 | 0.9548315 | 2.4954463 | 0.2832008 | -0.8637476 | 1.3000637 | 4.2538181 | -1.5243327 | -3.4584562 | 1.0828622 | 2.7538019 | -1.1730078 | -1.6669862 | 0.8777553 | -5.2262531 | 12.3439760 | -1.4369343 | -0.0530660 | -2.4067507 | -0.9405678 | 4.2768118 | -2.7845255 | -2.4825156 | 0.2643313 | -4.2852628 | -2.4285830 | -3.6685002 |
3.9452280 | -1.9737130 | 2.2364932 | -0.6219276 | 0.9748085 | 2.5476558 | 0.2891259 | -0.8818189 | 1.3272636 | 4.3428162 | -1.5562247 | -3.5308138 | 1.1055178 | 2.8114168 | -1.1975494 | -1.7018628 | 0.8961197 | -5.3355964 | 12.6022359 | -1.4669977 | -0.0541762 | -2.4571046 | -0.9602463 | 4.3662910 | -2.8427832 | -2.5344546 | 0.2698617 | -4.3749188 | -2.4793936 | -3.7452524 |
5.3272453 | -2.6651067 | 3.0199390 | -0.8397894 | 1.3162848 | 3.4401022 | 0.3904070 | -1.1907209 | 1.7922053 | 5.8641090 | -2.1013717 | -4.7676614 | 1.4927818 | 3.7962589 | -1.6170521 | -2.2980270 | 1.2100313 | -7.2046611 | 17.0168116 | -1.9808885 | -0.0731542 | -3.3178308 | -1.2966216 | 5.8958071 | -3.8386130 | -3.4222766 | 0.3643945 | -5.9074572 | -3.3479277 | -5.0572180 |
-5.5618701 | 2.7824845 | -3.1529445 | 0.8767758 | -1.3742572 | -3.5916127 | -0.4076015 | 1.2431631 | -1.8711384 | -6.1223787 | 2.1939213 | 4.9776408 | -1.5585276 | -3.9634554 | 1.6882711 | 2.3992377 | -1.2633240 | 7.5219720 | -17.7662735 | 2.0681316 | 0.0763761 | 3.4639561 | 1.3537280 | -6.1554728 | 4.0076748 | 3.5730020 | -0.3804433 | 6.1676360 | 3.4953786 | 5.2799502 |
-5.0306450 | 2.5167239 | -2.8518006 | 0.7930332 | -1.2429992 | -3.2485707 | -0.3686707 | 1.1244262 | -1.6924223 | -5.5376183 | 1.9843755 | 4.5022166 | -1.4096695 | -3.5848980 | 1.5270210 | 2.1700818 | -1.1426614 | 6.8035337 | -16.0693819 | 1.8706003 | 0.0690812 | 3.1331069 | 1.2244308 | -5.5675515 | 3.6248940 | 3.2317376 | -0.3441064 | 5.5785531 | 3.1615281 | 4.7756518 |
-2.0084481 | 1.0047836 | -1.1385605 | 0.3166127 | -0.4962583 | -1.2969680 | -0.1471891 | 0.4489189 | -0.6756872 | -2.2108535 | 0.7922474 | 1.7974769 | -0.5628002 | -1.4312442 | 0.6096519 | 0.8663892 | -0.4561992 | 2.7162609 | -6.4155828 | 0.7468235 | 0.0275802 | 1.2508699 | 0.4888450 | -2.2228041 | 1.4472123 | 1.2902475 | -0.1373820 | 2.2271964 | 1.2622169 | 1.9066440 |
1.7871172 | -0.8940565 | 1.0130912 | -0.2817220 | 0.4415707 | 1.1540422 | 0.1309688 | -0.3994481 | 0.6012265 | 1.9672175 | -0.7049417 | -1.5993951 | 0.5007797 | 1.2735212 | -0.5424683 | -0.7709132 | 0.4059261 | -2.4169291 | 5.7085859 | -0.6645235 | -0.0245408 | -1.1130241 | -0.4349743 | 1.9778512 | -1.2877296 | -1.1480623 | 0.1222425 | -1.9817594 | -1.1231207 | -1.6965319 |
4.9039358 | -2.4533340 | 2.7799710 | -0.7730587 | 1.2116912 | 3.1667475 | 0.3593848 | -1.0961047 | 1.6497945 | 5.3981397 | -1.9343942 | -4.3888172 | 1.3741635 | 3.4946035 | -1.4885592 | -2.1154230 | 1.1138807 | -6.6321699 | 15.6646350 | -1.8234846 | -0.0673413 | -3.0541919 | -1.1935905 | 5.4273190 | -3.5335921 | -3.1503383 | 0.3354392 | -5.4380435 | -3.0818973 | -4.6553653 |
3.1929807 | -1.5973798 | 1.8100551 | -0.5033430 | 0.7889391 | 2.0618874 | 0.2339975 | -0.7136801 | 1.0741907 | 3.5147597 | -1.2594951 | -2.8575840 | 0.8947258 | 2.2753564 | -0.9692094 | -1.3773640 | 0.7252541 | -4.3182439 | 10.1993336 | -1.1872813 | -0.0438463 | -1.9886018 | -0.7771536 | 3.5337585 | -2.3007421 | -2.0512033 | 0.2184064 | -3.5407413 | -2.0066410 | -3.0311350 |
-0.5433569 | 0.2718298 | -0.3080213 | 0.0856550 | -0.1342556 | -0.3508762 | -0.0398199 | 0.1214486 | -0.1827975 | -0.5981148 | 0.2143312 | 0.4862817 | -0.1522576 | -0.3872027 | 0.1649326 | 0.2343892 | -0.1234182 | 0.7348456 | -1.7356443 | 0.2020424 | 0.0074614 | 0.3384050 | 0.1322500 | -0.6013479 | 0.3915226 | 0.3490580 | -0.0371667 | 0.6025362 | 0.3414748 | 0.5158153 |
1.0970138 | -0.5488125 | 0.6218814 | -0.1729338 | 0.2710561 | 0.7084035 | 0.0803946 | -0.2451994 | 0.3690601 | 1.2075675 | -0.4327253 | -0.9817814 | 0.3074013 | 0.7817452 | -0.3329917 | -0.4732215 | 0.2491759 | -1.4836209 | 3.5041894 | -0.4079147 | -0.0150643 | -0.6832248 | -0.2670070 | 1.2140949 | -0.7904669 | -0.7047328 | 0.0750380 | -1.2164940 | -0.6894225 | -1.0414084 |
3.9359056 | -1.9690492 | 2.2312085 | -0.6204580 | 0.9725050 | 2.5416358 | 0.2884427 | -0.8797351 | 1.3241273 | 4.3325543 | -1.5525474 | -3.5224706 | 1.1029055 | 2.8047735 | -1.1947196 | -1.6978413 | 0.8940022 | -5.3229886 | 12.5724572 | -1.4635312 | -0.0540482 | -2.4512985 | -0.9579773 | 4.3559736 | -2.8360658 | -2.5284658 | 0.2692240 | -4.3645810 | -2.4735349 | -3.7364025 |
-2.8046970 | 1.4031298 | -1.5899426 | 0.4421337 | -0.6929998 | -1.8111508 | -0.2055422 | 0.6268927 | -0.9435633 | -3.0873460 | 1.1063337 | 2.5100864 | -0.7859223 | -1.9986607 | 0.8513483 | 1.2098691 | -0.6370593 | 3.7931221 | -8.9590396 | 1.0429015 | 0.0385143 | 1.7467771 | 0.6826475 | -3.1040344 | 2.0209594 | 1.8017659 | -0.1918470 | 3.1101680 | 1.7626226 | 2.6625326 |
-3.8351100 | 1.9186233 | -2.1740689 | 0.6045685 | -0.9475999 | -2.4765464 | -0.2810559 | 0.8572058 | -1.2902174 | -4.2216008 | 1.5127878 | 3.4322628 | -1.0746609 | -2.7329454 | 1.1641238 | 1.6543609 | -0.8711074 | 5.1866709 | -12.2504861 | 1.4260513 | 0.0526641 | 2.3885226 | 0.9334442 | -4.2444204 | 2.7634363 | 2.4637137 | -0.2623294 | 4.2528074 | 2.4101895 | 3.6407160 |
-6.1355199 | 3.0694692 | -3.4781384 | 0.9672062 | -1.5159977 | -3.9620507 | -0.4496414 | 1.3713826 | -2.0641272 | -6.7538391 | 2.4202017 | 5.4910334 | -1.7192737 | -4.3722451 | 1.8623989 | 2.6466944 | -1.3936229 | 8.2977861 | -19.5986822 | 2.2814382 | 0.0842535 | 3.8212276 | 1.4933511 | -6.7903466 | 4.4210253 | 3.9415205 | -0.4196821 | 6.8037644 | 3.8558910 | 5.8245229 |
-5.2540200 | 2.6284736 | -2.9784287 | 0.8282461 | -1.2981919 | -3.3928165 | -0.3850407 | 1.1743539 | -1.7675707 | -5.7835043 | 2.0724875 | 4.7021278 | -1.4722629 | -3.7440776 | 1.5948251 | 2.2664396 | -1.1933989 | 7.1056299 | -16.7829082 | 1.9536603 | 0.0721486 | 3.2722257 | 1.2787990 | -5.8147666 | 3.7858496 | 3.3752359 | -0.3593857 | 5.8262567 | 3.3019090 | 4.9877044 |
Circulo de correlaciones de acuerdo con 2, y en el primer plano factorial de la representación simultánea identifique y describa las principales tipologías de los coches. Apóyese en las contribuciones y cosenos.
Los vehículos volvo2 y volvo3, peyot, jaguar, audi, mercedes tienen mayor desempeño y los que tienen negativo más altoel menor desempeño son misuvichi, chevrolet, dodge. Adicionalmente, los vehículos con la calificación más alta en el seguro son toyota3, alfaromero y bmw.
Realice un Clúster Análisis de acuerdo con la mejor opción en 1., utilizando el algoritmo mixto (k-means y Ward), interprete las inercias Inter e Intra y las pruebas de hipótesis para caracterizar los grupos correspondientes.
library(printr)
res.HCPC<-HCPC(veh.Irs,nb.clust=2,consol=FALSE,graph=FALSE)
Mediante el primer plano factorial, que recoge el 72.58 % de varianza acumulada, pudo clasificar a los vehículos en dos grupos de acuerdo a la calidad del vehículo como desempeño bajo y desempeño alto, lo cual es muy útil para un comprador de vehículos. Se hallan dos individuos excentricos, los cuales son porsche y jaguar.
Descripción de cada cluster por variables cuantitativas
Para seleccionar las variables continuas o nominales (modalidades) más características de una clase, se mide la desviación entre las medias o porcentajes de la clase respecto a los valores globales. Se construyen los valores test para seleccionar las variables (rangos) más características de las clases.
\[H_0: \ E𝑥𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 \ 𝑎𝑙 \ 𝑎𝑧𝑎𝑟\ de \ la \ clase \ k \]
La media de cada clase difiere de la global y cada variable anterior caracteriza la clase puesto que todos sus valores p fueron menores a 0.05.
Ahora se calculan las varianzas intra e inter.
Varianzas Intra e Inter