Introducción

En el presente documento se desarrolló cuatro ACP con variables cuantitativas, de los cuales uno solamente no tuvo variables cualitativas. Esto permitiendo comparar los cuatro ACP y escoger el mejor de ellos para realizar un análisis de clúster por medio de un algoritmo mixto (k-means y Ward). Posteriormente se realizó la contaminación de la base de datos seleccionada con el 13 % de NA’s.

El objetivo fue estudiar el rendimiento de los vehículos de acuerdo a ciertas variables observables que los caracterizan y la calificación del riesgo de seguros. Se utilizó la base de datos vehicles de la librería plsdepot, la cual cuenta con 30 observaciones y 16 variables, se describió las variables cuantitativas y excluyó las variables cualitativas diésel, turbo, two.doors, hatchback y la variable cuantitativa peak.rpm.

Data Vehicles

Al excluir las variables cualitativas, el nuevo dataset cuenta con 11 variables:

  • diesel: Tipo de combustible diesel.
  • turbo: Turbo aspiración.
  • two.doors: Vehiculos con dos puertas.
  • hatchback: Estilo de carrocería hatchback.
  • wheel.base: Distancia entre ejes.
  • length: Longitud.
  • width: Ancho.
  • height: Altura.
  • curb.weight: Peso en vacío.
  • eng.size: Tamaño de la máquina.
  • horsepower: Caballo de fuerza.
  • peak.rpm: Pico de revoluciones por minuto.
  • price: Precio en dolares.
  • symbol: Calificación de riesgo de seguros.
  • city.mpg: Consumo de combustible en ciudad.
  • highway.mpg: Consumo de combustible en carretera.

De los 30 vehículos y 11 variables no se hallaron datos faltantes. Se observa por medio de los gráficos de boxplot y la siguiente tabla resumen, que los datos no son homogéneos de acuerdo a cada una de las variables estudiadas y sus dimensiones; por ello es necesario centrar y normalizar el dataset para evitar que se presente robo de inercia y por ende, los individuos se podrán dispersar para encontrar asociaciones.

Xo<-vehicles

library(FactoMineR)

Punto 1

a.

Se agregó como cualitativa suplementaria la variable 𝑠𝑦𝑚𝑏𝑜𝑙. Esta base de datos presenta 30 observaciones y 11 variables.

X<-Xo[,-c(1:4,12)] #excluyo variables
n<-nrow(X)
dim(X)
## [1] 30 11
#colnames(X) #matriz lista con una cualitativa

#PCA 1
#variable suplementaria [9]
veh.qs<-PCA(X,quali.sup = 9)

#veh.qs$call$X
#height tiene asociacion con el eje 2

Valores propios

El primer plano factorial da una buena representación puesto que representa una varianza acumulada del 87.9 % y todos los valores propios están aportando, por tanto no hay problemas de multicolinealidad ni baja frecuencia.

L.qs<-veh.qs$eig
DT::datatable(L.qs)

Los vehículos que más contribuyen al primer eje son jaguar, mercedes, audi y mercury.

b.

La variable cualitativa 𝑠𝑦𝑚𝑏𝑜𝑙 se agregó como activa a partir de todas sus k indicadoras.

library(ade4)

Xp<-X
as.factor(Xp$symbol) 
##  [1] 1  1  2  0  1  1  1  0  0  0  1  -1 1  2  1  1  1  0  3  2  0  1  0  2  -1
## [26] 2  0  -2 -1 -1
## Levels: -2 -1 0 1 2 3
sym.d<-acm.disjonctif(Xp[9])

Xd<-cbind(Xp[,-9],sym.d)

Mediante el circulo de correlaciones, se puede observar que las indicadoras de la variable symbol no aportn mucha información a los ejes, por lo cual reducirán la inercia.

#ACP 2
veh.cI<-PCA(Xd,graph = TRUE)

Se realizó el summary de cada una de las categorías de la variable symbol para determinar cuales presentan baja frecuencia y se encontró que symbol -2 y symbol 3 tienen solo un valor como calificación, lo cual es bastante bajo.

Valores propios

El porcentaje de varianza acumulado es del 61.7 % en los dos primeros ejes y en comparación con el ACP anterior (1.a), el primer valor propio aumentó pero la varianza acumulada por las dos primeras componentes disminuyó a 61.7 %, reduciendo 9.58 % de varianza acumulada.

Esto se debe a que aumentaron las variables y los ejes, porque la inercia se riega en todos esos ejes. Lo que da la conclusión que introducir cualitativas al ACP perjudica la inercia, puesto que esta se irradia en todas las categorias y el plano factorial recoge menos inercia que cuando no estaba esa variable cualitativa. Se observan 30 individuos y 16 valores propios, de los cuales solo 15 aportan debido a la multicolinealidad derivada de la variable symbol.

L.cI<-veh.cI$eig #valores propios
DT::datatable(L.cI)

c. 

En este caso se debe agregar la variable cualitativa 𝑠𝑦𝑚𝑏𝑜𝑙 como activa a partir de 𝑘 − 1.

Sin reagrupar, excluyendo simbol 0

Se tendrá en cuenta todas las categorías de la variable symbol, a excepción de symbol 0, puesto que esta es la que presenta la frecuencia más baja.

#ACP 5
vehd_2<-PCA(Xd,quali.sup = 13)

Ahora se tienen 5 (k-1) indicadoras y se tienen 15 valores propios. El primer valor propio es de 7.51, el cual es menor al primer valor propio del ACP 1.b y el último valor propio es diferente de cero, lo que significa que se ha corregido la multicolinealidad. Sin embargo, como se incluyeron variables cualitativas como activas, la inercia se dispersa y el primer plano factorial disminuye, el porcentaje de varianza acumulado es del 65.73 %, el cual es mayor al del ACP de 1b en 4.01 5, pero menor al del 1a.

Valores propios

d. 

En este caso se deben generar nuevas indicadoras derivadas de corregir primero la baja frecuencia, y luego la multicolinealidad.

Reagrupando indicadoras

Se agruparon las categorías symbol -1 y symbol -2 en la variable symbol._1 y las categorías symbol 2 y symbol 3 en la variable symbol2, quedando presentes las categorías symbol 0 y symbol 1, contando con 30 observaciones y 14 variables.

En este caso se estaría corrigiendo la baja frecuencia puesto que se agruparon algunas variables que presentan baja frecuencia y se desea corregir la multicolinealidad.

symbol._1<-Xd[,11]+Xd[,12] #symbol -1 y symbol -2 
symbol2<-Xd[,15]+Xd[,16] #symbol 2 y symbol 3

Xda<-cbind(Xd[,-c(11,12,15,16)],symbol._1,symbol2)
dim(Xda)
## [1] 30 14
View(Xd)
summary(Xd$symbol.0)
Min. 1st Qu. Median Mean 3rd Qu. Max.
0 0 0 0.2666667 0.75 1
#ACP 3
veh.Ir<-PCA(Xda,graph = TRUE)

Valores propios

No se corrigió la multicolinealidad, pero se corregió el problema de baja frecuencia. El último valor propio es 0, no aporta nada y esto es causado por la multicolinealidad generada por las indicadoras. Esto se puede deber porque aún está activa la categoría symbol 0 que tiene un solo valor igual a 1 y 29 son 0.

El porcentaje de varianza acumulado en los dos primeros ejes es del 67.54 %, el cual es mayor al del 1c por 1.81 % y al del 1b por 5.82 %.

DT::datatable(veh.Ir$eig)

Agrupadas sin symbol 0

En este caso, donde se agruparon las categorías de symbol -2 y symbol -1 en la variable symbol._1 y las categorías symbol 2 y symbol 3 en la variable symbol2, adicionalmente se colocó symbol 0 como suplementaria.

#2c con Xda

Xda<-cbind(Xd[,-c(11,12,15,16)],symbol._1,symbol2)
dim(Xda)
## [1] 30 14
#ACP 4
veh.Irs<-PCA(Xda,quanti.sup = 11)

Valores propios

Se logró corregir la multicolinealidad puesto que el último valor propio ya no es igual a cero. El porcentaje de varianza acumulado en los dos primeros ejes en el plano factorial es de 72.58 % aproximadamente, el cual es superior al de los ítems b y c, pero inferior al del 1a en 15.34 %. El primer valor propio en este caso fue de 7.47, el cual es inferior a todos los de los ACP anteriores, pero superior al del 1a.

DT::datatable(veh.Irs$eig)

Nota

Observe los valores propios y las inercias acumuladas; identifique la mejor opción entre 1.b , 1.c y 1.d.

De acuerdo a la nota del profesor, la mejor opción después de la 1a (sin variables cualitativas), es la opción 1d en términos de concentración de inercia en el primer plano factorial, además corrige la multicolinealidad.

Punto 2

Se debe aplicar la función fnipalsNA() a la base 𝑣𝑒ℎ𝑖𝑐𝑙𝑒𝑠 conformada según la mejor opción 1.d, y afectada con el 13 % de NAs.

Los NA han afectado las categorías de symbol puesto que los NA se generaron por fila. Como se muestra en el resumen descriptivo a continuación, hay cuatro datos faltantes en cada una de las categorías.

Valores propios

Los valores propios después de contaminar con el 13 % de NA’s no tuvo un cambio significativo. Comparando el porcentaje de varianza acumulado fue del 68.03 % y en el ACP de 1.d fue de 72.58 % aproximadamente, presentandose una disminución de la varianza acumulada del 4.55 %. Es de destacar que los valores propios en este caso, tienen un comportamiento descendiente similar al del item 1.d.

## [1] 13

Con el objetivo de comparar los resultados del ACP de 1.d y el ACP contaminado, se calculó la correlación entre las componentes, obteniendo valores similares, es decir, las variables se parecen o son practicamente iguales, pues la correlación es aproximadamente 1.

View(cor(Cord_Ind))
Cord_Ind[,1]%*%t(Cord_Ind[,2])
alfaromeo audi bmw chevrolet dodge1 dodge2 honda1 honda2 isuzu jaguar mazda mercedes mercury mitsubishi nissan1 nissan2 plymouth peugot porsche saab subaru toyota1 toyota2 toyota3 toyota4 volkswagen1 volkswagen2 volvo1 volvo2 volvo3
-1.4022182 0.7014997 -0.7948974 0.2210463 -0.3464677 -0.9054912 -0.1027615 0.3134172 -0.4717378 -1.5435295 0.5531154 1.2549265 -0.3929246 -0.9992375 0.4256346 0.6048783 -0.3185000 1.8963847 -4.4791034 0.5214023 0.0192554 0.8733074 0.3412920 -1.5518729 1.0103858 0.9007992 -0.0959146 1.5549394 0.8812294 1.3311426
-4.9462798 2.4745178 -2.8039752 0.7797338 -1.2221538 -3.1940913 -0.3624880 1.1055693 -1.6640400 -5.4447509 1.9510970 4.4267133 -1.3860290 -3.5247783 1.5014124 2.1336890 -1.1234987 6.6894366 -15.7998941 1.8392299 0.0679227 3.0805639 1.2038967 -5.4741822 3.5641035 3.1775405 -0.3383356 5.4849992 3.1085085 4.6955629
-0.1527267 0.0764059 -0.0865786 0.0240759 -0.0377365 -0.0986242 -0.0111926 0.0341368 -0.0513807 -0.1681180 0.0602442 0.1366840 -0.0427965 -0.1088349 0.0463592 0.0658821 -0.0346904 0.2065503 -0.4878546 0.0567900 0.0020973 0.0951188 0.0371728 -0.1690268 0.1100491 0.0981132 -0.0104468 0.1693608 0.0959817 0.1449853
5.5358408 -2.7694625 3.1381889 -0.8726725 1.3678257 3.5748041 0.4056940 -1.2373452 1.8623816 6.0937262 -2.1836538 -4.9543457 1.5512337 3.9449066 -1.6803700 -2.3880094 1.2574117 -7.4867695 17.6831281 -2.0584529 -0.0760186 -3.4477450 -1.3473926 6.1266654 -3.9889191 -3.5562805 0.3786628 -6.1387718 -3.4790204 -5.2552403
3.2960125 -1.6489244 1.8684622 -0.5195849 0.8143967 2.1284208 0.2415482 -0.7367092 1.1088529 3.6281747 -1.3001367 -2.9497931 0.9235969 2.3487780 -1.0004841 -1.4218091 0.7486567 -4.4575858 10.5284477 -1.2255927 -0.0452611 -2.0527704 -0.8022309 3.6477865 -2.3749828 -2.1173920 0.2254540 -3.6549946 -2.0713916 -3.1289443
5.2877247 -2.6453354 2.9975354 -0.8335594 1.3065199 3.4145815 0.3875108 -1.1818874 1.7789097 5.8206056 -2.0857825 -4.7322921 1.4817075 3.7680960 -1.6050559 -2.2809789 1.2010545 -7.1512128 16.8905711 -1.9661931 -0.0726115 -3.2932172 -1.2870025 5.8520686 -3.8101359 -3.3968882 0.3616912 -5.8636323 -3.3230908 -5.0197006
4.6373828 -2.3199832 2.6288659 -0.7310392 1.1458298 2.9946191 0.3398505 -1.0365260 1.5601200 5.1047242 -1.8292503 -4.1502634 1.2994710 3.3046546 -1.4076487 -2.0004393 1.0533358 -6.2716788 14.8131848 -1.7243693 -0.0636809 -2.8881815 -1.1287129 5.1323175 -3.3415239 -2.9791019 0.3172065 -5.1424590 -2.9143809 -4.4023232
1.1951145 -0.5978902 0.6774933 -0.1883984 0.2952954 0.7717527 0.0875839 -0.2671264 0.4020635 1.3155546 -0.4714219 -1.0695774 0.3348908 0.8516529 -0.3627696 -0.5155395 0.2714585 -1.6162941 3.8175525 -0.4443926 -0.0164114 -0.7443223 -0.2908842 1.3226657 -0.8611547 -0.7677537 0.0817483 -1.3252793 -0.7510743 -1.1345366
1.6463701 -0.8236437 0.9333036 -0.2595345 0.4067941 1.0631538 0.1206542 -0.3679889 0.5538760 1.8122863 -0.6494230 -1.4734323 0.4613400 1.1732231 -0.4997454 -0.7101987 0.3739567 -2.2265801 5.2589975 -0.6121880 -0.0226081 -1.0253662 -0.4007172 1.8220825 -1.1863125 -1.0576449 0.1126151 -1.8256829 -1.0346676 -1.5629189
-9.1472070 4.5761517 -5.1854206 1.4419699 -2.2601418 -5.9068666 -0.6703529 2.0445408 -3.0773265 -10.0690350 3.6081842 8.1863672 -2.5631980 -6.5184094 2.7765778 3.9458533 -2.0776979 12.3708453 -29.2189098 3.4013070 0.1256102 5.6969190 2.2263788 -10.1234625 6.5911340 5.8762589 -0.6256877 10.1434666 5.7485973 8.6835536
4.1859336 -2.0941329 2.3729458 -0.6598725 1.0342833 2.7030930 0.3067660 -0.9356202 1.4082424 4.6077794 -1.6511728 -3.7462353 1.1729675 2.9829465 -1.2706141 -1.8056965 0.9507936 -5.6611310 13.3711215 -1.5565019 -0.0574816 -2.6070171 -1.0188327 4.6326864 -3.0162266 -2.6890864 0.2863264 -4.6418407 -2.6306660 -3.9737571
-9.0100409 4.5075304 -5.1076631 1.4203470 -2.2262501 -5.8182907 -0.6603006 2.0138821 -3.0311808 -9.9180457 3.5540780 8.0636093 -2.5247618 -6.4206632 2.7349418 3.8866837 -2.0465420 12.1853394 -28.7807603 3.3503031 0.1237266 5.6114914 2.1929934 -9.9716571 6.4922973 5.7881420 -0.6163052 9.9913611 5.6623947 8.5533402
-3.7097773 1.8559221 -2.1030196 0.5848110 -0.9166320 -2.3956120 -0.2718709 0.8291920 -1.2480527 -4.0836374 1.4633494 3.3200953 -1.0395407 -2.6436318 1.1260798 1.6002958 -0.8426393 5.0171687 -11.8501360 1.3794475 0.0509430 2.3104649 0.9029390 -4.1057113 2.6731262 2.3831987 -0.2537563 4.1138242 2.3314237 3.5217362
5.7037340 -2.8534559 3.2333651 -0.8991392 1.4093097 3.6832222 0.4179980 -1.2748719 1.9188646 6.2785391 -2.2498805 -5.1046030 1.5982801 4.0645492 -1.7313330 -2.4604339 1.2955470 -7.7138312 18.2194290 -2.1208824 -0.0783242 -3.5523095 -1.3882568 6.3124774 -4.1098966 -3.6641368 0.3901471 -6.3249509 -3.5845335 -5.4146233
3.8643777 -1.9332654 2.1906604 -0.6091823 0.9548315 2.4954463 0.2832008 -0.8637476 1.3000637 4.2538181 -1.5243327 -3.4584562 1.0828622 2.7538019 -1.1730078 -1.6669862 0.8777553 -5.2262531 12.3439760 -1.4369343 -0.0530660 -2.4067507 -0.9405678 4.2768118 -2.7845255 -2.4825156 0.2643313 -4.2852628 -2.4285830 -3.6685002
3.9452280 -1.9737130 2.2364932 -0.6219276 0.9748085 2.5476558 0.2891259 -0.8818189 1.3272636 4.3428162 -1.5562247 -3.5308138 1.1055178 2.8114168 -1.1975494 -1.7018628 0.8961197 -5.3355964 12.6022359 -1.4669977 -0.0541762 -2.4571046 -0.9602463 4.3662910 -2.8427832 -2.5344546 0.2698617 -4.3749188 -2.4793936 -3.7452524
5.3272453 -2.6651067 3.0199390 -0.8397894 1.3162848 3.4401022 0.3904070 -1.1907209 1.7922053 5.8641090 -2.1013717 -4.7676614 1.4927818 3.7962589 -1.6170521 -2.2980270 1.2100313 -7.2046611 17.0168116 -1.9808885 -0.0731542 -3.3178308 -1.2966216 5.8958071 -3.8386130 -3.4222766 0.3643945 -5.9074572 -3.3479277 -5.0572180
-5.5618701 2.7824845 -3.1529445 0.8767758 -1.3742572 -3.5916127 -0.4076015 1.2431631 -1.8711384 -6.1223787 2.1939213 4.9776408 -1.5585276 -3.9634554 1.6882711 2.3992377 -1.2633240 7.5219720 -17.7662735 2.0681316 0.0763761 3.4639561 1.3537280 -6.1554728 4.0076748 3.5730020 -0.3804433 6.1676360 3.4953786 5.2799502
-5.0306450 2.5167239 -2.8518006 0.7930332 -1.2429992 -3.2485707 -0.3686707 1.1244262 -1.6924223 -5.5376183 1.9843755 4.5022166 -1.4096695 -3.5848980 1.5270210 2.1700818 -1.1426614 6.8035337 -16.0693819 1.8706003 0.0690812 3.1331069 1.2244308 -5.5675515 3.6248940 3.2317376 -0.3441064 5.5785531 3.1615281 4.7756518
-2.0084481 1.0047836 -1.1385605 0.3166127 -0.4962583 -1.2969680 -0.1471891 0.4489189 -0.6756872 -2.2108535 0.7922474 1.7974769 -0.5628002 -1.4312442 0.6096519 0.8663892 -0.4561992 2.7162609 -6.4155828 0.7468235 0.0275802 1.2508699 0.4888450 -2.2228041 1.4472123 1.2902475 -0.1373820 2.2271964 1.2622169 1.9066440
1.7871172 -0.8940565 1.0130912 -0.2817220 0.4415707 1.1540422 0.1309688 -0.3994481 0.6012265 1.9672175 -0.7049417 -1.5993951 0.5007797 1.2735212 -0.5424683 -0.7709132 0.4059261 -2.4169291 5.7085859 -0.6645235 -0.0245408 -1.1130241 -0.4349743 1.9778512 -1.2877296 -1.1480623 0.1222425 -1.9817594 -1.1231207 -1.6965319
4.9039358 -2.4533340 2.7799710 -0.7730587 1.2116912 3.1667475 0.3593848 -1.0961047 1.6497945 5.3981397 -1.9343942 -4.3888172 1.3741635 3.4946035 -1.4885592 -2.1154230 1.1138807 -6.6321699 15.6646350 -1.8234846 -0.0673413 -3.0541919 -1.1935905 5.4273190 -3.5335921 -3.1503383 0.3354392 -5.4380435 -3.0818973 -4.6553653
3.1929807 -1.5973798 1.8100551 -0.5033430 0.7889391 2.0618874 0.2339975 -0.7136801 1.0741907 3.5147597 -1.2594951 -2.8575840 0.8947258 2.2753564 -0.9692094 -1.3773640 0.7252541 -4.3182439 10.1993336 -1.1872813 -0.0438463 -1.9886018 -0.7771536 3.5337585 -2.3007421 -2.0512033 0.2184064 -3.5407413 -2.0066410 -3.0311350
-0.5433569 0.2718298 -0.3080213 0.0856550 -0.1342556 -0.3508762 -0.0398199 0.1214486 -0.1827975 -0.5981148 0.2143312 0.4862817 -0.1522576 -0.3872027 0.1649326 0.2343892 -0.1234182 0.7348456 -1.7356443 0.2020424 0.0074614 0.3384050 0.1322500 -0.6013479 0.3915226 0.3490580 -0.0371667 0.6025362 0.3414748 0.5158153
1.0970138 -0.5488125 0.6218814 -0.1729338 0.2710561 0.7084035 0.0803946 -0.2451994 0.3690601 1.2075675 -0.4327253 -0.9817814 0.3074013 0.7817452 -0.3329917 -0.4732215 0.2491759 -1.4836209 3.5041894 -0.4079147 -0.0150643 -0.6832248 -0.2670070 1.2140949 -0.7904669 -0.7047328 0.0750380 -1.2164940 -0.6894225 -1.0414084
3.9359056 -1.9690492 2.2312085 -0.6204580 0.9725050 2.5416358 0.2884427 -0.8797351 1.3241273 4.3325543 -1.5525474 -3.5224706 1.1029055 2.8047735 -1.1947196 -1.6978413 0.8940022 -5.3229886 12.5724572 -1.4635312 -0.0540482 -2.4512985 -0.9579773 4.3559736 -2.8360658 -2.5284658 0.2692240 -4.3645810 -2.4735349 -3.7364025
-2.8046970 1.4031298 -1.5899426 0.4421337 -0.6929998 -1.8111508 -0.2055422 0.6268927 -0.9435633 -3.0873460 1.1063337 2.5100864 -0.7859223 -1.9986607 0.8513483 1.2098691 -0.6370593 3.7931221 -8.9590396 1.0429015 0.0385143 1.7467771 0.6826475 -3.1040344 2.0209594 1.8017659 -0.1918470 3.1101680 1.7626226 2.6625326
-3.8351100 1.9186233 -2.1740689 0.6045685 -0.9475999 -2.4765464 -0.2810559 0.8572058 -1.2902174 -4.2216008 1.5127878 3.4322628 -1.0746609 -2.7329454 1.1641238 1.6543609 -0.8711074 5.1866709 -12.2504861 1.4260513 0.0526641 2.3885226 0.9334442 -4.2444204 2.7634363 2.4637137 -0.2623294 4.2528074 2.4101895 3.6407160
-6.1355199 3.0694692 -3.4781384 0.9672062 -1.5159977 -3.9620507 -0.4496414 1.3713826 -2.0641272 -6.7538391 2.4202017 5.4910334 -1.7192737 -4.3722451 1.8623989 2.6466944 -1.3936229 8.2977861 -19.5986822 2.2814382 0.0842535 3.8212276 1.4933511 -6.7903466 4.4210253 3.9415205 -0.4196821 6.8037644 3.8558910 5.8245229
-5.2540200 2.6284736 -2.9784287 0.8282461 -1.2981919 -3.3928165 -0.3850407 1.1743539 -1.7675707 -5.7835043 2.0724875 4.7021278 -1.4722629 -3.7440776 1.5948251 2.2664396 -1.1933989 7.1056299 -16.7829082 1.9536603 0.0721486 3.2722257 1.2787990 -5.8147666 3.7858496 3.3752359 -0.3593857 5.8262567 3.3019090 4.9877044

Punto 3

Circulo de correlaciones de acuerdo con 2, y en el primer plano factorial de la representación simultánea identifique y describa las principales tipologías de los coches. Apóyese en las contribuciones y cosenos.

Los vehículos volvo2 y volvo3, peyot, jaguar, audi, mercedes tienen mayor desempeño y los que tienen negativo más altoel menor desempeño son misuvichi, chevrolet, dodge. Adicionalmente, los vehículos con la calificación más alta en el seguro son toyota3, alfaromero y bmw.

Punto 4

Realice un Clúster Análisis de acuerdo con la mejor opción en 1., utilizando el algoritmo mixto (k-means y Ward), interprete las inercias Inter e Intra y las pruebas de hipótesis para caracterizar los grupos correspondientes.

library(printr)
res.HCPC<-HCPC(veh.Irs,nb.clust=2,consol=FALSE,graph=FALSE)

Mediante el primer plano factorial, que recoge el 72.58 % de varianza acumulada, pudo clasificar a los vehículos en dos grupos de acuerdo a la calidad del vehículo como desempeño bajo y desempeño alto, lo cual es muy útil para un comprador de vehículos. Se hallan dos individuos excentricos, los cuales son porsche y jaguar.

Descripción de cada cluster por variables cuantitativas

Para seleccionar las variables continuas o nominales (modalidades) más características de una clase, se mide la desviación entre las medias o porcentajes de la clase respecto a los valores globales. Se construyen los valores test para seleccionar las variables (rangos) más características de las clases.

\[H_0: \ E𝑥𝑡𝑟𝑎𝑐𝑐𝑖ó𝑛 \ 𝑎𝑙 \ 𝑎𝑧𝑎𝑟\ de \ la \ clase \ k \]

La media de cada clase difiere de la global y cada variable anterior caracteriza la clase puesto que todos sus valores p fueron menores a 0.05.

Ahora se calculan las varianzas intra e inter.

Varianzas Intra e Inter