En el presente documento se desarrolló un ACP general usando el concepto de métrica. Esto permitiendo realizar ACP normados y no normados, y preparará mi conocimiento para comprender mejor el AFM.
El objetivo fue estudiar el rendimiento de los vehículos de acuerdo a ciertas variables observables que los caracterizan. Se utilizó la base de datos vehicles de la librería plsdepot, la cual cuenta con 30 observaciones y 16 variables, se describió las variables cuantitativas y excluyó las variables cualitativas diésel, turbo, two.doors, hatchback y symbol.
Al excluir las variables cualitativas, el nuevo dataset cuenta con 11 variables:
De los 30 vehículos y 11 variables no se hallaron datos faltantes. Se observa por medio de los gráficos de boxplot y la siguiente tabla resumen, que los datos no son homogéneos de acuerdo a cada una de las variables estudiadas; por ello es necesario centrar y normalizar el dataset para evitar que se presente robo de inercia y por ende, los individuos se podrán dispersar para encontrar asociaciones.
Min. | 1st Qu. | Median | Mean | 3rd Qu. | Max. | |
---|---|---|---|---|---|---|
wheel.base | 89.5 | 94.35 | 96.85 | 99.37000 | 102.625 | 115.6 |
length | 150.0 | 165.55 | 171.85 | 174.30667 | 185.000 | 202.6 |
width | 61.8 | 63.85 | 65.30 | 65.86333 | 67.125 | 71.7 |
curb.weight | 1909.0 | 1994.75 | 2366.00 | 2524.16667 | 2838.750 | 4066.0 |
height | 61.8 | 63.85 | 65.30 | 65.86333 | 67.125 | 71.7 |
eng.size | 90.0 | 97.00 | 110.00 | 124.26667 | 141.000 | 258.0 |
horsepower | 52.0 | 69.00 | 90.50 | 100.13333 | 113.000 | 207.0 |
peak.rpm | 4150.0 | 4800.00 | 5200.00 | 5130.00000 | 5500.000 | 6000.0 |
price | 5348.0 | 7311.50 | 9417.00 | 13058.83333 | 16482.500 | 37028.0 |
highway.mpg | 19.0 | 25.25 | 30.00 | 31.50000 | 37.000 | 46.0 |
## % latex table generated in R 4.1.2 by xtable 1.8-4 package
## % Thu Apr 14 21:42:39 2022
## \begin{table}[ht]
## \centering
## \begin{tabular}{rrrrrrr}
## \hline
## & Min. & 1st Qu. & Median & Mean & 3rd Qu. & Max. \\
## \hline
## wheel.base & 89.50 & 94.35 & 96.85 & 99.37 & 102.62 & 115.60 \\
## length & 150.00 & 165.55 & 171.85 & 174.31 & 185.00 & 202.60 \\
## width & 61.80 & 63.85 & 65.30 & 65.86 & 67.12 & 71.70 \\
## curb.weight & 1909.00 & 1994.75 & 2366.00 & 2524.17 & 2838.75 & 4066.00 \\
## height & 61.80 & 63.85 & 65.30 & 65.86 & 67.12 & 71.70 \\
## eng.size & 90.00 & 97.00 & 110.00 & 124.27 & 141.00 & 258.00 \\
## horsepower & 52.00 & 69.00 & 90.50 & 100.13 & 113.00 & 207.00 \\
## peak.rpm & 4150.00 & 4800.00 & 5200.00 & 5130.00 & 5500.00 & 6000.00 \\
## price & 5348.00 & 7311.50 & 9417.00 & 13058.83 & 16482.50 & 37028.00 \\
## highway.mpg & 19.00 & 25.25 & 30.00 & 31.50 & 37.00 & 46.00 \\
## \hline
## \end{tabular}
## \end{table}
La matriz de datos centrada resulta ser la siguiente
wheel.base | length | width | height | curb.weight | eng.size | horsepower | peak.rpm | price | city.mpg | highway.mpg | |
---|---|---|---|---|---|---|---|---|---|---|---|
alfaromeo | -0.6979223 | -0.2207608 | -0.1489178 | -0.7107064 | 0.5217954 | 0.7311889 | 1.3580788 | -0.2664547 | 0.3974423 | -1.1359184 | -0.8273750 |
audi | 0.9214867 | 1.3070368 | 2.2692882 | 0.9370673 | 0.5584637 | 0.3093492 | 0.2487570 | 0.7583711 | 0.5371929 | -1.1359184 | -0.9778068 |
bmw | 0.2622583 | 0.1771772 | -0.4358236 | 0.2380118 | -0.2255390 | -0.4288704 | 0.0218503 | 1.3732666 | 0.3893576 | -0.5163266 | -0.3760795 |
chevrolet | -0.6979223 | -1.1019092 | -0.9276621 | -0.9104366 | -1.0741478 | -0.9034402 | -0.7597173 | 0.5534060 | -0.7488593 | 1.8071430 | 1.7299659 |
dodge1 | -0.8125707 | -1.2084998 | -0.8456890 | -1.5096270 | -0.6917500 | -0.6925203 | 0.0470621 | 0.7583711 | -0.5892433 | -0.3614286 | -0.2256477 |
dodge2 | -0.8125707 | -1.2084998 | -0.8456890 | -1.6094921 | -0.9728735 | -0.9034402 | -0.8101410 | 0.7583711 | -0.7888211 | 0.7228572 | 0.9778068 |
honda1 | -0.8125707 | -1.7272404 | -0.7637159 | -0.6108414 | -0.9920807 | -0.8507102 | -0.6084462 | 1.7831970 | -0.6848743 | 0.5679592 | 0.3760795 |
honda2 | -0.4113012 | 0.0776927 | -0.2718774 | 0.1381467 | -0.3844349 | -0.3761405 | -0.3563276 | 1.3732666 | -0.4866825 | 0.1032653 | 0.2256477 |
isuzu | -0.7265844 | -0.2562910 | -1.6654198 | -0.1614485 | -0.3268133 | -0.3497755 | -0.5580225 | -0.6763851 | -0.7246051 | -0.3614286 | -0.3760795 |
jaguar | 1.9533226 | 1.7973532 | 1.5315305 | -0.5109763 | 2.6922084 | 3.5258774 | 1.9127397 | -0.7788676 | 2.5976484 | -1.7555103 | -1.8803977 |
mazda | -0.8985570 | -0.5334264 | -0.6817428 | 0.1381467 | -1.0025573 | -0.8770752 | -0.8101410 | -0.2664547 | -0.6541523 | 0.7228572 | 0.9778068 |
mercedes | 2.3259300 | 2.0105343 | 2.3922479 | 1.2366625 | 2.1753603 | 1.5485035 | 0.5765112 | -1.5987283 | 2.1414377 | -0.6712245 | -0.9778068 |
mercury | 0.4772241 | 0.2908737 | 0.8757458 | 0.4876744 | 0.6737069 | 0.4148091 | 1.8875278 | -0.2664547 | 0.3977888 | -1.1359184 | -1.1282386 |
mitsubishi | -0.8125707 | -1.2084998 | -0.5997697 | -1.5096270 | -1.0584328 | -0.8507102 | -0.8101410 | 0.7583711 | -0.8858380 | 1.6522450 | 1.4291022 |
nissan1 | -0.6979223 | -0.2918212 | -0.8456890 | -0.1614485 | -0.8733453 | -0.7188853 | -0.7849292 | 0.1434756 | -0.6594651 | 0.7228572 | 0.8273750 |
nissan2 | -0.6979223 | -0.6400169 | -0.8456890 | 0.3378768 | -1.0008112 | -0.7188853 | -0.7849292 | 0.1434756 | -0.6652399 | 0.7228572 | 0.8273750 |
plymouth | -0.8125707 | -1.2084998 | -0.8456890 | -1.6094921 | -0.9728735 | -0.9034402 | -0.8101410 | 0.7583711 | -0.7888211 | 0.7228572 | 0.9778068 |
peugot | 2.1252952 | 1.7476110 | 1.0396920 | 2.4350433 | 1.5816834 | 0.7311889 | -0.1294209 | -2.0086586 | 0.0925319 | -0.2065306 | -0.9778068 |
porsche | -1.4144750 | -0.3841997 | -0.3538505 | -1.1101667 | 0.4816350 | 1.8385183 | 2.6943073 | 1.5782318 | 2.7683521 | -1.4457144 | -0.9778068 |
saab | -0.0386938 | 0.8735686 | 0.2609477 | 1.1367974 | 0.2982935 | -0.0861256 | 0.2487570 | 0.2459582 | -0.1026570 | -0.8261225 | -0.5265114 |
subaru | -0.3109839 | -0.1639126 | -0.1899043 | -0.6607739 | -0.5834913 | -0.4288704 | -0.4571750 | -1.4962457 | -0.6102637 | 0.2581633 | 0.2256477 |
toyota1 | -0.5259497 | -1.1090153 | -0.9276621 | 0.3378768 | -0.9414435 | -0.8507102 | -0.9614122 | -0.6763851 | -0.8905734 | 1.3424491 | 1.1282386 |
toyota2 | -0.5259497 | -0.5689566 | -0.5997697 | -0.4111112 | -0.4350721 | -0.3761405 | -1.1126833 | -1.2912806 | -0.5960576 | 1.1875511 | 0.6769432 |
toyota3 | -0.1390112 | 0.1345409 | -0.1079312 | -0.9104366 | 0.0468539 | 0.5729990 | 0.4000282 | -0.6763851 | -0.3545547 | -0.3614286 | -0.2256477 |
toyota4 | 0.4342309 | 0.0919047 | 0.2609477 | 0.5376070 | -0.0771198 | -0.3761405 | -0.6840818 | -1.2912806 | -0.2726677 | 0.5679592 | 0.2256477 |
volkswagen1 | -0.2966528 | -0.1852307 | -0.1489178 | 0.9370673 | -0.4595176 | -0.7188853 | -1.2135308 | -0.6763851 | -0.6102637 | 1.6522450 | 2.1812613 |
volkswagen2 | 0.1476098 | 0.4187824 | 0.4248938 | 0.6374720 | 0.2389259 | 0.3093492 | 0.2487570 | 0.7583711 | 0.0272764 | -1.1359184 | -1.1282386 |
volvo1 | 0.7065209 | 1.0299014 | 0.5478534 | 1.1867299 | 0.6771991 | 0.4411741 | 0.3496044 | 0.5534060 | -0.0137248 | -0.5163266 | -0.5265114 |
volvo2 | 1.3944115 | 1.0299014 | 1.2036381 | 0.8372022 | 0.9164160 | 0.4411741 | 1.5093499 | 0.3484408 | 0.6913806 | -1.1359184 | -0.9778068 |
volvo3 | 1.3944115 | 1.0299014 | 1.2446247 | 0.8372022 | 1.2097622 | 0.5466340 | 0.1479096 | -0.6763851 | 1.0869557 | -0.0516327 | -0.6769432 |
Como se puedem observar los valores propios a continuación,los dos primeros son mayores que 1, presentando \(\lambda_1=7.202\) y \(\lambda_2=2.003\), lo cual será útil emplear dos componentes principales, donde se estará expresando un porcentaje de variabilidad del 84 %.
## [1] 2
Mediante el círculo de correlaciones, como su nombre lo dice, es necesario para determinar las corrrelaciones entre las variables, tales como:
## numeric(0)
## numeric(0)
En la nube de individuos se observan los 30 vehículos estudiados en el plano factorial de la primera y segunda componente, presentando similitudes entre una gran cantidad de estos; sin embargo, existen vehículos particularmente distintos en sus variables como lo son mercedes, porsche, jaguar. Para encontrar los perfiles de los vehículos se empleará la representación simultanea de las variables y los individuos más adelante del documento.
Mediante la representación simultanea se pueden observar asociaciones de perfiles entre vehículos de acuerdo a las similitudes de sus variables, como por ejemplo:
Toyota 1 y 2, presentan menores caballos de fuerza y mayor consumo de combustible en carretera al igual que volkswagen1 y chevrolet. Los vehículos más costosos en dólares, presentan los mayores valores en caballos de fuerza y menor consumo de combustible en carretera, como lo son mercury y como excentricos porshe, jaguar y mercedes. Los vehículos promedios en las variables de precio en dólares, consumo de combustible en carretera y caballos de fuerza que son las variables más relevantes a la hora de comprar un vehículo, son honda2, usuzu y toyota3.
El índice de Performance se creó como, donde Performance se entiende como el rendimiento y/o desempeño de un vehículo
\[I_{Performance}=\frac{CP_1*65.47+CP_2*18.21}{84}*100\]
## Registered S3 method overwritten by 'GGally':
## method from
## +.gg ggplot2
El Índice Performance presenta una mediana de 32 en el rendimiento, se calculó esta medidad de tendencia central puesto que no es simétrico.
median(Performance)
## [1] 32
La línea punteada roja expresa el valor que supondría un escenario en el que todas las variables presentaran un rendimiento igual. Es notorio de acuerdo a los análsis anteriores que los vehículos más costosos presentan un rendimiento mayor.