Introducción

En el presente documento se desarrolló un ACP general usando el concepto de métrica. Esto permitiendo realizar ACP normados y no normados, y preparará mi conocimiento para comprender mejor el AFM.

El objetivo fue estudiar el rendimiento de los vehículos de acuerdo a ciertas variables observables que los caracterizan. Se utilizó la base de datos vehicles de la librería plsdepot, la cual cuenta con 30 observaciones y 16 variables, se describió las variables cuantitativas y excluyó las variables cualitativas diésel, turbo, two.doors, hatchback y symbol.

Data Vehicles

Al excluir las variables cualitativas, el nuevo dataset cuenta con 11 variables:

  • diesel: Tipo de combustible diesel.
  • turbo: Turbo aspiración.
  • two.doors: Vehiculos con dos puertas.
  • hatchback: Estilo de carrocería hatchback.
  • wheel.base: Distancia entre ejes.
  • length: Longitud.
  • width: Ancho.
  • height: Altura.
  • curb.weight: Peso en vacío.
  • eng.size: Tamaño de la máquina.
  • horsepower: Caballo de fuerza.
  • peak.rpm: Pico de revoluciones por minuto.
  • price: Precio en dolares.
  • symbol: Calificación de riesgo de seguros.
  • city.mpg: Consumo de combustible en ciudad.
  • highway.mpg: Consumo de combustible en carretera.

De los 30 vehículos y 11 variables no se hallaron datos faltantes. Se observa por medio de los gráficos de boxplot y la siguiente tabla resumen, que los datos no son homogéneos de acuerdo a cada una de las variables estudiadas; por ello es necesario centrar y normalizar el dataset para evitar que se presente robo de inercia y por ende, los individuos se podrán dispersar para encontrar asociaciones.

Min. 1st Qu. Median Mean 3rd Qu. Max.
wheel.base 89.5 94.35 96.85 99.37000 102.625 115.6
length 150.0 165.55 171.85 174.30667 185.000 202.6
width 61.8 63.85 65.30 65.86333 67.125 71.7
curb.weight 1909.0 1994.75 2366.00 2524.16667 2838.750 4066.0
height 61.8 63.85 65.30 65.86333 67.125 71.7
eng.size 90.0 97.00 110.00 124.26667 141.000 258.0
horsepower 52.0 69.00 90.50 100.13333 113.000 207.0
peak.rpm 4150.0 4800.00 5200.00 5130.00000 5500.000 6000.0
price 5348.0 7311.50 9417.00 13058.83333 16482.500 37028.0
highway.mpg 19.0 25.25 30.00 31.50000 37.000 46.0
## % latex table generated in R 4.1.2 by xtable 1.8-4 package
## % Thu Apr 14 21:42:39 2022
## \begin{table}[ht]
## \centering
## \begin{tabular}{rrrrrrr}
##   \hline
##  & Min. & 1st Qu. & Median & Mean & 3rd Qu. & Max. \\ 
##   \hline
## wheel.base & 89.50 & 94.35 & 96.85 & 99.37 & 102.62 & 115.60 \\ 
##   length & 150.00 & 165.55 & 171.85 & 174.31 & 185.00 & 202.60 \\ 
##   width & 61.80 & 63.85 & 65.30 & 65.86 & 67.12 & 71.70 \\ 
##   curb.weight & 1909.00 & 1994.75 & 2366.00 & 2524.17 & 2838.75 & 4066.00 \\ 
##   height & 61.80 & 63.85 & 65.30 & 65.86 & 67.12 & 71.70 \\ 
##   eng.size & 90.00 & 97.00 & 110.00 & 124.27 & 141.00 & 258.00 \\ 
##   horsepower & 52.00 & 69.00 & 90.50 & 100.13 & 113.00 & 207.00 \\ 
##   peak.rpm & 4150.00 & 4800.00 & 5200.00 & 5130.00 & 5500.00 & 6000.00 \\ 
##   price & 5348.00 & 7311.50 & 9417.00 & 13058.83 & 16482.50 & 37028.00 \\ 
##   highway.mpg & 19.00 & 25.25 & 30.00 & 31.50 & 37.00 & 46.00 \\ 
##    \hline
## \end{tabular}
## \end{table}

Análisis de componentes principales (ACP)

La matriz de datos centrada resulta ser la siguiente

wheel.base length width height curb.weight eng.size horsepower peak.rpm price city.mpg highway.mpg
alfaromeo -0.6979223 -0.2207608 -0.1489178 -0.7107064 0.5217954 0.7311889 1.3580788 -0.2664547 0.3974423 -1.1359184 -0.8273750
audi 0.9214867 1.3070368 2.2692882 0.9370673 0.5584637 0.3093492 0.2487570 0.7583711 0.5371929 -1.1359184 -0.9778068
bmw 0.2622583 0.1771772 -0.4358236 0.2380118 -0.2255390 -0.4288704 0.0218503 1.3732666 0.3893576 -0.5163266 -0.3760795
chevrolet -0.6979223 -1.1019092 -0.9276621 -0.9104366 -1.0741478 -0.9034402 -0.7597173 0.5534060 -0.7488593 1.8071430 1.7299659
dodge1 -0.8125707 -1.2084998 -0.8456890 -1.5096270 -0.6917500 -0.6925203 0.0470621 0.7583711 -0.5892433 -0.3614286 -0.2256477
dodge2 -0.8125707 -1.2084998 -0.8456890 -1.6094921 -0.9728735 -0.9034402 -0.8101410 0.7583711 -0.7888211 0.7228572 0.9778068
honda1 -0.8125707 -1.7272404 -0.7637159 -0.6108414 -0.9920807 -0.8507102 -0.6084462 1.7831970 -0.6848743 0.5679592 0.3760795
honda2 -0.4113012 0.0776927 -0.2718774 0.1381467 -0.3844349 -0.3761405 -0.3563276 1.3732666 -0.4866825 0.1032653 0.2256477
isuzu -0.7265844 -0.2562910 -1.6654198 -0.1614485 -0.3268133 -0.3497755 -0.5580225 -0.6763851 -0.7246051 -0.3614286 -0.3760795
jaguar 1.9533226 1.7973532 1.5315305 -0.5109763 2.6922084 3.5258774 1.9127397 -0.7788676 2.5976484 -1.7555103 -1.8803977
mazda -0.8985570 -0.5334264 -0.6817428 0.1381467 -1.0025573 -0.8770752 -0.8101410 -0.2664547 -0.6541523 0.7228572 0.9778068
mercedes 2.3259300 2.0105343 2.3922479 1.2366625 2.1753603 1.5485035 0.5765112 -1.5987283 2.1414377 -0.6712245 -0.9778068
mercury 0.4772241 0.2908737 0.8757458 0.4876744 0.6737069 0.4148091 1.8875278 -0.2664547 0.3977888 -1.1359184 -1.1282386
mitsubishi -0.8125707 -1.2084998 -0.5997697 -1.5096270 -1.0584328 -0.8507102 -0.8101410 0.7583711 -0.8858380 1.6522450 1.4291022
nissan1 -0.6979223 -0.2918212 -0.8456890 -0.1614485 -0.8733453 -0.7188853 -0.7849292 0.1434756 -0.6594651 0.7228572 0.8273750
nissan2 -0.6979223 -0.6400169 -0.8456890 0.3378768 -1.0008112 -0.7188853 -0.7849292 0.1434756 -0.6652399 0.7228572 0.8273750
plymouth -0.8125707 -1.2084998 -0.8456890 -1.6094921 -0.9728735 -0.9034402 -0.8101410 0.7583711 -0.7888211 0.7228572 0.9778068
peugot 2.1252952 1.7476110 1.0396920 2.4350433 1.5816834 0.7311889 -0.1294209 -2.0086586 0.0925319 -0.2065306 -0.9778068
porsche -1.4144750 -0.3841997 -0.3538505 -1.1101667 0.4816350 1.8385183 2.6943073 1.5782318 2.7683521 -1.4457144 -0.9778068
saab -0.0386938 0.8735686 0.2609477 1.1367974 0.2982935 -0.0861256 0.2487570 0.2459582 -0.1026570 -0.8261225 -0.5265114
subaru -0.3109839 -0.1639126 -0.1899043 -0.6607739 -0.5834913 -0.4288704 -0.4571750 -1.4962457 -0.6102637 0.2581633 0.2256477
toyota1 -0.5259497 -1.1090153 -0.9276621 0.3378768 -0.9414435 -0.8507102 -0.9614122 -0.6763851 -0.8905734 1.3424491 1.1282386
toyota2 -0.5259497 -0.5689566 -0.5997697 -0.4111112 -0.4350721 -0.3761405 -1.1126833 -1.2912806 -0.5960576 1.1875511 0.6769432
toyota3 -0.1390112 0.1345409 -0.1079312 -0.9104366 0.0468539 0.5729990 0.4000282 -0.6763851 -0.3545547 -0.3614286 -0.2256477
toyota4 0.4342309 0.0919047 0.2609477 0.5376070 -0.0771198 -0.3761405 -0.6840818 -1.2912806 -0.2726677 0.5679592 0.2256477
volkswagen1 -0.2966528 -0.1852307 -0.1489178 0.9370673 -0.4595176 -0.7188853 -1.2135308 -0.6763851 -0.6102637 1.6522450 2.1812613
volkswagen2 0.1476098 0.4187824 0.4248938 0.6374720 0.2389259 0.3093492 0.2487570 0.7583711 0.0272764 -1.1359184 -1.1282386
volvo1 0.7065209 1.0299014 0.5478534 1.1867299 0.6771991 0.4411741 0.3496044 0.5534060 -0.0137248 -0.5163266 -0.5265114
volvo2 1.3944115 1.0299014 1.2036381 0.8372022 0.9164160 0.4411741 1.5093499 0.3484408 0.6913806 -1.1359184 -0.9778068
volvo3 1.3944115 1.0299014 1.2446247 0.8372022 1.2097622 0.5466340 0.1479096 -0.6763851 1.0869557 -0.0516327 -0.6769432

Valores y vectores propios

Como se puedem observar los valores propios a continuación,los dos primeros son mayores que 1, presentando \(\lambda_1=7.202\) y \(\lambda_2=2.003\), lo cual será útil emplear dos componentes principales, donde se estará expresando un porcentaje de variabilidad del 84 %.

## [1] 2

Círculo de correlaciones

Mediante el círculo de correlaciones, como su nombre lo dice, es necesario para determinar las corrrelaciones entre las variables, tales como:

  • El consumo de conbustible en ciudad se correlaciona positivamente con el consumo de combustible en carretera.
  • El ancho y la longitud del vehiculo se correlacionan positivamente.
  • Precio en dólares y tamaño de la máquina se correlacionan positivamente. Y el precio se correlaciona negativamente con el consumo de combustible en carretera. Por otro lado, no existe correlación entre el precio del vehículo y el pico de revoluciones por minuto.
  • Caballo de fuerza presenta una correlación negativa con consumo de combustible en ciudad.
  • El caballo de fuerza del vehículo no presenta ninguna correlación con la altura del mismo.
## numeric(0)
## numeric(0)

Nube de individuos

En la nube de individuos se observan los 30 vehículos estudiados en el plano factorial de la primera y segunda componente, presentando similitudes entre una gran cantidad de estos; sin embargo, existen vehículos particularmente distintos en sus variables como lo son mercedes, porsche, jaguar. Para encontrar los perfiles de los vehículos se empleará la representación simultanea de las variables y los individuos más adelante del documento.

Representación simultanea

Mediante la representación simultanea se pueden observar asociaciones de perfiles entre vehículos de acuerdo a las similitudes de sus variables, como por ejemplo:

Toyota 1 y 2, presentan menores caballos de fuerza y mayor consumo de combustible en carretera al igual que volkswagen1 y chevrolet. Los vehículos más costosos en dólares, presentan los mayores valores en caballos de fuerza y menor consumo de combustible en carretera, como lo son mercury y como excentricos porshe, jaguar y mercedes. Los vehículos promedios en las variables de precio en dólares, consumo de combustible en carretera y caballos de fuerza que son las variables más relevantes a la hora de comprar un vehículo, son honda2, usuzu y toyota3.

Perfiles

  • Entre más alto es el precio, más caballo de fuerza y más tamaño de máquina tiene el vehículo, menos consumo en carretera y ciudad tendrá.
  • Entre más velocidad tiene el vehículo, menos altura tiene, menos ancho y menos longitud y menos distancia entre ejes.
  • Si se busca economía, debe esperar un consumo alto de combustible, tanto en ciudad como en carretera.

Índice

El índice de Performance se creó como, donde Performance se entiende como el rendimiento y/o desempeño de un vehículo

\[I_{Performance}=\frac{CP_1*65.47+CP_2*18.21}{84}*100\]

## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2

El Índice Performance presenta una mediana de 32 en el rendimiento, se calculó esta medidad de tendencia central puesto que no es simétrico.

median(Performance)
## [1] 32

La línea punteada roja expresa el valor que supondría un escenario en el que todas las variables presentaran un rendimiento igual. Es notorio de acuerdo a los análsis anteriores que los vehículos más costosos presentan un rendimiento mayor.

Conclusiones

  • Mediante el Análisis de Componentes Principales se pueden disminuir las dimensiones y la gran cantidad de variables medidas a un índice o a componentes que expliquen gran variabilidad de los datos.
  • Mediante el ACP se puede entender con mayor facilidad un problema o un estudio de interés, puesto que se emplean tecnicas descriptivas basadas en el algebra lineal.
  • De acuerdo a la base de datos de Vehicles, se puede rescatar que a la hora de comprar un vehículo, existen diversas variables que afectan a esa decisión, para este estudio tomé las más relevantes como el precio, caballos de fuerza y consumo de combustible, las cuales fueron útiles para crear el índice de Performance (Rendimiento del vehículo.)