Uno de los temas clásicos de la estadistica multivariada es el análisis de componentes principales (ACP), creado por Lebart y Marinoe.
El objeto del ACP es de observar que tan correlacionadas están las variables, disminuyendo un conjunto p-dimensiones a uno de 2D y mirar que dimensiones del modelo concentran la mayor variabilidad. Ademas PCA tiene como objetivo reducir el número de dimensiones(componente de la varianza)
En este biplot se puede observar la fuerte asociación o dependencia entre las variables acelaración Z y las corrientes y las potencias. así como una fuerte asociación entre la aceleración X y los voltages. Por otra parte se observa un grado de independecia entre las variables temeperaturas y voltages, corrientes y temperaturas y aceleración X y Y con respecto a las variables voltages y temeprartura.
Nota: si dos variables forman 90°, son independientes, y si forman 0 o 180° son dependientes. Tmanbien se puede hacer la interpretación con el coseno de los ángulos formados por las variables.
Cabe mencionar que el biplot muestra dos dimensiones que explican la variabilidad de nuestros datos, la dimensión 1 explica el 54.76 % de esa variabilidad, miestras que la dimensión 2 explica el 22.28 %, dando una variabilidad total de 77.04 %.
Lo importante de hacer este tipo de representaciones descriptivas es que nos permite capturar en dos dimensiones un problema que originalmente se plantean en muchas más. Sin embargo es importante tambien mencionar que hacer esto hace que se pierda información.
Otra cosa importante son los valores propios, si nos fijamos bien los dos primeros ejes capturan 77.04 % de la varianza.
En el contexto del Análisis de Componentes Principales (PCA), cos2 (coseno cuadrado) es una medida que indica la calidad de la representación de cada individuo (punto) en el espacio de las componentes principales. Específicamente, cos2 mide la proporción de la variación de un individuo que es capturada por las componentes principales.
Un valor alto de cos2 (cercano a 1) indica que el individuo está bien representado por esa componente principal.
Un valor bajo de cos2 (cercano a 0) indica que el individuo no está bien representado por esa componente principal y que su variación es explicada en gran medida por otras componentes.
Observamos el número de cluster a utilizar con la función “fviz_nbclust”
Se puede visualizar que el número optimo de clúster a utilizar se encuentra entre 3 y 4, para este estudio se tomarán 4.
Este modelo es una alternativa del modelo de agrupamiento por división de la subsección anterior. Este no es necesario especificar como tal el número de clúster , si no al final se elige un corte que genera una cantidad de ellos. Basicamente el clúter jerárquico maneja una semejanza a las raices de y las hojas de un árbol.
X = número de elementos que identifican los experimentos realizados, la altura de las ramas representa la similitud que existe entre los individuos o entre los clúster. Podemos observar que un buen corte sería donde se forman 4 clúster de acuerdo al gráfico de agrupamiento o dendograma.
Acontinuación se muestran los valores
En las tablas se puede observar las dimensiones y a su vez la contribución de cada uno respecto a sus componentes, algo importante que mencionar es que la dimensión 3 es muy probable que este asociada a temas de vibración dentro del estudio de salud de los componentes críticos en el motor eléctrico, por su pare las dimensiones 1 y 2, están como asociadas a fallas electricas, dada su fuerte representación en las corrientes, potencias y voltages. ademas el impacto que hace la temperarura en cuanto al rendimiento del motor es el mismo en cada una de las dimensiones.
por otra parte y con lo cual podemos caracterizar las dimensiones es la siguiente:
#Interpretación de resultados de cada una de las dimensiones
Dimensión 1: Esta puede estar asociada a temas de intensidad de Operación Eléctrica, y se relaciona o la podemos caracterizar como fallas electricas. Si obervamos bien en esta dimensión dominada por las corrientes y las potencias en las distintas fases del motor (CURRENT_A_CALC, CURRENT_B_CALC, CURRENT_C_CALC, CURRENT_D_CALC, POWER_A, POWER_B, etc.). Esta dimensión captura la variabilidad relacionada con:
Carga Eléctrica o intensidad eléctrica: Los valores altos en esta dimensión indican una mayor intensidad de operación eléctrica. Esto significa que el motor está utilizando más corriente y generando más potencia, lo cual es típico cuando el motor está operando a una alta carga. A suvez esto puede producir un aislamiento entre bobinas, generando cortocircuito dentro del motor eléctrico. Lo cual incrementar la corriente y posteriormente la estabilidad o vida útil del motor.
Dimensión 2: Estabilidad y Equilibrio del Suministro Eléctrico
La Dimensión 2 también tiene una fuerte carga de las corrientes y potencias, pero con pesos distribuidos de manera diferente. Esto sugiere que esta dimensión captura aspectos relacionados con:
Distribución de Carga: Esta dimensión se refleja cómo se distribuye la carga eléctrica entre las diferentes fases del motor. Un buen equilibrio es crucial para evitar problemas como el sobrecalentamiento o el desgaste de componentes.
Estabilidad del Suministro: Una distribución uniforme de la carga eléctrica asegura que el motor funcione de manera estable, evitando fluctuaciones que podrían llevar a fallas o ineficiencias. Es esencial para el mantenimiento preventivo y la optimización del rendimiento del motor.
Dimensión 3: Problemas Mecánicos y Vibraciones
La Dimensión 3 está dominada por las variables de aceleración (ACCELERATION_X, ACCELERATION_Y, ACCELERATION_Z). Esto indica que:
Vibraciones: Las altas cargas de aceleración sugieren que esta dimensión captura la variabilidad relacionada con las vibraciones del motor. Las vibraciones pueden ser causadas por desalineaciones, desequilibrios, desgaste de componentes o problemas estructurales.
#CLÚSTER CON CORRIENTES
#CLÚSTER CON TEMPERATURA
#CLÚSTER CON POTENCIAS
#CLÚSTER CON VOLTAGES