El análisis de datos multivariado tiene por objetivo el estudio estadístico de varias variables medidas en elementos de una población. Para el contenido de este documento se hace referencia a mayormente a conceptos incluidos en Peña (2013). Al finalizar la lectura se tendrá un panorama general de lo que es el análisis multivariado. Además este artículo corresponde a la primera parte de una serie dedicada al análisis de datos multivariado.
Los objetivos que persigue el análisis de datos multivariados son:
Resumir el conjunto de variables en unas pocas nuevas variables, construidas como trasformaciones de las originales, con la mínima pérdida de información.
Encontrar grupos en los datos si existen.
Clasificar nuevas observaciones en grupos definidos.
Relacionar dos conjuntos de variables.
Algunas de las aplicaciones del análisis multivariado según son:
Administración de Empresas: Construir tipologías de clientes.
Agricultura: ClasiÞcar terrenos de cultivo por fotos aéreas.
Arqueología: ClasiÞcar restos arqueológicos.
Biometría: Identicar los factores que determinan la forma de un organismo vivo.
Ciencias de la Computación: Diseñar algoritmos de clasiÞcación automática.
Ciencias de la Educación: Investigar la efectividad del aprendizaje a distancia.
Ciencias del medio ambiente: Investigar las dimensiones de la contaminación ambiental.
Documentación: ClasiÞcar revistas por sus artículos y construir indicadores bibliométricos.
Economía: IdentiÞcar las dimensiones del desarrollo económico.
Geología: ClasiÞcar sedimentos.
Historia: Determinar la importancia relativa de los factores que caracterizan los periodos prerevolucionarios.
Ingeniería: Transmitir óptimamente señales por canales digitales.
Lingüística: Encontrar patrones de asociación de palabras.
Medicina: IdentiÞcar tumores mediante imágenes digitales.
Psicología: Determinar los factores que componen la inteligencia humana.
Sociología y Ciencia Política: Consstruir tipologías de los votantes de un partido.
El análisis multivariado es la parte de la estadística y del análisis de datos que estudia, analiza, representa e interpreta los datos que resultan de observar más de una variable estadística sobre muestras de individuos. Las variables observables son homogéneas y correlacionadas sin que alguna predomine sobre las demás. La información estadística en el análisis multivariado es de carácter multidimencional, por lo tanto la geometría, el cálculo matricial (la información multivariante esuna matriz de datos) y las distribuciones multivariantes juegan un papel fundamental.
El próximo paso es conocer sobre los fundamentos matemáticos necesarios para en análisis de datos multivarados ( Álgebra Matricial).
Peña, D. (2013). Análisis de datos multivariantes. McGraw-Hill España.