Matrices

Una matriz de tamaño (\(n\times p\)) es un arreglo rectangular de números (Los números pueden ser reales o complejos) dispuestos en \(n\)-filas y en \(p\)-columnas; se escribe de la siguiente manera forma \[ {\boldsymbol{A}}=\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1p}\\ a_{21} & a_{22} & \cdots & a_{2p}\\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{np}\\ \end{bmatrix} \]

Es usual la notación de una matriz \({\boldsymbol{A}}\) en términos de sus elementos genéricos \(a_{ij}\); es decir, \({\boldsymbol{A}}=(a_{ij})\), \(i=1,\ldots,n\) y \(j=1,\ldots,p\).

Las filas suelen representar los individuos, mientras las columnas representan las variables.

Sean \({\boldsymbol{A}}\) y \({\boldsymbol{B}}\) matrices de tamaño \(n\times p\) las cuales son conformables para la suma (o resta) solo sí las matrices tienen el mismo tamaño. Se define la suma (o resta) entre \({\boldsymbol{A}}\) y \({\boldsymbol{B}}\) por \[ {\boldsymbol{A}}\pm{\boldsymbol{B}}=(a_{ij})\pm(b_{ij})=(a_{ij}\pm b_{ij}) \]

Algunas propiedades entre matrices satisfacen las siguientes propiedades respecto a la suma:

Conmutativa: \({\boldsymbol{A}}+{\boldsymbol{B}}={\boldsymbol{B}}+{\boldsymbol{A}}\), para todo par de matrices \({\boldsymbol{A}}\) y \({\boldsymbol{B}}\) conformables para la suma.
Asociativa: \(({\boldsymbol{A}}+{\boldsymbol{B}})+{\boldsymbol{C}}={\boldsymbol{A}}+({\boldsymbol{B}}+{\boldsymbol{C}})\), para todo par de matrices \({\boldsymbol{A}}\) y \({\boldsymbol{B}}\) y \({\boldsymbol{C}}\) conformables para la suma.
Identidad: existe la matriz nula \({\boldsymbol{0}}\), tal que \({\boldsymbol{A}}+{\boldsymbol{0}}={\boldsymbol{0}}+{\boldsymbol{A}}\), para toda matriz \({\boldsymbol{A}}\).
Opuesta: para toda matriz \({\boldsymbol{A}}\) existe la matriz opuesta aditiva, notada por \(-{\boldsymbol{A}}\) tal que \({\boldsymbol{A}}+(-{\boldsymbol{A}})=(-{\boldsymbol{A}})+{\boldsymbol{A}}={\boldsymbol{0}}\).

Multiplicación por un escalar

La multiplicación de una matriz \({\boldsymbol{A}}\) por un escalar \(\lambda\) es igual a la matriz que resputa de multiplicar cada elemento de \({\boldsymbol{A}}\) por \(\lambda\). En general, se tiene que: \[ \lambda{\boldsymbol{A}}=(\lambda a_{ij})={\boldsymbol{A}}= \begin{bmatrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1p}\\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2p}\\ \vdots & \vdots & \ddots & \vdots \\ \lambda a_{n1} & \lambda a_{n2} & \cdots & \lambda a_{np}\\ \end{bmatrix} \]

Algunas propiedades básicas de la multiplicación de un escalar por una matriz son las siguientes:

\(\lambda{\boldsymbol{A}}\) es una matriz \(n\times p\).
\((\lambda_1 + \lambda_2){\boldsymbol{A}}=\lambda_1{\boldsymbol{A}} + \lambda_2{\boldsymbol{A}}\).
\(\lambda({\boldsymbol{A}}+{\boldsymbol{B}})=\lambda{\boldsymbol{A}}+\lambda{\boldsymbol{B}}\).
\(\lambda_1(\lambda_2{\boldsymbol{A}})=(\lambda_1\lambda_2){\boldsymbol{A}}\).
\(1{\boldsymbol{A}}={\boldsymbol{A}}\).

Producto

Si la matriz \({\boldsymbol{A}}_{n\times k}\) y la matriz \({\boldsymbol{B}}_{k\times p}\), se dicen que son conformables respecto al producto entre matrices y su operación es la siguiente: \[ \begin{align*} {\boldsymbol{A}}{\boldsymbol{B}} & = \begin{bmatrix} & & \vdots & \\ a_{i1} & a_{i2} & \cdots & a_{ik}\\ & & \vdots & \\ \end{bmatrix}_{n\times k} \begin{bmatrix} & b_{1j} & \\ & b_{2j} & \\ \cdots & \vdots & \cdots \\ & b_{kj} & \\ \end{bmatrix}_{k\times p}\\ &= \begin{bmatrix} & \vdots & \\ \cdots & a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{ik}b_{kj} & \cdots \\ & \vdots & \\ \end{bmatrix}_{n\times p} \end{align*} \] Algunas propiedades del producto entre matrices son las siguientes:

Asociativa: \(({\boldsymbol{A}}{\boldsymbol{B}}){\boldsymbol{C}}={\boldsymbol{A}}({\boldsymbol{B}}{\boldsymbol{C}})\).
Distributiva a derecha: \({\boldsymbol{A}}({\boldsymbol{B}}+{\boldsymbol{C}})={\boldsymbol{A}}{\boldsymbol{B}}+{\boldsymbol{A}}{\boldsymbol{C}}\).
Distributiva a izquierda: \(({\boldsymbol{A}} + {\boldsymbol{B}}){\boldsymbol{C}}={\boldsymbol{A}}{\boldsymbol{C}}+{\boldsymbol{B}}{\boldsymbol{C}}\).
Identidad: \({\boldsymbol{I}}{\boldsymbol{A}}={\boldsymbol{A}}{\boldsymbol{I}}={\boldsymbol{A}}\).

La transposición de una matriz tiene, entre otras, las siguientes propiedades

\(({\boldsymbol{A}}')'={\boldsymbol{A}}\).
\((\lambda_1 {\boldsymbol{A}}+\lambda_2 {\boldsymbol{B}})'=\lambda_1{\boldsymbol{A}}'+\lambda_2{\boldsymbol{B}}'\).
\(({\boldsymbol{A}}{\boldsymbol{B}})'={\boldsymbol{B}}'{\boldsymbol{A}}'\).

Ejercicio

Sean las matrices

\(A= \begin{bmatrix} 2 & -3 & 1 & 0 \\ 1 & 5 & 4 & 5 \\ 3 & 0 & -1 & 6 \end{bmatrix}\) y

\(B= \begin{bmatrix} 4 & 7 & -1 & 2 \\ 0 & 6 & 3 & 1 \\ -2 & 1 & 1 & 4 \end{bmatrix}\)

Realice las siguientes operaciones en R. \({\boldsymbol{A}}'{\boldsymbol{B}}\), \({\boldsymbol{A}}{\boldsymbol{B}}'\), \({\boldsymbol{A}}+{\boldsymbol{B}}\), \({\boldsymbol{A}}{\boldsymbol{A}}'\)

Traza

La traza de una matriz cuadrada \({\boldsymbol{A}}_{p\times p}\) es la suma de los elementos de su diagonal principal. \[ \text{tr}({\boldsymbol{A}})=a_{11}+a_{22}+\cdots+a_{pp}=\sum_{i=1}^pa_{ii}. \]

Algunas propiedades de la traza son las siguientes:

\(\text{tr}({\boldsymbol{A}}')=\text{tr}({\boldsymbol{A}})\).
\(\text{tr}(\lambda{\boldsymbol{A}})=\lambda\text{tr}({\boldsymbol{A}})\).
\(\text{tr}({\boldsymbol{A}}+{\boldsymbol{B}})=\text{tr}({\boldsymbol{A}})+\text{tr}({\boldsymbol{B}})\).

Determinante

Dada una matriz cuadrada \({\boldsymbol{A}}_{p\times p}\), el determinante de \({\boldsymbol{A}}\), es el siguiente \[ |{\boldsymbol{A}}|=\sum(-1)^{f(j_1,j_2,\cdots,j_p)}\prod_{i=1}^p a_{ij}, \] La suma es sobre todas las permutaciones \((j_1,\cdots,j_p)\) de los enteros de 1 a \(p\) y \(f(j_1,j_2,\cdots,j_p)\) es el número de transposiciones requeridas para ir de \((1,\cdots,p)\) a \((j_1,\cdots,j_p)\).

\(\text{det}({\boldsymbol{A}}_{2\times 2})=a_{11}a_{22}-a_{12}a_{21}\).
\(\text{det}({\boldsymbol{A}}_{3\times 3})=a_{11}a_{22}a_{33}-a_{11}a_{23}a_{32}-a_{12}a_{21}a_{33} + a_{12}a_{23}a_{31} + a_{13}a_{21}a_{32} - a_{13}a_{22}a_{31}\).

Algunas propiedades del determinante son los siguientes:

\(|{\boldsymbol{A}}{\boldsymbol{B}}|=|{\boldsymbol{A}}| |{\boldsymbol{B}}|\).
\(|\lambda {\boldsymbol{A}}|=\lambda^p|{\boldsymbol{A}}|\).
\(|{\boldsymbol{A}}'|=|{\boldsymbol{A}}|\).
Si los elementos de una fila (o columna) de una matriz \({\boldsymbol{A}}\) son todos cero, entonces \(|{\boldsymbol{A}}|=0\).
Si una fila (o columna) de una matriz \({\boldsymbol{A}}\)es múltiplo de otra, entonces \(|{\boldsymbol{A}}|=0\).

Inversa

Dada una matriz cuadrada \({\boldsymbol{A}}_{p\times p}\neq {\boldsymbol{0}}\), entonces su inversa notada \({\boldsymbol{A}}^{-1}\), es tal que \({\boldsymbol{A}}{\boldsymbol{A}}^{-1}={\boldsymbol{I}}\), con \({\boldsymbol{I}}\) la matriz idéntica.

Algunas propiedades de la inversa son los siguientes:

Si existe la inversa de una matriz \({\boldsymbol{A}}\), está es única.
Para que una matriz \({\boldsymbol{A}}\) tenga inversa, es una condición necesaria y suficiente que su determinante sea diferente de cero. Una matriz invertible se denomina no singular.
Para cualquier escalar \(\lambda\neq 0\), \((\lambda{\boldsymbol{A}})^{-1}=\lambda^{-1}{\boldsymbol{A}}^{-1}\).
\(({\boldsymbol{A}}{\boldsymbol{B}})^{-1}={\boldsymbol{B}}^{-1}{\boldsymbol{A}}^{-1}\).
\(({\boldsymbol{A}}^{-1})^{-1}={\boldsymbol{A}}\).
\({\boldsymbol{A}}^{-n}=({\boldsymbol{A}}^{-1})^n\), para \(n\geq 0\).
\({\boldsymbol{A}}^{-1/2}=({\boldsymbol{A}}^{-1})^{1/2}\).

Rango

El rango de una matriz \({\boldsymbol{A}}_{n\times p}\) es el número máximo de filas (o columnas) linealmente independientes. Si el rango de \({\boldsymbol{A}}\) es \(r\) se nota \(\text{r}({\boldsymbol{A}})\).

Algunas propiedades del rango son los siguientes:

El rango fila de una matriz \({\boldsymbol{A}}\) es igual a su rango columna.
\(0\leq \text{r}({\boldsymbol{A}})\leq \min\{n,p\}\).
\(\text{r}({\boldsymbol{A}}{\boldsymbol{B}})\leq \min\{\text{r}({\boldsymbol{A}}),\text{r}({\boldsymbol{B}})\}\).
\(\text{r}({\boldsymbol{A}}')=\text{r}({\boldsymbol{A}})=\text{r}({\boldsymbol{A}}{\boldsymbol{A}}')=\text{r}({\boldsymbol{A}}'{\boldsymbol{A}})\).
\(\text{r}({\boldsymbol{A}}+{\boldsymbol{B}})\leq \text{r}({\boldsymbol{A}})+\text{r}({\boldsymbol{B}})\).
Si \({\boldsymbol{A}}\) es idempotente (Una matriz \({\boldsymbol{A}}\) es idempotente si \({\boldsymbol{A}}^2={\boldsymbol{A}}\)) \(\text{r}({\boldsymbol{A}})=\text{tr}({\boldsymbol{A}})\).
Si \({\boldsymbol{A}}\) es idempotente \(|{\boldsymbol{A}}|=0\) o \(|{\boldsymbol{A}}|=1\).

Matrices ortogonales

La matriz \({\boldsymbol{A}}\) es ortogonal si y sólo si \({\boldsymbol{A}}{\boldsymbol{A}}'={\boldsymbol{I}}\); es decir, si \({\boldsymbol{A}}'={\boldsymbol{A}}^{-1}\).

Las matrices ortogonales tienen, entre otras, las siguientes propiedades:

\(\text{det}({\boldsymbol{A}})=\pm 1\).
El producto de número finito de matrices ortogonales es ortogonal.
La inversa y en consecuencia la transpuesta de una matriz ortogonal es ortogonal.
Dada la matriz \({\boldsymbol{A}}\) y la matriz \({\boldsymbol{P}}\), entonces \(\text{det}({\boldsymbol{A}})=\text{det}({\boldsymbol{P}}'{\boldsymbol{A}}{\boldsymbol{P}})\).

Transformaciones lineales

Sea \({\boldsymbol{A}}_{n\times p}\) y sea \({\boldsymbol{X}}_{1\times p}\), la ecuación \[ {\boldsymbol{Y}}={\boldsymbol{A}}{\boldsymbol{X}} \] define una transformación lineal de \(\mathbb{R}^p\) en \(\mathbb{R}^n\); es decir, el vector \({\boldsymbol{X}}\) se transforma mediante la matriz \({\boldsymbol{A}}\) en el vector \({\boldsymbol{Y}}\).

Ejemplo

La transformación \({\boldsymbol{Y}}:\mathbb{R}^2\longleftarrow\mathbb{R}^2\), definida por \({\boldsymbol{Y}}={\boldsymbol{A}}{\boldsymbol{X}}\) donde la matriz \({\boldsymbol{A}}\) está dada por \[ {\boldsymbol{A}}=\begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \\ \end{bmatrix} \]

es una transformación lineal. La transformación \({\boldsymbol{Y}}\) sobre un vector \({\boldsymbol{X}}\) corresponde a la rotación de \({\boldsymbol{X}}=(x_1,x_2)\) un ángulo \(\theta\).

Vectores propios

Dada la transformación definida por la matriz cuadrada \({\boldsymbol{A}}_{p\times p}\), encontrar los vectores no nulos \({\boldsymbol{X}}\) de \(\mathbb{R}^p\), tal que \[ {\boldsymbol{A}}{\boldsymbol{X}}=\lambda{\boldsymbol{X}},\quad\text{ para }\lambda\neq 0. \]

Se denominan vectores propios o vector característico. Al escalar \(\lambda\) se le denomina valor propio o valor característico.

En un lenguaje geométrico-estadístico, se trata de buscar aquellos vectores, que al ser transformados por \({\boldsymbol{A}}\) no cambian su sentido (permanecen en la misma recta); esto es importante en estadística, pues conserva la información más importante contenida en los datos.

Encontrar este vector significa hallar la dirección en la que se encuentra una biena parte de la información contenida en los datos.

Resolver la ecuación es equivalente a encontrar la solución de \[ ({\boldsymbol{A}}-\lambda{\boldsymbol{I}}){\boldsymbol{X}}={\boldsymbol{0}} \] respecto a \(\lambda\), con \({\boldsymbol{X}}\neq 0\). El sistema anterior tiene soluciones diferentes a la solución nula, si y sólo si, el determinante de la matriz \(({\boldsymbol{A}}-\lambda{\boldsymbol{I}})\) es igual a cero; es decir, \[ |{\boldsymbol{A}}-\lambda{\boldsymbol{I}}|=0 \]

La ecuación anterior se le denomina ecuación característica y sus soluciones son los valores propios de la matriz \({\boldsymbol{A}}\). Un vector \({\boldsymbol{X}}\) asociado al valor propio de \(\lambda\) es llamado el vector propio.

A continuación se describen algunas propiedades sobre los valores propios, de uso más frecuente en estadística multivariada.

Una matriz \({\boldsymbol{A}}\) tiene al menos un valor propio igual a cero si y solo si \({\boldsymbol{A}}\) es singular, esto equivale que \(|{\boldsymbol{A}}|=0\).
Si \({\boldsymbol{A}}\) es una matriz simétrica con valores en los números reales, los vectores propios correspondientes a valores propios diferentes son ortogonales.
Cualquier matriz simétrica \({\boldsymbol{A}}\) puede ser escrita como \[ {\boldsymbol{A}}={\boldsymbol{P}}{\boldsymbol{\Lambda}}{\boldsymbol{P}}', \] donde \({\boldsymbol{\Lambda}}\) es una matriz diagonal formada por los valores propios de \({\boldsymbol{A}}\) y \({\boldsymbol{P}}\) es una matriz ortogonal cuyas columnas son los vectores propios unitarios asociados con los elementos de la diagonal \({\boldsymbol{\Lambda}}\). Esta propiedad se conoce con el nombre de teorema de la descomposición espectral.
Si \({\boldsymbol{A}}\) es una matriz simétrica, entonces \(\text{r}({\boldsymbol{A}})\) es igual al número de sus valores propios.
Si \(\lambda_1,\lambda_2,\ldots,\lambda_p\) son los valores propios de la matriz \({\boldsymbol{A}}\), entonces \[ \begin{align*} \text{tr}({\boldsymbol{A}})&= \lambda_1+\lambda_2+\cdots+\lambda_p\\ |{\boldsymbol{A}}|&=\lambda_1\cdot\lambda_2\cdot\cdots\cdot\lambda_p \end{align*} \]
Si \(\lambda\) es un valor propio de la matriz \({\boldsymbol{A}}\), entonces \(\lambda^k\) es una valor propio de la matriz \({\boldsymbol{A}}^k\). Los valores propios del polinomio matricial \(a_0{\boldsymbol{I}}+a_i{\boldsymbol{A}}+a_2{\boldsymbol{A}}^2+\cdots+a_k{\boldsymbol{A}}^k\) corresponden al polinomio de la forma \(a_0+a_1\lambda+a_2\lambda^2+\cdots+a_k\lambda^k\).
Dada la matriz \({\boldsymbol{A}}_{n\times p}\) de rango \(r\), entonces \({\boldsymbol{A}}\) puede escribirse de la forma, \[ {\boldsymbol{A}}={\boldsymbol{U}}{\boldsymbol{\Delta}}{\boldsymbol{V}}', \] donde \({\boldsymbol{\Delta}}=\text{Diag}(\delta_1,\ldots,\delta_r)\), con \(\delta_1\geq\delta_2\geq\cdots\geq\delta_r\geq 0\), \({\boldsymbol{U}}\) una matriz ortogonales del tamaño (\(n\times r\)), \({\boldsymbol{V}}\) una matriz ortonormal de tamaño (\(p\times r\)); es decir, \({\boldsymbol{U}}'{\boldsymbol{U}}={\boldsymbol{V}}'{\boldsymbol{V}}={\boldsymbol{I}}_r\).
Las matrices \({\boldsymbol{A}}\) y \({\boldsymbol{A}}'\) tienen el mismo conjunto de valores propios pero un vector propio de \({\boldsymbol{A}}\) no necesariamente es un vector propio de \({\boldsymbol{A}}'\).
Si \({\boldsymbol{A}}\) es idempotente entonces sus valores propios son cero o uno.

Ejemplo

Dada la matriz \[ {\boldsymbol{A}}= \begin{bmatrix} 3 & -2 & 0 \\ -2 & 3 & 0 \\ 0 & 0 & 5 \end{bmatrix} \] Calcular, el determinante, su inversa, la traza, los valores y vectores propios, diagonalizar, si es posible la matriz \({\boldsymbol{A}}\).

Formas cuadráticas

Sea \({\boldsymbol{A}}_{p\times p}\) una matriz simétrica y un vector \({\boldsymbol{X}}_{p\times 1}\), la función \[ Q({\boldsymbol{X}})={\boldsymbol{X}}'{\boldsymbol{A}}{\boldsymbol{X}}, \] se llama forma cuadrática de \({\boldsymbol{X}}\). \(Q({\boldsymbol{X}})\) es un escalar y puede ser expresado alternativamente por la ecuación \[ Q({\boldsymbol{X}})=\sum_{i=1}^p\sum_{i=1}^p a_{ij}x_ix_j \] con \(a_{ij}\) elemeto de la matriz \({\boldsymbol{A}}\), \(x_i\) y \(x_j\) elementos del vector \({\boldsymbol{X}}\).

Note que

\({\boldsymbol{X}}'{\boldsymbol{A}}{\boldsymbol{X}}=\text{tr}({\boldsymbol{X}}'{\boldsymbol{A}}{\boldsymbol{X}})=\text{tr}({\boldsymbol{A}}{\boldsymbol{X}}'{\boldsymbol{X}})\)
Si \({\boldsymbol{A}}\) es una matriz cuales quiera entonces \({\boldsymbol{X}}'{\boldsymbol{A}}{\boldsymbol{X}}={\boldsymbol{X}}'\left(\frac{{\boldsymbol{A}}{\boldsymbol{A}}'}{2}\right)\).

Si \(Q({\boldsymbol{X}})>0\) para \({\boldsymbol{X}}\ne 0\), se dice que \({\boldsymbol{A}}\) es definida positiva. Si \(Q({\boldsymbol{X}})\geq 0\) para todo \(bs{X}\ne 0\), \({\boldsymbol{A}}\) se llama semidefinida positiva. Si \({\boldsymbol{A}}\) es definida positiva se nota \({\boldsymbol{A}}>0\) y si \({\boldsymbol{A}}\) es semidefinida positiva, se nota \({\boldsymbol{A}}\geq 0\).

Se resaltan las siguientes propiedades para las formas cuadráticas.

Si \({\boldsymbol{A}}>0\), entonces todos los valores propios \(\lambda_1,\lambda_2,\ldots,\lambda_p\) son positivos. Si \({\boldsymbol{A}}\leq 0\), entonces \(\lambda_i\leq 0\) para \(i=1,2,\ldots,p\) y \(\lambda_i=0\) para algún \(i\).
Si \({\boldsymbol{A}}>0\), entonces \({\boldsymbol{A}}\) es no singular y en consecuencia \(|{\boldsymbol{A}}|>0\).
Si \({\boldsymbol{A}}>0\), entonces \({\boldsymbol{A}}^{-1}>0\).
Si \({\boldsymbol{A}}>0\) y \({\boldsymbol{C}}\) es una matriz no singular \((p\times p)\), entonces \({\boldsymbol{C}}'{\boldsymbol{A}}{\boldsymbol{C}}>0.\)

Nociones básicas de Algebra Lineal

Matrices

Multiplicación por un escalar

Producto

Ejercicio

Traza

Determinante

Inversa

Rango

Matrices ortogonales

Transformaciones lineales

Ejemplo

Vectores propios

Ejemplo

Formas cuadráticas