Nociones básicas de Algebra Lineal

Alex Zambrano

9 de agosto de 2017

Matrices

Una matriz de tamaño (\(n\times p\)) es un arreglo rectangular de números (Los números pueden ser reales o complejos) dispuestos en \(n\)-filas y en \(p\)-columnas; se escribe de la siguiente manera forma \[ {\boldsymbol{A}}=\begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1p}\\ a_{21} & a_{22} & \cdots & a_{2p}\\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{np}\\ \end{bmatrix} \]

Es usual la notación de una matriz \({\boldsymbol{A}}\) en términos de sus elementos genéricos \(a_{ij}\); es decir, \({\boldsymbol{A}}=(a_{ij})\), \(i=1,\ldots,n\) y \(j=1,\ldots,p\).

Las filas suelen representar los individuos, mientras las columnas representan las variables.

Sean \({\boldsymbol{A}}\) y \({\boldsymbol{B}}\) matrices de tamaño \(n\times p\) las cuales son conformables para la suma (o resta) solo sí las matrices tienen el mismo tamaño. Se define la suma (o resta) entre \({\boldsymbol{A}}\) y \({\boldsymbol{B}}\) por \[ {\boldsymbol{A}}\pm{\boldsymbol{B}}=(a_{ij})\pm(b_{ij})=(a_{ij}\pm b_{ij}) \]

Algunas propiedades entre matrices satisfacen las siguientes propiedades respecto a la suma:

Multiplicación por un escalar

La multiplicación de una matriz \({\boldsymbol{A}}\) por un escalar \(\lambda\) es igual a la matriz que resputa de multiplicar cada elemento de \({\boldsymbol{A}}\) por \(\lambda\). En general, se tiene que: \[ \lambda{\boldsymbol{A}}=(\lambda a_{ij})={\boldsymbol{A}}= \begin{bmatrix} \lambda a_{11} & \lambda a_{12} & \cdots & \lambda a_{1p}\\ \lambda a_{21} & \lambda a_{22} & \cdots & \lambda a_{2p}\\ \vdots & \vdots & \ddots & \vdots \\ \lambda a_{n1} & \lambda a_{n2} & \cdots & \lambda a_{np}\\ \end{bmatrix} \]

Algunas propiedades básicas de la multiplicación de un escalar por una matriz son las siguientes:

Producto

Si la matriz \({\boldsymbol{A}}_{n\times k}\) y la matriz \({\boldsymbol{B}}_{k\times p}\), se dicen que son conformables respecto al producto entre matrices y su operación es la siguiente: \[ \begin{align*} {\boldsymbol{A}}{\boldsymbol{B}} & = \begin{bmatrix} & & \vdots & \\ a_{i1} & a_{i2} & \cdots & a_{ik}\\ & & \vdots & \\ \end{bmatrix}_{n\times k} \begin{bmatrix} & b_{1j} & \\ & b_{2j} & \\ \cdots & \vdots & \cdots \\ & b_{kj} & \\ \end{bmatrix}_{k\times p}\\ &= \begin{bmatrix} & \vdots & \\ \cdots & a_{i1}b_{1j} + a_{i2}b_{2j} + \cdots + a_{ik}b_{kj} & \cdots \\ & \vdots & \\ \end{bmatrix}_{n\times p} \end{align*} \] Algunas propiedades del producto entre matrices son las siguientes:

La transposición de una matriz tiene, entre otras, las siguientes propiedades

Ejercicio

Sean las matrices

\(A= \begin{bmatrix} 2 & -3 & 1 & 0 \\ 1 & 5 & 4 & 5 \\ 3 & 0 & -1 & 6 \end{bmatrix}\) y

\(B= \begin{bmatrix} 4 & 7 & -1 & 2 \\ 0 & 6 & 3 & 1 \\ -2 & 1 & 1 & 4 \end{bmatrix}\)

Realice las siguientes operaciones en R. \({\boldsymbol{A}}'{\boldsymbol{B}}\), \({\boldsymbol{A}}{\boldsymbol{B}}'\), \({\boldsymbol{A}}+{\boldsymbol{B}}\), \({\boldsymbol{A}}{\boldsymbol{A}}'\)

Traza

La traza de una matriz cuadrada \({\boldsymbol{A}}_{p\times p}\) es la suma de los elementos de su diagonal principal. \[ \text{tr}({\boldsymbol{A}})=a_{11}+a_{22}+\cdots+a_{pp}=\sum_{i=1}^pa_{ii}. \]

Algunas propiedades de la traza son las siguientes:

Determinante

Dada una matriz cuadrada \({\boldsymbol{A}}_{p\times p}\), el determinante de \({\boldsymbol{A}}\), es el siguiente \[ |{\boldsymbol{A}}|=\sum(-1)^{f(j_1,j_2,\cdots,j_p)}\prod_{i=1}^p a_{ij}, \] La suma es sobre todas las permutaciones \((j_1,\cdots,j_p)\) de los enteros de 1 a \(p\) y \(f(j_1,j_2,\cdots,j_p)\) es el número de transposiciones requeridas para ir de \((1,\cdots,p)\) a \((j_1,\cdots,j_p)\).

Algunas propiedades del determinante son los siguientes:

Inversa

Dada una matriz cuadrada \({\boldsymbol{A}}_{p\times p}\neq {\boldsymbol{0}}\), entonces su inversa notada \({\boldsymbol{A}}^{-1}\), es tal que \({\boldsymbol{A}}{\boldsymbol{A}}^{-1}={\boldsymbol{I}}\), con \({\boldsymbol{I}}\) la matriz idéntica.

Algunas propiedades de la inversa son los siguientes:

Rango

El rango de una matriz \({\boldsymbol{A}}_{n\times p}\) es el número máximo de filas (o columnas) linealmente independientes. Si el rango de \({\boldsymbol{A}}\) es \(r\) se nota \(\text{r}({\boldsymbol{A}})\).

Algunas propiedades del rango son los siguientes:

Matrices ortogonales

La matriz \({\boldsymbol{A}}\) es ortogonal si y sólo si \({\boldsymbol{A}}{\boldsymbol{A}}'={\boldsymbol{I}}\); es decir, si \({\boldsymbol{A}}'={\boldsymbol{A}}^{-1}\).

Las matrices ortogonales tienen, entre otras, las siguientes propiedades:

Transformaciones lineales

Sea \({\boldsymbol{A}}_{n\times p}\) y sea \({\boldsymbol{X}}_{1\times p}\), la ecuación \[ {\boldsymbol{Y}}={\boldsymbol{A}}{\boldsymbol{X}} \] define una transformación lineal de \(\mathbb{R}^p\) en \(\mathbb{R}^n\); es decir, el vector \({\boldsymbol{X}}\) se transforma mediante la matriz \({\boldsymbol{A}}\) en el vector \({\boldsymbol{Y}}\).

Ejemplo

La transformación \({\boldsymbol{Y}}:\mathbb{R}^2\longleftarrow\mathbb{R}^2\), definida por \({\boldsymbol{Y}}={\boldsymbol{A}}{\boldsymbol{X}}\) donde la matriz \({\boldsymbol{A}}\) está dada por \[ {\boldsymbol{A}}=\begin{bmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \\ \end{bmatrix} \]

es una transformación lineal. La transformación \({\boldsymbol{Y}}\) sobre un vector \({\boldsymbol{X}}\) corresponde a la rotación de \({\boldsymbol{X}}=(x_1,x_2)\) un ángulo \(\theta\).

Vectores propios

Dada la transformación definida por la matriz cuadrada \({\boldsymbol{A}}_{p\times p}\), encontrar los vectores no nulos \({\boldsymbol{X}}\) de \(\mathbb{R}^p\), tal que \[ {\boldsymbol{A}}{\boldsymbol{X}}=\lambda{\boldsymbol{X}},\quad\text{ para }\lambda\neq 0. \]

Se denominan vectores propios o vector característico. Al escalar \(\lambda\) se le denomina valor propio o valor característico.

En un lenguaje geométrico-estadístico, se trata de buscar aquellos vectores, que al ser transformados por \({\boldsymbol{A}}\) no cambian su sentido (permanecen en la misma recta); esto es importante en estadística, pues conserva la información más importante contenida en los datos.

Encontrar este vector significa hallar la dirección en la que se encuentra una biena parte de la información contenida en los datos.

Resolver la ecuación es equivalente a encontrar la solución de \[ ({\boldsymbol{A}}-\lambda{\boldsymbol{I}}){\boldsymbol{X}}={\boldsymbol{0}} \] respecto a \(\lambda\), con \({\boldsymbol{X}}\neq 0\). El sistema anterior tiene soluciones diferentes a la solución nula, si y sólo si, el determinante de la matriz \(({\boldsymbol{A}}-\lambda{\boldsymbol{I}})\) es igual a cero; es decir, \[ |{\boldsymbol{A}}-\lambda{\boldsymbol{I}}|=0 \]

La ecuación anterior se le denomina ecuación característica y sus soluciones son los valores propios de la matriz \({\boldsymbol{A}}\). Un vector \({\boldsymbol{X}}\) asociado al valor propio de \(\lambda\) es llamado el vector propio.

A continuación se describen algunas propiedades sobre los valores propios, de uso más frecuente en estadística multivariada.

Ejemplo

Dada la matriz \[ {\boldsymbol{A}}= \begin{bmatrix} 3 & -2 & 0 \\ -2 & 3 & 0 \\ 0 & 0 & 5 \end{bmatrix} \] Calcular, el determinante, su inversa, la traza, los valores y vectores propios, diagonalizar, si es posible la matriz \({\boldsymbol{A}}\).

Formas cuadráticas

Sea \({\boldsymbol{A}}_{p\times p}\) una matriz simétrica y un vector \({\boldsymbol{X}}_{p\times 1}\), la función \[ Q({\boldsymbol{X}})={\boldsymbol{X}}'{\boldsymbol{A}}{\boldsymbol{X}}, \] se llama forma cuadrática de \({\boldsymbol{X}}\). \(Q({\boldsymbol{X}})\) es un escalar y puede ser expresado alternativamente por la ecuación \[ Q({\boldsymbol{X}})=\sum_{i=1}^p\sum_{i=1}^p a_{ij}x_ix_j \] con \(a_{ij}\) elemeto de la matriz \({\boldsymbol{A}}\), \(x_i\) y \(x_j\) elementos del vector \({\boldsymbol{X}}\).

Note que

Si \(Q({\boldsymbol{X}})>0\) para \({\boldsymbol{X}}\ne 0\), se dice que \({\boldsymbol{A}}\) es definida positiva. Si \(Q({\boldsymbol{X}})\geq 0\) para todo \(bs{X}\ne 0\), \({\boldsymbol{A}}\) se llama semidefinida positiva. Si \({\boldsymbol{A}}\) es definida positiva se nota \({\boldsymbol{A}}>0\) y si \({\boldsymbol{A}}\) es semidefinida positiva, se nota \({\boldsymbol{A}}\geq 0\).

Se resaltan las siguientes propiedades para las formas cuadráticas.