Matemáticas para Machine Learning

Algebra Lineal cumple un importante rol en el ámbito del Aprendizaje Automático (Machine Learning). Esto por su estudio profundo de vectores, matrices, funciones lineales, entre otras ramas.

Al momento del uso de modelos de Machine Learning, estos manejan los datos representándolos como Matrices. Posterior se procede a su manipulación matemática, por esta razón es importante el conocimiento de Algebra Lineal para poder desempeñar de una manera optima los modelos de Machine Learning.

1.- Escalares, Vectores, Matrices y Tensores

“Broadly speaking, in Linear Algebra, data is represented in the form of linear equations. These linear equations are in turn represented in the form of matrices and vectors”

Vignesh Natarajan

1.1.- Escalares:

  • Un numero simple es un escalar (como por ejemplo: x = 23). A su vez es el ejemplo de un tensor de orden 0.

  • Es necesario describir el conjunto de valores al cual pertenece dicho escalar.

\[ a = 2 \] \[ b = 3.1416 \]


1.2.- Vectores:

  • Es una lista de números.

  • Hay dos maneras de interpretarlo. Primero, como un vector en un punto del espacio, donde los números que están en la lista son una manera para identificar al dicho punto en el espacio. Segundo, como una magnitud y dirección, como por ejemplo la velocidad.

  • Hay dos maneras de interpretar los vectores, una vendría siendo por el lado de la Física, y el otro por el lado de las Ciencias de la Computación.

\[ a = \{1,2,3,4\} \]


1.3.- Matrices:

  • Una matriz es parecida a un vector, en el sentido en que ambas son colecciones de números.

  • La diferencia entre una matriz y un vector, es que la primera es una tabla de números, y no así una lista.

\[ A= \begin{bmatrix} a_{11} & a_{12} & a_{13} & ... & a_{1n}\\ a_{21} & a_{22} & a_{23} & ... & a_{2n}\\ a_{31} & a_{32} & a_{33} & ... & a_{3n}\\ . & . & . & . & . \\ . & . & . & . & . \\ . & . & . & . & . \\ a_{m1} & a_{m2} & a_{m3} & ... & a_{mn}\\ \end{bmatrix} \]


1.4.- Tensores:

  • Un tensor es una generalización de vectores y matrices y se entiende fácilmente como una matriz multidimensional.


1.5.- En resumen:

Podemos interpretar de la siguiente manera gráfica:


- A continuación se presenta un vídeo obtenido de YouTube explicando conceptos y definiciones:

2.- Operaciones

2.1.- Operaciones con Vectores:

Adición de Vectores

\[ \vec{R} + \vec{S} = \vec{T} \] \[ R + S = S + R \] \[ (R_x,R_y) + (S_x,S_y) = (T_x,T_y) \]


Sustracción de Vectores

\[ \vec{R} - \vec{S} = \vec{U} \] \[ R - S = U \] \[ (R_x,R_y) - (S_x,S_y) = (U_x,U_y) \]


Multiplicación de Vectores:

  • Multiplicación de escalar con matriz

\[ 2\times r = \begin{bmatrix} 2\times3\\ 2\times2 \end{bmatrix} = \begin{bmatrix} 6\\ 4 \end{bmatrix} \]


2.2.- Operaciones con Matrices

Multiplicación de Escalar con Matriz:

  • Cuando un Escalar es multiplicado con una Matriz, esta se realiza con todos los números que yacen en la Matriz.

\[ 3\times \begin{pmatrix} 4 & 1 & 7\\ 5 & 9 & 12 \end{pmatrix} = \begin{pmatrix} 3\times4 & 3\times1 & 3\times7\\ 3\times5 & 3\times9 & 3\times12 \end{pmatrix} = \begin{pmatrix} 12 & 3 & 21\\ 15 & 27 & 36 \end{pmatrix} \]


Producto Dot:

  • Para multiplicar una matriz con otra matriz podemos realizarlo con el Dot Product.

\[ \begin{bmatrix} a & b \end{bmatrix} ● \begin{bmatrix} x\\ y \end{bmatrix} = \begin{bmatrix} ax + by \end{bmatrix} \] \[ \begin{bmatrix} a & b\\ c & d \end{bmatrix} ● \begin{bmatrix} x\\ y \end{bmatrix} = \begin{bmatrix} ax + by\\ cx + dy \end{bmatrix} \] \[ \begin{bmatrix} a & b\\ c & d \end{bmatrix} ● \begin{bmatrix} w & x\\ y & z \end{bmatrix} = \begin{bmatrix} aw + by & ax + bz\\ cw + dy & cx + dz \end{bmatrix} \]


Producto Hadamard:

  • Otra manera de realizar la multiplicación de dos matrices (una técnica bastante similar a la suma de dos matrices) puede realizarse mediante el Producto Hadamard

\[ \begin{bmatrix} 3 & 5 & 7\\ 4 & 9 & 8 \end{bmatrix} ○ \begin{bmatrix} 1 & 6 & 3\\ 0 & 2 & 9 \end{bmatrix} = \begin{bmatrix} 3\times1 & 5\times6 & 7\times3\\ 4\times0 & 9\times2 & 8\times9 \end{bmatrix} \]


Matriz Identidad:

  • Una matriz identidad, representado por I, tiene toda la diagonal principal definida por 1, y los demás valores rellenadas con 0.

  • Una matriz identidad es siempre una matriz cuadrada.

\[ \begin{bmatrix} 1 & 0\\ 0 & 1 \end{bmatrix}_{2x2} \]

\[ \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}_{3x3} \]


Matriz Inversa:

  • La inversa de una matriz cuadrada A, está definida de la siguiente manera:

\[ AA^{-1} = A^{-1} = I \]

  • Para obtener la inversa de una matriz 2x2 se puede obtener de la siguiente manera:

\[ \begin{bmatrix} a & b\\ c & d \end{bmatrix}^{-1} \]

\[ = \frac{1}{ad - bc} \begin{bmatrix} d & -b\\ -c & d \end{bmatrix} \]


Propiedades de producto de matrices:

  • Asociatividad:

\[ A = \begin{bmatrix} 1 & 2\\ 3 & 4\\ 0 & 1 \end{bmatrix} \] \[ B = \begin{bmatrix} 4 & 3\\ 2 & 1 \end{bmatrix} \] \[ A = \begin{bmatrix} 1 & 0\\ 2 & 3 \end{bmatrix} \]

Luego:

\[ A = \begin{bmatrix} 1 & 2\\ 3 & 4\\ 0 & 1 \end{bmatrix} \cdot B = \begin{bmatrix} 4 & 3\\ 2 & 1 \end{bmatrix} = \begin{bmatrix} 8 & 5\\ 20 & 13\\ 2 & 1 \end{bmatrix} \]

y

\[ B = \begin{bmatrix} 4 & 3\\ 2 & 1 \end{bmatrix} \cdot C = \begin{bmatrix} 1 & 0\\ 2 & 3 \end{bmatrix} = \begin{bmatrix} 10 & 9\\ 4 & 3 \end{bmatrix} \]

Por lo tanto:

\[ (AB)C = \begin{bmatrix} 8 & 5\\ 20 & 13\\ 2 & 1 \end{bmatrix} \cdot B = \begin{bmatrix} 1 & 0\\ 2 & 3 \end{bmatrix} = \begin{bmatrix} 18 & 15\\ 46 & 39\\ 4 & 3 \end{bmatrix} \]

y

\[ A(BC) = \begin{bmatrix} 1 & 2\\ 3 & 4\\ 0 & 1 \end{bmatrix} \cdot B = \begin{bmatrix} 10 & 9\\ 4 & 3 \end{bmatrix} = \begin{bmatrix} 18 & 15\\ 46 & 39\\ 4 & 3 \end{bmatrix} \]


  • Distribuidad:

\[ A (B + C) = AB + AC \] \[ (B + C) A = BA + CA \]


  • Conmutatividad: A diferencia de la adición, en la multiplicación la conmutatividad de matrices no satisface la equitividad.

    • Adición y Multiplicación

\[ A + B = B + A \]

\[ AB = !BA \]


  • Transpuesta: Una transpuesta de una matriz, es una nueva matriz donde prácticamente las filas son las columnas de la matriz original.

\[ A = \begin{bmatrix} 3 & 3\\ 5 & -3\\ 1 & 3\\ 0 & -2\\ 5 & -2 \end{bmatrix} \] \[ A^{T} = \begin{bmatrix} 3 & 5 & 1 & 0 & 5\\ 3 & -3 & 3 & -2 & -2\\ \end{bmatrix} \]


- A continuación se presenta un vídeo obtenido de YouTube, que muestra cómo Matlab resuelve Operaciones con Matrices y Vectores:

