DS4EyN - Clase 8

11/4/2020

Análisis Multivariado

Introducción

¿Qué harían su supieran que el dólar el día de mañana aumentará en 20 pesos su precio?

Introducción

¿ Y si supieran que mañana va a llover?

Introducción

Si hoy supiésemos el futuro podríamos tomar mejores decisiones el día de hoy.
Es por esto que académicos y cientistas de datos, a través de teorías y/o algoritmos, han dedicado esfuerzos por predecir futuros eventos de interés.

Pronosticando en la práctica: Ventas

Pronosticando en la práctica: Cambio Climático

Pero…¿Cómo pronosticamos?

En extremo, podemos distinguir entre dos tipos de enfoques:

Modelos teóricos: conjunto organizado de ideas que explican un fenómeno, deducidas a partir de la observación, la experiencia o el razonamiento lógico.
Inteligencia Artificial: el uso de algoritmos que, sin necesariamente explicar los mecanismos, buscan pronosticar.

Modelos Teóricos

En Microeconomía I enseñaron que el salario de los trabajadores es igual a PMgL (recuerde que PMgL = w)

Si las personas son más productivas, entonces su salario más alto.

Entonces, si la educación nos vuelve más productivos, podríamos pronosticar salarios con la información educacional de las personas.

Inteligencia Artificial: Pronosticando ventas de hamburguesas

En lugar de preocuparnos de la teoría que explica las ventas de hamburguesas podríamos preocuparnos de otras cosas para pronosticar:

¿Las ventas del mes pasado?
¿El promedio de ventas del año pasado?
¿Las ventas de la semana pasada?
¿Existe algún patrón que siguen las ventas? Quizás podríamos utilizar algoritmos para pronosticar.

Y… ¿Entonces?

En la práctica, obviamente, se pueden realizar pronósticos utilizando una mezcla de ambos enfoques.
En este tópico del curso se comenzará la discusión sobre métodos de pronóstico.

¿Cómo pronosticar?

Supongamos que se nos ha asignado la tarea de entrevistar a los nuevos postulantes de un magíster de la UAI que nos esperan en la sala del lado.
Si tuviésemos que pronosticar la edad del primer entrevistado ¿cómo lo harían?

¿Cómo pronosticar?

Supongamos que se nos ha asignado la tarea de entrevistar a los nuevos postulantes de un magíster de la UAI que nos esperan en la sala del lado.
Si tuviésemos que pronosticar la edad del primer entrevistado ¿cómo lo harían?
Una alternativa razonable podría ser el promedio de los actuales estudiantes del magíster…

¿Cómo pronosticar?

¿Y si además les digo que escucha Marco Antonio Solis por las tardes?

¿Cómo pronosticar?

¿Y si también les digo que es calvo?

¿Cómo pronosticar?

Si tenemos información de estas tres variables, quizás, puede que nuestro mejor pronosticador es el promedio de edad de los estudiantes del magíster de este año condicionado a que estamos hablando de estudiantes calvos fanáticos de Marco Antonio Solis.

¿Cómo pronosticar?

Si tenemos información de estas tres variables, quizás, puede que nuestro mejor pronosticador es el promedio de edad de los estudiantes del magíster de este año condicionado a que estamos hablando de estudiantes calvos fanáticos de Marco Antonio Solis.
¿Y si incluímos más variables? Deberíamos condicionar por estas variables extras a la hora de calcular el promedio.

¿Cómo pronosticar?

¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?

¿Cómo pronosticar?

¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?
Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.

¿Cómo pronosticar?

¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?
Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.
A este método lo llamaremos Mínimos Cuadrados Ordinarios (MCO)

¿Cómo pronosticar?

¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?
Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.
A este método lo llamaremos Mínimos Cuadrados Ordinarios (MCO).
¡Este método nos permitirá utilizar toda la información disponible para calcular promedios incluso para individuos que no existen!

Enfoque de los Mínimos Cuadrados Ordinarios

Denotaremos como Y nuestra variable de interés a pronosticar
X corresponderá al vector de predictores que tenemos disponibles donde X = (X₁X₂…X_k)
u corresponderá a nuestro término del errores y a todos lo factores que afectan a Y que no son X₁,X₂,…,X_k

Enfoque de los Mínimos Cuadrados Ordinarios

Vamos a suponer que la relación entre X y Y puede ser representada de la siguiente forma:

\[Y =f(X)+u\]

Donde f es una función desconocida dependiente de X₁,X₂,…,X_k

En esta representación f representa la información sistemática que entrega X sobre Y .

Enfoque de los Mínimos Cuadrados Ordinario

Dado que la función f que relaciona a X con Y generalmente es una función desconocida, debemos estimarla con información observable.
A la estimación de f la denotaremos como \(\hat{f}\)
Por ejemplo, podríamos realizar una encuesta a 30 individuos y preguntarles su ingreso (income) y los años de educación.

Enfoque de los Mínimos Cuadrados Ordinarios

Nuestro objetivo será encontrar la curva f que nos identifica la relación entre ambas variables:

Enfoque de los Mínimos Cuadrados Ordinarios

Para simplificar la discusión sobre f , vamos a suponer que f está dado por la siguiente forma funcional:

\[f(X)=β_0 +β_1X_1 +β_2X_2 +...+β_kX_k\] Donde β₀,β₁, … , β_k corresponden a parámetros desconocidos de interés.

Nuestro interés será estimar los β para encontrar una estimación sobre f.

Como verán más adelante el suponer linealidad en f no es tan restrictivo a la hora de realizar pronósticos.

Enfoque de los Mínimos Cuadrados Ordinarios

Definiremos a nuestra función de predicciones estimada, \(\hat{f}\)(X), como \(\hat{f}\)(X) = \(\hat{y}\).

Las predicciones de nuestro modelo se definirán como

\[\hat{y}_i=\hat{β}_0 +\hat{β}_1X_1 +\hat{β}_2X_2 +...+\hat{β}_kX_k\] Nuestro error de predicción, u_i, se definirá como:

\[u_i = y_i − \hat{y}_i\]

u_i medirá la diferencia entre los valores originales de la variable y_i con los pronósticos que realizamos, \(\hat{y}\)_i.

Enfoque de los Mínimos Cuadrados Ordinarios

El objetivo de MCO será elegir lo \(\hat{β}\) que minimizan las Suma de Cuadrado de Residuos (SCR).

Si bien la estimación puede ser matemáticamente desafiante, el cálculo se puede realizar en R de forma muy sencilla.

Análisis Multivariado

Introducción

Introducción

Introducción

Pronosticando en la práctica: Ventas

Pronosticando en la práctica: Cambio Climático

Pero…¿Cómo pronosticamos?

Modelos Teóricos

Inteligencia Artificial: Pronosticando ventas de hamburguesas

Y… ¿Entonces?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

¿Cómo pronosticar?

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinario

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinarios

Vamos a R!