11/4/2020

Análisis Multivariado

Introducción

¿Qué harían su supieran que el dólar el día de mañana aumentará en 20 pesos su precio?

Introducción

¿ Y si supieran que mañana va a llover?

Introducción

  • Si hoy supiésemos el futuro podríamos tomar mejores decisiones el día de hoy.

  • Es por esto que académicos y cientistas de datos, a través de teorías y/o algoritmos, han dedicado esfuerzos por predecir futuros eventos de interés.

Pronosticando en la práctica: Ventas

Pronosticando en la práctica: Cambio Climático

Pero…¿Cómo pronosticamos?

En extremo, podemos distinguir entre dos tipos de enfoques:

  1. Modelos teóricos: conjunto organizado de ideas que explican un fenómeno, deducidas a partir de la observación, la experiencia o el razonamiento lógico.

  2. Inteligencia Artificial: el uso de algoritmos que, sin necesariamente explicar los mecanismos, buscan pronosticar.

Modelos Teóricos

En Microeconomía I enseñaron que el salario de los trabajadores es igual a PMgL (recuerde que PMgL = w)

Si las personas son más productivas, entonces su salario más alto.

Entonces, si la educación nos vuelve más productivos, podríamos pronosticar salarios con la información educacional de las personas.

Inteligencia Artificial: Pronosticando ventas de hamburguesas

En lugar de preocuparnos de la teoría que explica las ventas de hamburguesas podríamos preocuparnos de otras cosas para pronosticar:

  • ¿Las ventas del mes pasado?

  • ¿El promedio de ventas del año pasado?

  • ¿Las ventas de la semana pasada?

  • ¿Existe algún patrón que siguen las ventas? Quizás podríamos utilizar algoritmos para pronosticar.

Y… ¿Entonces?

  • En la práctica, obviamente, se pueden realizar pronósticos utilizando una mezcla de ambos enfoques.

  • En este tópico del curso se comenzará la discusión sobre métodos de pronóstico.

¿Cómo pronosticar?

  • Supongamos que se nos ha asignado la tarea de entrevistar a los nuevos postulantes de un magíster de la UAI que nos esperan en la sala del lado.

  • Si tuviésemos que pronosticar la edad del primer entrevistado ¿cómo lo harían?

¿Cómo pronosticar?

  • Supongamos que se nos ha asignado la tarea de entrevistar a los nuevos postulantes de un magíster de la UAI que nos esperan en la sala del lado.

  • Si tuviésemos que pronosticar la edad del primer entrevistado ¿cómo lo harían?

  • Una alternativa razonable podría ser el promedio de los actuales estudiantes del magíster…

¿Cómo pronosticar?

¿Y si además les digo que escucha Marco Antonio Solis por las tardes?

¿Cómo pronosticar?

¿Y si también les digo que es calvo?

¿Cómo pronosticar?

  • Si tenemos información de estas tres variables, quizás, puede que nuestro mejor pronosticador es el promedio de edad de los estudiantes del magíster de este año condicionado a que estamos hablando de estudiantes calvos fanáticos de Marco Antonio Solis.

¿Cómo pronosticar?

  • Si tenemos información de estas tres variables, quizás, puede que nuestro mejor pronosticador es el promedio de edad de los estudiantes del magíster de este año condicionado a que estamos hablando de estudiantes calvos fanáticos de Marco Antonio Solis.

  • ¿Y si incluímos más variables? Deberíamos condicionar por estas variables extras a la hora de calcular el promedio.

¿Cómo pronosticar?

  • ¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?

¿Cómo pronosticar?

  • ¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?

  • Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.

¿Cómo pronosticar?

  • ¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?

  • Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.

  • A este método lo llamaremos Mínimos Cuadrados Ordinarios (MCO)

¿Cómo pronosticar?

  • ¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?

  • Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.

  • A este método lo llamaremos Mínimos Cuadrados Ordinarios (MCO).

  • ¡Este método nos permitirá utilizar toda la información disponible para calcular promedios incluso para individuos que no existen!

Enfoque de los Mínimos Cuadrados Ordinarios

  • Denotaremos como Y nuestra variable de interés a pronosticar

  • X corresponderá al vector de predictores que tenemos disponibles donde X = (X1X2…Xk)

  • u corresponderá a nuestro término del errores y a todos lo factores que afectan a Y que no son X1,X2,…,Xk

Enfoque de los Mínimos Cuadrados Ordinarios

Vamos a suponer que la relación entre X y Y puede ser representada de la siguiente forma:

\[Y =f(X)+u\]

Donde f es una función desconocida dependiente de X1,X2,…,Xk

En esta representación f representa la información sistemática que entrega X sobre Y .

Enfoque de los Mínimos Cuadrados Ordinario

  • Dado que la función f que relaciona a X con Y generalmente es una función desconocida, debemos estimarla con información observable.

  • A la estimación de f la denotaremos como \(\hat{f}\)

  • Por ejemplo, podríamos realizar una encuesta a 30 individuos y preguntarles su ingreso (income) y los años de educación.

Enfoque de los Mínimos Cuadrados Ordinarios

Enfoque de los Mínimos Cuadrados Ordinarios

Nuestro objetivo será encontrar la curva f que nos identifica la relación entre ambas variables:

Enfoque de los Mínimos Cuadrados Ordinarios

Para simplificar la discusión sobre f , vamos a suponer que f está dado por la siguiente forma funcional:

\[f(X)=β_0 +β_1X_1 +β_2X_2 +...+β_kX_k\] Donde β01, … , βk corresponden a parámetros desconocidos de interés.

Nuestro interés será estimar los β para encontrar una estimación sobre f.

Como verán más adelante el suponer linealidad en f no es tan restrictivo a la hora de realizar pronósticos.

Enfoque de los Mínimos Cuadrados Ordinarios

Definiremos a nuestra función de predicciones estimada, \(\hat{f}\)(X), como \(\hat{f}\)(X) = \(\hat{y}\).

Las predicciones de nuestro modelo se definirán como

\[\hat{y}_i=\hat{β}_0 +\hat{β}_1X_1 +\hat{β}_2X_2 +...+\hat{β}_kX_k\] Nuestro error de predicción, ui, se definirá como:

\[u_i = y_i − \hat{y}_i\]

ui medirá la diferencia entre los valores originales de la variable yi con los pronósticos que realizamos, \(\hat{y}\)i.

Enfoque de los Mínimos Cuadrados Ordinarios

El objetivo de MCO será elegir lo \(\hat{β}\) que minimizan las Suma de Cuadrado de Residuos (SCR).

Si bien la estimación puede ser matemáticamente desafiante, el cálculo se puede realizar en R de forma muy sencilla.

Enfoque de los Mínimos Cuadrados Ordinarios

Vamos a R!