11/4/2020
¿Qué harían su supieran que el dólar el día de mañana aumentará en 20 pesos su precio?
¿ Y si supieran que mañana va a llover?
Si hoy supiésemos el futuro podríamos tomar mejores decisiones el día de hoy.
Es por esto que académicos y cientistas de datos, a través de teorías y/o algoritmos, han dedicado esfuerzos por predecir futuros eventos de interés.
En extremo, podemos distinguir entre dos tipos de enfoques:
Modelos teóricos: conjunto organizado de ideas que explican un fenómeno, deducidas a partir de la observación, la experiencia o el razonamiento lógico.
Inteligencia Artificial: el uso de algoritmos que, sin necesariamente explicar los mecanismos, buscan pronosticar.
En Microeconomía I enseñaron que el salario de los trabajadores es igual a PMgL (recuerde que PMgL = w)
Si las personas son más productivas, entonces su salario más alto.
Entonces, si la educación nos vuelve más productivos, podríamos pronosticar salarios con la información educacional de las personas.
En lugar de preocuparnos de la teoría que explica las ventas de hamburguesas podríamos preocuparnos de otras cosas para pronosticar:
¿Las ventas del mes pasado?
¿El promedio de ventas del año pasado?
¿Las ventas de la semana pasada?
¿Existe algún patrón que siguen las ventas? Quizás podríamos utilizar algoritmos para pronosticar.
En la práctica, obviamente, se pueden realizar pronósticos utilizando una mezcla de ambos enfoques.
En este tópico del curso se comenzará la discusión sobre métodos de pronóstico.
Supongamos que se nos ha asignado la tarea de entrevistar a los nuevos postulantes de un magíster de la UAI que nos esperan en la sala del lado.
Si tuviésemos que pronosticar la edad del primer entrevistado ¿cómo lo harían?
Supongamos que se nos ha asignado la tarea de entrevistar a los nuevos postulantes de un magíster de la UAI que nos esperan en la sala del lado.
Si tuviésemos que pronosticar la edad del primer entrevistado ¿cómo lo harían?
Una alternativa razonable podría ser el promedio de los actuales estudiantes del magíster…
¿Y si además les digo que escucha Marco Antonio Solis por las tardes?
¿Y si también les digo que es calvo?
Si tenemos información de estas tres variables, quizás, puede que nuestro mejor pronosticador es el promedio de edad de los estudiantes del magíster de este año condicionado a que estamos hablando de estudiantes calvos fanáticos de Marco Antonio Solis.
¿Y si incluímos más variables? Deberíamos condicionar por estas variables extras a la hora de calcular el promedio.
¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?
Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.
¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?
Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.
A este método lo llamaremos Mínimos Cuadrados Ordinarios (MCO)
¿Y si a la hora de condicionar por tantas variables a la hora de calcular un promedio no existen datos?
Hay un método que incluso nos permite hacer este cálculo con individuos de características inexistentes.
A este método lo llamaremos Mínimos Cuadrados Ordinarios (MCO).
¡Este método nos permitirá utilizar toda la información disponible para calcular promedios incluso para individuos que no existen!
Denotaremos como Y nuestra variable de interés a pronosticar
X corresponderá al vector de predictores que tenemos disponibles donde X = (X1X2…Xk)
u corresponderá a nuestro término del errores y a todos lo factores que afectan a Y que no son X1,X2,…,Xk
Vamos a suponer que la relación entre X y Y puede ser representada de la siguiente forma:
\[Y =f(X)+u\]
Donde f es una función desconocida dependiente de X1,X2,…,Xk
En esta representación f representa la información sistemática que entrega X sobre Y .
Dado que la función f que relaciona a X con Y generalmente es una función desconocida, debemos estimarla con información observable.
A la estimación de f la denotaremos como \(\hat{f}\)
Por ejemplo, podríamos realizar una encuesta a 30 individuos y preguntarles su ingreso (income) y los años de educación.
Nuestro objetivo será encontrar la curva f que nos identifica la relación entre ambas variables:
Para simplificar la discusión sobre f , vamos a suponer que f está dado por la siguiente forma funcional:
\[f(X)=β_0 +β_1X_1 +β_2X_2 +...+β_kX_k\] Donde β0,β1, … , βk corresponden a parámetros desconocidos de interés.
Nuestro interés será estimar los β para encontrar una estimación sobre f.
Como verán más adelante el suponer linealidad en f no es tan restrictivo a la hora de realizar pronósticos.
Definiremos a nuestra función de predicciones estimada, \(\hat{f}\)(X), como \(\hat{f}\)(X) = \(\hat{y}\).
Las predicciones de nuestro modelo se definirán como
\[\hat{y}_i=\hat{β}_0 +\hat{β}_1X_1 +\hat{β}_2X_2 +...+\hat{β}_kX_k\] Nuestro error de predicción, ui, se definirá como:
\[u_i = y_i − \hat{y}_i\]
ui medirá la diferencia entre los valores originales de la variable yi con los pronósticos que realizamos, \(\hat{y}\)i.
El objetivo de MCO será elegir lo \(\hat{β}\) que minimizan las Suma de Cuadrado de Residuos (SCR).
Si bien la estimación puede ser matemáticamente desafiante, el cálculo se puede realizar en R de forma muy sencilla.