Instalar paquetes y llamar librerías

#install.packages("forecast")
library(forecast)
## Registered S3 method overwritten by 'quantmod':
##   method            from
##   as.zoo.data.frame zoo
library(readxl)

Ejemplo. Producción

Contexto

Una serie de tiempo es una colección de observaciones sobre un determinado fenómeno efectuadas en momentos de tiempo sucesivos, usualmente equiespaciados.

Ejemplos de series de tiempo son:
1. Precio de acciones 2. Niveles de inventario 3. Rotación de personal 4. Ventas 5. PIB (GDP).

Crear la serie de tiempo

Ejemplo: Los siguientes datos de producción trimestral inician el primer trimestre de 2020. Se busca pronosticar la producción de los siguientes 5 trimestres.

produccion <- c(50,53,55,57,55,60)
st_produccion <- ts(data=produccion, start= c(2020, 1), frequency=4) # En este caso, la serie de tiempo inicia en 2020, en el 1º trimestre

# Mensual primer mes : st_produccion <- ts(data=produccion, start= c(2020, 1), frequency=12) # En este caso, la serie de tiempo inicia en 2020, en el 1º mes

# Mensual otro mes :  : st_produccion <- ts(data=produccion, start= c(2020, 8), frequency=12) # En este caso, la serie de tiempo inicia en 2020, en el 8vo mes

# Anual : st_produccion <- ts(data=produccion, start= c(2020), frequency=1) # En este caso, la serie de tiempo inicia en 2020

Crear el modelo ARIMA

ARIMA significa Modelo Autorregresivo Integrado de Promedio Móvil, en inglés.

modelo_produccion <- auto.arima(st_produccion, D=1) # D: Diferenciación estacional
modelo_produccion
## Series: st_produccion 
## ARIMA(0,0,0)(0,1,0)[4] with drift 
## 
## Coefficients:
##        drift
##       1.5000
## s.e.  0.1768
## 
## sigma^2 = 2.01:  log likelihood = -2.84
## AIC=9.68   AICc=-2.32   BIC=7.06
summary(modelo_produccion) #MAPE : Median Absolute Porcentage Error / Porcentaje de Error Promedio Absoluto
## Series: st_produccion 
## ARIMA(0,0,0)(0,1,0)[4] with drift 
## 
## Coefficients:
##        drift
##       1.5000
## s.e.  0.1768
## 
## sigma^2 = 2.01:  log likelihood = -2.84
## AIC=9.68   AICc=-2.32   BIC=7.06
## 
## Training set error measures:
##                      ME      RMSE       MAE        MPE      MAPE       MASE
## Training set 0.03333332 0.5787923 0.3666667 0.03685269 0.6429133 0.06111111
##                    ACF1
## Training set -0.5073047
# Al comparar modelos, seleccionamos el que tenga el menor MAPE.

Generar el pronóstico

pronostico_produccion <- forecast(modelo_produccion, level = c(95), h=5)
# Si no nos dicen otra cosa, el nivel de confiabilidad es 95%. Los periodos a pronosticar es h
pronostico_produccion
##         Point Forecast    Lo 95    Hi 95
## 2021 Q3             61 58.22127 63.77873
## 2021 Q4             63 60.22127 65.77873
## 2022 Q1             61 58.22127 63.77873
## 2022 Q2             66 63.22127 68.77873
## 2022 Q3             67 63.07028 70.92972
plot(pronostico_produccion)

Ejercicio 1. Mexico rumbo al 2050

En equipos de 2 o 3, seleccionar un estado de México, obtener los datos históricos de su poblacón, generar un pronóstico hasta 2050

Cargar archivo

pob_sonora <- read_excel("/Users/hugoenrique/Desktop/Universidad/8vo\ Semestre/Generación\ de\ Escenarios/M1/Act2/pob_sonora_1990_2020.xlsx")
pob_sonora
## # A tibble: 7 × 3
##   Entidad   Año Población
##   <chr>   <dbl>     <dbl>
## 1 Sonora   1990   1823606
## 2 Sonora   1995   2085536
## 3 Sonora   2000   2216969
## 4 Sonora   2005   2394861
## 5 Sonora   2010   2662480
## 6 Sonora   2015   2850330
## 7 Sonora   2020   2944840

Crear la serie de tiempo

st_pob_sonora <- ts(data=pob_sonora$Población, start= c(1990), frequency=.2)
#En este caso, la serie de tiempo inicia en 2020, en el 1er trimestre.

Crear el modeo ARIMA

ARIMA significa Modelo Autorregresivo Integrado de Promedio Móvil, en inglés.

modelo_pbsonora <- auto.arima(st_pob_sonora) # Diferenciación Estacional
modelo_pbsonora
## Series: st_pob_sonora 
## ARIMA(0,1,0) with drift 
## 
## Coefficients:
##           drift
##       186872.33
## s.e.   25733.79
## 
## sigma^2 = 4.768e+09:  log likelihood = -74.82
## AIC=153.64   AICc=157.64   BIC=153.23
summary(modelo_pbsonora)
## Series: st_pob_sonora 
## ARIMA(0,1,0) with drift 
## 
## Coefficients:
##           drift
##       186872.33
## s.e.   25733.79
## 
## sigma^2 = 4.768e+09:  log likelihood = -74.82
## AIC=153.64   AICc=157.64   BIC=153.23
## 
## Training set error measures:
##                   ME     RMSE      MAE       MPE     MAPE       MASE       ACF1
## Training set 233.819 58361.29 45028.68 0.1062428 1.823979 0.01856457 -0.1802949
# Al comparar modelos, seleccionamos el que tenga el menor MAPE (Porcentaje de Error Promedio Absoluto)

Generar el pronóstico

pronostico_pbsonora <- forecast(modelo_pbsonora, level=c(95), h=7)
#Si no nos dicen otra cosa, el nivel de confiabilidad es 95%. Los periodos a pronosticar es h.
pronostico_pbsonora
##      Point Forecast   Lo 95   Hi 95
## 2025        3131712 2996369 3267056
## 2030        3318585 3127180 3509989
## 2035        3505457 3271035 3739879
## 2040        3692329 3421643 3963016
## 2045        3879202 3576565 4181839
## 2050        4066074 3734552 4397596
## 2055        4252946 3894861 4611031
plot(pronostico_pbsonora)

Conclusión

En nuestro pronóstico se refleja un constante crecimiento en la población de Sonora. El último censo realizado por INEGI en 2020 registró una población de 2,944,840 en Sonora, mientras que nuestro pronóstico refleja una población ligeramente mayor a los 4 millones de habitantes.

Ejercicio 2. Aplicación de Shiny

Agregar una pestaña en la aplicación de Shiny con el ejercicio México rumbo al 2050. En el menú se debe seleccionar la cantidad de años a pronosticar y el nivel de confiabilidad.

Aplicación de Shiny

Ejercicio 3. Reflexión de mis materias en LIT

  1. El rol de los Negocios en la Sociedad: Aprendí a realizar el análisis PESTEL, FODA y creación de KPI’s al mismo tiempo aprendimos a realizar propuestas de valor para una empresa
  2. Decisiones Financieras: Aprendimos a hacer los Estados de resultados, Balance general, entre otros documentos contables.
  3. Pensamiento Estadístico: No recuerdo que vi en esta materia.
  4. Comunicación que inspira: Vimos el IKIGAI para encontrar nuestro proposito, la intención era aprender a desenvolverte para generar un negocio que llenara tu pasión.
  5. Estrategias de Mercado y Diferenciación: Aprendimos a hacer costeo de un plan de marketing para el socio formador y presentamos un tablero interactivo en excel.
  6. Evaluación de Proyectos de inversión: Aprendimos a sacar el WACC, Costo de Capital, cosas así para poder evaluar empresas y saber si serían rentables.
  7. Manipulación de Datos: Aprendimos a hacer limpieza, y utilización de datos en R para poder generar insights y entender el funcionamiento de tablas.
  8. Minería de datos: Aprendimos muchos modelos de Machine Learning, la relación entre explanibilidad y dificultad de un modelo y como entre más sencillo el modelo más fácil de leerlo.
  9. Bootcamp de programación: Aprendimos a hacer ShinyApps, programación en R y utilizamos mucho esto para trabajar con datos de Arca Continental
  10. Semestre Tec: Reforcé en España diversos temas de Recursos humanos, Finanzas y aprendi a hacer impuestos en España debido a una materia de Fiscabilidad.

Actividad 2. Hershey’s

Crear la serie de tiempo

ventas <- read_excel("/Users/hugoenrique/Desktop/Universidad/8vo\ Semestre/Generación\ de\ Escenarios/M1/Act2/Ventas_Históricas_Lechitas.xlsx")
str(ventas)
## tibble [36 × 1] (S3: tbl_df/tbl/data.frame)
##  $ Ventas: num [1:36] 25521 23740 26254 25868 27073 ...
st_ventas <- ts(data=ventas, start=c(2017, 1), frequency = 12)

Crear el modeo ARIMA

modelo_ventas <- auto.arima(st_ventas)
modelo_ventas
## Series: st_ventas 
## ARIMA(1,0,0)(1,1,0)[12] with drift 
## 
## Coefficients:
##          ar1     sar1     drift
##       0.6383  -0.5517  288.8980
## s.e.  0.1551   0.2047   14.5026
## 
## sigma^2 = 202700:  log likelihood = -181.5
## AIC=371   AICc=373.11   BIC=375.72
summary(modelo_ventas)
## Series: st_ventas 
## ARIMA(1,0,0)(1,1,0)[12] with drift 
## 
## Coefficients:
##          ar1     sar1     drift
##       0.6383  -0.5517  288.8980
## s.e.  0.1551   0.2047   14.5026
## 
## sigma^2 = 202700:  log likelihood = -181.5
## AIC=371   AICc=373.11   BIC=375.72
## 
## Training set error measures:
##                    ME    RMSE      MAE        MPE      MAPE       MASE
## Training set 25.22163 343.863 227.1699 0.08059942 0.7069541 0.06491041
##                   ACF1
## Training set 0.2081043

Generar el pronóstico

pronostico_ventas <- forecast(modelo_ventas, level = c(95), h = 12)
pronostico_ventas
##          Point Forecast    Lo 95    Hi 95
## Jan 2020       35498.90 34616.48 36381.32
## Feb 2020       34202.17 33155.29 35249.05
## Mar 2020       36703.01 35596.10 37809.92
## Apr 2020       36271.90 35141.44 37402.36
## May 2020       37121.98 35982.07 38261.90
## Jun 2020       37102.65 35958.91 38246.40
## Jul 2020       37151.04 36005.74 38296.35
## Aug 2020       38564.65 37418.71 39710.59
## Sep 2020       38755.23 37609.03 39901.42
## Oct 2020       39779.03 38632.73 40925.33
## Nov 2020       38741.63 37595.29 39887.97
## Dec 2020       38645.86 37499.50 39792.22
plot(pronostico_ventas)

