Ejercicio en clase: población

Instalar paquetes y llamar librerías

# Instalar paquetes y llamar librerías 
#install.packages("forecast")
library(forecast)
#install.packages("tidyverse")
library(tidyverse)
#install.packages("ggplot2")
library(ggplot2)

Importar la base de datos

# Importar la base de datos 
poblacion <- read.csv("~/Downloads/R databases /population.csv")

Análisis descriptivo

# Análisis descriptivo 
summary(poblacion)

##     state                year        population      
##  Length:6020        Min.   :1900   Min.   :   43000  
##  Class :character   1st Qu.:1930   1st Qu.:  901483  
##  Mode  :character   Median :1960   Median : 2359000  
##                     Mean   :1960   Mean   : 3726003  
##                     3rd Qu.:1990   3rd Qu.: 4541883  
##                     Max.   :2019   Max.   :39512223

str(poblacion)

## 'data.frame':    6020 obs. of  3 variables:
##  $ state     : chr  "AK" "AK" "AK" "AK" ...
##  $ year      : int  1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 ...
##  $ population: int  135000 158000 189000 205000 215000 222000 224000 231000 224000 224000 ...

head(poblacion)

##   state year population
## 1    AK 1950     135000
## 2    AK 1951     158000
## 3    AK 1952     189000
## 4    AK 1953     205000
## 5    AK 1954     215000
## 6    AK 1955     222000

Serie de tiempo en Texas

# Serie de tiempo en Texas
poblacion_texas <- poblacion %>% filter(state == "TX")
ggplot(poblacion_texas, aes(x=year, y=population)) + geom_line() +
  labs (title = "Población de Texas", x = "Año", y = "Población")

ts_texas <- ts(poblacion_texas$population, start=1900, frequency=1) #Cada año un dato # Formato serie de tiempo
               
# ts_texas <- ts(poblacion_texas$population, start=c (1900,4), frequency = 4 #La serie arranca en el trimestre 4 y cada año hay 4 registros 

# ts_texas <- ts(poblacion_texas$population, start=c (1900,8), frequency = 12 #Mensual

arima_texas <- auto.arima (ts_texas)
summary(arima_texas)

## Series: ts_texas 
## ARIMA(0,2,2) 
## 
## Coefficients:
##           ma1      ma2
##       -0.5950  -0.1798
## s.e.   0.0913   0.0951
## 
## sigma^2 = 1.031e+10:  log likelihood = -1527.14
## AIC=3060.28   AICc=3060.5   BIC=3068.6
## 
## Training set error measures:
##                    ME     RMSE      MAE       MPE      MAPE      MASE
## Training set 12147.62 99818.31 59257.39 0.1046163 0.5686743 0.2672197
##                     ACF1
## Training set -0.02136734

pronostico_texas <- forecast(arima_texas, level=95, h=10) #h = num predicciones

pronostico_texas

##      Point Forecast    Lo 95    Hi 95
## 2020       29398472 29199487 29597457
## 2021       29806827 29463665 30149990
## 2022       30215183 29742956 30687410
## 2023       30623538 30024100 31222977
## 2024       31031894 30303359 31760429
## 2025       31440249 30579246 32301253
## 2026       31848605 30851090 32846119
## 2027       32256960 31118581 33395339
## 2028       32665316 31381587 33949044
## 2029       33073671 31640070 34507272

plot(pronostico_texas, main = "Población en Texas")

Ejercicio en clase Lunes 17: Mapa

# Instalar paquetes y llamar librerías 
#install.packages("forecast")
library(forecast)
#install.packages("tidyverse")
library(tidyverse)
#install.packages("ggplot2")
library(ggplot2)
#install.packages("maps")
library(maps)
#install.packages("readxl")
library ("readxl")

# Análisis descriptivo 
summary(poblacion)

##     state                year        population      
##  Length:6020        Min.   :1900   Min.   :   43000  
##  Class :character   1st Qu.:1930   1st Qu.:  901483  
##  Mode  :character   Median :1960   Median : 2359000  
##                     Mean   :1960   Mean   : 3726003  
##                     3rd Qu.:1990   3rd Qu.: 4541883  
##                     Max.   :2019   Max.   :39512223

str(poblacion)

## 'data.frame':    6020 obs. of  3 variables:
##  $ state     : chr  "AK" "AK" "AK" "AK" ...
##  $ year      : int  1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 ...
##  $ population: int  135000 158000 189000 205000 215000 222000 224000 231000 224000 224000 ...

head(poblacion)

##   state year population
## 1    AK 1950     135000
## 2    AK 1951     158000
## 3    AK 1952     189000
## 4    AK 1953     205000
## 5    AK 1954     215000
## 6    AK 1955     222000

Instrucciones

Crear un mapa de EUA por década, con un gradiente verde-rojo de la población por estado, desde 1950 hasta 2050

# Crear un mapa 
map(database = "state")
map(database = "state", regions = "Texas", col = "red", fill = TRUE, add = TRUE)
map(database = "state", regions = "New York", col = "green", fill = TRUE, add = TRUE)

Código

# MAPA
# Instalar y/o cargar librerías necesarias
# install.packages(c("dplyr", "ggplot2", "forecast", "maps"))
library(dplyr)
library(ggplot2)
library(forecast)
library(maps)

# 1) Cargar los datos ----------------------------------------
poblacion <- read.csv("~/Downloads/R databases /population.csv")

# 2) Generar pronósticos para cada estado hasta el año 2050 ---
#    y combinarlos con los datos originales

# Creamos un dataset extendido que inicialmente es igual al original
poblacion_extendida <- poblacion

# Identificamos los estados únicos
estados <- unique(poblacion$state)

# Para cada estado, entrenamos un modelo ARIMA y hacemos forecast hasta 2050
for(st in estados){
  
  # Filtrar datos de ese estado y ordenarlos por año
  datos_st <- poblacion %>%
    filter(state == st) %>%
    arrange(year)
  
  # Determinar el último año disponible
  ultimo_anio <- max(datos_st$year)
  
  # Crear serie de tiempo
  ts_st <- ts(datos_st$population,
              start = min(datos_st$year),
              end   = ultimo_anio,
              frequency = 1)  # Anual
  
  # Entrenar el modelo ARIMA
  modelo_st <- auto.arima(ts_st)
  
  # Calcular cuántos años hay que pronosticar
  # (solo hacemos forecast si el ultimo_anio es < 2050)
  h_years <- 2050 - ultimo_anio
  
  if(h_years > 0){
    # Hacemos el pronóstico
    pronostico <- forecast(modelo_st, h = h_years)
    
    # Creamos un data frame con los resultados
    anios_pronostico <- (ultimo_anio + 1):2050
    poblacion_pronosticada <- as.numeric(pronostico$mean)
    
    df_forecast <- data.frame(
      state = st,
      year  = anios_pronostico,
      population = poblacion_pronosticada
    )
    
    # Agregamos filas con la población pronosticada
    poblacion_extendida <- rbind(poblacion_extendida, df_forecast)
  }
}

# 3) Función para graficar el mapa para un año dado ------------
plot_map <- function(year) {
  
  # Filtramos los datos para el año solicitado
  data_year <- poblacion_extendida %>%
    filter(year == !!year)
  
  # Cargar datos geográficos de EE.UU.
  states_map <- map_data("state")
  
  # Necesitamos relacionar la sigla (state) con el nombre en minúsculas
  # R trae dos vectores auxiliares: state.abb (siglas) y state.name (nombres completos)
  data_year <- data_year %>%
    mutate(region = tolower(state.name[match(state, state.abb)])) %>%
    right_join(states_map, by = "region")
  
  # Graficar
  ggplot(data_year, aes(x = long, y = lat, group = group, fill = population)) +
    geom_polygon(color = "black") +
    # Gradiente verde -> rojo
    scale_fill_gradient(
      low = "green",   # color mínimo
      high = "red",    # color máximo
      name = "Población"
    ) +
    labs(
      title = paste("Población por Estado en", year)
    ) +
    theme_void() +
    theme(
      legend.position = "right",
      plot.title = element_text(size = 16, face = "bold")
    )
}

# 4) Graficar el mapa cada década entre 1900 y 2050 -------------
for(year in seq(1900, 2050, by = 10)) {
  print(plot_map(year))
}

Actividad 2: Caso Hershey

Importar la base de datos

Hershey <- read_excel("~/Downloads/R databases /Copia de Ventas_Históricas_Lechitas.xlsx")

Hershey

## # A tibble: 36 × 2
##    Mes                 Ventas
##    <dttm>               <dbl>
##  1 2017-01-01 00:00:00 25521.
##  2 2017-02-01 00:00:00 23740.
##  3 2017-03-01 00:00:00 26254.
##  4 2017-04-01 00:00:00 25868.
##  5 2017-05-01 00:00:00 27073.
##  6 2017-06-01 00:00:00 27150.
##  7 2017-07-01 00:00:00 27067.
##  8 2017-08-01 00:00:00 28145.
##  9 2017-09-01 00:00:00 27546.
## 10 2017-10-01 00:00:00 28400.
## # ℹ 26 more rows

Hershey <- Hershey  %>% select(Ventas)

Modelo ARIMA

ts_hershey <- ts(Hershey$Ventas, start=c(2017,1), frequency = 12)
autoplot(ts_hershey) + labs (title = "Ventas de leche saborizada Hershey´s", x="Tiempo", y = "Miles de dólares") # De la librería de forecast

arima_hershey <- auto.arima(ts_hershey)
summary(arima_hershey)

## Series: ts_hershey 
## ARIMA(1,0,0)(1,1,0)[12] with drift 
## 
## Coefficients:
##          ar1     sar1     drift
##       0.6383  -0.5517  288.8979
## s.e.  0.1551   0.2047   14.5026
## 
## sigma^2 = 202701:  log likelihood = -181.5
## AIC=371   AICc=373.11   BIC=375.72
## 
## Training set error measures:
##                    ME    RMSE    MAE        MPE      MAPE       MASE      ACF1
## Training set 25.22158 343.864 227.17 0.08059932 0.7069542 0.06491044 0.2081026

pronostico_hershey <- forecast(arima_hershey, level=95, h=12)
pronostico_hershey

##          Point Forecast    Lo 95    Hi 95
## Jan 2020       35498.90 34616.48 36381.32
## Feb 2020       34202.17 33155.28 35249.05
## Mar 2020       36703.01 35596.10 37809.92
## Apr 2020       36271.90 35141.44 37402.36
## May 2020       37121.98 35982.07 38261.90
## Jun 2020       37102.65 35958.90 38246.40
## Jul 2020       37151.04 36005.73 38296.34
## Aug 2020       38564.64 37418.70 39710.58
## Sep 2020       38755.22 37609.03 39901.42
## Oct 2020       39779.02 38632.72 40925.32
## Nov 2020       38741.63 37595.28 39887.97
## Dec 2020       38645.86 37499.50 39792.22

autoplot (pronostico_hershey) + labs (title = "Pronóstico de ventas 2020 de leche saborizada Hershey´s", x="Tiempo", y="Miles de dólares")

Modelo Regresión Lineal

Hershey$mes <- 1:36
regresion_Hershey <- lm(Ventas ~ mes, data = Hershey)
summary(regresion_Hershey)

## 
## Call:
## lm(formula = Ventas ~ mes, data = Hershey)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -2075.79  -326.41    33.74   458.40  1537.04 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 24894.67     275.03   90.52   <2e-16 ***
## mes           298.37      12.96   23.02   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 808 on 34 degrees of freedom
## Multiple R-squared:  0.9397, Adjusted R-squared:  0.9379 
## F-statistic: 529.8 on 1 and 34 DF,  p-value: < 2.2e-16

años_prediccion <- data.frame(mes = 37:48)
prediccion_regresion <- predict (regresion_Hershey, años_prediccion)
prediccion_regresion

##        1        2        3        4        5        6        7        8 
## 35934.49 36232.86 36531.23 36829.61 37127.98 37426.35 37724.73 38023.10 
##        9       10       11       12 
## 38321.47 38619.85 38918.22 39216.59

plot(Hershey$mes, Hershey$Ventas, 
     main = "Pronóstico de ventas 2020 de leche saborizada Hershey´s", 
     xlab = "Tiempo", ylab = "Miles de dólares", 
     xlim = c(1, 50),  # Extender el eje X hasta 50
     ylim = range(c(Hershey$Ventas, prediccion_regresion)))  
abline(regresion_Hershey, col = "blue")
points(años_prediccion$mes, prediccion_regresion, col = "red", pch = 19)

predicciones_reales <- predict(regresion_Hershey, Hershey)
MAPE <- mean(abs((Hershey$Ventas - predicciones_reales)/Hershey$Ventas))*100
MAPE

## [1] 2.011297

Recomendaciones

# El arima es un modelo de predicción más certero ya que tiene un MAPE menor

# El mejor modelo que se adapta a la serie es el SARIMA (tiene un componente temporal), con un MAPE de 0.70, comparado con la regresión lineal que su MAPE es de 2.01%

# Según el modelo SARIMA, para el siguiente año la proyección de ventas es la siguiente:

Mes y año	escenario esperado	escenario pesimista	escenario optimista
Jan 2020	35498.90	34616.48	36381.32
Feb 2020	34202.17	33155.28	35249.05
Mar 2020	36703.01	35596.10	37809.92
Apr 2020	36271.90	35141.44	37402.36
May 2020	37121.98	35982.07	38261.90
Jun 2020	37102.65	35958.90	38246.40
Jul 2020	37151.04	36005.73	38296.34
Aug 2020	38564.64	37418.70	39710.58
Sep 2020	38755.22	37609.03	39901.42
Oct 2020	39779.02	38632.72	40925.32

# Una recomendación para la empresa podría ser prepararse para un crecimeinto de ventas en el próximo año, de tal forma que se invierta en mejorar la maquinaria, aumentar o capacitar mejor al personal y así tener las herrameintas necesarias para elevar la producción

ventas_por_año <- read.csv("~/Downloads/R databases /ventas_por_anio.csv")
ggplot(ventas_por_año, aes(x=mes, y= ventas, col=as.factor(anio),
col = as.factor(anio), group = anio)) + 
  geom_line() +
  labs (title = "Ventas de leche saborizada Hershey´s por año", x = "Mes", y = "Miles de dólares")

# Otra de nuestras recomendaciones sería realizar campañas publicitarias para aumentar el consumo de leche saborizada Hershey´s en el primer semestre del año

LS0tCnRpdGxlOiAiQWN0Ml9TZXJpZXNkZVRpZW1wbyIKYXV0aG9yOiAiQW5kcmVhIE9ydGl6IgpkYXRlOiAiMjAyNS0wMi0xNyIKb3V0cHV0OiAKICBodG1sX2RvY3VtZW50OgogICAgdG9jOiBUUlVFCiAgICB0b2NfZmxvYXQ6IFRSVUUgI1BhcmEgcG9kZXIgZGVzY2FyZ2FyIGVsIGPDs2RpZ28gcHVibGljYWRvCiAgICBjb2RlX2Rvd25sb2FkOiBUUlVFCiAgICB0aGVtZTogY2VydWxlYW4KLS0tCgpgYGB7ciBzZXR1cCwgaW5jbHVkZT1GQUxTRX0Ka25pdHI6Om9wdHNfY2h1bmskc2V0KGVjaG8gPSBUUlVFKQpgYGAKCiMgRWplcmNpY2lvIGVuIGNsYXNlOiBwb2JsYWNpw7NuIAoKIVtdKC9Vc2Vycy9hbmRlci9Eb3dubG9hZHMvUG9wdWxhdGlvbl9naWYud2VicCkKCgojIyBJbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXLDrWFzIAoKYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KIyBJbnN0YWxhciBwYXF1ZXRlcyB5IGxsYW1hciBsaWJyZXLDrWFzIAojaW5zdGFsbC5wYWNrYWdlcygiZm9yZWNhc3QiKQpsaWJyYXJ5KGZvcmVjYXN0KQojaW5zdGFsbC5wYWNrYWdlcygidGlkeXZlcnNlIikKbGlicmFyeSh0aWR5dmVyc2UpCiNpbnN0YWxsLnBhY2thZ2VzKCJnZ3Bsb3QyIikKbGlicmFyeShnZ3Bsb3QyKQpgYGAKIyMgSW1wb3J0YXIgbGEgYmFzZSBkZSBkYXRvcwoKYGBge3J9CiMgSW1wb3J0YXIgbGEgYmFzZSBkZSBkYXRvcyAKcG9ibGFjaW9uIDwtIHJlYWQuY3N2KCJ+L0Rvd25sb2Fkcy9SIGRhdGFiYXNlcyAvcG9wdWxhdGlvbi5jc3YiKQpgYGAKCiMjIEFuw6FsaXNpcyBkZXNjcmlwdGl2byAKCmBgYHtyfQojIEFuw6FsaXNpcyBkZXNjcmlwdGl2byAKc3VtbWFyeShwb2JsYWNpb24pCnN0cihwb2JsYWNpb24pCmBgYApgYGB7cn0KaGVhZChwb2JsYWNpb24pCmBgYAoKIyMgU2VyaWUgZGUgdGllbXBvIGVuIFRleGFzCgpgYGB7cn0KIyBTZXJpZSBkZSB0aWVtcG8gZW4gVGV4YXMKcG9ibGFjaW9uX3RleGFzIDwtIHBvYmxhY2lvbiAlPiUgZmlsdGVyKHN0YXRlID09ICJUWCIpCmdncGxvdChwb2JsYWNpb25fdGV4YXMsIGFlcyh4PXllYXIsIHk9cG9wdWxhdGlvbikpICsgZ2VvbV9saW5lKCkgKwogIGxhYnMgKHRpdGxlID0gIlBvYmxhY2nDs24gZGUgVGV4YXMiLCB4ID0gIkHDsW8iLCB5ID0gIlBvYmxhY2nDs24iKQoKdHNfdGV4YXMgPC0gdHMocG9ibGFjaW9uX3RleGFzJHBvcHVsYXRpb24sIHN0YXJ0PTE5MDAsIGZyZXF1ZW5jeT0xKSAjQ2FkYSBhw7FvIHVuIGRhdG8gIyBGb3JtYXRvIHNlcmllIGRlIHRpZW1wbwogICAgICAgICAgICAgICAKIyB0c190ZXhhcyA8LSB0cyhwb2JsYWNpb25fdGV4YXMkcG9wdWxhdGlvbiwgc3RhcnQ9YyAoMTkwMCw0KSwgZnJlcXVlbmN5ID0gNCAjTGEgc2VyaWUgYXJyYW5jYSBlbiBlbCB0cmltZXN0cmUgNCB5IGNhZGEgYcOxbyBoYXkgNCByZWdpc3Ryb3MgCgojIHRzX3RleGFzIDwtIHRzKHBvYmxhY2lvbl90ZXhhcyRwb3B1bGF0aW9uLCBzdGFydD1jICgxOTAwLDgpLCBmcmVxdWVuY3kgPSAxMiAjTWVuc3VhbAoKYXJpbWFfdGV4YXMgPC0gYXV0by5hcmltYSAodHNfdGV4YXMpCnN1bW1hcnkoYXJpbWFfdGV4YXMpCgpwcm9ub3N0aWNvX3RleGFzIDwtIGZvcmVjYXN0KGFyaW1hX3RleGFzLCBsZXZlbD05NSwgaD0xMCkgI2ggPSBudW0gcHJlZGljY2lvbmVzIApgYGAKYGBge3J9CnByb25vc3RpY29fdGV4YXMKcGxvdChwcm9ub3N0aWNvX3RleGFzLCBtYWluID0gIlBvYmxhY2nDs24gZW4gVGV4YXMiKQpgYGAKCiMgRWplcmNpY2lvIGVuIGNsYXNlIEx1bmVzIDE3OiBNYXBhIAoKYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KCiMgSW5zdGFsYXIgcGFxdWV0ZXMgeSBsbGFtYXIgbGlicmVyw61hcyAKI2luc3RhbGwucGFja2FnZXMoImZvcmVjYXN0IikKbGlicmFyeShmb3JlY2FzdCkKI2luc3RhbGwucGFja2FnZXMoInRpZHl2ZXJzZSIpCmxpYnJhcnkodGlkeXZlcnNlKQojaW5zdGFsbC5wYWNrYWdlcygiZ2dwbG90MiIpCmxpYnJhcnkoZ2dwbG90MikKI2luc3RhbGwucGFja2FnZXMoIm1hcHMiKQpsaWJyYXJ5KG1hcHMpCiNpbnN0YWxsLnBhY2thZ2VzKCJyZWFkeGwiKQpsaWJyYXJ5ICgicmVhZHhsIikKYGBgCmBgYHtyfQojIEFuw6FsaXNpcyBkZXNjcmlwdGl2byAKc3VtbWFyeShwb2JsYWNpb24pCnN0cihwb2JsYWNpb24pCmhlYWQocG9ibGFjaW9uKQpgYGAKIyMgSW5zdHJ1Y2Npb25lcyAKCkNyZWFyIHVuIG1hcGEgZGUgRVVBIHBvciBkw6ljYWRhLCBjb24gdW4gZ3JhZGllbnRlIHZlcmRlLXJvam8gZGUgbGEgcG9ibGFjacOzbiBwb3IgZXN0YWRvLCBkZXNkZSAxOTUwIGhhc3RhIDIwNTAKYGBge3J9CiMgQ3JlYXIgdW4gbWFwYSAKbWFwKGRhdGFiYXNlID0gInN0YXRlIikKbWFwKGRhdGFiYXNlID0gInN0YXRlIiwgcmVnaW9ucyA9ICJUZXhhcyIsIGNvbCA9ICJyZWQiLCBmaWxsID0gVFJVRSwgYWRkID0gVFJVRSkKbWFwKGRhdGFiYXNlID0gInN0YXRlIiwgcmVnaW9ucyA9ICJOZXcgWW9yayIsIGNvbCA9ICJncmVlbiIsIGZpbGwgPSBUUlVFLCBhZGQgPSBUUlVFKQpgYGAKCiMjIEPDs2RpZ28gCgpgYGB7cn0KIyBNQVBBCiMgSW5zdGFsYXIgeS9vIGNhcmdhciBsaWJyZXLDrWFzIG5lY2VzYXJpYXMKIyBpbnN0YWxsLnBhY2thZ2VzKGMoImRwbHlyIiwgImdncGxvdDIiLCAiZm9yZWNhc3QiLCAibWFwcyIpKQpsaWJyYXJ5KGRwbHlyKQpsaWJyYXJ5KGdncGxvdDIpCmxpYnJhcnkoZm9yZWNhc3QpCmxpYnJhcnkobWFwcykKCiMgMSkgQ2FyZ2FyIGxvcyBkYXRvcyAtLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tLS0tCnBvYmxhY2lvbiA8LSByZWFkLmNzdigifi9Eb3dubG9hZHMvUiBkYXRhYmFzZXMgL3BvcHVsYXRpb24uY3N2IikKCiMgMikgR2VuZXJhciBwcm9uw7NzdGljb3MgcGFyYSBjYWRhIGVzdGFkbyBoYXN0YSBlbCBhw7FvIDIwNTAgLS0tCiMgICAgeSBjb21iaW5hcmxvcyBjb24gbG9zIGRhdG9zIG9yaWdpbmFsZXMKCiMgQ3JlYW1vcyB1biBkYXRhc2V0IGV4dGVuZGlkbyBxdWUgaW5pY2lhbG1lbnRlIGVzIGlndWFsIGFsIG9yaWdpbmFsCnBvYmxhY2lvbl9leHRlbmRpZGEgPC0gcG9ibGFjaW9uCgojIElkZW50aWZpY2Ftb3MgbG9zIGVzdGFkb3Mgw7puaWNvcwplc3RhZG9zIDwtIHVuaXF1ZShwb2JsYWNpb24kc3RhdGUpCgojIFBhcmEgY2FkYSBlc3RhZG8sIGVudHJlbmFtb3MgdW4gbW9kZWxvIEFSSU1BIHkgaGFjZW1vcyBmb3JlY2FzdCBoYXN0YSAyMDUwCmZvcihzdCBpbiBlc3RhZG9zKXsKICAKICAjIEZpbHRyYXIgZGF0b3MgZGUgZXNlIGVzdGFkbyB5IG9yZGVuYXJsb3MgcG9yIGHDsW8KICBkYXRvc19zdCA8LSBwb2JsYWNpb24gJT4lCiAgICBmaWx0ZXIoc3RhdGUgPT0gc3QpICU+JQogICAgYXJyYW5nZSh5ZWFyKQogIAogICMgRGV0ZXJtaW5hciBlbCDDumx0aW1vIGHDsW8gZGlzcG9uaWJsZQogIHVsdGltb19hbmlvIDwtIG1heChkYXRvc19zdCR5ZWFyKQogIAogICMgQ3JlYXIgc2VyaWUgZGUgdGllbXBvCiAgdHNfc3QgPC0gdHMoZGF0b3Nfc3QkcG9wdWxhdGlvbiwKICAgICAgICAgICAgICBzdGFydCA9IG1pbihkYXRvc19zdCR5ZWFyKSwKICAgICAgICAgICAgICBlbmQgICA9IHVsdGltb19hbmlvLAogICAgICAgICAgICAgIGZyZXF1ZW5jeSA9IDEpICAjIEFudWFsCiAgCiAgIyBFbnRyZW5hciBlbCBtb2RlbG8gQVJJTUEKICBtb2RlbG9fc3QgPC0gYXV0by5hcmltYSh0c19zdCkKICAKICAjIENhbGN1bGFyIGN1w6FudG9zIGHDsW9zIGhheSBxdWUgcHJvbm9zdGljYXIKICAjIChzb2xvIGhhY2Vtb3MgZm9yZWNhc3Qgc2kgZWwgdWx0aW1vX2FuaW8gZXMgPCAyMDUwKQogIGhfeWVhcnMgPC0gMjA1MCAtIHVsdGltb19hbmlvCiAgCiAgaWYoaF95ZWFycyA+IDApewogICAgIyBIYWNlbW9zIGVsIHByb27Ds3N0aWNvCiAgICBwcm9ub3N0aWNvIDwtIGZvcmVjYXN0KG1vZGVsb19zdCwgaCA9IGhfeWVhcnMpCiAgICAKICAgICMgQ3JlYW1vcyB1biBkYXRhIGZyYW1lIGNvbiBsb3MgcmVzdWx0YWRvcwogICAgYW5pb3NfcHJvbm9zdGljbyA8LSAodWx0aW1vX2FuaW8gKyAxKToyMDUwCiAgICBwb2JsYWNpb25fcHJvbm9zdGljYWRhIDwtIGFzLm51bWVyaWMocHJvbm9zdGljbyRtZWFuKQogICAgCiAgICBkZl9mb3JlY2FzdCA8LSBkYXRhLmZyYW1lKAogICAgICBzdGF0ZSA9IHN0LAogICAgICB5ZWFyICA9IGFuaW9zX3Byb25vc3RpY28sCiAgICAgIHBvcHVsYXRpb24gPSBwb2JsYWNpb25fcHJvbm9zdGljYWRhCiAgICApCiAgICAKICAgICMgQWdyZWdhbW9zIGZpbGFzIGNvbiBsYSBwb2JsYWNpw7NuIHByb25vc3RpY2FkYQogICAgcG9ibGFjaW9uX2V4dGVuZGlkYSA8LSByYmluZChwb2JsYWNpb25fZXh0ZW5kaWRhLCBkZl9mb3JlY2FzdCkKICB9Cn0KCiMgMykgRnVuY2nDs24gcGFyYSBncmFmaWNhciBlbCBtYXBhIHBhcmEgdW4gYcOxbyBkYWRvIC0tLS0tLS0tLS0tLQpwbG90X21hcCA8LSBmdW5jdGlvbih5ZWFyKSB7CiAgCiAgIyBGaWx0cmFtb3MgbG9zIGRhdG9zIHBhcmEgZWwgYcOxbyBzb2xpY2l0YWRvCiAgZGF0YV95ZWFyIDwtIHBvYmxhY2lvbl9leHRlbmRpZGEgJT4lCiAgICBmaWx0ZXIoeWVhciA9PSAhIXllYXIpCiAgCiAgIyBDYXJnYXIgZGF0b3MgZ2VvZ3LDoWZpY29zIGRlIEVFLlVVLgogIHN0YXRlc19tYXAgPC0gbWFwX2RhdGEoInN0YXRlIikKICAKICAjIE5lY2VzaXRhbW9zIHJlbGFjaW9uYXIgbGEgc2lnbGEgKHN0YXRlKSBjb24gZWwgbm9tYnJlIGVuIG1pbsO6c2N1bGFzCiAgIyBSIHRyYWUgZG9zIHZlY3RvcmVzIGF1eGlsaWFyZXM6IHN0YXRlLmFiYiAoc2lnbGFzKSB5IHN0YXRlLm5hbWUgKG5vbWJyZXMgY29tcGxldG9zKQogIGRhdGFfeWVhciA8LSBkYXRhX3llYXIgJT4lCiAgICBtdXRhdGUocmVnaW9uID0gdG9sb3dlcihzdGF0ZS5uYW1lW21hdGNoKHN0YXRlLCBzdGF0ZS5hYmIpXSkpICU+JQogICAgcmlnaHRfam9pbihzdGF0ZXNfbWFwLCBieSA9ICJyZWdpb24iKQogIAogICMgR3JhZmljYXIKICBnZ3Bsb3QoZGF0YV95ZWFyLCBhZXMoeCA9IGxvbmcsIHkgPSBsYXQsIGdyb3VwID0gZ3JvdXAsIGZpbGwgPSBwb3B1bGF0aW9uKSkgKwogICAgZ2VvbV9wb2x5Z29uKGNvbG9yID0gImJsYWNrIikgKwogICAgIyBHcmFkaWVudGUgdmVyZGUgLT4gcm9qbwogICAgc2NhbGVfZmlsbF9ncmFkaWVudCgKICAgICAgbG93ID0gImdyZWVuIiwgICAjIGNvbG9yIG3DrW5pbW8KICAgICAgaGlnaCA9ICJyZWQiLCAgICAjIGNvbG9yIG3DoXhpbW8KICAgICAgbmFtZSA9ICJQb2JsYWNpw7NuIgogICAgKSArCiAgICBsYWJzKAogICAgICB0aXRsZSA9IHBhc3RlKCJQb2JsYWNpw7NuIHBvciBFc3RhZG8gZW4iLCB5ZWFyKQogICAgKSArCiAgICB0aGVtZV92b2lkKCkgKwogICAgdGhlbWUoCiAgICAgIGxlZ2VuZC5wb3NpdGlvbiA9ICJyaWdodCIsCiAgICAgIHBsb3QudGl0bGUgPSBlbGVtZW50X3RleHQoc2l6ZSA9IDE2LCBmYWNlID0gImJvbGQiKQogICAgKQp9CgojIDQpIEdyYWZpY2FyIGVsIG1hcGEgY2FkYSBkw6ljYWRhIGVudHJlIDE5MDAgeSAyMDUwIC0tLS0tLS0tLS0tLS0KZm9yKHllYXIgaW4gc2VxKDE5MDAsIDIwNTAsIGJ5ID0gMTApKSB7CiAgcHJpbnQocGxvdF9tYXAoeWVhcikpCn0KYGBgCgojIDxzcGFuIHN0eWxlPSJjb2xvcjogYnJvd247Ij5BY3RpdmlkYWQgMjogQ2FzbyBIZXJzaGV5PC9zcGFuPgoKIVtdKC9Vc2Vycy9hbmRlci9Eb3dubG9hZHMvSGVyc2hleV9naWYuZ2lmKQoKIyMgIDxzcGFuIHN0eWxlPSJjb2xvcjogYnJvd247Ij5JbXBvcnRhciBsYSBiYXNlIGRlIGRhdG9zPC9zcGFuPgoKYGBge3J9CkhlcnNoZXkgPC0gcmVhZF9leGNlbCgifi9Eb3dubG9hZHMvUiBkYXRhYmFzZXMgL0NvcGlhIGRlIFZlbnRhc19IaXN0b8yBcmljYXNfTGVjaGl0YXMueGxzeCIpCmBgYAoKYGBge3J9CkhlcnNoZXkKYGBgCgpgYGB7cn0KSGVyc2hleSA8LSBIZXJzaGV5ICAlPiUgc2VsZWN0KFZlbnRhcykKYGBgCgojIyA8c3BhbiBzdHlsZT0iY29sb3I6IGJyb3duOyI+ICBNb2RlbG8gQVJJTUE8L3NwYW4+CgpgYGB7cn0KdHNfaGVyc2hleSA8LSB0cyhIZXJzaGV5JFZlbnRhcywgc3RhcnQ9YygyMDE3LDEpLCBmcmVxdWVuY3kgPSAxMikKYXV0b3Bsb3QodHNfaGVyc2hleSkgKyBsYWJzICh0aXRsZSA9ICJWZW50YXMgZGUgbGVjaGUgc2Fib3JpemFkYSBIZXJzaGV5wrRzIiwgeD0iVGllbXBvIiwgeSA9ICJNaWxlcyBkZSBkw7NsYXJlcyIpICMgRGUgbGEgbGlicmVyw61hIGRlIGZvcmVjYXN0IApgYGAKYGBge3J9CmFyaW1hX2hlcnNoZXkgPC0gYXV0by5hcmltYSh0c19oZXJzaGV5KQpzdW1tYXJ5KGFyaW1hX2hlcnNoZXkpCnByb25vc3RpY29faGVyc2hleSA8LSBmb3JlY2FzdChhcmltYV9oZXJzaGV5LCBsZXZlbD05NSwgaD0xMikKcHJvbm9zdGljb19oZXJzaGV5CmF1dG9wbG90IChwcm9ub3N0aWNvX2hlcnNoZXkpICsgbGFicyAodGl0bGUgPSAiUHJvbsOzc3RpY28gZGUgdmVudGFzIDIwMjAgZGUgbGVjaGUgc2Fib3JpemFkYSBIZXJzaGV5wrRzIiwgeD0iVGllbXBvIiwgeT0iTWlsZXMgZGUgZMOzbGFyZXMiKQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjogYnJvd247Ij4gIE1vZGVsbyBSZWdyZXNpw7NuIExpbmVhbDwvc3Bhbj4KCmBgYHtyfQpIZXJzaGV5JG1lcyA8LSAxOjM2CnJlZ3Jlc2lvbl9IZXJzaGV5IDwtIGxtKFZlbnRhcyB+IG1lcywgZGF0YSA9IEhlcnNoZXkpCnN1bW1hcnkocmVncmVzaW9uX0hlcnNoZXkpCmHDsW9zX3ByZWRpY2Npb24gPC0gZGF0YS5mcmFtZShtZXMgPSAzNzo0OCkKcHJlZGljY2lvbl9yZWdyZXNpb24gPC0gcHJlZGljdCAocmVncmVzaW9uX0hlcnNoZXksIGHDsW9zX3ByZWRpY2Npb24pCnByZWRpY2Npb25fcmVncmVzaW9uCnBsb3QoSGVyc2hleSRtZXMsIEhlcnNoZXkkVmVudGFzLCAKICAgICBtYWluID0gIlByb27Ds3N0aWNvIGRlIHZlbnRhcyAyMDIwIGRlIGxlY2hlIHNhYm9yaXphZGEgSGVyc2hlecK0cyIsIAogICAgIHhsYWIgPSAiVGllbXBvIiwgeWxhYiA9ICJNaWxlcyBkZSBkw7NsYXJlcyIsIAogICAgIHhsaW0gPSBjKDEsIDUwKSwgICMgRXh0ZW5kZXIgZWwgZWplIFggaGFzdGEgNTAKICAgICB5bGltID0gcmFuZ2UoYyhIZXJzaGV5JFZlbnRhcywgcHJlZGljY2lvbl9yZWdyZXNpb24pKSkgIAphYmxpbmUocmVncmVzaW9uX0hlcnNoZXksIGNvbCA9ICJibHVlIikKcG9pbnRzKGHDsW9zX3ByZWRpY2Npb24kbWVzLCBwcmVkaWNjaW9uX3JlZ3Jlc2lvbiwgY29sID0gInJlZCIsIHBjaCA9IDE5KQpgYGAKCmBgYHtyfQpwcmVkaWNjaW9uZXNfcmVhbGVzIDwtIHByZWRpY3QocmVncmVzaW9uX0hlcnNoZXksIEhlcnNoZXkpCk1BUEUgPC0gbWVhbihhYnMoKEhlcnNoZXkkVmVudGFzIC0gcHJlZGljY2lvbmVzX3JlYWxlcykvSGVyc2hleSRWZW50YXMpKSoxMDAKTUFQRQpgYGAKCiMjIDxzcGFuIHN0eWxlPSJjb2xvcjogYnJvd247Ij4gIFJlY29tZW5kYWNpb25lczwvc3Bhbj4KCmBgYHtyfQojIEVsIGFyaW1hIGVzIHVuIG1vZGVsbyBkZSBwcmVkaWNjacOzbiBtw6FzIGNlcnRlcm8geWEgcXVlIHRpZW5lIHVuIE1BUEUgbWVub3IgCmBgYAoKYGBge3J9CiMgRWwgbWVqb3IgbW9kZWxvIHF1ZSBzZSBhZGFwdGEgYSBsYSBzZXJpZSBlcyBlbCBTQVJJTUEgKHRpZW5lIHVuIGNvbXBvbmVudGUgdGVtcG9yYWwpLCBjb24gdW4gTUFQRSBkZSAwLjcwLCBjb21wYXJhZG8gY29uIGxhIHJlZ3Jlc2nDs24gbGluZWFsIHF1ZSBzdSBNQVBFIGVzIGRlIDIuMDElCmBgYAoKYGBge3J9CiMgU2Vnw7puIGVsIG1vZGVsbyBTQVJJTUEsIHBhcmEgZWwgc2lndWllbnRlIGHDsW8gbGEgcHJveWVjY2nDs24gZGUgdmVudGFzIGVzIGxhIHNpZ3VpZW50ZToKYGBgCgp8IE1lcyB5IGHDsW8gfCBlc2NlbmFyaW8gZXNwZXJhZG8gfCBlc2NlbmFyaW8gcGVzaW1pc3RhIHwgZXNjZW5hcmlvIG9wdGltaXN0YSAKfC0tLS0tLS0tLS0tfC0tLS0tLS0tLS0tLS0tLS0tLS0tfC0tLS0tLS0tLS0tLS0tLS0tLS0tLXwtLS0tLS0tLS0tLS0tLS0tLS0tLQp8IEphbiAyMDIwCXwgMzU0OTguOTAJICAgICAgICAgfCAzNDYxNi40OAkgICAgICAgICAgIHwgMzYzODEuMzIJCnwgRmViIDIwMjAJfCAzNDIwMi4xNwkgICAgICAgICB8IDMzMTU1LjI4CSAgICAgICAgICAgfCAzNTI0OS4wNQkKfCBNYXIgMjAyMAl8IDM2NzAzLjAxCSAgICAgICAgIHwgMzU1OTYuMTAJICAgICAgICAgICB8IDM3ODA5LjkyCQp8IEFwciAyMDIwCXwgMzYyNzEuOTAJICAgICAgICAgfCAzNTE0MS40NAkgICAgICAgICAgIHwgMzc0MDIuMzYJCnwgTWF5IDIwMjAJfCAzNzEyMS45OAkgICAgICAgICB8IDM1OTgyLjA3CSAgICAgICAgICAgfCAzODI2MS45MAkKfCBKdW4gMjAyMAl8IDM3MTAyLjY1CSAgICAgICAgIHwgMzU5NTguOTAJICAgICAgICAgICB8IDM4MjQ2LjQwCQp8IEp1bCAyMDIwCXwgMzcxNTEuMDQJICAgICAgICAgfCAzNjAwNS43MwkgICAgICAgICAgIHwgMzgyOTYuMzQJCnwgQXVnIDIwMjAJfCAzODU2NC42NAkgICAgICAgICB8IDM3NDE4LjcwCSAgICAgICAgICAgfCAzOTcxMC41OAkKfCBTZXAgMjAyMAl8IDM4NzU1LjIyCSAgICAgICAgIHwgMzc2MDkuMDMJICAgICAgICAgICB8IDM5OTAxLjQyCQp8IE9jdCAyMDIwCXwgMzk3NzkuMDIJICAgICAgICAgfCAzODYzMi43MgkgICAgICAgICAgIHwgNDA5MjUuMzIJCgpgYGB7cn0KIyBVbmEgcmVjb21lbmRhY2nDs24gcGFyYSBsYSBlbXByZXNhIHBvZHLDrWEgc2VyIHByZXBhcmFyc2UgcGFyYSB1biBjcmVjaW1laW50byBkZSB2ZW50YXMgZW4gZWwgcHLDs3hpbW8gYcOxbywgZGUgdGFsIGZvcm1hIHF1ZSBzZSBpbnZpZXJ0YSBlbiBtZWpvcmFyIGxhIG1hcXVpbmFyaWEsIGF1bWVudGFyIG8gY2FwYWNpdGFyIG1lam9yIGFsIHBlcnNvbmFsIHkgYXPDrSB0ZW5lciBsYXMgaGVycmFtZWludGFzIG5lY2VzYXJpYXMgcGFyYSBlbGV2YXIgbGEgcHJvZHVjY2nDs24gCmBgYAoKYGBge3IgbWVzc2FnZT1GQUxTRSwgd2FybmluZz1GQUxTRX0KdmVudGFzX3Bvcl9hw7FvIDwtIHJlYWQuY3N2KCJ+L0Rvd25sb2Fkcy9SIGRhdGFiYXNlcyAvdmVudGFzX3Bvcl9hbmlvLmNzdiIpCmdncGxvdCh2ZW50YXNfcG9yX2HDsW8sIGFlcyh4PW1lcywgeT0gdmVudGFzLCBjb2w9YXMuZmFjdG9yKGFuaW8pLApjb2wgPSBhcy5mYWN0b3IoYW5pbyksIGdyb3VwID0gYW5pbykpICsgCiAgZ2VvbV9saW5lKCkgKwogIGxhYnMgKHRpdGxlID0gIlZlbnRhcyBkZSBsZWNoZSBzYWJvcml6YWRhIEhlcnNoZXnCtHMgcG9yIGHDsW8iLCB4ID0gIk1lcyIsIHkgPSAiTWlsZXMgZGUgZMOzbGFyZXMiKQpgYGAKCmBgYHtyfQojIE90cmEgZGUgbnVlc3RyYXMgcmVjb21lbmRhY2lvbmVzIHNlcsOtYSByZWFsaXphciBjYW1wYcOxYXMgcHVibGljaXRhcmlhcyBwYXJhIGF1bWVudGFyIGVsIGNvbnN1bW8gZGUgbGVjaGUgc2Fib3JpemFkYSBIZXJzaGV5wrRzIGVuIGVsIHByaW1lciBzZW1lc3RyZSBkZWwgYcOxbyAKYGBgCgoK

Act2_SeriesdeTiempo

Andrea Ortiz

2025-02-17

Ejercicio en clase: población

Instalar paquetes y llamar librerías

Importar la base de datos

Análisis descriptivo

Serie de tiempo en Texas

Ejercicio en clase Lunes 17: Mapa

Instrucciones

Código

Actividad 2: Caso Hershey

Importar la base de datos

Modelo ARIMA

Modelo Regresión Lineal

Recomendaciones