Lista de Ejercicios

1.

Realice el siguiente análisis exploratorio de series de tiempo en R utilizando los datos de producción de chocolate o de cerveza de https.

datos <- read.table("C:/Users/Javier Escobar/Downloads/cbe.dat", header = TRUE)

a) Gráfica temporal y análisis estacional

head(datos)

##   choc beer elec
## 1 1451 96.3 1497
## 2 2037 84.4 1463
## 3 2477 91.2 1648
## 4 2785 81.9 1595
## 5 2994 80.5 1777
## 6 2681 70.4 1824

dim(datos)

## [1] 396   3

La base de datos cbe.dat contiene tres series temporales mensuales correspondientes a la oferta de tres productos esenciales en Australia: electricidad, cerveza y productos a base de chocolate. Estos datos fueron recopilados por el Australian Bureau of Statistics (ABS) y abarcan el período comprendido entre enero de 1958 y diciembre de 1990, es decir, un total de 396 observaciones mensuales para cada variable.

Las variables incluidas son:

elec: Suministro mensual de electricidad, medido en millones de kilovatios-hora (kWh).

beer: Producción mensual de cerveza, expresada en litros por persona adulta.

choc: Producción mensual de productos a base de chocolate, medida en toneladas métricas.

Estas series han sido ampliamente utilizadas en literatura estadística y textos de series de tiempo, ya que presentan características típicas como tendencias a largo plazo, patrones estacionales bien definidos y variabilidad interanual, lo cual las convierte en ejemplos ideales para ilustrar técnicas de análisis exploratorio y modelado en series temporal

summary(datos)

##       choc           beer            elec      
##  Min.   :1066   Min.   : 69.2   Min.   : 1463  
##  1st Qu.:3460   1st Qu.:113.7   1st Qu.: 3239  
##  Median :4579   Median :140.6   Median : 5891  
##  Mean   :4685   Mean   :137.6   Mean   : 6312  
##  3rd Qu.:5735   3rd Qu.:159.7   3rd Qu.: 8820  
##  Max.   :9558   Max.   :217.8   Max.   :14338

sapply(datos, sd)

##       choc       beer       elec 
## 1771.23918   33.58404 3382.86753

par(mfrow = c(1, 3))  # 1 fila, 3 columnas
# Histogramas
hist(datos$choc, main = "Chocolate", col = "chocolate", xlab = "Toneladas")
hist(datos$beer, main = "Cerveza", col = "goldenrod", xlab = "Litros por adulto")
hist(datos$elec, main = "Electricidad", col = "skyblue", xlab = "Millones de kWh")

# Restaurar la configuración gráfica por defecto
par(mfrow = c(1, 1))

En el análisis descriptivo de las tres series temporales (electricidad, cerveza y chocolate), se observan las siguientes características principales:

La serie correspondiente al suministro de electricidad muestra la mayor amplitud en cuanto a valores, con un mínimo de 1463 millones de kWh y un máximo de 14338 millones de kWh. La media de la serie es de 6312 millones de kWh, lo que indica un promedio alto de suministro. Sin embargo, la desviación estándar de 3382.87 es la más alta entre las tres series, lo que sugiere una considerable variabilidad en la oferta de electricidad durante el período analizado. Los histogramas muestran una distribución asimétrica, con un sesgo hacia los valores más altos, lo que podría estar relacionado con cambios en la demanda o patrones estacionales de consumo.

La producción de cerveza varía entre 69.2 litros por adulto y 217.8 litros por adulto, con una media de 137.6 litros por adulto. La desviación estándar de 33.58 es relativamente baja en comparación con la electricidad, lo que indica que la producción de cerveza muestra menos fluctuaciones y una variabilidad más estable a lo largo del tiempo. El histograma de esta serie sugiere una distribución aproximadamente simétrica, lo que refleja una producción de cerveza menos afectada por cambios extremos o patrones estacionales, a diferencia de las otras dos variables.

Por último, la serie de producción de chocolate muestra valores que oscilan entre 1066 toneladas y 9558 toneladas, con una media de 4685 toneladas métricas. La desviación estándar de 1771.24 indica una variabilidad notable, aunque inferior a la observada en la electricidad. El histograma de la serie de chocolate es asimétrico, con una ligera inclinación hacia los valores más altos, lo que sugiere que en algunos períodos del año hubo una mayor producción de chocolate. Este patrón podría estar influenciado por factores estacionales o la variabilidad en la demanda de productos derivados del cacao.

En resumen, la serie de electricidad muestra la mayor variabilidad y los valores más altos en términos absolutos, lo que podría reflejar fluctuaciones más amplias en la demanda de electricidad. La producción de cerveza presenta una variabilidad más baja y una distribución bastante uniforme, mientras que la producción de chocolate muestra una variabilidad interanual considerable y ciertos sesgos hacia producciones más altas en determinados meses.

Produce un gráfico temporal de los datos.

Para visualizar la evolución de las variables a lo largo del tiempo, se construyen gráficos temporales de las series mensuales de producción de cerveza y chocolate. Estos gráficos permiten identificar tendencias, estacionalidades y posibles anomalías en los datos entre los años 1958 y 1990.

# Crear las series de tiempo
beer.ts <- ts(datos$beer, start = c(1958, 1), frequency = 12)
choc.ts <- ts(datos$choc, start = c(1958, 1), frequency = 12)
plot(cbind(beer.ts, choc.ts), 
     main="Produccion mensual de Cerveza y Chocolate (1958-1990)")

Grafique la serie anual agregada.

Con el objetivo de observar la evolución anual total de la producción, se agregaron los datos mensuales sumando los valores correspondientes a cada año. El gráfico resultante permite identificar tendencias generales a lo largo del periodo 1958–1990. Se observa que la producción de cerveza y chocolate presenta variaciones importantes año a año, aunque ambas mantienen comportamientos relativamente estables con leves tendencias al alza en ciertos periodos.

# Series mensuales
beer.ts <- ts(datos$beer, start = c(1958, 1), frequency = 12)
choc.ts <- ts(datos$choc, start = c(1958, 1), frequency = 12)

# Agregación anual (suma de los 12 meses por año)
beer.anual <- aggregate(beer.ts, nfrequency = 1, FUN = sum)
choc.anual <- aggregate(choc.ts, nfrequency = 1, FUN = sum)

plot(cbind(beer.anual, choc.anual), 
     main="Produccion Anual Agregada de Cerveza y Chocolate (1958-1990)")

Cree un diagrama de caja que resuma los valores observados para cada temporada.

Para explorar la estacionalidad de las series, se construyeron diagramas de caja (boxplots) agrupando los datos por mes. Esta visualización permite identificar patrones recurrentes a lo largo del año, como incrementos o caídas sistemáticas en ciertos periodos.

En el caso de la producción de cerveza, se observa una clara estacionalidad con mayores valores en los meses cálidos, mientras que la producción de chocolate presenta patrones distintos, posiblemente asociados a otras dinámicas de consumo.

beer.ts <- ts(datos$beer, start = c(1958, 1), frequency = 12)
choc.ts <- ts(datos$choc, start = c(1958, 1), frequency = 12)

par(mfrow = c(1, 2))

boxplot(beer.ts ~ cycle(beer.ts),
        main = "Estacionalidad de la Cerveza",
        xlab = "Mes", ylab = "Litros por adulto",
        col = "goldenrod")

boxplot(choc.ts ~ cycle(choc.ts),
        main = "Estacionalidad del Chocolate",
        xlab = "Mes", ylab = "Toneladas",
        col = "chocolate")

Los diagramas de caja permiten observar claramente los patrones estacionales en las series de producción de cerveza y chocolate. En el caso de la cerveza, se evidencia una fuerte estacionalidad: los meses más cálidos del año (particularmente junio a agosto y diciembre) presentan una mayor mediana de producción, lo cual sugiere un aumento del consumo en épocas veraniegas y festivas. Por el contrario, entre los meses de abril y julio se observa una disminución en la mediana, indicando una baja estacional en la demanda.

En cuanto al chocolate, la estacionalidad es menos pronunciada, aunque también observable. Los meses iniciales del año (especialmente enero y febrero) presentan una menor producción promedio, mientras que entre marzo y julio se alcanzan los valores más altos, posiblemente relacionados con celebraciones o clima templado que favorece su consumo. Además, se aprecian varios valores atípicos (outliers) en la serie de chocolate, lo cual indica que en ciertos años hubo meses con una producción significativamente mayor o menor respecto al patrón típico mensual.

b) Descomposición de series de tiempo

Con el fin de analizar en mayor profundidad el comportamiento de las series, se procede a descomponer cada una en sus componentes fundamentales: tendencia (cambios a largo plazo), estacionalidad (patrones repetitivos anuales) y residuos (componente aleatorio o irregular). Esto permite entender qué parte del comportamiento observado se debe a fluctuaciones sistemáticas y cuál es atribuible a variaciones aleatorias.

Descomponer la serie en sus componentes: tendencia, efecto estacional y residuos.

# Descomposición clásica aditiva
beer.decomp_A <- decompose(beer.ts, type="a")
choc.decomp_A <- decompose(choc.ts, type="a")

beer.decomp_M <- decompose(beer.ts, type="m")
choc.decomp_M <- decompose(choc.ts, type="m")

Al descomponer la serie de producción mensual de cerveza, se observa una clara tendencia creciente a lo largo de los años, acompañada de un patrón estacional muy definido: la producción tiende a incrementarse en los meses cálidos y festivos, como diciembre y verano. Por su parte, los residuos muestran cierta variabilidad aleatoria sin una estructura clara, lo que sugiere que gran parte del comportamiento se explica por la tendencia y la estacionalidad.

En la serie de chocolate, también se identifica una tendencia general creciente, aunque con menor intensidad que en la cerveza. La componente estacional presenta una pauta repetitiva anual, con mayores niveles de producción en los meses intermedios del año. Al igual que en la cerveza, los residuos no presentan un patrón visible, aunque muestran mayor dispersión en ciertos años.

Gráficar la serie descompuesta.

# Gráficos de descomposición
plot(beer.decomp_A)

plot(beer.decomp_M)

plot(choc.decomp_A)

plot(choc.decomp_M)

Generar un gráfico de la tendencia con un efecto estacional superpuesto.

# Descomposición clásica aditiva
beer.decomp <- decompose(beer.ts)
choc.decomp <- decompose(choc.ts)
# Graficar tendencia + estacionalidad superpuesta para la cerveza
trend_beer <- beer.decomp$trend
seasonal_beer <- beer.decomp$seasonal
# Repetir para chocolate
trend_choc <- choc.decomp$trend
seasonal_choc <- choc.decomp$seasonal

# Ajustar márgenes para permitir leyenda fuera del gráfico
par(mar = c(5, 4, 4, 2) + 0.1, oma = c(4, 0, 0, 0))  # oma: espacio para la leyenda

# Gráfico de cerveza
ts.plot(trend_beer, col = "blue", ylab = "Litros por adulto", main = "Tendencia y Estacionalidad - Cerveza",  ylim = c(60, 230))
lines(trend_beer + seasonal_beer, col = "orange")

# Leyenda debajo
legend("bottom", inset = 1, xpd = TRUE, horiz = TRUE,
       legend = c("Tendencia", "Tendencia + Estacionalidad"),
       col = c("blue", "orange"), lty = 1, bty = "n")

# Nuevo gráfico para chocolate
par(mar = c(5, 4, 4, 2) + 0.1, oma = c(4, 0, 0, 0))

ts.plot(trend_choc, col = "brown", ylab = "Toneladas", main = "Tendencia y Estacionalidad - Chocolate",  ylim = c(1000, 9000))
lines(trend_choc + seasonal_choc, col = "darkgreen")

legend("bottom", inset = 1, xpd = TRUE, horiz = TRUE,
       legend = c("Tendencia", "Tendencia + Estacionalidad"),
       col = c("brown", "darkgreen"), lty = 1, bty = "n")

Ambos productos presentan estacionalidad, pero mientras la cerveza muestra una tendencia de crecimiento más consistente y estacionalidad más marcada hacia el final del año (posiblemente asociada a festividades), el chocolate tiene una evolución más variable con patrones estacionales distribuidos a lo largo del año.

Índice de Precios de Laspeyres

En este ejercicio se calcula el índice de precios de Laspeyres del año 2004 con respecto al año 2000, utilizando una canasta de bienes relacionada con los costos del transporte.

Fórmula

\[ LI_{2004} = \frac{\sum (q_{i,2000} \cdot p_{i,2004})}{\sum (q_{i,2000} \cdot p_{i,2000})} \]

Donde: - \(q_{i,2000}\): cantidad del bien i en el año base (2000) - \(p_{i,2000}\): precio del bien i en el año base (2000) - \(p_{i,2004}\): precio del bien i en el año actual (2004)

Datos

# Definir los datos como vectores
item <- c("Carro", "Gasolina", "Servicio", "Llantas", "Embrague")
cantidad_2000 <- c(0.33, 2000, 40, 3, 2)
precio_2000 <- c(18000, 0.80, 40, 80, 200)
precio_2004 <- c(20000, 1.60, 60, 120, 360)

# Calcular valor en año base y en año actual usando cantidad del año base
valor_base <- cantidad_2000 * precio_2000
valor_actual <- cantidad_2000 * precio_2004

# Crear data frame resumen
datos <- data.frame(item, cantidad_2000, precio_2000, precio_2004, valor_base, valor_actual)
knitr::kable(datos, digits = 2, caption = "Consumo y Precios en 2000 y 2004")

Consumo y Precios en 2000 y 2004
item	cantidad_2000	precio_2000	precio_2004	valor_base	valor_actual
Carro	0.33	18000.0	20000.0	5940	6600
Gasolina	2000.00	0.8	1.6	1600	3200
Servicio	40.00	40.0	60.0	1600	2400
Llantas	3.00	80.0	120.0	240	360
Embrague	2.00	200.0	360.0	400	720

# Cálculo del índice de precios de Laspeyres
LI_2004 <- sum(valor_actual) / sum(valor_base)
LI_2004

## [1] 1.357873

round((LI_2004 - 1) * 100, 2)

## [1] 35.79

El índice de precios de Laspeyres calculado para el año 2004 respecto al año base 2000 es aproximadamente 1.3579. Esto significa que, manteniendo constante el patrón de consumo del año 2000, el costo total de la canasta de bienes relacionados con el transporte aumentó un 35.79% en 2004.

En otras palabras, si en el año 2000 el gasto para adquirir esta canasta era de 100 unidades monetarias, en 2004 habría sido necesario gastar aproximadamente 135.79 unidades para adquirir exactamente los mismos bienes, lo que evidencia un incremento significativo en los precios de los componentes clave del transporte personal durante ese período.

3.)

El índice de precios de Paasche en el momento t con respecto al año base 0 es:

\[ PIt =\frac{\sum(q_{it}·p_{it})}{\sum (q_{it}·p_{i0})} \]

donde: \(q_{it}\) es la cantidad del bien i en el año \(t\), \(p_{it}\) es el precio del bien \(i\) en el año \(t\), \(p_{i0}\) es el precio del bien i en el año base \((2000)\).

a) Utilice los datos anteriores para calcular el \(PIt\) para 2004 en relación con 2000.

# Datos
item <- c("Carro", "Gasolina", "Servicio", "Llanta", "Clutch")
q_2000 <- c(0.33, 2000, 40, 3, 2)     # Cantidades año base (2000)
p_2000 <- c(18000, 0.80, 40, 80, 200) # Precios año base
q_2004 <- c(0.5, 1500, 20, 2, 1)      # Cantidades año 2004
p_2004 <- c(20000, 1.60, 60, 120, 360)# Precios año 2004

# Numerador del índice de Paasche: sum(q_2004 * p_2004)
numerador_Paasche <- sum(q_2004 * p_2004)

# Denominador del índice de Paasche: sum(q_2004 * p_2000)
denominador_Paasche <- sum(q_2004 * p_2000)

# Cálculo del índice de Paasche
PI_2004 <- numerador_Paasche / denominador_Paasche
PI_2004

## [1] 1.25

# Porcentaje de aumento de precios según el índice de Paasche
round((PI_2004 - 1) * 100, 2)

## [1] 25

El Índice de Precios de Paasche calculado para el año 2004 con respecto al año base 2000 es de 1.25, lo que indica que el costo de la canasta de bienes relacionados con el transporte ha aumentado un 25% durante este período, considerando las cantidades consumidas en el año 2004.

Este índice refleja el cambio en los precios ajustado al patrón de consumo más reciente, lo cual implica que los consumidores, posiblemente, han ajustado sus decisiones de compra para enfrentar los aumentos de precio (por ejemplo, reduciendo el uso de gasolina o adquiriendo menos repuestos), lo que lleva a que el aumento calculado sea más moderado en comparación con otros índices como el de Laspeyres.

b.) Explique por qué la \(PIt\) suele ser menor que la \(LIt\).

El Índice de Paasche (PIt) suele ser menor que el Índice de Laspeyres (LIt) porque utiliza las cantidades consumidas en el año actual (en este caso, 2004), mientras que el LIt se basa en las cantidades del año base (2000).

Cuando los precios aumentan, los consumidores tienden a ajustar su comportamiento de consumo, comprando menos de los bienes que se han encarecido (por ejemplo, menos gasolina o menos mantenimiento). Al considerar esta adaptación, el índice de Paasche refleja una canasta más económica, lo que modera el efecto del aumento de precios.

En cambio, el índice de Laspeyres asume que los consumidores siguen comprando la misma cantidad que en el año base, sin adaptación al cambio de precios, lo que puede sobreestimar el incremento real del costo de vida.

c) Calcule el índice de precios de Irving-Fisher como la media geométrica de LIt y P It. La media geométrica de una muestra de n artículos es la raíz n-ésima de su producto:

\[ GeometricMean = \left ( \prod_{i=1}^{n} x_i \right ) ^{1/n} \]

donde \(x1, x2, . . . , xn\) son los valores de los índices \(LIt\) y \(PIt\).

# Cálculo del Índice de Irving-Fisher como media geométrica
IF_2004 <- sqrt(LI_2004 * PI_2004)
IF_2004

## [1] 1.302821

# Porcentaje de aumento de precios según el índice de Fisher
round((IF_2004 - 1) * 100, 2)

## [1] 30.28

El Índice de precios de Irving-Fisher para el año 2004 respecto al año base 2000 es aproximadamente 1.303, lo que indica un aumento del 30.3% en los costos del automovilismo en ese periodo.

Este índice se considera una medida más precisa del cambio en el costo de vida, ya que combina las ventajas del índice de Laspeyres (que usa cantidades del año base) y del índice de Paasche (que usa cantidades del año actual). Así, el índice de Fisher equilibra la posible sobreestimación del LIt y la subestimación del PIt, ofreciendo una visión más realista del aumento de precios.