Última actualización: 01/04/2023

1. Naturaleza del análisis de regresión

Ejercicio 1.1

La siguiente tabla (ipc) proporciona datos sobre el índice de precios al consumidor de siete países industrializados, cuya base es 1982-1984 = 100.

a) A partir de estos datos, calcule la tasa de inflación en cada país.

> library(dplyr)
> growth_rate <- function(x) (round((((x / lag(x, 1)) - 1) * 100), 4))[-1,]
> # equivalente: function(x) (round(((x - lag(x, 1)) /lag(x, 1)) * 100), 4)[-1,]
> tasaInflacion <- growth_rate(ipc[, 2:8])
> Year <- seq(from = 1974, to = 1997)
> tasaInflacion <- data.frame(Year, tasaInflacion)

b) Grafique la tasa de inflación de cada nación en función del tiempo (es decir, asigne el eje horizontal al tiempo, y el vertical, a la tasa de inflación).

Alternativa 1

> library(reshape2)
> data_long <- melt(tasaInflacion, id.vars = "Year")
> library(ggplot2)
> ggplot(data_long, aes(x = Year, y = value, col = variable)) +
+   geom_point() +
+   geom_line() +
+   xlab("Año") + 
+   ylab("Tasa de inflación") +
+   labs(color = "País") +
+   scale_x_continuous(limits = c(1974, 1997),
+                      breaks = seq(1974, 1997, by = 2))

Alternativa 2

> (tasaInflacion_ts <- ts(tasaInflacion[-1], start = 1974, end = 1997))
Time Series:
Start = 1974 
End = 1997 
Frequency = 1 
      Canada  France Germany   Italy   Japan      UK      US
1974 10.7843 13.5838  6.8471 19.4175 23.1733 15.7706 11.0360
1975 10.8407 11.7048  5.9613 17.0732 11.6949 24.4582  9.1278
1976  7.5848  9.5672  4.3601 16.6667  9.5599 16.4179  5.7621
1977  7.7922  9.5634  3.6388 19.3452  8.1717 15.8120  6.5026
1978  8.9501  9.1082  2.7308 12.4688  4.2254  8.3026  7.5908
1979  9.3207 10.6087  4.0506 15.5211  3.6855 13.4583 11.3497
1980  9.9711 13.6792  5.4745 21.3052  7.7014 17.8679 13.4986
1981 12.4836 13.2780  6.3437 19.3038  4.8405 11.9745 10.3155
1982 10.8645 11.9658  5.3145 16.3130  2.9381  8.5324  6.1606
1983  5.7956  9.4875  3.2956 14.9373  1.7329  4.6122  3.2124
1984  4.2829  7.6693  2.3928 10.6151  2.3046  5.0100  4.3173
1985  4.1070  5.8279  2.0448  8.6099  1.9589  6.0115  3.5611
1986  4.1284  2.5350 -0.0954  6.1107  0.6724  3.4203  1.8587
1987  4.3172  3.2396  0.1910  4.5914  0.0000  4.1775  3.6496
1988  4.0541  2.7250  1.3346  4.9851  0.7634  4.9290  4.1373
1989  4.9513  3.4566  2.7281  6.5911  2.3674  7.7229  4.8183
1990  4.7951  3.3411  2.7473  6.1170  3.0527  9.5344  5.4032
1991  5.6089  3.1579  3.6542  6.3910  3.2316  5.8704  4.2081
1992  1.5374  2.4052  4.9871  5.3004  1.6522  3.6966  3.0103
1993  1.7894  2.1352  4.5045  4.2506  1.2831  1.5980  2.9936
1994  0.2028  1.6028  2.7429  3.9163  0.7601  2.4803  2.5606
1995  2.1592  1.7833  1.8307  5.3691 -0.1676  3.3648  2.8340
1996  1.5852  2.0216  1.4981  3.8707  0.1679  2.4557  2.9528
1997  1.6255  1.1889  1.6974  1.7453  1.6764  3.1215  2.2945
> library(ggfortify)
> autoplot(tasaInflacion_ts, facets = FALSE, xlab = "Año", ylab = "Tasa de inflación")

c) ¿Qué conclusiones generales pueden deducirse respecto a la inflación en los siete países?

Como se puede observar en la figura, la tasa de inflación de cada país generalmente ha declinado con el paso del tiempo.

d) ¿Qué país al parecer tiene la tasa de inflación más variable?, ¿puede darse una explicación para esto?

Como medida de variabilidad, podemos usar la desviación estándar. Estas desviaciones estándar son:

> sapply(tasaInflacion[, 2:8], sd)
  Canada   France  Germany    Italy    Japan       UK       US 
3.590102 4.468087 1.871857 6.295856 5.130747 6.063977 3.277632 

De esta manera, la tasa de inflación más variable pertenece a Italia, la menos variable a Alemania.

Ejercicio 1.2

a) Grafique la tasa de inflación para Canadá, Francia, Alemania, Italia, Japón y Gran Bretaña, contra la de Estados Unidos.

> plot(tasaInflacion$US, tasaInflacion$Canada, col = 2, pch = 0, 
+      xlab="Inflación Estados Unidos (%)", 
+      ylab="Inflación resto de países (%)", 
+      xlim = c(1, 15), 
+      ylim = c(-1, 25))
> points(tasaInflacion$US, tasaInflacion$France, col = 3, pch = 1)
> points(tasaInflacion$US, tasaInflacion$Germany,  col = 4, pch = 2)
> points(tasaInflacion$US, tasaInflacion$Italy, col = 5, pch = 3)
> points(tasaInflacion$US, tasaInflacion$Japan, col = 6, pch = 4)
> points(tasaInflacion$US, tasaInflacion$UK, col = 7, pch = 5)

b) Comente en términos generales el comportamiento de la tasa de inflación de los seis países, en comparación con la de Estados Unidos.

Como se observa en el gráfico, las tasas de inflación de los seis países están positivamente correlacionadas con la tasa de inflación de Estados Unidos.

c) Si descubre que la tasa de inflación de esos seis países se mueven en la misma dirección que la de Estados Unidos, ¿esto sugeriría que la inflación en Estados Unidos «provoca» la inflación en las demás naciones?, ¿por qué sí, o por qué no?.

Recuerda que correlación no implica causación. Se debería consultar un libro de macroeconomía internacional para encontrar si existe alguna conexión causal entre las tasas de inflación de los Estados Unidos y la de los otros seis países.

2. Análisis de regresión con dos variables

Ejercicio 2.15

En la tabla 2.8 (table28) se proporcionan los datos sobre gasto en comida y gasto total (dados en rupias), para una muestra de 55 familias rurales de India.(A principios del año 2000, un dólar estadounidense equivalía a casi 40 rupias indias).

a) Grafique los datos utilizando el eje vertical para el gasto en comida y el eje horizontal para el gasto total; trace una recta de regresión a través de los puntos de dispersión.

> model28 <- lm(table28$FOODEXP~table28$TOTALEXP)
> ggplot(table28, aes(x=TOTALEXP, y=FOODEXP)) +
+   geom_point(shape=1) +
+   geom_abline(intercept = coef(model28)[1], slope = coef(model28)[2], col='red')

b) ¿Qué conclusiones generales se pueden deducir a partir de este ejemplo?

A medida que aumenta el gasto total, en promedio, el gasto en alimentos también aumenta.

c) Diga a priori si se esperaría que el gasto en comida se incrementaría de manera lineal conforme el gasto total aumentase, independientemente del nivel de gasto? ¿Por qué sí o por qué no? Se puede emplear el gasto total como representante del ingreso total.

No esperaríamos que el gasto en alimentos aumentara linealmente (es decir, en línea recta) para siempre. Una vez cubiertas las necesidades básicas satisfechas, la gente gastará relativamente menos en alimentos ya que sus ingresos aumentan, es decir, a niveles más altos de ingresos, los consumidores tendrán más ingresos discrecionales. Hay alguna evidencia de esto en el diagrama de dispersión.