Análisis de indicadores económicos
En este reporte se analizan variables económicas que influyen en el
PIB de los Estados Unidos desde el año del 1967. Las principales
variables serían: el desempleo, la tasa de ahorro, y el gasto en el
consumo personal. Se busca investigar el comportamiento de estos
indicadores a través de los años.
Como primer paso, se cargaron las siguientes paqueterías:
ggplot2, dplyr, y
tidyr.
library(ggplot2)
library(dplyr)
library(tidyr)
Para esta tarea, se utlizó el dataset “economics”,
el cual le pertenece a la paqueteria de ggplot2. Aquí
se encuentran varios datos relacionados al enfoque del análisis.
data("economics")
head(economics)
## # A tibble: 6 × 6
## date pce pop psavert uempmed unemploy
## <date> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1967-07-01 507. 198712 12.6 4.5 2944
## 2 1967-08-01 510. 198911 12.6 4.7 2945
## 3 1967-09-01 516. 199113 11.9 4.6 2958
## 4 1967-10-01 512. 199311 12.9 4.9 3143
## 5 1967-11-01 517. 199498 12.8 4.7 3066
## 6 1967-12-01 525. 199657 11.8 4.8 3018
Se utilizó la función de head()
para inspeccionar la
estructura de los datos. Aparecen 6 columnas, las cuales son: 1. date,
2. pce, 3. pop, 4. psavert, 5. uempmed, y 6. unemploy.
GGPLOT 1
Ahora se estará presentando la primera gráfica utilizando
ggplot.
ggplot(economics, aes(x=date, y=unemploy)) +
geom_line(color = "purple") +
labs(title = "Unemployment in EE.UU. (1967-)", x = "Date", y = "Number of unemployed")

En esta gráfica se muestran los ciclos económicos de Estados Unidos
en base al desempleo. Se pueden aprecias periodos de crecimiento y
periodos de crisis desde el 1967 hasta el presente. Durante los años 70
y principio de los 80 el desempleo creció significativamente, tuvo un
pico de un poco más de 12 millonespersonas. En los años 90 se redujo y
vuelve a crecer la cantidad de personas desempleadas para la crisis
económica del 2008, llegando a su punto más alto en el 2010. Más de 14
millones personas estaban desempleadas. En resumen, este gráfico
evidencia cómo los cambios en la economía han afectado el nivel de
desempleo en Estados Unidos.
GGPLOT 2
Ahora se estará presentando la segunda gráfica utilizando
ggplot.
ggplot(economics, aes(x = pce, y = psavert)) +
geom_point(alpha = 0.6) +
geom_smooth(method = "lm", color = "blue") +
labs(title = "Relationship between spending and the savings rate", x = "Spending on personal consumption", y = "Savings rate")

En esta ocasión tenemos un diagrama de dispersión en el que cada uno
de los puntos negros representan una observación y la línea azul es una
recta de regresión lineal que muestra la tendencia entre ambas variables
o su relación. Vemos la relación entre el gasto en consumo personal que
se encuentra en el eje de x y la tasa de ahorro que se encuentra en el
eje de y. Al igual que en la gráfica anterior, estos datos son solamente
de Estados Unidos. Podemos decir que esta gráfica muestra una relación
negativa y nos dice lo siguiente; a medida que aumenta el gasto en
consumo personal, la tasa de ahorro tiende a disminuir. De cierta manera
podemos llegar a la conclusión de que los hogares cuando destinan más
dinero o recursos al consumo, tienen la tendencia de ahorrar menos.
MODELO DE REGRESION LINEAL
Por último, se estará presentando un modelo de regresión lineal
model <- lm(psavert ~ pce + unemploy + uempmed, data = economics)
summary(model)
##
## Call:
## lm(formula = psavert ~ pce + unemploy + uempmed, data = economics)
##
## Residuals:
## Min 1Q Median 3Q Max
## -5.1101 -0.9785 -0.1965 0.8394 6.0349
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.064e+01 1.926e-01 55.240 < 2e-16 ***
## pce -9.895e-04 2.432e-05 -40.684 < 2e-16 ***
## unemploy -2.179e-04 4.549e-05 -4.789 2.14e-06 ***
## uempmed 5.102e-01 3.362e-02 15.174 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.42 on 570 degrees of freedom
## Multiple R-squared: 0.7717, Adjusted R-squared: 0.7705
## F-statistic: 642.1 on 3 and 570 DF, p-value: < 2.2e-16
En este modelo es regresión lineal múltiple, tenemos como variable
dependiente la tasa de ahorro o psavert y como variables independientes
tenemos gasto en consumo personal o pce, número de desempleados o
unemploy y duración media del desempleo o uempmed. Comenzando con el
intercepto, cuando todas las variables son 0, la tasa de ahorro esperada
es aproximadamente de 10.6. Cada una de las variables tiene un efecto,
sea negativo como positivo en la tasa de ahorro. El gasto en consumo
personal tiene un efecto negativo y altamente significativo, mientras
más se consume, menos se ahorra. El desempleo también tiene un efecto
negativo y significativo, cuando aumenta el desempleo, la tasa de ahorro
disminuye. Por otro lado, la duración media del desempleo tiene un
efecto positivo y significativo, este se puede interpretar o sugiere que
cuando tenemos un periodo de desempleo largo, las personas tienden a
ahorrar más. Cabe destacar que el adjusted R-squared nos deja saber que
este modelo explica el 77% de la variabilidad en la tasa de ahorro.
En base a los tres modelos que se trabajaron, pudimos observar cómo
las variables económicas interactúan entre sí mismas y se relacionan las
unas con las otras. Especialmente vimos cómo afectan el comportamiento
de los hogares en Estados Unidos ante situaciones económicas. En la
primera gráfica se mostró la evolución del desempleo desde 1967 y se
aprecian ciclos en los que Estados Unidos entra en crisis y vuelve a
recuperarse. La segunda gráfica, vimos un diagrama de disperción que
muestra una relación negativa entre el consumo personal y la tasa de
ahorro, es decir que mientras más se gasta en consumo menos ahorra una
persona o un hogar en Estados Unidos. La tercera y última gráfica
confirma las tendencias que se observaron en las primeras dos. Entre
todas las gráficas se puede llegar a la conclusión de que el mercado
laboral, las decisiones de consumo y la capacidad de ahorro tienen una
fuerte conexión en Estados Unidos.