## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Descripción de los datos

El conjunto de datos economics se generó a partir de series temporales económicas de EE. UU.

La fuente de los datos en este caso se llama FRED. FRED es una base de datos en línea que contiene cientos de miles de series temporales de datos económicos provenientes de numerosas fuentes nacionales, internacionales, públicas y privadas.

Las distintas fuentes de datos que podemos encontrar dentro de nuestros data frames incluyen: Oficina de análisis económico de EE. UU., Oficina del censo de los Estados Unidos y Oficina de Estadísticas Laborales de EE. UU.

Las distintas variables del data frame tienen fecha de recopilación de 1948, 1959, 1967, etc. En este caso, la variable PCE tiene una frecuencia de actualización mensual (la próxima actua- lización se realizará el 30 de abril del 2026). Con registros desde 1959 y la siguiente sugerencia de citación:

PIB (tercera estimación), sectores, beneficios empresariales, PIB estatal e ingresos personales estatales, cuarto trimestre y año 2025. El producto interno bruto (PIB) real aumentó a una tasa anual del 0,5 por ciento en el cuarto trimestre de 2025 (octubre, noviembre y diciembre), según la tercera estimación publicada hoy por la Oficina de Análisis Económico de EE. UU.

Plantilla de tabla resumen:

Variable	Descripción
date	Mes del registro.Tipo fecha (variable continua)
——–	————————–
pce	Gastos de consumo personal (en billones de dólares). Tipo numérico (variable continua)
——–	————————–
pop	Población total (en miles). Tipo numérico (variable continua).
——–	————————–
psavert	Tasa de ahorro personal. Tipo numérico (variable continua).
——–	————————–
uempmed	Duración media de desempleo (en semanas). Tipo numérico (variable continua).
——–	————————–
unemploy	Número de desempleados (en miles). Tipo numérico (variable continua).

Visualizaciones de datos

# Escriba el código R aquí para cargar su archivo de datos
library(ggplot2);
library(magrittr);
library(dplyr);

# Escriba el código R aquí para crear su primer gráfico
ggplot(economics, aes(x = pop, y = unemploy)) +
  geom_point(color = "blue", alpha = 0.6) +
  labs(
    title = "Relación entre población y desempleo",
    x = "Población",
    y = "Número de desempleados"
  ) +
  theme_minimal();

Escriba aquí una descripción e interpretación de su primer gráfico. La gráfica muestra la relación que existe entre la población y el número de desempleo. Observando la gráfica podemos observar una tendencia “creciente”, a medida que la población aumenta, el número de desempleados también tiende a incrementarse.

Sin embargo, podemos observar que la relación entre la población y el desempleo no es lineal. Esto puede deverse a los ciclos económicos que existen (recesión y crecimiento económico).

# Escriba el código R aquí para crear su segundo gráfico
economics <- economics %>%
  mutate(
    ahorro_categoria = case_when(
      psavert < 5 ~ "Bajo",
      psavert >= 5 & psavert < 10 ~ "Medio",
      psavert >= 10 ~ "Alto"
    )
  );

ggplot(economics, aes(x = psavert, fill = ahorro_categoria)) +
  geom_histogram(
    color = "black",
    alpha = 0.7,
    bins = 30
  ) +
  facet_wrap(~ ahorro_categoria) +
  labs(
    title = "Distribución de la tasa de ahorro por categoría",
    x = "Tasa de ahorro personal (%)",
    y = "Frecuencia",
    fill = "Categoría"
  ) +
  theme_minimal()

Escriba aquí una descripción e interpretación de su segundo gráfico.

Para esta gráfica lo que se realizó primero fue categorizar psavert (tasa de ahorro personal). Categorizando: bajo, medio y alto. Esto para poder observar cómo es que se distribuyen los valores de ahorro dentro de cada categoría.

La categoría media es la que tiene la mayor cantidad de observaciones, esto nos indica que la tasa de ahorro personal suele ubicarse con mayor frecuencia en valores intermedios (de 5 a 10). La categoría baja muestra valores más cercanos entre sí (de 2 a 5), mientras que la categoría alta presenta valores de 10 a 15 con algunos valores más extremos.

Observando el histograma podemos entender que las observaciones realizadas indican un mayor incremento en la tasa de ahorro cuando se encuentra en rangos medios.

Proyecto: Resumen del dataset economics del paquete ggplot2

Leví Hernández

28/04/2026

Descripción de los datos

Visualizaciones de datos