Curso Libre - Análisis y Manipulación de datos con Tidyverse Unidad de Informática - Facultad de Ciencias Económicas Universidad Nacional de Colombia
Cargue los paquetes readr y tidyr en R
rm(list = ls())
# Cargar los paquetes
pacman::p_load(
readr,
tidyr)
Importe el archivo previamente mencionado con alguna función del paquete readr. En la misma función de importación, nombre las columnas de la siguiente manera: Ciudad, Prefijo_país, País, Prefijo_ciudad, Población_2023, Población_2024.
datos=read.csv("global_population_growth.csv",col.names=c("Ciudad", "Prefijo_país","País","Prefijo_ciudad","Población_2023","Población_2024"))
Use el paquete tidyr para unir la columna Ciudad con la columna Prefijo ciudad separadas por un slash (/) y guárdela en una nueva columna llamada Ciudad final. Al final, obtendrá una tabla en R como la siguiente
unir_ciudad_final= unite(datos,
Ciudad,
Prefijo_ciudad,
col="Ciudad_final",
sep="/");View(unir_ciudad_final)
Use el paquete tidyr para unir la columna País con la columna Prefijo país separadas por un asterisco (*) y guárdela en una nueva columna llamada País final.
unir_país_final= unite(unir_ciudad_final,
País,
Prefijo_país,
col="País_final",
sep = "*");View(unir_país_final)
Use el paquete tidyr para transformar la estructura de los datos a formato long, tomando como columnas identificadoras País final y Ciudad final. La columna que contendrá el nombre de las variables se llamará Variables población y la columna que contendrá los valores se llamará Métrica.
datos_longer=pivot_longer(unir_país_final,
cols = 3:4,
names_to = "Variables_población",
values_to = "Métrica");View(datos_longer)
Use el paquete tidyr para separar la columna Variables población en dos: Variable y Año.
datos_longer_sep=separate(datos_longer,
Variables_población,
sep = "_",
into = c("variable","año"));view(datos_longer_sep)
Use el paquete tidyr para transformar la estructura de los datos a formato wide, tomando como variables identificadoras las columnas País y Año. Los valores que pasarán a columna será la columna Variable, la columna con los valores es Métrica y aplique la función de agregación suma para sumar los valores a través de los años.
datos_wider=pivot_wider(datos_longer_sep,
id_cols = c("País_final","año"),
names_from = "variable",
values_from="Métrica",
values_fn=sum);view(datos_wider)