Importación de datos y tidyr

Curso Libre - Análisis y Manipulación de datos con Tidyverse Unidad de Informática - Facultad de Ciencias Económicas Universidad Nacional de Colombia

punto 1

Cargue los paquetes readr y tidyr en R

rm(list = ls())

# Cargar los paquetes 
pacman::p_load(
  readr,
  tidyr)

punto 2

Importe el archivo previamente mencionado con alguna función del paquete readr. En la misma función de importación, nombre las columnas de la siguiente manera: Ciudad, Prefijo_país, País, Prefijo_ciudad, Población_2023, Población_2024.

datos=read.csv("global_population_growth.csv",col.names=c("Ciudad", "Prefijo_país","País","Prefijo_ciudad","Población_2023","Población_2024"))

punto 3

Use el paquete tidyr para unir la columna Ciudad con la columna Prefijo ciudad separadas por un slash (/) y guárdela en una nueva columna llamada Ciudad final. Al final, obtendrá una tabla en R como la siguiente

unir_ciudad_final= unite(datos,
                       Ciudad,
                       Prefijo_ciudad,
                       col="Ciudad_final",
                       sep="/");View(unir_ciudad_final)

punto 4

Use el paquete tidyr para unir la columna País con la columna Prefijo país separadas por un asterisco (*) y guárdela en una nueva columna llamada País final.

unir_país_final= unite(unir_ciudad_final,
                       País,
                       Prefijo_país,
                       col="País_final",
                       sep = "*");View(unir_país_final)

punto 5

Use el paquete tidyr para transformar la estructura de los datos a formato long, tomando como columnas identificadoras País final y Ciudad final. La columna que contendrá el nombre de las variables se llamará Variables población y la columna que contendrá los valores se llamará Métrica.

datos_longer=pivot_longer(unir_país_final,
                          cols = 3:4,
                          names_to = "Variables_población",
                          values_to = "Métrica");View(datos_longer)

punto 6

Use el paquete tidyr para separar la columna Variables población en dos: Variable y Año.

datos_longer_sep=separate(datos_longer,
                          Variables_población,
                          sep = "_",
                          into = c("variable","año"));view(datos_longer_sep)

punto 7

Use el paquete tidyr para transformar la estructura de los datos a formato wide, tomando como variables identificadoras las columnas País y Año. Los valores que pasarán a columna será la columna Variable, la columna con los valores es Métrica y aplique la función de agregación suma para sumar los valores a través de los años.

datos_wider=pivot_wider(datos_longer_sep,
                        id_cols = c("País_final","año"),
                        names_from = "variable",
                        values_from="Métrica",
                        values_fn=sum);view(datos_wider)