Librerías

library(WDI)

## Warning: package 'WDI' was built under R version 4.2.1

library(wbstats)

## Warning: package 'wbstats' was built under R version 4.2.1

library(tidyverse)

## Warning: package 'tidyverse' was built under R version 4.2.1

## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.3.6      ✔ purrr   0.3.4 
## ✔ tibble  3.1.7      ✔ dplyr   1.0.10
## ✔ tidyr   1.2.0      ✔ stringr 1.4.0 
## ✔ readr   2.1.2      ✔ forcats 0.5.2

## Warning: package 'ggplot2' was built under R version 4.2.1

## Warning: package 'readr' was built under R version 4.2.1

## Warning: package 'dplyr' was built under R version 4.2.1

## Warning: package 'forcats' was built under R version 4.2.1

## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()

Extracción de datos

En esta ocasión se obtuvieron datos del Banco Mundial para realizar análisis, en primera instancia se extrajo datos del PIB de México del año 1973 al 2022.

gdp_data <- wb_data(country="MX", indicator="NY.GDP.PCAP.CD", start_date=1973, end_date=2022)
summary(gdp_data)

##     iso2c              iso3c             country               date     
##  Length:49          Length:49          Length:49          Min.   :1973  
##  Class :character   Class :character   Class :character   1st Qu.:1985  
##  Mode  :character   Mode  :character   Mode  :character   Median :1997  
##                                                           Mean   :1997  
##                                                           3rd Qu.:2009  
##                                                           Max.   :2021  
##  NY.GDP.PCAP.CD        unit            obs_status          footnote        
##  Min.   :  981.5   Length:49          Length:49          Length:49         
##  1st Qu.: 2569.2   Class :character   Class :character   Class :character  
##  Median : 5650.0   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 5751.7                                                           
##  3rd Qu.: 9068.3                                                           
##  Max.   :10928.9                                                           
##   last_updated       
##  Min.   :2022-09-16  
##  1st Qu.:2022-09-16  
##  Median :2022-09-16  
##  Mean   :2022-09-16  
##  3rd Qu.:2022-09-16  
##  Max.   :2022-09-16

Después para conocer cuáles fueron los datos más grandes y más pequeños se utilizaron las funciones head() y tail()

head(gdp_data)

## # A tibble: 6 × 9
##   iso2c iso3c country  date NY.GDP.PCAP.CD unit  obs_status footnote
##   <chr> <chr> <chr>   <dbl>          <dbl> <chr> <chr>      <chr>   
## 1 MX    MEX   Mexico   1973           981. <NA>  <NA>       <NA>    
## 2 MX    MEX   Mexico   1974          1242. <NA>  <NA>       <NA>    
## 3 MX    MEX   Mexico   1975          1476. <NA>  <NA>       <NA>    
## 4 MX    MEX   Mexico   1976          1454. <NA>  <NA>       <NA>    
## 5 MX    MEX   Mexico   1977          1301. <NA>  <NA>       <NA>    
## 6 MX    MEX   Mexico   1978          1589. <NA>  <NA>       <NA>    
## # … with 1 more variable: last_updated <date>

tail(gdp_data)

## # A tibble: 6 × 9
##   iso2c iso3c country  date NY.GDP.PCAP.CD unit  obs_status footnote
##   <chr> <chr> <chr>   <dbl>          <dbl> <chr> <chr>      <chr>   
## 1 MX    MEX   Mexico   2016          8745. <NA>  <NA>       <NA>    
## 2 MX    MEX   Mexico   2017          9288. <NA>  <NA>       <NA>    
## 3 MX    MEX   Mexico   2018          9687. <NA>  <NA>       <NA>    
## 4 MX    MEX   Mexico   2019          9950. <NA>  <NA>       <NA>    
## 5 MX    MEX   Mexico   2020          8432. <NA>  <NA>       <NA>    
## 6 MX    MEX   Mexico   2021          9926. <NA>  <NA>       <NA>    
## # … with 1 more variable: last_updated <date>

Gráfico

Para visualizarlo de una forma más gráfica y amigable se utilizaron 3 tipos de gráficas de la librería ggplot2, la primera es un “scatter plot”, la segunda una gráfica de barras y la tercera una gráfica de barras con puntos y colores.

ggplot(gdp_data, aes(x=date, y=NY.GDP.PCAP.CD)) +
    geom_point()

ggplot(gdp_data, aes(x=date, y=NY.GDP.PCAP.CD)) +
  geom_col()

ggplot(gdp_data, aes(x=date, y=NY.GDP.PCAP.CD)) +
  geom_col(fill="red") +
  geom_point(color="blue")

Más países

Por último se hizo el mismo procedimiento con 3 para después compararlos en una gráfca, estos países fueron Haití, Kenya y Nigeria.

more_gdp_data <- wb_data(country=c("NG", "HT", "KE"),
                         indicator="NY.GDP.PCAP.CD",
                         start_date=1981, end_date=2015)

ggplot(more_gdp_data, aes(x=date, y=NY.GDP.PCAP.CD, color=country, shape=country)) +
    geom_point()

Conclusión

Utilizar este método extrayendo directamente información de la base de datos del Banco Mundial en la web nos permite no solamente agilizar el proceso y hacerlo sin necesidad de tener a la disposición la base de datos en archivo, sino que nos permite siempre tener la información más actualizada y confiando en que es información acertada.

6 Banco Mundial

Aldo Fabián Rodríguez Almaguer - A01570685

2022-09-19

Librerías

Extracción de datos

Gráfico

Más países

Conclusión