library(WDI)
## Warning: package 'WDI' was built under R version 4.2.1
library(wbstats)
## Warning: package 'wbstats' was built under R version 4.2.1
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.2.1
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
## ✔ ggplot2 3.3.6 ✔ purrr 0.3.4
## ✔ tibble 3.1.7 ✔ dplyr 1.0.10
## ✔ tidyr 1.2.0 ✔ stringr 1.4.0
## ✔ readr 2.1.2 ✔ forcats 0.5.2
## Warning: package 'ggplot2' was built under R version 4.2.1
## Warning: package 'readr' was built under R version 4.2.1
## Warning: package 'dplyr' was built under R version 4.2.1
## Warning: package 'forcats' was built under R version 4.2.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
En esta ocasión se obtuvieron datos del Banco Mundial para realizar análisis, en primera instancia se extrajo datos del PIB de México del año 1973 al 2022.
gdp_data <- wb_data(country="MX", indicator="NY.GDP.PCAP.CD", start_date=1973, end_date=2022)
summary(gdp_data)
## iso2c iso3c country date
## Length:49 Length:49 Length:49 Min. :1973
## Class :character Class :character Class :character 1st Qu.:1985
## Mode :character Mode :character Mode :character Median :1997
## Mean :1997
## 3rd Qu.:2009
## Max. :2021
## NY.GDP.PCAP.CD unit obs_status footnote
## Min. : 981.5 Length:49 Length:49 Length:49
## 1st Qu.: 2569.2 Class :character Class :character Class :character
## Median : 5650.0 Mode :character Mode :character Mode :character
## Mean : 5751.7
## 3rd Qu.: 9068.3
## Max. :10928.9
## last_updated
## Min. :2022-09-16
## 1st Qu.:2022-09-16
## Median :2022-09-16
## Mean :2022-09-16
## 3rd Qu.:2022-09-16
## Max. :2022-09-16
Después para conocer cuáles fueron los datos más grandes y más pequeños se utilizaron las funciones head() y tail()
head(gdp_data)
## # A tibble: 6 × 9
## iso2c iso3c country date NY.GDP.PCAP.CD unit obs_status footnote
## <chr> <chr> <chr> <dbl> <dbl> <chr> <chr> <chr>
## 1 MX MEX Mexico 1973 981. <NA> <NA> <NA>
## 2 MX MEX Mexico 1974 1242. <NA> <NA> <NA>
## 3 MX MEX Mexico 1975 1476. <NA> <NA> <NA>
## 4 MX MEX Mexico 1976 1454. <NA> <NA> <NA>
## 5 MX MEX Mexico 1977 1301. <NA> <NA> <NA>
## 6 MX MEX Mexico 1978 1589. <NA> <NA> <NA>
## # … with 1 more variable: last_updated <date>
tail(gdp_data)
## # A tibble: 6 × 9
## iso2c iso3c country date NY.GDP.PCAP.CD unit obs_status footnote
## <chr> <chr> <chr> <dbl> <dbl> <chr> <chr> <chr>
## 1 MX MEX Mexico 2016 8745. <NA> <NA> <NA>
## 2 MX MEX Mexico 2017 9288. <NA> <NA> <NA>
## 3 MX MEX Mexico 2018 9687. <NA> <NA> <NA>
## 4 MX MEX Mexico 2019 9950. <NA> <NA> <NA>
## 5 MX MEX Mexico 2020 8432. <NA> <NA> <NA>
## 6 MX MEX Mexico 2021 9926. <NA> <NA> <NA>
## # … with 1 more variable: last_updated <date>
Para visualizarlo de una forma más gráfica y amigable se utilizaron 3 tipos de gráficas de la librería ggplot2, la primera es un “scatter plot”, la segunda una gráfica de barras y la tercera una gráfica de barras con puntos y colores.
ggplot(gdp_data, aes(x=date, y=NY.GDP.PCAP.CD)) +
geom_point()
ggplot(gdp_data, aes(x=date, y=NY.GDP.PCAP.CD)) +
geom_col()
ggplot(gdp_data, aes(x=date, y=NY.GDP.PCAP.CD)) +
geom_col(fill="red") +
geom_point(color="blue")
Por último se hizo el mismo procedimiento con 3 para después compararlos en una gráfca, estos países fueron Haití, Kenya y Nigeria.
more_gdp_data <- wb_data(country=c("NG", "HT", "KE"),
indicator="NY.GDP.PCAP.CD",
start_date=1981, end_date=2015)
ggplot(more_gdp_data, aes(x=date, y=NY.GDP.PCAP.CD, color=country, shape=country)) +
geom_point()
Utilizar este método extrayendo directamente información de la base de datos del Banco Mundial en la web nos permite no solamente agilizar el proceso y hacerlo sin necesidad de tener a la disposición la base de datos en archivo, sino que nos permite siempre tener la información más actualizada y confiando en que es información acertada.