library(tidyverse)
library(here)
library(gt)
library(treemapify)
library(kableExtra)
library(lessR)
library(ggpubr)
#source("data_getting.R")
grupo_df_articulos <-
read_csv(here("output",
"articulos.csv"))
## Parsed with column specification:
## cols(
## grupo = col_character(),
## categoria = col_character(),
## tipo_producto = col_character(),
## titulo = col_character(),
## pais_revista = col_character(),
## revista = col_character(),
## ISSN = col_character(),
## ano = col_double(),
## vol = col_character(),
## fasc = col_character(),
## pags = col_character(),
## DOI = col_character(),
## autores = col_character()
## )
Para este análisis filtramos el periódo de tiempo de los últimos
produccion_articulos <-
grupo_df_articulos %>%
filter(ano <= 2020,
ano >= 2014)
plot_articulos_total <-
produccion_articulos %>%
count(ano) %>%
arrange(ano) %>%
ggplot(aes(x = ano, y = n, group = 1)) +
geom_line(color = 4) +
geom_point(color = 4) +
xlab("año") +
ylab("cantidad") +
ggtitle("Producción") +
theme_classic()
Producción total por tipo de producto.
Artículos
plot_articulos_espe<-
produccion_articulos %>%
filter(tipo_producto == "Publicado en revista especializada") %>%
count(ano) %>%
arrange(ano) %>%
ggplot(aes(x = ano, y = n, group = 1)) +
geom_line(color = 4) +
geom_point(color = 4) +
labs(title = "Artículos en revistas especializadas",
y = "Cantidad",
x = "año") +
theme_classic()
Artículos cortos
plot_articulos_corto <-
produccion_articulos %>%
filter(tipo_producto == "Corto (Resumen)") %>%
count(ano) %>%
arrange(ano) %>%
ggplot(aes(x = ano, y = n, group = 1)) +
geom_line(color = 4) +
geom_point(color = 4) +
labs(title = "Artículos Cortos (Resumen)",
y = "Cantidad",
x = "año") +
theme_classic()
plot_articulos_revision <-
produccion_articulos %>%
filter(tipo_producto == "Revisión (Survey)") %>%
count(ano) %>%
arrange(ano) %>%
ggplot(aes(x = ano, y = n, group = 1)) +
geom_line(color = 4) +
geom_point(color = 4) +
labs(title = "Artículos Revisión (Survey) ",
y = "Cantidad",
x = "año") +
theme_classic()
Gráfico general produccion artículos
global_scientific_production_papers <-
ggarrange(plot_articulos_total,
plot_articulos_espe,
ggarrange(plot_articulos_corto, plot_articulos_revision,
ncol = 2, labels = c("c", "d"),
align = "h",widths = c(2,2)),
nrow = 3,
heights = c(1.5, 1, 1),
labels = c("a","b")
)
global_scientific_production_papers
Análisis por países
top_paises <-
produccion_articulos %>%
filter(pais_revista != "") %>%
count(pais_revista, sort = T) %>%
slice(1:6) %>%
mutate(porcentaje = round(n/sum(n)*100,
2))
otros_paises <-
produccion_articulos %>%
count(pais_revista, sort = T) %>%
filter(pais_revista != "") %>%
mutate(porcentaje =round(n/sum(n)*100,2)) %>%
slice(7:n) %>%
summarize(n = sum(n),
porcentaje = sum(porcentaje)) %>%
mutate(pais_revista = "Otros") %>%
select(pais_revista, n, porcentaje)
top_otras_paises <-
top_paises %>%
bind_rows(otros_paises)
top_otras_paises
Hay 25 productos que no presenta país.
Análisis por revistas
top_revistas <-
produccion_articulos %>%
count(revista, sort = T) %>%
slice(1:6) %>%
mutate(porcentaje = round(n/sum(n)*100,
2))
otras_revistas <-
produccion_articulos %>%
count(revista, sort = T) %>%
mutate(porcentaje =round(n/sum(n)*100,2)) %>%
slice(7:n) %>%
summarize(n = sum(n),
porcentaje = sum(porcentaje)) %>%
mutate(revista = "Otros") %>%
select(revista, n, porcentaje)
top_otras_revistas <-
top_revistas %>%
bind_rows(otras_revistas)
top_otras_revistas