Dos bases de datos para un curso universitario de Sistemas Políticos Comparados con R

TL;DR

  • V-Dem (Varieties of Democracy) y Quality of Government (QoG) Basic Dataset son las dos opciones más adecuadas: ambas son gratuitas, bien documentadas, ampliamente citadas en la literatura comparada, descargables en CSV/Excel y cuentan con paquetes oficiales de R (vdemdata y rqog), lo que minimiza la fricción para estudiantes principiantes.
  • V-Dem v16 (2026) ofrece la medición más completa y matizada de la democracia (531 indicadores y 251 índices, 202 países, 1789–2024); su índice de poliarquía v2x_polyarchy es ideal para ejercicios introductorios de filtrado y graficado por país y año.
  • QoG Basic Dataset (versión Jan26) es un compilado curado (~400 variables provenientes de ~80 fuentes, 194 países, 1946–2025) que combina Polity, Freedom House, V-Dem, WDI, ICRG y Banco Mundial en un solo archivo CSV, lo que permite a los estudiantes comparar varias mediciones de democracia y gobernanza sin descargar archivos múltiples.

Key Findings

Criterio V-Dem QoG Basic
Productor V-Dem Institute, Univ. de Gotemburgo Quality of Government Institute, Univ. de Gotemburgo
Cobertura geográfica 202 países y territorios históricos 194 países
Cobertura temporal 1789–2024 (v16, 2026) 1946–2025 (Time-Series)
Tamaño 531 indicadores + 251 índices + 62 indicadores externos ~400 variables curadas de ~80 fuentes
Formatos descargables CSV, Excel (.xlsx), Stata (.dta), SPSS (.sav), R (.rds) CSV, DTA, SAV, XLSX
Paquete R oficial vdemdata (GitHub) rqog (rOpenGov)
Licencia CC BY-SA Uso libre académico/no comercial
Reconocimiento Considerada por UNESCO la base más completa de democracia Premio Lijphart-Przeworski-Verba a la mejor base de datos (APSA, 2009)

Ambas son apropiadas para principiantes porque (a) están en formato country-year limpio y rectangular —ideal para enseñar filter(), select() y group_by() de dplyr—, (b) cuentan con codebooks completos y (c) tienen una base sólida de tutoriales públicos en R.

Details

1) V-Dem (Varieties of Democracy)

Fuente / organización: V-Dem Institute, Departamento de Ciencia Política, Universidad de Gotemburgo (Suecia). Los Investigadores Principales son Michael Coppedge, John Gerring, Carl Henrik Knutsen, Staffan I. Lindberg y Jan Teorell. Involucra a más de 4 200 expertos académicos en todo el mundo.

URL principal de descarga: https://www.v-dem.net/data/the-v-dem-dataset/
La versión más reciente al momento de redactar este informe es la v16 (publicada en 2026); cuando se cita V-Dem en clase debe indicarse el número de versión usado. La v15 (marzo 2025) cubre 1789–2024 con 202 países y más de 31 millones de puntos de datos.

Variables principales: V-Dem operacionaliza siete concepciones de democracia. Los índices de alto nivel más usados son: - v2x_polyarchy — Índice de Democracia Electoral (poliarquía de Dahl), rango 0–1. - v2x_libdem — Índice de Democracia Liberal. - v2x_partipdem — Índice de Democracia Participativa. - v2x_delibdem — Índice de Democracia Deliberativa. - v2x_egaldem — Índice de Democracia Igualitaria. - v2x_regime — Tipología de regímenes (autocracia cerrada, autocracia electoral, democracia electoral, democracia liberal). - Variables temáticas como elecciones limpias (v2xel_frefair), libertad de expresión (v2x_freexp_altinf), libertad de asociación (v2x_frassoc_thick), sufragio (v2x_suffr), corrupción (v2x_corr), igualdad de género en política (v2x_gender), etc. - Identificadores: country_name, country_text_id, country_id, year, COWcode.

Formatos: ZIP que incluye CSV, .xlsx, .dta (Stata), .sav (SPSS) y .rds (R), además del codebook PDF y notas metodológicas.

Paquete de R: vdemdata (mantenido por el V-Dem Institute, no está en CRAN; se instala desde GitHub). Funciones clave: - vdem — carga el dataset Country-Year Full+Others. - vparty — dataset de partidos políticos (V-Party). - find_var() — busca variables por palabra clave. - var_info() — imprime metadatos del codebook. - plot_indicator() — gráficos exploratorios.

# Instalación
install.packages("devtools")
devtools::install_github("vdeminstitute/vdemdata")
library(vdemdata)
library(dplyr)
library(ggplot2)

# Cargar datos (es un objeto data frame ya disponible)
df <- vdem

# Filtrar 3 países y graficar evolución de la poliarquía 1900-2024
df %>%
  filter(country_name %in% c("Argentina", "Chile", "México"),
         year >= 1900) %>%
  ggplot(aes(x = year, y = v2x_polyarchy, color = country_name)) +
  geom_line(linewidth = 1) +
  labs(title = "Democracia electoral en América Latina",
       x = "Año", y = "Índice de poliarquía (0-1)",
       color = "País", caption = "Fuente: V-Dem v16") +
  theme_minimal()

Cobertura: 202 países y entidades políticas históricas; 1789–2024.

2) Quality of Government (QoG) Basic Dataset

Fuente / organización: Quality of Government Institute, Departamento de Ciencia Política, Universidad de Gotemburgo. Cita sugerida: Dahlberg, Sundström, Holmberg, Rothstein, Alvarado Pachón, Phiri, Chen y Liu (2026), The Quality of Government Basic Dataset, Version Jan26. DOI: 10.18157/qogbasjan26.

URL de descarga: https://www.gu.se/en/quality-government/qog-data/data-downloads/basic-dataset (página principal con CSV, DTA, SAV y XLSX). Archivo histórico de versiones: https://www.gu.se/en/quality-government/qog-data/data-downloads/data-archive.

Por qué la versión “Basic” y no la “Standard”: La QoG Standard contiene ~2 100 variables, lo que abruma a estudiantes principiantes y excede el límite de Stata/IC; la QoG Basic, con ~400 variables seleccionadas como las más usadas en la literatura, es manejable y se carga rápido en R desde un CSV. Existe en versión cross-sectional (un valor por país, ~año 2022) y time-series (1946–2025, unidad país-año).

Variables principales (organizadas en 19 categorías temáticas): - Identificadores: cname, ccodealp, ccode, year, region. - Democracia y régimen: p_polity2 (Polity 5, –10 a +10), fh_pr y fh_cl (Freedom House, derechos políticos y libertades civiles), fh_status, bmr_dem (Boix-Miller-Rosato), vdem_polyarchy (índice de poliarquía de V-Dem ya integrado), chga_demo (Cheibub-Gandhi-Vreeland democracia/dictadura), ht_regtype (tipo de régimen Hadenius-Teorell). - Calidad de gobierno y corrupción: icrg_qog (índice ICRG agregado), wbgi_cce (control de corrupción de los Worldwide Governance Indicators), wbgi_gee (efectividad gubernamental), wbgi_rle (Estado de derecho), ti_cpi (Índice de Percepción de la Corrupción de Transparencia Internacional). - Instituciones: variables de la Database of Political Institutions, sistemas electorales, sistema presidencial/parlamentario. - Socioeconómicas: wdi_gdpcappppcon2015 (PIB per cápita PPA), wdi_pop, undp_hdi (IDH), wdi_lifexp, etc.

Formatos: CSV, Stata (.dta), SPSS (.sav), Excel (.xlsx). Cada versión viene con un codebook PDF.

Paquete de R: rqog (rOpenGov), instalable desde GitHub:

devtools::install_github("ropengov/rqog")
library(rqog)
library(dplyr); library(ggplot2); library(tidyr)

# Descarga directa (cacheada localmente)
basic <- read_qog(which_data = "basic", data_type = "time-series")

# Ejercicio: comparar Polity y población activa en BRICS, 1990-2010
basic %>%
  filter(year %in% 1990:2010,
         cname %in% c("Russia","China","India","Brazil")) %>%
  select(cname, year, p_polity2, wdi_pop1564) %>%
  pivot_longer(cols = c(p_polity2, wdi_pop1564),
               names_to = "var", values_to = "valor") %>%
  filter(!is.na(valor)) %>%
  ggplot(aes(year, valor, color = cname)) +
  geom_line() + geom_point() +
  facet_wrap(~ var, scales = "free_y") +
  theme_minimal() +
  labs(title = "Democracia y población en BRICS",
       caption = "Fuente: QoG Basic")

Alternativa sin el paquete (recomendada para clases muy introductorias, evita complicaciones con devtools y compilación):

library(readr)
qog <- read_csv("qog_bas_ts_jan26.csv")  # archivo descargado del sitio

Cobertura: 194 países; CS ~2022, TS 1946–2025.

Paquete adicional útil: democracyData

Para docentes que deseen mostrar a los estudiantes cómo varias mediciones de democracia coinciden o difieren, el paquete democracyData de Xavier Marquez (Victoria University of Wellington) archiva en un solo lugar Polity 5, Freedom House, Geddes-Wright-Frantz, Cheibub-Gandhi-Vreeland (PACL), Boix-Miller-Rosato, los Unified Democracy Scores, el Lexical Index of Electoral Democracy y los principales índices V-Dem (vdem_simple). Se instala con remotes::install_github("xmarquez/democracyData"). Tiene funciones download_fh() y download_polity_annual() para datos siempre actualizados, además de country_year_coder() para resolver códigos de país problemáticos (Alemania, Yugoslavia, Vietnam). No está en CRAN.

Por qué se descartaron las otras candidatas para un curso introductorio

  • Polity V: cobertura termina en 2018 en su última versión consolidada; tiene códigos especiales (–66, –77, –88) que requieren recodificación previa, lo cual añade fricción innecesaria para principiantes. Está incluido como variable dentro de QoG Basic (p_polity2 ya recodificado), por lo que los estudiantes pueden usarlo sin descargarlo aparte.
  • Freedom House: el archivo oficial es un Excel con encabezados anidados que requiere readxl::read_excel(..., skip = ...) y limpieza manual; sólo aporta dos puntajes (PR y CL). También integrado en QoG Basic.
  • Worldwide Governance Indicators (Banco Mundial): cubre solo seis dimensiones de gobernanza desde 1996 y exige unir varios archivos. Sus seis indicadores wbgi_* están en QoG Basic.
  • Economist Democracy Index (EIU): los datos sólo se publican como tablas dentro de un PDF anual y deben extraerse manualmente; el paquete democracyData lo señala explícitamente como problemático. No es apropiado para principiantes.

Sugerencia de ejercicio práctico de dos sesiones

  1. Sesión 1 — V-Dem con vdemdata: instalar el paquete; cargar vdem; usar find_var("polyarchy") para explorar el codebook; filtrar tres países latinoamericanos; producir una serie temporal con ggplot2 + geom_line(); discutir qué significa la caída de la poliarquía en años específicos.
  2. Sesión 2 — QoG Basic vía CSV: descargar el CSV desde la página oficial; cargarlo con read_csv(); comparar vdem_polyarchy, p_polity2 y fh_ipolity2 para los mismos países; calcular correlaciones con cor(); reflexionar sobre la concordancia/divergencia entre mediciones de democracia.

Caveats

  • Versión de V-Dem: en el momento de escribir, la página oficial muestra la v16 (2026) como la más reciente, mientras que el paquete vdemdata en GitHub puede no haberse sincronizado todavía con la v16 (la documentación consultada cita aún la v15 de 2025). Para clases es buena práctica fijar la versión del dataset en el syllabus y que todos los estudiantes usen la misma; comparar puntajes entre versiones puede ser engañoso, según advierte el propio V-Dem.
  • Instalación desde GitHub: tanto vdemdata como rqog y democracyData están solo en GitHub, no en CRAN. Esto implica que los estudiantes necesitan tener instalado devtools o remotes y, en Windows, posiblemente Rtools. Si esto causa fricción, lo más simple es que descarguen el CSV directamente desde el sitio web y lo carguen con readr::read_csv(). Para QoG Basic esto funciona perfectamente; para V-Dem el ZIP del Country-Year Full+Others también incluye un CSV.
  • Tamaño del archivo V-Dem: el archivo Country-Year Full+Others tiene cerca de 28 000 filas y más de 4 600 columnas, lo que puede saturar RStudio en computadoras antiguas. Para estudiantes con equipos modestos conviene usar la versión “V-Dem Core” (solo los cinco índices principales y sus 167 indicadores constitutivos), también disponible en la página oficial.
  • Licencia QoG: el dataset está disponible gratis y sin registro para uso académico y de enseñanza, pero la propia QoG prohíbe explícitamente su redistribución comercial; pídase a los estudiantes citar tanto la base como las fuentes originales (Polity, Freedom House, V-Dem, etc.).
  • Adolescentes universitarios: si bien la consigna habla de “adolescentes universitarios”, los códigos mostrados asumen alfabetización mínima en R (función, asignación, tubería %>% o |>). Recomiendo que la primera clase sea sobre el flujo install.packages()library()read_csv()glimpse() antes de pasar a dplyr y ggplot2. Los tutoriales públicos en rforpoliticalscience.com (V-Dem) y ropengov.github.io/rqog (QoG) son recursos complementarios útiles.
  • Actualización: V-Dem se actualiza cada marzo; QoG Basic se actualiza en enero. Si el curso se imparte en otras épocas, siempre estará disponible la versión publicada más reciente.