Este informe quiere ofrecer una imagen completa de los Acuerdos de Paz firmados en el mundo durante las 3 decadas que comprenden los años 1990 y 2020. Este informe se completará un Panel de Control que muestre los elementos más representativos del dataset.
PA-X ha sido diseñado para facilitar el acceso a los textos de los acuerdos de paz y permitir a los usuarios explorar los patrones de los acuerdos a lo largo del tiempo, tanto dentro de los procesos como entre ellos. PA-X es producido principalmente por un equipo de investigadores de la Universidad de Edimburgo, con colaboradores adicionales.
Version 4:
Bell, Christine, Sanja Badanjak, Juline Beujouan, Robert Forster, Tim Epple, Astrid Jamar, Kevin McNicholl, Sean Molloy, Kathryn Nash, Jan Pospisil, Robert Wilson, Laura Wise (2020). PA-X Codebook, Version 4. Political Settlements Research Programme, University of Edinburgh, Edinburgh. www.peaceagreements.org
Bell, C. and Badanjak, S. (2019) ‘Introducing PA-X: A new peace agreement database and dataset’, Journal of Peace Research, 56 (3).
PA-X Peace Agreement Database www.peaceagreements.org
El {PA-X Codebook}(https://www.peaceagreements.org/files/PA-X%20codebook%20Version4.pdf)
El dataset utilizado es el último que se obtiene de la búsqueda sin ningún filtro:
https://www.peaceagreements.org/search
Para este informe se utilizó:
# Carga del dataset
raw_data <- read.csv("pax_data_1868_agreements_11-04-21.csv")
## [1] 1868 267
La dimensión del dataset es de 1868 filas o registros y 267 columnas o atributos
Las categorías son:
## [1] "Con" "Contp" "PP" "PPName" "Reg"
## [6] "AgtId" "Ver" "Agt" "Dat" "Status"
## [11] "Lgt" "N_characters" "Agtp" "Stage" "StageSub"
## [16] "Part" "ThrdPart" "OthAgr" "Loc1ISO" "Loc2ISO"
## [21] "Loc1GWNO" "Loc2GWNO" "UcdpCon" "UcdpAgr" "PamAgr"
## [26] "CowWar" "Interim" "GCh" "GChRhet" "GChAntid"
## [31] "GChSubs" "GChOth" "GDis" "GDisRhet" "GDisAntid"
## [36] "GDisSubs" "GDisOth" "GAge" "GAgeRhet" "GAgeAntid"
## [41] "GAgeSubs" "GAgeOth" "GMig" "GMigRhet" "GMigAntid"
## [46] "GMigSubs" "GMigOth" "GRa" "GRaRhet" "GRaAntid"
## [51] "GRaSubs" "GRaOth" "GRe" "GReRhet" "GReAntid"
## [56] "GReSubs" "GReOth" "GInd" "GIndRhet" "GIndAntid"
## [61] "GIndSubs" "GIndOth" "GOth" "GOthRhet" "GOthAntid"
## [66] "GOthSubs" "GOthOth" "GRef" "GRefRhet" "GRefSubs"
## [71] "GRefOth" "GSoc" "GSocRhet" "GSocAntid" "GSocSubs"
## [76] "GSocOth" "GeWom" "GeMe" "GeMeNu" "GeMeOth"
## [81] "GeLgbti" "GeLgbtiPos" "GeLgbtiNeg" "GeFa" "StDef"
## [86] "StGen" "StCon" "StSd" "StRef" "StSym"
## [91] "StInd" "StUni" "StBor" "StXbor" "Pol"
## [96] "PolGen" "PolNewInd" "PolNewTemp" "ConRen" "Cons"
## [101] "Ele" "ElecComm" "PolPar" "PolParTrans" "PolParOth"
## [106] "Civso" "Tral" "Pubad" "Polps" "PpsSt"
## [111] "PpsSub" "PpsEx" "PpsOro" "PpsOthPr" "PpsVet"
## [116] "PpsAut" "PpsInt" "PpsOth" "Terps" "TpsSub"
## [121] "TpsLoc" "TpsAut" "TpsOth" "Eps" "EpsRes"
## [126] "EpsFis" "EpsOth" "Mps" "MpsMe" "MpsJt"
## [131] "MpsPro" "MpsOth" "HrGen" "EqGen" "HrDem"
## [136] "Prot" "ProtCiv" "ProtGrp" "ProtLgl" "ProtOth"
## [141] "HrFra" "HrfSp" "HrfBor" "HrfTinc" "HrfOth"
## [146] "HrCp" "CprLife" "CprTort" "CprEq" "CprSlav"
## [151] "CprLib" "CprDet" "CprFmov" "CprFspe" "CprFass"
## [156] "CprTria" "CprPriv" "CprVote" "CprReli" "CprOth"
## [161] "HrSec" "SerProp" "SerWork" "SerHeal" "SerEdu"
## [166] "SerStdl" "SerShel" "SerSs" "SerCult" "SerOth"
## [171] "HrNi" "HrNiMe" "HrNiNe" "HrNiOth" "HrIi"
## [176] "HrIiMon" "HrIiBod" "HrIiOth" "HrMob" "HrDet"
## [181] "Med" "MedGov" "MedSubs" "MedLog" "MedOth"
## [186] "HrCit" "CitGen" "CitRights" "CitDef" "CitOth"
## [191] "JusCr" "JusCrSp" "JusCrSys" "JusCrPow" "JusEm"
## [196] "JusJu" "JusPri" "JusTra" "Dev" "DevSoc"
## [201] "DevHum" "DevInfra" "NEC" "NatRes" "IntFu"
## [206] "Bus" "Tax" "TaxPo" "TaxRef" "TaxOth"
## [211] "Ban" "CenBan" "BanPers" "BanInt" "BanXb"
## [216] "LaRef" "LaRefMan" "LaRefRet" "LaRefOth" "LaNom"
## [221] "LaCH" "LaCHTa" "LaCHIt" "LaCHPro" "LaCHOth"
## [226] "LaEn" "Wat" "SsrGua" "Ce" "CeProv"
## [231] "CeGen" "SsrPol" "SsrArm" "SsrDdr" "DdrDemil"
## [236] "DdrProg" "SsrInt" "SsrPsf" "SsrFf" "Cor"
## [241] "SsrCrOcr" "SsrDrugs" "Terr" "TjGen" "TjAm"
## [246] "TjAmPro" "TjSan" "TjPower" "TjAmBan" "TjCou"
## [251] "TjJaNc" "TjJaIc" "TjMech" "TjPrire" "TjVet"
## [256] "TjVic" "TjMis" "TjRep" "TjRSym" "TjRMa"
## [261] "TjNR" "ImUN" "ImOth" "ImRef" "ImPK"
## [266] "ImE" "ImSrc"
Dichas categorías las podemos dividir en 2 partes muy bien delimitadas.
Comprenden los campos 1 hasta 27 inclusive:
Se tratan de valores mayoritariamente cualitativos en formato carácter y numéricos. En este tramo se ofrece la información básica sobre los Acuerdos de Paz.
Primero vemos su estructura
## 'data.frame': 1868 obs. of 20 variables:
## $ Con : chr "Afghanistan" "Afghanistan" "Afghanistan" "Afghanistan" ...
## $ Contp : chr "Government/territory" "Government" "Government" "Government" ...
## $ PP : int 2 2 2 2 2 2 2 2 2 2 ...
## $ PPName : chr "Afghanistan: 2000s Post-intervention process" "Afghanistan: 2000s Post-intervention process" "Afghanistan: 2000s Post-intervention process" "Afghanistan: 2000s Post-intervention process" ...
## $ Reg : chr "Europe and Eurasia" "Europe and Eurasia" "Europe and Eurasia" "Europe and Eurasia" ...
## $ AgtId : int 2232 1739 1923 864 848 849 709 708 707 706 ...
## $ Ver : int 3 2 2 1 1 1 1 1 1 1 ...
## $ Agt : chr "Resolution of Intra Afghan Peace Conference in Doha, Qatar (Doha Roadmap for Peace)" "Agreement between the Islamic Republic of Afghanistan and Hizb-e-Islami " "Agreement between the two campaign teams regarding the structure of the national unity government" "Tokyo Declaration Partnership for Self-Reliance in Afghanistan from Transition to Transformation (Tokyo Conference)" ...
## $ Dat : chr "2019-07-08" "2016-09-22" "2014-09-21" "2012-07-08" ...
## $ Status : chr "Multiparty signed/agreed" "Multiparty signed/agreed" "Multiparty signed/agreed" "Multiparty signed/agreed" ...
## $ Lgt : int 2 4 4 14 7 10 9 4 7 4 ...
## $ N_characters: int 5235 10203 11110 39746 24106 21299 33137 9289 27083 9555 ...
## $ Agtp : chr "Intra" "Intra" "Intra" "InterIntra" ...
## $ Stage : chr "Pre" "SubPar" "Imp" "Imp" ...
## $ StageSub : chr "PreMix" "MultIss" "ExtSub" "ExtSub" ...
## $ Part : chr "Stated to be Participants to the Afghan Peace Conference.\n(secondary sources suggest that 62 participants were"| __truncated__ "President of the IRA Mohammad Ashraf Ghani, chairman of HIA delegation Gulbuddin Hekmatyar, chairman of HPC Pee"| __truncated__ "Dr. Mohammad Ashraf Ghani Ahmadzai \nDr. Abdullah Abdullah" "Not signed, agreement mentions the following parties as having produced it: The Afghan Government and the Inter"| __truncated__ ...
## $ ThrdPart : chr "Qatar\nGerman Government \nUnited Nations\nUSA\nCountries in the region " "" "The foregoing signatures were witnessed by:\nH.E. Jan Kubis, Special Representative of the Secretary General of"| __truncated__ "Ambassador Kazuo Kodama, Chargé d’affaires ad interim Permanent Mission of Japan to the United Nations\n" ...
## $ OthAgr : chr "Page 2, 8:\n8. We acknowledge and approve the recent resolution of intra afghan conference held on 6 Feb 2019 i"| __truncated__ "" "Page 3, D. Creation of the position of leader of the runner-up team\nIn line with the Joint Declaration of 17 A"| __truncated__ "Page 2, Preamble, 1\n...\nThese undertakings are built on the outcome of the Bonn Conference in December 2011"| __truncated__ ...
## $ Loc1ISO : chr "AFG" "AFG" "AFG" "AFG" ...
## $ Loc2ISO : chr "" "" "" "" ...
## NULL
Mostramos los campos (Hemos realizado una pequeña transformación, obteniendo el año del acuerdo de paz)
## variable q_zeros p_zeros q_na p_na q_inf p_inf type
## 1 pais_entidad 0 0 0 0.00 0 0 character
## 2 tipo_conflicto 0 0 0 0.00 0 0 character
## 3 proc_paz 0 0 0 0.00 0 0 integer
## 4 nombre_proc_paz 0 0 0 0.00 0 0 character
## 5 region 0 0 0 0.00 0 0 character
## 6 id 0 0 0 0.00 0 0 integer
## 7 version 0 0 0 0.00 0 0 integer
## 8 acuerdo 0 0 0 0.00 0 0 character
## 9 fecha 0 0 0 0.00 0 0 Date
## 10 definicion 0 0 0 0.00 0 0 character
## 11 paginas 0 0 0 0.00 0 0 integer
## 12 caracteres 0 0 0 0.00 0 0 integer
## 13 tipo_acuerdo_conflict 0 0 0 0.00 0 0 character
## 14 situacion 0 0 0 0.00 0 0 character
## 15 subestado 0 0 0 0.00 0 0 character
## 16 partes 0 0 0 0.00 0 0 character
## 17 terceros 0 0 0 0.00 0 0 character
## 18 otros_acuerdos 0 0 0 0.00 0 0 character
## 19 loc1ISO 0 0 0 0.00 0 0 character
## 20 loc2ISO 0 0 0 0.00 0 0 character
## 21 loc1GWNO 0 0 11 0.59 0 0 integer
## 22 loc2GWNO 0 0 1622 86.83 0 0 integer
## 23 uppsala_conflicto 0 0 141 7.55 0 0 character
## 24 uppsala_acuerdo 0 0 1571 84.10 0 0 numeric
## 25 krock 0 0 1835 98.23 0 0 integer
## 26 num_guerra 0 0 753 40.31 0 0 integer
## 27 interim 0 0 0 0.00 0 0 character
## 28 año 0 0 0 0.00 0 0 numeric
## unique
## 1 170
## 2 5
## 3 157
## 4 157
## 5 6
## 6 1868
## 7 4
## 8 1832
## 9 1534
## 10 4
## 11 70
## 12 1722
## 13 4
## 14 7
## 15 22
## 16 1760
## 17 907
## 18 966
## 19 83
## 20 31
## 21 83
## 22 30
## 23 110
## 24 292
## 25 33
## 26 63
## 27 3
## 28 31
Vemos los valores únicos por cada columna:
## pais_entidad tipo_conflicto proc_paz
## 170 5 157
## nombre_proc_paz region id
## 157 6 1868
## version acuerdo fecha
## 4 1832 1534
## definicion paginas caracteres
## 4 70 1722
## tipo_acuerdo_conflict situacion subestado
## 4 7 22
## partes terceros otros_acuerdos
## 1760 907 966
## loc1ISO loc2ISO loc1GWNO
## 83 31 84
## loc2GWNO uppsala_conflicto uppsala_acuerdo
## 31 111 293
## krock num_guerra interim
## 34 64 3
## año
## 31
En este apartado destacamos los siguientes atributos
## Bosnia and Herzegovina/Yugoslavia (former)
## 133
## Colombia
## 128
## Philippines/Mindanao
## 126
## Syria
## 93
## Nepal
## 51
## South Sudan
## 51
## Yemen
## 50
## Croatia/Yugoslavia (former)
## 44
## South Sudan/Sudan
## 44
## Central African Republic
## 43
## Africa (excl MENA) Americas
## 584 195
## Asia and Pacific Cross-regional
## 377 38
## Europe and Eurasia Middle East and North Africa
## 411 263
## Agreement with subsequent status Multiparty signed/agreed
## 8 1725
## Status unclear Unilateral document
## 10 125
## Government Government/territory Inter-group
## 653 843 261
## Other Territory
## 2 109
## Inter InterIntra Intra IntraLocal
## 72 240 1270 286
## 1 2 3 4
## 1517 272 43 36
## Cea Imp Oth Pre Ren SubComp SubPar
## 388 335 1 513 43 113 475
## CeaMix Ceas Conf ExtPar ExtSub FrAg FrCons
## 25 44 214 88 16 110 92 18
## FrparOth ImpMod
## 13 188
##
## 16
## United Nations Security Council
## 10
## Israel, signed for by Yitzhak Rabin and Shimon Peres; PLO, signed for by Yasser Arafat;
## 8
## EZLN, Mexican Government
## 5
## National Govt, FARC
## 5
## British and Irish Governments
## 4
## Georgia, Abkhazia
## 4
## The Government of Sudan; Sudan People's Liberation Movement/Army
## 4
## The national government, the FARC-EP
## 4
## Amb. Rafael E. Seguis, GRP Panel Chairman; \nMohagher Iqbal, MILF Panel Chairman
## 3
Tamaño de los acuerdos:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.000000 1.000000 2.000000 6.274625 5.000000 323.000000
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 329.00 2397.25 4354.00 11951.51 9420.50 908459.00
Comprenden los campos desde 28 hasta 268 inclusive:
Se tratan de las variables categóricas del conjunto de datos que se recodifícan en un conjunto de variables binarias separadas (dummies). De manera resumida estas variables son:
Vemos un detalle de la estructura de estos datos
## 'data.frame': 1868 obs. of 31 variables:
## $ GChAntid : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GChSubs : int 0 0 1 0 0 0 1 0 0 0 ...
## $ GChOth : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GDis : int 0 0 2 0 0 0 0 0 0 0 ...
## $ GDisRhet : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GDisAntid: int 0 0 0 0 0 0 0 0 0 0 ...
## $ GDisSubs : int 0 0 1 0 0 0 0 0 0 0 ...
## $ GDisOth : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GAge : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GAgeRhet : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GAgeAntid: int 0 0 0 0 0 0 0 0 0 0 ...
## $ GAgeSubs : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GAgeOth : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GMig : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GMigRhet : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GMigAntid: int 0 0 0 0 0 0 0 0 0 0 ...
## $ GMigSubs : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GMigOth : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GRa : int 0 1 0 0 0 0 0 0 0 0 ...
## $ GRaRhet : int 0 1 0 0 0 0 0 0 0 0 ...
## $ GRaAntid : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GRaSubs : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GRaOth : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GRe : int 0 0 0 0 0 0 0 2 0 0 ...
## $ GReRhet : int 0 0 0 0 0 0 0 1 0 0 ...
## $ GReAntid : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GReSubs : int 0 0 0 0 0 0 0 1 0 0 ...
## $ GReOth : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GInd : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GIndRhet : int 0 0 0 0 0 0 0 0 0 0 ...
## $ GIndAntid: int 0 0 0 0 0 0 0 0 0 0 ...
## NULL
Estos valores indican si el acuerdo hace referencia al Genero, Derechos humanos, Reformas, Reparto de poder, Reconstruccion, etc.
En este dataset vemos claramente las 2 partes bien diferenciadas de la estructura, por lo que las posibles tranformaciones a realizar serian la siguiente:
datos_raw$Dat <- as.Date(datos_raw$Dat)
datos_raw$year <- format(datos_raw$Dat, format ="%Y")
datos_raw$year <- as.numeric(datos_raw$year)
datos_raw[is.na(datos_raw)] <- 0
datos_raw[sapply(datos_raw, is.character)] <- lapply(datos_raw[sapply(datos_raw, is.character)],
as.factor)
A la vista de como están distribuidos los datos donde se almacena los grupos clave que aparecen en los acuerdos, convertir estos datos factorizados en valores dummies o binarios, lo que el dataset crecería a lo ancho.
En el ámbito de los valoes binarios, se podrían tranformar factorizando/categorizando los valores binarios, con lo que reduciriamos la anchura del dataset a cambio de alargar el número de registros.
datos <- datos_raw%>%
tidyr::pivot_longer(
GChRhet:GChOth,
names_to = "GCh_"
)
En relación a los paises, La antigua Yugoslavia y Colombia han sido los paises con mayor número de acuerdos de paz en estas 3 últimas décadas.
Comprobamos que cerca de un 50% de los Acuerdos de Paz durante este periodo han estado centrados por conflictos derivados del Gobierno/Territorio y también que más del 50% del tipo de acuerdo es Intra.
Por último comprobamos que a pesar de estar dividido Africa en 2 regiones, vemos que el continente al sur de Europa concentra un porcentaje muy superior al 25 % del total de Acuerdos.
El propio dataset. No tenia conocimiento del gran trabajo realizado por la Universidad de Edimburgo a la hora de recopilar, clasificar, analizar los acuerdos de paz a lo largo de los últimos años.
En referencia a los propios datos, me sorprende que los atributos/columnas pertenecientes a los diferentes grupos se encuentren desagrupados y en formato binario.
En cuanto a las tendencias, hay una tendencia creciente según se muestra el gŕafico Páginas por fecha del número de páginas y caracteres por año.
Se puede comprobar que hay una tendencia poco creciente que a medida que transcurren los años el número de páginas se incrementa.
No obstante esta afirmación puede que no sea correcta ya que vemos periodos de tiempo con valores disparados, los cuales los podemos tratar como outliers.
Outliers
Tal y como habíamos indicado en la tendencia de los valores, vemos que puede encontrarse outliers en la columna caracteres.
El proceso proviene tras realizar una EDA exhaustiva del dataset, y a raiz de ese punto, recopilar los apartados más importantes y destacable para dicho punto.
## No LSB modules are available.
## Distributor ID: Ubuntu
## Description: Ubuntu 20.04.2 LTS
## Release: 20.04
## Codename: focal
## AVISO: debería ejecutar este programa como superusuario.
## ruta H/W Dispositivo Clase Descripción
## =======================================================
## system Computer
## /0 bus Motherboard
## /0/0 memory 16GiB Memoria de sistema
## /0/1 processor Intel(R) Core(TM) i7-5500U CPU @ 2.40GHz
## /0/100 bridge Broadwell-U Host Bridge -OPI
## /0/100/2 display HD Graphics 5500
## /0/100/3 multimedia Broadwell-U Audio Controller
## /0/100/14 bus Wildcat Point-LP USB xHCI Controller
## /0/100/16 communication Wildcat Point-LP MEI Controller #1
## /0/100/1b multimedia Wildcat Point-LP High Definition Audio Controller
## /0/100/1c bridge Wildcat Point-LP PCI Express Root Port #1
## /0/100/1c.2 bridge Wildcat Point-LP PCI Express Root Port #3
## /0/100/1c.2/0 enp2s0 network RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller
## /0/100/1c.3 bridge Wildcat Point-LP PCI Express Root Port #4
## /0/100/1c.3/0 wlp3s0 network QCA9377 802.11ac Wireless Network Adapter
## /0/100/1c.4 bridge Wildcat Point-LP PCI Express Root Port #5
## /0/100/1c.4/0 display GK208BM [GeForce 920M]
## /0/100/1d bus Wildcat Point-LP USB EHCI Controller
## /0/100/1f bridge Wildcat Point-LP LPC Controller
## /0/100/1f.2 storage Wildcat Point-LP SATA Controller [AHCI Mode]
## /0/100/1f.3 bus Wildcat Point-LP SMBus Controller
## /0/2 system PnP device PNP0c02
## /0/3 system PnP device PNP0b00
## /0/4 generic PnP device INT3f0d
## /0/5 input PnP device PNP0303
## /0/6 system PnP device PNP0c02
## /0/7 system PnP device PNP0c02
## AVISO: la salida puede ser incompleta o imprecisa, debería ejecutar este programa como superusuario.
## _
## platform x86_64-pc-linux-gnu
## arch x86_64
## os linux-gnu
## system x86_64, linux-gnu
## status
## major 4
## minor 0.5
## year 2021
## month 03
## day 31
## svn rev 80133
## language R
## version.string R version 4.0.5 (2021-03-31)
## nickname Shake and Throw
Las herramientas de visualización que conozco son:
PowerBI [https://powerbi.microsoft.com/es-es/]
Tableau [https://public.tableau.com/es-es/s/]
Flourish [https://flourish.studio/]
Debido a las limitaciones por S.O. (Linux) por su incompatibilidad con dichas herramientas el Dashboard es muy limitado (debo utilizar una máquina virtual en Windows y los recursos de mi hardware son muy limitados para su correcta utulización.)
Se representa un conjunto de vistas sobre los datos escogidos y al final del documento se muesta el link con el dashboard realizado en Shinyapp.
Podemos obtener un listado de los acuerdos por pais:
Podemos obtener un listado de los paises con más acuerdos de paz: