En septiembre del 2017 dejé mi ciudad natal para iniciar una nueva en Nueva Zelanda. Esta ha sido mi segundo viaje a lejanos confines del mundo, decidí registrar y documentar de la mejor manera posible mi experiencia. En esta serie de artículos, voy a compartir algunos experimentos de visualización de datos basado en mis registros de viaje como una forma de narrativa.
Poco antes de mi partida, mi cuñada me regaló una pequeña y bonita libreta de anotaciones.
Luego de aterrizar en Auckland, le encontré un uso a esta libreta: escribir los nombres de todas las personas que he conocido durante mis viajes, sin importar que fuesen amigos, conocidos pasajeros o incluso personas que deseo no haber conocido jamás.
Aclaro que los datos, así como la versión original de este artículo, se encuentran en inglés. Algunos nombres, especialmente en los gráficos generados programáticamente, continúan en su idioma original.
Esta nube de palabras exhibe los nombres de todas aquellas personas. Los nombres que se muestran más grandes son aquellos que se repiten entre distintas personas. Unos pocos nombres son sólo sobrenombres que inventé porque no llegué a conocer el nombre verdadero. Otros, sin embargo, parecen seudónimos pero en verdad no lo son.
Para ser honesto, no es un recuento exhaustivo de todas y cada una de las almas con las que me crucé. Muchas personas en verdad jamás supe el nombre, aunque pude haber tenido alguna interacción con ello/as – aunque ciertamente no una conversación relevante. Más allá del caso de los dependientes de tiendas, de algunas personas sencillamente jamás super el nombre o no me las han presentado apropiadamente .
Además de nombres, anoté los países de origen junto a cada nombre. Resulta que conocí personas de muy diversos lugares del mundo.
El siguiente planisferio muestra una escala de colores acorde con el número relativo de personas para cada territorio. Las proporciones van desde menor número en tonos verdes hasta mayores, en rojo.
Nueva Zelanda tiene el color más intenso mientras que una mayoría de países tienen tonos verdosos.
No fue hasta mediados del 2018 que comencé a tomar nota de las nacionalidades. Así, me he olvidado de dónde vienen muchos de mis conocidos en etapas tempranas, por lo que los consigné como nacionalidad desconocida. Además, algunas personas jamás pude saber o preguntarles de dónde venían.
El siguiente gráfico “waffle” exhibe la distribución proporcional de nacionalidades de las personas que conocí.
Algunas observaciones:
1. Casi un quinto de mis conocidos son nacionales de Nueva Zelanda.
2. Luego de los kiwis, el segundo grupo más importante son los de “origen desconocido”.
3. Mi país de origen se encuentra muy bien representado entre mis conocidos.
4. Hay cuatros otras nacionalidades que representan cada una entre 6 o 4%. Todas las demás son comprimidas en la categoría “otros” (“other”).
Aunque sexi e intuitivo, el defecto de esta visualización es que sólo puede incluir hasta 9 colores. Sin embargo, hay 48 nacionalidades en mi Libro de Nombres (más, la etiquita “desconocido”) y para algunos de estos países, sólo hay un puñado de personas.
Una ligeramente mejor aproximación es por grupos de países según región geográfica. Tenga presente que la definición de “región” es discutible, pero mi intención es encontrar un balance entre agregación y enunciación.
La gráfica “waffle” resultante muestra una distribución mucho más balanceada entre regiones, con las notables excepciones de África y Angloamérica. Pese a la multitud de mis con-nacionales que se destacaron en la gráfica anterior, los latinoamericanos ocupan el cuarto lugar como región. Además, los catalogados como “origen desconocido” se transforman en un segmento marginal en esta perspectiva.
Como quiero saber un poco más sobre la distribución de países de origen en mi Libro de Nombres, exploraré un gráfico de estimación de densidades.
El número de frecuencias (cuánta gente de cada país) está representada en el eje horizontal y la altura de la figura corresponde a cuántos países se encuentran en dicha frecuencia. Observe cómo los 92 Neocelandeses están aislados en la esquina derecha. En contraste, para la gran mayoría de los países, he conocido menos de diez personas en total. La línea roja es la mediana (separando la mitad de la distribución a cada lado) coincide con el valor 4 en frecuencias de conocidos.
Por último, para complementar este gráfico, puedo muestras una nube de nombres sobre el fondo del panel:
Este es un proyecto personal par compartir mis habilidades de análisis y visualización de datos con R y combinarlo con un formato narrativo. Para aquellos interesados en el código que usé en la publicación, siéntanse libres de contactarme. A continuación se encuentran las citas para las tecnologías que usé en este artículo:
## R Core Team (2018). _R: A Language and Environment for Statistical
## Computing_. R Foundation for Statistical Computing, Vienna,
## Austria. <URL: https://www.R-project.org/>.
##
## Urbanek S (2013). _png: Read and write PNG images_. R package
## version 0.1-7, <URL: https://CRAN.R-project.org/package=png>.
##
## Müller K (2018). _bindrcpp: An 'Rcpp' Interface to Active
## Bindings_. R package version 0.2.2, <URL:
## https://CRAN.R-project.org/package=bindrcpp>.
##
## Becker OScbRA, Minka ARWRvbRBEbTP, Deckmyn. A (2018). _maps: Draw
## Geographical Maps_. R package version 3.3.0, <URL:
## https://CRAN.R-project.org/package=maps>.
##
## Hijmans R (2019). _geosphere: Spherical Trigonometry_. R package
## version 1.5-10, <URL:
## https://CRAN.R-project.org/package=geosphere>.
##
## Vaidyanathan R, Xie Y, Allaire J, Cheng J, Russell K (2018).
## _htmlwidgets: HTML Widgets for R_. R package version 1.3, <URL:
## https://CRAN.R-project.org/package=htmlwidgets>.
##
## Wickham H (2017). _httr: Tools for Working with URLs and HTTP_. R
## package version 1.3.1, <URL:
## https://CRAN.R-project.org/package=httr>.
##
## Wickham H (2019). _rvest: Easily Harvest (Scrape) Web Pages_. R
## package version 0.3.4, <URL:
## https://CRAN.R-project.org/package=rvest>.
##
## Wickham H, Hester J, Ooms J (2018). _xml2: Parse XML_. R package
## version 1.2.0, <URL: https://CRAN.R-project.org/package=xml2>.
##
## Wickham H (2018). _stringr: Simple, Consistent Wrappers for Common
## String Operations_. R package version 1.3.1, <URL:
## https://CRAN.R-project.org/package=stringr>.
##
## Wickham H, Henry L (2018). _tidyr: Easily Tidy Data with
## 'spread()' and 'gather()' Functions_. R package version 0.8.2,
## <URL: https://CRAN.R-project.org/package=tidyr>.
##
## Garnier S (2018). _viridis: Default Color Maps from 'matplotlib'_.
## R package version 0.5.1, <URL:
## https://CRAN.R-project.org/package=viridis>.
##
## Garnier S (2018). _viridisLite: Default Color Maps from
## 'matplotlib' (Lite Version)_. R package version 0.3.0, <URL:
## https://CRAN.R-project.org/package=viridisLite>.
##
## Rudis B, Gandy D (2017). _waffle: Create Waffle Chart
## Visualizations in R_. R package version 0.7.0, <URL:
## https://CRAN.R-project.org/package=waffle>.
##
## Wickham H, François R, Henry L, Müller K (2018). _dplyr: A Grammar
## of Data Manipulation_. R package version 0.7.8, <URL:
## https://CRAN.R-project.org/package=dplyr>.
##
## Wickham H (2016). _ggplot2: Elegant Graphics for Data Analysis_.
## Springer-Verlag New York. ISBN 978-3-319-24277-4, <URL:
## http://ggplot2.org>.