Los diagramas de Sankey son un tipo de diagrama de flujo en el que el ancho de las flechas es proporcional a la cantidad de flujo. Son útiles para visualizar el flujo de datos entre diferentes nodos en un sistema. Los diagramas de Sankey se utilizan comúnmente en la visualización de datos de eficiencia energética, costos, flujos de recursos y muchas otras aplicaciones de datos en flujo.
En el área médica, los diagramas de Sankey pueden tener usos específicos, como representar flujos de un tratamiento médico y su desenlace final. Esto puede ayudar a entender mejor la eficacia de diferentes tratamientos y a identificar áreas de mejora en el proceso de tratamiento. También pueden ser útiles para representar la prevalencia de una enfermedad específica y su resultado final. Por ejemplo, puede mostrar la cantidad de pacientes que se recuperan, los que experimentan complicaciones o los que no sobreviven a una enfermedad. Estas representaciones visuales pueden ser útiles para informar a los profesionales de la salud, a los responsables de la toma de decisiones y al público en general sobre las implicancias de una enfermedad y el impacto de diferentes estrategias de tratamiento.
El siguiente diagrama fue elaborado con los datos del articulo original: Prevalencia, tratamiento y control de la hipertensión arterial en adultos mexicanos: resultados de la Ensanut 2022/https://doi.org/10.21149/14779
De los autores: Ismael Campos-Nonato, D en C en SP,(1) Cecilia Oviedo-Solís, D en Nutr Pobl,(1) Jorge Vargas-Meza, D en Nutr Pobl,(1) Dolores Ramírez-Villalobos, M en C de la Salud,(2) Catalina Medina-García, D en Epidem,(1) Enrique Gómez-Álvarez, M Intern Hemod,(3) Lucía Hernández-Barrera, D en Epidem,(1) Simón Barquera, PhD Nutr Epidem.
Publicado en línea: 14 de junio de 2023 Autor de correspondencia: Dra. Lucía Hernández Barrera. Centro de Investigación en Nutrición y Salud, Instituto Nacional de Salud Pública.Av. Universidad 655, col. Santa María Ahuacatitlán. 62100 Cuernavaca, Morelos, México.
Debido a que el grafico original desde el punto de vista estadistico no representaba los porcentajes visuales, se tomo como ejemplo para mejorar el grafico utilizando otros diagramas, en este caso Sankey en R studio:
# Instala y carga las librerias necesarias
# install.packages("remotes")
#remotes::install_github("davidsjoberg/ggsankey")
library(ggsankey)
# install.packages("ggplot2")
#library(ggplot2)
# install.packages("dplyr")
library(dplyr) # Also needed
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
#install.packages("gridExtra")
library(gridExtra)
##
## Attaching package: 'gridExtra'
## The following object is masked from 'package:dplyr':
##
## combine
#if(!require(networkD3)) install.packages("networkD3")
library(networkD3)
# Contruccion de dataframe (datos)
nodes <- data.frame(
name = c("Hipertensión Arterial(Pob. Adultos) 47.8%", "Diagnosticados 34.4%", "No Diagnosticados 65.6%", "No Tratados 17.7%", "Tratados con Fármaco 82.3%", "No Controlados 67.1%", "Controlados 32.9%")
)
edges <- data.frame(
source = c(0, 0, 1, 1, 3, 4, 4),
target = c(1, 2, 3, 4, 5, 5, 6),
value = c(100 * 0.344, 100 * 0.656, 100 * 0.344 * 0.1438, 100 * 0.344 * 0.823, 100 * 0.344 * 0.823 * 0.177, 100 * 0.344 * 0.823 * 0.671, 100 * 0.344 * 0.823 * 0.329)
)
# Gráfico de Sankey
sankeyNetwork(Links = edges, Nodes = nodes, Source = 'source',
Target = 'target', Value = 'value', NodeID = 'name',
fontSize = 18, nodeWidth = 30)
# ajustando el tamaño del texto y nodo:
# Gráfico de Sankey
sankeyNetwork(Links = edges, Nodes = nodes, Source = 'source',
Target = 'target', Value = 'value', NodeID = 'name',
fontSize = 9, nodeWidth = 20)
El tamaño se puede modificar al momento de guardar la imagen.