12 de agosto de 2020

Libro guía: BDWS

BDWS-Cap1: Google Flu Trends (GFT)

Contexto

  • En el año 2009 surge la gripe A (H1N1) , una pandemia que cobró alrededor de 18.337 victimas en el mundo

  • Esto generó un problema de Salud Pública Mundial

  • Hasta ese año el monitoreo en EEUU estaba a cargo del “Centro para el control de enfermedades y Prevención de enfermedades) (CDC)

  • El CDC generaba un reporte a través de la agregación de la información a nivel nacional

  • Este proceso tomaba alrededor de 10 días

“En estas situaciones se vueve crucial monitorear con precisión y rapidez su evolución, tanto en el espacio (por dónde se produce) como en el tiempo (a qué velocidad)”. Walter Sosa

Solución de Google

Predecir la intensidad de la gripe en tiempo real y con precisión geográfica

¿Cómo?

Generar un modelo de predicción a partir de:

  1. Datos históricos de prevalencia: Semanales entre 2003 -2007 para 9 unidades hospitalarias ->2340 datos

  2. Datos de la intensidad de búsqueda de términos y frases relacionados con la gripe

\[Intensidadgripe= f(intensidadbusqueda,otros)\]

Éxito del DS: Google Flu Trends es Elvis del Big Data

La decadencia de GFT

La decadencia de GFT

Aprendizajes

Ambiciosas estrategias y modelamiento de big data no siempre solucionarán todo:

  • Más no siempre es preferido a menos
  • Es importante encontrar un correlato de los datos con la realidad
  • Tener cuidado con inducir “correlaciones espureas”

Pero, GFT sí resolvió un problema en un comienzo:

  • Redujo mucho el tiempo en que la política pública podía tomar acción sobre un posible crecimiento de la epidemia
  • El día de hoy coopera con CDC y podemos intuir que ha ayudado a mejorar los pronósticos de este organismo.

Caso Covid y BD

Datos ideales

  • Desagregados a nivel individual

  • Desagregados a nivel espacial: Ubicación del punto o manzana

  • Vinculado con variables relevantes: sexo, edad, fecha de síntomas, fecha de examen, sector laboral, condiciones de habitabilidad, riesgo financiero, entre otros

  • Trazabilidad: veracidad del dato y fechas confiables de publicación

  • Confidencialidad: aseguramiento de la confidencialidad de los datos a pacientes y familiares

Caso China:

Caso Chile

Caso Chile

Caso Chile: Análisis de datos

Caso Chile: Análisis de datos