El rol de los datos anónimos en la lucha contra las enfermedades
Los datos siempre han sido una herramienta vital para comprender y combatir las enfermedades, desde las ilustraciones dibujadas a mano por Florence Nightingale en los 1800s que mostraban cómo el saneamiento deficiente contribuía a enfermedades prevenibles en los soldados británicos, hasta el primer repositorio de datos de código abierto desarrollado en respuesta a la crisis del Ébola de 2014 en África Occidental. Cuando se reportaron los primeros casos de COVID-19 en Wuhan, los datos volvieron a convertirse en la herramienta más crítica para combatir la pandemia.
Un grupo de investigadores, que documentó el brote inicial, rápidamente unió fuerzas y comenzó a recopilar datos que podrían ayudar a los epidemiólogos de todo el mundo a modelar la trayectoria del brote del nuevo coronavirus. Los investigadores procedían de la Universidad de Oxford, la Universidad de Tsinghua, la Universidad Northeastern y el Boston Children’s Hospital, entre otros.
Sin embargo, su flujo de trabajo inicial no fue diseñado para el aumento exponencial de casos. Los investigadores acudieron a Google.org en busca de ayuda. Como parte de la contribución de 100 millones de dólares de Google para las labores de asistencia COVID, Google.org otorgó 1,25 millones de dólares en fondos y proporcionó un equipo de 10 Google.org Fellows a tiempo completo y 7 voluntarios de Google a tiempo parcial para ayudar con el proyecto.
Estos voluntarios de Google ayudaron a los investigadores de las principales instituciones académicas a crear Global.health: una plataforma (escalable y de acceso abierto) que reúne millones de casos de COVID-19 anonimizados de más de 100 países, la más completa del mundo. Esta plataforma permitirá a los epidemiólogos de todo el mundo modelar la trayectoria del COVID-19, así como sus variantes y otras enfermedades infecciosas.
La necesidad de datos de casos fiables y anónimos: la historia del origen de Global.health
Cuando ocurre un brote, el acceso oportuno a datos organizados, confiables y anónimos es fundamental para que los líderes de salud pública informen de manera temprana las decisiones políticas, las intervenciones médicas y la asignación de recursos, todo lo cual puede desacelerar la propagación y salvar vidas. Los conocimientos derivados de los datos de “lista lineal” (ej. Información anonimizada a nivel de caso), a diferencia de los datos agregados como el recuento de casos, son esenciales para que los epidemiólogos realicen análisis estadísticos más detallados y modelen la eficacia de diversas intervenciones.
Un grupo de voluntarios de la Universidad de Oxford había comenzado a seleccionar de forma manual estos datos, pero los datos estaban distribuidos en cientos de sitios web, en docenas de formatos y en varios idiomas. El equipo de HealthMap del Boston Children’s Hospital también había identificado los primeros reportes de COVID-19 mediante la indexación automatizada de sitios de noticias y fuentes oficiales. Los dos equipos unieron fuerzas, compartieron los datos y publicaron hallazgos revisados por pares para crear un recurso confiable para la comunidad global.
La participación de Google.org Fellowship
Para ayudar a la comunidad global de investigadores en este significativo esfuerzo, Google.org decidió ofrecer el apoyo de 10 Google.org Fellows que pasaron 6 meses trabajando a tiempo completo en Global.health, además de 1,25 millones de dólares en subvenciones. Trabajando mano a mano con la Universidad de Oxford y el Boston Children’s Hospital, el equipo de Google.org Fellows habló con investigadores y funcionarios de salud pública trabajando en la primera línea de la respuesta a COVID-19 para comprender los desafíos de la vida real que enfrentaron al encontrar y utilizar datos confiables de alta calidad, un proceso manual laborioso y tedioso que a menudo lleva horas realizar.
Garantizar la privacidad de los datos es clave para el diseño de la plataforma. Los datos anonimizados utilizados en Global.health provienen de fuentes autorizadas de salud pública de acceso libre, y son rigurosamente verificados por un panel de expertos en datos para garantizar que cumplan con los estrictos requisitos de anonimato. Los Google.org Fellows ayudaron al equipo de Global.health a diseñar el flujo de ingesta de datos para implementar las mejores prácticas para la verificación de datos y controles de calidad para ayudar a asegurar que ningún dato personal llegue a la plataforma. (Todos los datos de lista lineal agregados a la plataforma se almacenan y alojan en la infraestructura de datos segura del Boston Children's Hospital, y no en la de Google).
Mirando hacia el futuro
Con el apoyo de Google.org y la Fundación Rockefeller, Global.health se ha convertido en un consorcio internacional de investigadores en universidades líderes que recopilan la base de datos COVID-19 de lista lineal más completa del mundo que incluye millones de registros anonimizados de fuentes confiables que abarcan más de 100 países (incluyendo Argentina, Brasil, Chile, Colombia, México, Panamá y Perú, entre otros) cada uno de los cuales contiene 40 campos estandarizados de metadatos.
Con una visión clara centrada en la estandarización y anonimización de datos, flujos de trabajo de ingesta automatizados, controles de calidad y validación, y una experiencia de usuario intuitiva, Global.health permite a los investigadores de todo el mundo acceder a los datos en cuestión de minutos y una serie de clics. La flexibilidad de la plataforma Global.health significa que puede adaptarse a los datos de enfermedades infecciosas y al contexto local a medida que ocurren nuevos brotes. Global.health sienta las bases para que los investigadores y los funcionarios de salud pública accedan a estos datos sin importar su ubicación, ya sea en Nueva York, São Paulo, Munich, Kyoto o Nairobi.