https://frosthead.com

Sus tweets pueden predecir cuándo contraerá la gripe

En 1854, en respuesta a una devastadora epidemia de cólera que se extendía por Londres, el médico británico John Snow presentó una idea que revolucionaría el campo de la salud pública: el mapa epidemiológico. Al registrar casos de cólera en diferentes vecindarios de la ciudad y trazarlos en un mapa basado en las residencias de los pacientes, descubrió que una sola bomba de agua contaminada era responsable de gran parte de las infecciones.

El mapa lo persuadió, y, finalmente, a las autoridades públicas, de que la teoría de la enfermedad miasma (que afirmaba que las enfermedades se propagaban a través de gases nocivos) era falsa, y que la teoría de los gérmenes (que correctamente afirmaba que los microorganismos eran los culpables) era cierta. Pusieron un candado en el mango de la bomba responsable del brote, señalando un cambio de paradigma que cambió permanentemente la forma en que tratamos las enfermedades infecciosas y, por lo tanto, el saneamiento.

La tecnología de mapeo es bastante diferente, al igual que la enfermedad, pero hay una cierta similitud entre el mapa de Snow y un nuevo proyecto realizado por un grupo de investigadores dirigido por Henry Kautz de la Universidad de Rochester. Al crear algoritmos que pueden detectar las tendencias de la gripe y hacer predicciones basadas en palabras clave en tweets geoetiquetados disponibles públicamente, están adoptando un nuevo enfoque para estudiar la transmisión de enfermedades, uno que podría cambiar la forma en que estudiamos y rastreamos el movimiento de enfermedades en la sociedad .

"Podemos pensar en las personas como sensores que miran el mundo que les rodea y luego informan lo que están viendo y experimentando en las redes sociales", explica Kautz. "Esto nos permite hacer mediciones detalladas a escala de población y no requiere la participación activa de los usuarios".

En otras palabras, cuando tuiteamos que la tos dolorosa y la fiebre acaban de ponernos bajo, sin saberlo, estamos proporcionando datos ricos para un enorme experimento de salud pública, información que los investigadores pueden usar para rastrear el movimiento de enfermedades como la gripe en alta resolución y en tiempo real.

El proyecto de Kautz, llamado SocialHealth, ha utilizado tweets y otros tipos de redes sociales para rastrear una variedad de problemas de salud pública. Recientemente, comenzaron a usar tweets para monitorear casos de intoxicación alimentaria en los restaurantes de la ciudad de Nueva York registrando a todos los que habían publicado etiquetó geográficamente los tweets de un restaurante, luego siguió sus tweets durante las siguientes 72 horas, buscando menciones de vómitos, diarrea, dolor abdominal, fiebre o escalofríos. Al hacerlo, detectaron 480 casos probables de intoxicación alimentaria.

Pero a medida que cambia la temporada, su trabajo de seguimiento del virus de la influenza es lo que más te abre los ojos. Google Flu Trends también buscó utilizar los buscadores de Google para rastrear el movimiento de la gripe, pero el modelo sobreestimó en gran medida el brote del año pasado, tal vez porque la cobertura mediática de la gripe llevó a las personas a comenzar a hacer consultas relacionadas con la gripe. El análisis de Twitter representa un nuevo conjunto de datos con algunas cualidades (una resolución geográfica más alta y la capacidad de capturar el movimiento de un usuario a lo largo del tiempo) que podría generar mejores predicciones.

Para comenzar su proyecto de seguimiento de la gripe, los investigadores de SocialHealth observaron específicamente Nueva York, recolectando alrededor de 16 millones de tweets públicos geoetiquetados por mes de 600, 000 usuarios durante tres meses. A continuación se muestra un lapso de tiempo de un día de Twitter en Nueva York, con diferentes colores que representan diferentes frecuencias de tweets en esa ubicación (azul y verde significan menos tweets, naranja y rojo significan más):

Para hacer uso de todos estos datos, su equipo desarrolló un algoritmo que determina si cada tweet representa un informe de síntomas similares a la gripe. Anteriormente, otros investigadores simplemente habían hecho esto buscando palabras clave en los tweets ("enfermo", por ejemplo), pero su equipo descubrió que el enfoque conduce a falsos positivos: muchos más usuarios tuitean que están cansados ​​de la tarea de lo que están sentirse enfermo

Para dar cuenta de esto, el algoritmo de su equipo busca tres palabras seguidas (en lugar de una) y considera con qué frecuencia la secuencia particular es indicativa de una enfermedad, en función de un conjunto de tweets que etiquetaron manualmente. La frase "enfermo de gripe", por ejemplo, está fuertemente correlacionada con la enfermedad, mientras que "enfermo y cansado" no lo es tanto. Algunas palabras particulares (dolor de cabeza, fiebre, tos) están fuertemente relacionadas con la enfermedad, sin importar de qué secuencia de tres palabras formen parte.

Una vez que se codificaron estos millones de tweets, los investigadores pudieron hacer algunas cosas interesantes con ellos. Para empezar, observaron los cambios en los tweets relacionados con la gripe a lo largo del tiempo y los compararon con los niveles de gripe según lo informado por los CDC, confirmando que los tweets capturaron con precisión la tendencia general en las tasas de gripe. Sin embargo, a diferencia de los datos de los CDC, está disponible casi en tiempo real, en lugar de una o dos semanas después del hecho.

Pero también profundizaron, observando las interacciones entre diferentes usuarios, como lo representan dos usuarios que tuitean desde la misma ubicación (la resolución del GPS es aproximadamente media manzana) en la misma hora, para modelar la probabilidad de que una persona sana se enfermaría después de entrar en contacto con alguien con gripe. Obviamente, dos personas tuiteando desde el mismo bloque con 40 minutos de diferencia no necesariamente se reunieron en persona, pero las probabilidades de que se hayan reunido son ligeramente más altas que dos usuarios aleatorios.

Como resultado, cuando observa un conjunto de datos de interacciones lo suficientemente grande, surge una imagen de transmisión. Descubrieron que si un usuario sano se encuentra con otros 40 usuarios que se reportan enfermos con síntomas de gripe, sus probabilidades de tener síntomas de gripe al día siguiente aumentan de menos del uno por ciento al 20 por ciento. Con 60 interacciones, ese número aumenta al 50 por ciento.

El equipo también analizó las interacciones en Twitter, aislando pares de usuarios que se siguen y llamándolos "amistades". Aunque muchas relaciones de Twitter existen solo en la Web, algunas corresponden a interacciones de la vida real, y descubrieron que un usuario quien tiene diez amigos que se reportan enfermos tienen un 28 por ciento más de probabilidades de enfermarse al día siguiente. En total, utilizando ambos tipos de interacciones, su algoritmo fue capaz de predecir si una persona sana se enfermaría (y tuitearía al respecto) con una precisión del 90 por ciento.

Todavía estamos en las primeras etapas de esta investigación, y hay muchas limitaciones: la mayoría de las personas todavía no usan Twitter (sí, de verdad) e incluso si lo hacen, es posible que no twitteen acerca de enfermarse.

Pero si este tipo de sistema se pudiera desarrollar más, es fácil imaginar todo tipo de aplicaciones. Su teléfono inteligente podría advertirle automáticamente, por ejemplo, si hubiera pasado demasiado tiempo en los lugares ocupados por personas con gripe, lo que le indicaría que se vaya a casa para dejar de ponerse en el camino de la infección. Incluso se podría advertir a los residentes de una ciudad entera si estuviera al borde de un brote.

A pesar de los 150 años que nos separaron del avance en el mapeo de la enfermedad de John Snow, está claro que todavía hay aspectos de la información de la enfermedad que no entendemos completamente. Ahora, como entonces, mapear los datos podría ayudar a obtener las respuestas.

Sus tweets pueden predecir cuándo contraerá la gripe