https://frosthead.com

El mundo según Twitter, en Maps

Tweets de todo el mundo, trazados por ubicación como parte de un nuevo estudio. Click para agrandar. Imagen vía First Monday / Leetaru et. Alabama.

Es difícil apreciar cuán rápida y exhaustivamente Twitter se ha apoderado del mundo. Hace solo siete años, en 2006, era una idea esbozada en un bloc de papel. Ahora, se estima que 554 millones de usuarios utilizan el servicio, un número que representa casi el 8 por ciento de todos los humanos en el planeta, y se han enviado unos 170 mil millones de tweets, con un número que aumenta en aproximadamente 58 millones cada día .

Todos estos tweets proporcionan una fuente invaluable de noticias, entretenimiento, conversación y conexión entre personas. Pero para los científicos, también son valiosos como algo bastante diferente: datos sin procesar.

Debido a que Twitter presenta una API abierta (que permite que los tweets se descarguen como datos sin procesar y analizables) y muchos tweets están geoetiquetados, los investigadores pueden usar miles de millones de estos tweets y analizarlos por ubicación para obtener más información sobre la geografía de los humanos en todo el planeta. El otoño pasado, como parte de Global Twitter Heartbeat, un equipo de la Universidad de Illinois analizó el idioma y la ubicación de más de mil millones de tweets de todo Estados Unidos para crear mapas sofisticados de cosas como las emociones positivas y negativas expresadas durante el huracán Sandy, o el apoyo a Barack Obama o Mitt Romney durante las elecciones presidenciales.

Como señaló Joshua Keating en el blog War of Ideas de Foreign Policy, los miembros del mismo grupo, liderados por Kalev Leetaru, recientemente han ido un paso más allá. Como se publicó en un nuevo estudio a principios de esta semana en la revista en línea First Monday, analizaron las ubicaciones y los idiomas de 46, 672, 798 tweets publicados entre el 23 de octubre y el 30 de noviembre del año pasado para crear un impresionante retrato de la actividad humana en todo el planeta, que se muestra en el arriba de la publicación. Hicieron uso de Twitter decahose, un flujo de datos que captura un 10 por ciento aleatorio de todos los tweets en todo el mundo en un momento dado (que totalizó 1, 535, 929, 521 para el período de tiempo), y simplemente se centró en los tweets con datos geográficos asociados.

Como señalan los investigadores, la densidad geográfica de los tweets en muchas regiones, especialmente en el mundo occidental, donde las computadoras, los dispositivos móviles y Twitter se utilizan en los niveles máximos, coincide estrechamente con las tasas de electrificación y uso de iluminación. Como resultado, los mapas de tweets (como la vista detallada de los Estados Unidos continentales, a continuación) terminan pareciéndose mucho a imágenes satelitales de luz artificial por la noche.

Click para agrandar. Imagen vía First Monday / Leetaru et. Alabama.

Como prueba para ver qué tan bien los tweets coincidían con el uso de la luz artificial, crearon el mapa compuesto a continuación, en el que los tweets se muestran como puntos rojos y la iluminación nocturna se muestra como azul. Las áreas en las que se corresponden en frecuencia (y se cancelan entre sí efectivamente) se muestran en blanco, y las áreas donde una supera a la otra permanecen en rojo o azul. Muchas áreas terminan pareciendo bastante blancas, con algunas excepciones clave: Irán y China, donde está prohibido Twitter, son notablemente azules, mientras que muchos países con tasas de electrificación relativamente bajas (pero donde Twitter sigue siendo popular) aparecen en rojo.

Click para agrandar. Imagen vía First Monday / Leetaru et. Alabama.

El proyecto se volvió aún más interesante cuando los investigadores utilizaron un sistema automatizado para desglosar los tweets por idioma. El idioma más común en Twitter es el inglés, que está representado en el 38.25 por ciento de todos los Tweets. Luego vinieron los japoneses (11.84 por ciento), españoles (11.37 por ciento), indonesios (8.84 por ciento), noruegos (7.74 por ciento) y portugueses (5.58 por ciento).

El equipo construyó un mapa de todos los tweets escritos en los 26 idiomas más populares, cada uno representado por un color diferente, a continuación:

Click para agrandar. Imagen vía First Monday / Leetaru et. Alabama.

Si bien los tweets de la mayoría de los países están dominados por sus idiomas oficiales, muchos revelan que incluyen tweets en una variedad de otros idiomas. Mire lo suficientemente de cerca, y verá un arco iris de colores sutilmente saliendo de los puntos grises (tweets en inglés) que cubren los Estados Unidos:

Click para agrandar. Imagen vía First Monday / Leetaru et. Alabama.

Entre otros análisis, el equipo de investigación incluso analizó la geografía de retuitear y hacer referencia: la distancia promedio entre un usuario y alguien a quien retuitea, así como la distancia promedio entre ese usuario y alguien a quien simplemente hace referencia en un tweet. En promedio, la distancia para un retweet fue de 1, 115 millas y 1, 118 como referencia. Pero, contraintuitivamente, hubo una relación positiva entre el número de veces que un usuario dado retuiteó o hizo referencia a otro usuario y su distancia: los pares de usuarios con solo un puñado de interacciones, en general, tenían más probabilidades de estar más juntos (500- 600 millas de distancia) que aquellos con docenas de retweets y referencias entre ellos.

Esto indica que los usuarios que viven lejos están más propensos a usar Twitter para interactuar regularmente. Una explicación podría ser que las entidades con la mayor cantidad de seguidores, y por lo tanto la mayor cantidad de referencias y retuits, son a menudo celebridades, organizaciones o corporaciones, usuarios con los que las personas están familiarizadas, pero en realidad no tienen una relación personal. A continuación se muestra un mapa global de retweets entre usuarios:

Click para agrandar. Imagen vía First Monday / Leetaru et. Alabama.

El documento entró en más detalles sobre otros datos asociados con los tweets: la relación entre la cobertura de noticias convencionales y el número de tweets en un país (Europa y los EE. UU. Obtienen una cobertura de medios desproporcionada, mientras que América Latina e Indonesia se pasan por alto), los lugares que Twitter tiene agregó la mayoría de los usuarios recientemente (Medio Oriente y España) y los lugares donde los usuarios tienen, en promedio, la mayor cantidad de seguidores (América del Sur y la Costa Oeste).

Hay algunas advertencias a todos estos datos. Por un lado, aunque los tweets analizaron el número en decenas de millones, siguen siendo solo el 0.3 por ciento de todos los tweets enviados, por lo que podrían no representar adecuadamente todos los patrones de Twitter, especialmente si los usuarios que permiten geoetiquetado se comportan de manera diferente a los demás. Además, en el mundo en rápido cambio de Twitter, algunas tendencias ya podrían haber cambiado significativamente desde el otoño pasado. Pero a medida que Twitter continúa creciendo y a medida que hay más datos disponibles, es lógico que este tipo de análisis solo sea más popular para los demógrafos, informáticos y otros investigadores.

El mundo según Twitter, en Maps