En 2010, nadie esperaba que el centro del discurso político de los Estados Unidos pronto cambiara a Twitter, la aplicación de mensajería social que brindaba a los usuarios la oportunidad de "microblogar" mensajes de 140 caracteres (aunque eso se ha elevado recientemente a un brisa 280). caracteres). En ese momento, Twitter comenzó a enviar a la Biblioteca del Congreso todos los tuits públicos que se enviaron, incluso desde sus primeros días de existencia en 2006. Después de 12 años de tomar cada toma caliente, disputa de comida rápida, re-tweet racista, ruso bot y la extraña reflexión de la estrella de Twitter, la Biblioteca ha tenido suficiente. Harper Neidig en The Hill informa que el LOC anunció ayer que después del 31 de diciembre, solo recopilará Tweets que considere de importancia histórica.
En un libro blanco sobre el tema, la Biblioteca cita varias razones para el cambio. Primero, el volumen de tweets ha crecido dramáticamente desde que se firmó un acuerdo con Twitter hace siete años, lo que hace que la gestión de la colección sea engorrosa. La naturaleza de los tweets también ha cambiado. La biblioteca solo recibe los textos de los tweets y no recibe imágenes, videos o gifs animados asociados con ellos. Con el tiempo, como se ha convertido en una parte más importante de la cultura de Twitter, la colección ha perdido mucho contenido y contexto.
La Biblioteca también cita la reciente expansión del límite de caracteres de tweet como una razón para el cambio, explicando que Twitter se está transformando y puede cambiar más en el futuro. “La Biblioteca generalmente no recopila de manera integral. Dada la dirección desconocida de las redes sociales cuando el regalo se planeó por primera vez, la Biblioteca hizo una excepción para los tweets públicos ”, explica la Biblioteca en el documento. "Con las redes sociales ahora establecidas, la Biblioteca está alineando su práctica de recolección con sus políticas de recolección".
Actualmente, el archivo de Tweets de 12 años no es de acceso público y el LOC no tiene un calendario actual para cuándo podría estar disponible. Ahora dicen que servirá como una instantánea de los primeros 12 años de una forma emergente de comunicación social, como si la Biblioteca hubiera enviado todos los telégrafos durante los primeros 12 años de esa tecnología.
El movimiento no fue completamente inesperado. Andrew McGill en The Atlantic explica que el COL no tenía los recursos o la experiencia adecuados para el proyecto y no tenía ingenieros trabajando a tiempo completo en los tweets. La Biblioteca arrojó más o menos lotes de tweets sin procesar, 500 millones producidos cada día, en un servidor para ser tratado en una fecha posterior. "Esta es una advertencia a medida que comenzamos a tratar con grandes datos, tenemos que tener cuidado con lo que nos suscribimos", le dice a McGill Michael Zimmer, de la Universidad de Wisconsin-Milwaukee. “Cuando las bibliotecas no tenían los recursos para digitalizar libros, solo una empresa del tamaño de Google podía poner el dinero y los cuerpos en él. Y eso podría ser donde está atascada la Biblioteca del Congreso ".
En 2010, el número de tweets era aproximadamente una décima parte del tráfico actual, y la función de "retweet" todavía era nueva y los hilos no estaban activos. Con el tiempo, sin embargo, los tweets incrustados en hilos, fotos y videos y el nuevo límite de caracteres han aumentado cada tweet y el volumen de datos diarios es asombroso. Para 2013, informa McGill, la Biblioteca ya admitió que estaba luchando y dijo que realizar una búsqueda en el archivo de tweets de 2006 a 2010 tomaría 24 horas en el sistema actual del LOC.
En el acuerdo original, la Biblioteca acordó embargar los tweets durante seis meses y eliminar los tweets eliminados y privados. Los investigadores estaban entusiasmados por acceder a los datos, pero se han sentido decepcionados por la falta de acceso público. Aún así, algunos esperan que la Biblioteca finalmente encuentre una manera de hacer accesibles los Tweets, lo que podría ser muy valioso para los sociólogos, psicólogos, politólogos y otros investigadores.
"No soy doctorado, pero me sorprende pensar qué podríamos aprender sobre nosotros mismos y el mundo que nos rodea a partir de esta gran cantidad de datos", escribió Matt Raymond, ex director de comunicaciones de LOC, cuando la asociación fue Anunciado. "Y estoy seguro de que aprenderemos cosas que ninguno de nosotros puede concebir".
Aunque no tenemos los archivos para revisar, Twitter todavía nos ha enseñado muchas cosas. Las personas normales pueden ser más divertidas que los mejores comediantes. También pueden ser abismalmente tontos. Los nazis todavía existen y no tienen problemas para expresar sus horribles pensamientos. Los trolls arruinarán cualquier conversación, por banal que sea. Y, por supuesto, la brevedad es el alma del ingenio. Y la ingenuidad en igual medida.