https://frosthead.com

La gran mayoría de los datos en bruto de los antiguos estudios científicos pueden faltar ahora

Uno de los fundamentos del método científico es la reproducibilidad de los resultados. En un laboratorio de cualquier parte del mundo, un investigador debería poder estudiar el mismo tema que otro científico y reproducir los mismos datos, o analizar los mismos datos y notar los mismos patrones.

Es por eso que los hallazgos de un estudio publicado hoy en Current Biology son tan preocupantes. Cuando un grupo de investigadores intentó enviar un correo electrónico a los autores de 516 estudios biológicos publicados entre 1991 y 2011 y solicitar los datos en bruto, se sorprendieron al descubrir que más del 90 por ciento de los datos más antiguos (de documentos escritos hace más de 20 años) inaccesible. En total, incluso los documentos publicados en 2011, solo pudieron rastrear los datos en un 23 por ciento.

"Todo el mundo sabe que si le preguntas a un investigador los datos de estudios antiguos, ellos no saben dónde está", dice Timothy Vines, zoólogo de la Universidad de Columbia Británica, que dirigió el esfuerzo. "Pero realmente nunca hubo estimaciones sistemáticas de la rapidez con la que los datos en poder de los autores realmente desaparecen".

Para hacer su estimación, su grupo eligió un tipo de datos que ha sido relativamente consistente a lo largo del tiempo (mediciones anatómicas de plantas y animales) y desenterró entre 25 y 40 documentos por cada año impar durante el período que usó este tipo de datos, para ver si pudieran cazar los números en bruto.

Una cantidad sorprendente de sus consultas se detuvo en el primer paso: en el 25 por ciento de los estudios, no se pudieron encontrar las direcciones de correo electrónico activas, con direcciones desaparecidas que figuran en el propio documento y las búsquedas en la web no aparecían. Para otro 38 por ciento de los estudios, sus consultas no dieron respuesta. Otro 7 por ciento de los conjuntos de datos se perdieron o fueron inaccesibles.

"Algunas veces, por ejemplo, se guardaba en disquetes de tres pulgadas y media, por lo que nadie podía acceder a él, porque ya no tenían las unidades adecuadas", dice Vines. Debido a que la idea básica de mantener los datos es para que otros puedan usarlos en futuras investigaciones, este tipo de obsolescencia esencialmente hace que los datos sean inútiles.

Estos pueden parecer obstáculos mundanos, pero los científicos son como el resto de nosotros: cambian las direcciones de correo electrónico, obtienen nuevas computadoras con diferentes unidades, pierden sus copias de seguridad de archivos, por lo que estas tendencias reflejan problemas serios y sistémicos en la ciencia.

Y preservar los datos es tan importante, vale la pena recordarlo, porque es imposible predecir en qué dirección se moverá la investigación en el futuro. Vines, por ejemplo, ha llevado a cabo su propia investigación sobre un par de especies de sapos nativas de Europa del Este que parecen estar en proceso de hibridación. En la década de 1980, dice, un equipo separado de investigadores estaba trabajando en el mismo tema, y ​​encontró un artículo antiguo que documentaba la distribución de estos sapos en la década de 1930. Saber que su distribución había cambiado relativamente poco durante las décadas intermedias permitió a los científicos hacer todo tipo de cálculos que de otro modo no hubieran sido posibles. "Que los datos originales disponibles, de un estudio antiguo muy pequeño escrito en polaco, fue increíblemente útil para los investigadores que llegaron 70 años después", dice.

También existe el hecho de que gran parte de esta investigación se paga con fondos públicos, gran parte de ellos a través de subvenciones que estipulan que los datos resultantes se pongan a disposición del público de forma gratuita. Además, los datos de campo se ven afectados por las circunstancias del entorno en el que se recopilan; por lo tanto, es imposible replicarlos perfectamente más adelante, cuando las condiciones han cambiado.

¿Cual es la solución? Algunas revistas, incluida Molecular Ecology, de la cual Vines es editor editorial, han adoptado políticas que requieren que los autores envíen datos sin procesar junto con sus documentos, lo que permite a la propia revista archivar los datos a perpetuidad. Aunque las revistas, como las personas, son susceptibles de cambiar las direcciones de correo electrónico y la obsolescencia tecnológica, estos problemas pueden manejarse mucho más fácilmente a escala institucional.

La gran mayoría de los datos en bruto de los antiguos estudios científicos pueden faltar ahora