https://frosthead.com

Este puede ser el árbol genealógico más grande del mundo

El aumento de las pruebas de ADN a través de servicios como 23andme muestra que hay un gran mercado para la historia familiar.

Ahora, los científicos se han basado en esos datos al publicar lo que creen que es la base de datos de genealogía más grande del mundo, con un árbol genealógico que vincula a 13 millones de personas y se remonta a más de cinco siglos.

Como Jocelyn Kaiser informa para la revista Science, Yaniv Erlich, un genetista computacional de la Universidad de Columbia, pensó el proyecto hace siete años después de recibir un correo electrónico de un primo pariente lejano a través de Geni.com, uno de los muchos sitios donde buscar lazos familiares.

Con el apoyo del director de tecnología de Gemi.com, Erlich descargó los perfiles públicos del sitio, decenas de millones de ellos. Aunque no ofrecía datos de ADN, la información incluía el nombre de una persona, sexo, fecha y lugar de nacimiento, fecha de fallecimiento y familiares inmediatos.

Nature escribió sobre el proyecto de Erlich en sus primeras etapas en 2013, y el año pasado, Sarah Zhang, del Atlántico, informó que los investigadores habían publicado una preimpresión del enorme árbol. Ahora, escribe Kaiser, el equipo de Erlich ha publicado un estudio sobre su trabajo en la revista Science. Utilizando los datos, terminaron con 5, 3 millones de árboles, el mayor de los cuales conecta a unos 13 millones de parientes, en su mayoría de ascendencia europea.

Desde que comenzó el proyecto, Erlich se ha convertido en el director científico de MyHeritage, una compañía de pruebas de genealogía y ADN que posee Geni.com. Hizo un Reddit Ask Me Anything el viernes pasado sobre sus hallazgos, corrigiendo conceptos erróneos y explicando la metodología detrás del proyecto. También señaló que la parte más interesante de la experiencia para él fue descubrir cómo traducir todos los datos disponibles en algo personal.

En una entrevista con Nicole Wetsman de National Geographic, Erlich dice que descubrir cómo trabajar con esos datos también fue la parte más difícil del proyecto. “Los conjuntos de datos genómicos tienen herramientas específicas, estructuras de datos, métodos, pero no teníamos nada de eso para esto. Estábamos inventando la rueda a medida que avanzábamos ", dice.

Finalmente, los investigadores utilizaron la teoría de grafos matemáticos para organizar y verificar la información, informa Laura Geggel para Live Science . También compararon los perfiles con alrededor de 80, 000 certificados de defunción disponibles públicamente de Vermont durante un período de 25 años para garantizar que no solo se cargaran perfiles ricos en Geni.com.

Luego, el equipo decidió qué información querían buscar para probar la base de datos, escribe Wetsman.

Comenzaron a observar patrones y encontraron fluctuaciones en la vida útil, algo que habían anticipado. Por ejemplo, vieron una caída de hombres jóvenes durante la Guerra Civil y las Guerras Mundiales I y II, y un aumento de la supervivencia infantil en el siglo XX. También pudieron rastrear la migración, como la llegada del Mayflower en 1620 en lo que ahora es Massachusetts, seguido de un aumento de nacimientos en esa área.

Los investigadores también descubrieron que la longevidad tiene más que ver con el medio ambiente y el comportamiento que con la genética; de hecho, los datos revelaron que los genes son solo el 16 por ciento responsables de la duración de la vida. Sin embargo, Paola Sebastiani, profesora de bioestadística de la Escuela de Salud Pública de la Universidad de Boston, advierte sacar conclusiones sobre estos datos en una entrevista con Wetsman. "Hay mucha confusión sobre las definiciones de longevidad", dice ella.

El genetista Peter Visscher, de la Universidad de Queensland en Brisbane, Australia, le dice a Kaiser que los datos que el equipo de Erlich cumplió tienen el potencial de proporcionar información sobre el papel de la genética en las enfermedades si los datos están vinculados a información de salud.

El equipo de investigación ya ha comenzado a combinar el árbol con la información de DNA.Land, que reúne fuentes de datos de ADN, lo que podría significar que pronto llegará un árbol aún más grande. Los investigadores predicen que si la base de datos pudiera retroceder 65 generaciones, podrán completar el árbol.

Este puede ser el árbol genealógico más grande del mundo