https://frosthead.com

¿Pueden las computadoras descifrar un lenguaje de 5,000 años?

La civilización del Indo, que floreció durante gran parte del tercer milenio antes de Cristo, fue la sociedad más extensa de su tiempo. En su apogeo, abarcaba un área de más de medio millón de millas cuadradas centrada en lo que hoy es la frontera entre India y Pakistán. Se han encontrado restos del Indo tan al norte como el Himalaya y tan al sur como Mumbai. Era la cultura urbana más antigua conocida del subcontinente y contaba con dos grandes ciudades, una en Harappa y otra en Mohenjo-daro. Sin embargo, a pesar de su tamaño y longevidad, y a pesar de casi un siglo de investigaciones arqueológicas, gran parte del Indo permanece envuelto en misterio.

Lo poco que sabemos proviene de excavaciones arqueológicas que comenzaron en la década de 1920 y continúan hoy. A lo largo de las décadas, los arqueólogos han encontrado una gran cantidad de artefactos, incluidos sellos de sellos, amuletos y tabletas pequeñas. Muchos de estos artefactos llevan lo que parecen ser especímenes de escritura: figuras grabadas que se asemejan, entre otras cosas, a herraduras aladas, ruedas con radios y peces verticales. Sin embargo, qué significan exactamente esos símbolos sigue siendo uno de los acertijos sin resolver más famosos de la erudición de las civilizaciones antiguas.

Ha habido otros códigos difíciles de descifrar en la historia. Los sorprendidos egiptólogos tuvieron un golpe de suerte con el descubrimiento de la famosa piedra de Rosetta en 1799, que contenía texto en egipcio y griego. El estudio de los jeroglíficos mayas languideció hasta que un lingüista ruso llamado Yury Knorozov hizo un uso inteligente del maya hablado contemporáneo en la década de 1950. Pero no hay piedra de Rosetta del Indo, y los estudiosos no saben qué idiomas, si es que los hay, pueden haber descendido del hablado por el pueblo del Indo.

Hace unos 22 años, en Hyderabad, India, un estudiante de octavo grado llamado Rajesh Rao pasó la página de un libro de texto de historia y aprendió por primera vez sobre esta fascinante civilización y su misterioso guión. En los años que siguieron, la educación y la profesión de Rao lo llevaron en una dirección diferente: terminó buscando la informática, que enseña hoy en la Universidad de Washington en Seattle, pero supervisó cuidadosamente la beca de Indus, vigilando las docenas de fracasados. intenta dar sentido al guión. Incluso mientras estudiaba inteligencia artificial y robótica, Rao acumuló una pequeña biblioteca de libros y monografías sobre el guión del Indo, unos 30 de ellos. En una estantería cercana, también mantuvo el preciado libro de texto de historia de octavo grado que lo presentó al Indo.

"Fue increíble ver la cantidad de ideas diferentes que la gente sugirió", dice. Algunos estudiosos afirmaron que la escritura era una especie de escritura sumeria; otros lo ubicaron en la familia Dravidian; otros pensaban que estaba relacionado con un idioma de la Isla de Pascua. Rao llegó a apreciar que este era "probablemente uno de los problemas más desafiantes en términos de historia antigua".

Como un intento tras otro no pudo descifrar el guión, algunos expertos comenzaron a perder la esperanza de que pudiera decodificarse. En 2004, tres académicos argumentaron en un controvertido artículo que los símbolos del Indo no tenían contenido lingüístico en absoluto. En cambio, los símbolos pueden haber sido poco más que pictogramas que representan figuras políticas o religiosas. Los autores llegaron a sugerir que el Indo no era una civilización alfabetizada en absoluto. Para algunos en el campo, toda la búsqueda de tratar de encontrar el lenguaje detrás de esos grabados del Indo comenzó a parecerse a un ejercicio inútil.

Unos años más tarde, Rao entró en la refriega. Hasta entonces, las personas que estudiaban el guión eran arqueólogos, historiadores, lingüistas o criptólogos. Pero Rao decidió sacar a colación los secretos del guión Indus utilizando la herramienta que mejor conocía: la informática.

Fascinado por la civilización del Indo desde el octavo grado, Rajesh Rao está utilizando la informática y un concepto llamado "entropía condicional" para ayudar a decodificar el guión del Indo. (Cortesía de David Zax) A lo largo de las décadas, los arqueólogos han encontrado una gran cantidad de artefactos de la civilización del Indo, incluidos sellos de sellos, amuletos y tabletas pequeñas. (Robert Harding / Robert Harding World Imagery / Corbis) Rao y sus colaboradores publicaron sus hallazgos en la revista Science en mayo. No descifraron el lenguaje, pero sus hallazgos agudizaron la comprensión del mismo. (Robert Harding / Robert Harding World Imagery / Corbis) Rao y sus colegas ahora están mirando cadenas de caracteres más largas de las que analizaron en el artículo de Science . Encontrar patrones a su vez ayudaría a determinar a qué familias de idiomas podría pertenecer el guión. (Cortesía de David Zax)

En un día de verano en Seattle, Rao me recibió en su oficina para mostrarme cómo él y sus colegas abordaron el problema. Expuso una colección de réplicas de impresiones de sellos de arcilla que los arqueólogos han encontrado en los sitios del Indo. Son pequeños, como pequeños chocolates cuadrados, y la mayoría de ellos presentan una imagen de un animal debajo de una serie de símbolos del Indo. La mayoría de las muestras del guión Indus son miniaturas como estas, que solo tienen unos pocos caracteres; No se han descubierto grandes monolitos. Los académicos no están seguros de la función de los sellos pequeños, me dijo Rao, pero una teoría es que pueden haber sido utilizados para certificar la calidad de los bienes comercializados. Otro sugiere que las focas podrían haber sido una forma de garantizar que los comerciantes pagaran impuestos al entrar o salir de una ciudad; se han encontrado muchas focas entre las ruinas de las casas de la puerta, que podrían haber funcionado como antiguas casetas de peaje.

Rao y sus colegas no buscaron hacer milagros (sabían que no tenían suficiente información para descifrar el guión antiguo), pero plantearon la hipótesis de que al usar métodos computacionales, al menos podrían comenzar a establecer qué tipo de escritura del Indo el script era: ¿codificaba el lenguaje o no? Lo hicieron usando un concepto llamado "entropía condicional".

A pesar del nombre imponente, la entropía condicional es un concepto bastante simple: es una medida de la cantidad de aleatoriedad en una secuencia. Considera nuestro alfabeto. Si tomas fichas de Scrabble y las lanzas al aire, es posible que encuentres cualquier carta vieja que aparezca después de otra. Pero en palabras reales en inglés, es más probable que ciertas letras aparezcan después de otras. Una q en inglés casi siempre es seguida por una u . A t puede ser seguido por un r o e, pero es menos probable que lo sigan an o a b .

Rao y sus colaboradores, un grupo internacional que incluye científicos informáticos, astrofísicos y matemáticos, utilizaron un programa informático para medir la entropía condicional del guión del Indo. Luego midieron la entropía condicional de otros tipos de sistemas: lenguajes naturales (sumerio, tamil, sánscrito e inglés), un lenguaje artificial (el lenguaje de programación de computadoras Fortran) y sistemas no lingüísticos (secuencias de ADN humano, secuencias de proteínas bacterianas y dos conjuntos de datos artificiales que representan extremos altos y bajos de entropía condicional). Cuando compararon la cantidad de aleatoriedad en el guión Indus con la de los otros sistemas, descubrieron que se parecía más a las tasas que se encuentran en los idiomas naturales. Publicaron sus hallazgos en mayo en la revista Science .

Si parece un idioma y actúa como un idioma, entonces probablemente sea un idioma, sugiere su trabajo. Los hallazgos no descifran el guión, por supuesto, pero sí agudizan nuestra comprensión del mismo, y han brindado consuelo a los arqueólogos que habían estado trabajando bajo el supuesto de que el guión Indus codifica el lenguaje.

Después de publicar el periódico, Rao tuvo una sorpresa. Resulta que la cuestión de a qué familia lingüística pertenece el guión es delicada: debido a la edad y el significado de la civilización del Indo, muchos grupos contemporáneos en la India quisieran reclamarlo como un antepasado directo. Por ejemplo, los indios de habla tamil del sur preferirían aprender que el guión del Indo era una especie de proto-dravidiano, ya que el tamil desciende del proto-dravidiano. Los hablantes de hindi en el norte preferirían que sea una antigua forma de sánscrito, un antepasado del hindi. El artículo de Rao no concluye a qué familia de idiomas pertenece el guión, aunque sí señala que la entropía condicional es similar a la del antiguo tamil, lo que hace que algunos críticos sumariamente "nos acusen de ser nacionalistas dravidianos", dice Rao. "La ferocidad de las acusaciones y ataques fue completamente inesperada".

Rao a veces se alivia al regresar al mundo de la neurociencia y la robótica menos ferozmente disputado. Pero la llamada del guión de Indus sigue siendo atractiva, y "lo que solía ser un hobby ahora está monopolizando más de un tercio de mi tiempo", dice. Rao y sus colegas ahora están mirando cadenas de caracteres más largas de las que analizaron en el artículo de Science . "Si hay patrones", dice Rao, "podríamos llegar a reglas gramaticales. Eso a su vez daría restricciones a los tipos de familias de idiomas a las que podría pertenecer el guión.

Espera que sus hallazgos futuros hablen por sí mismos, incitando menos rencor a los opositores que apoyan a una región de la India frente a otra. Por su parte, cuando Rao habla sobre lo que el guión Indus significa para él, tiende a hablar en términos de la India en su conjunto. "La herencia de la India se enriquecería considerablemente si pudiéramos comprender la civilización del Indo", dice. Rao y sus colaboradores están trabajando en ello, una línea de código fuente a la vez.

¿Pueden las computadoras descifrar un lenguaje de 5,000 años?