https://frosthead.com

Cómo el GPS aprende a hablar tu idioma

Karen Jacobsen, una cantante y actriz de voz australiana, consiguió el concierto en 2000, poco después de llegar a Nueva York. Los productores, tipos corporativos, la enviaron a un estudio de grabación durante tres semanas, donde pasó cuatro horas al día diciendo cosas como "en la próxima intersección, gire a la izquierda" y "recalculando". Al final, no fue su voz eso fue tenso. "Dije 'aproximadamente' aproximadamente 186 veces", recuerda Jacobsen. "Ese tipo de cosas puede hacer que te vuelvas loco".

contenido relacionado

  • De Ptolomeo al GPS, la breve historia de los mapas

Dos años después, recibió una llamada telefónica de un amigo. "Karen", soltó su amigo. “Le compré a mi esposo una de esas cosas nuevas de GPS y la pusimos en la voz australiana. ¡Eres tú! ”Así es como Jacobsen descubrió que su voz daba instrucciones a 400 millones de personas en todo el mundo.

Su trabajo destaca el híbrido de sangre y tecnología que se usa en las voces ahora ubicuas que nos dicen a dónde acudir: más de mil millones de personas confían en Google Maps cada mes, y el 80 por ciento activa la opción de voz.

En los primeros días de la síntesis de voz, pensemos en los sonidos robóticos de Speak & Spell de fines de la década de 1970, un algoritmo convirtió el texto en un flujo monótono. Luego, a medida que crecen las bases de datos, puede grabar un actor de voz como Jacobsen pronunciando un corpus de sílabas y palabras, que los algoritmos combinarían y alterarían según las reglas básicas. Más recientemente, los codificadores de software de empresas como Nuance, que diseña interfaces de navegación para automóviles, han desarrollado un tercer enfoque: aplicar el aprendizaje profundo a la síntesis de voz. Mezcla palabras grabadas y fragmentos sintetizados, basándose en la inteligencia artificial para hacer que la pronunciación sea aún más humana. "Suenan increíblemente naturales", dice el director de tecnología de Nuance, Vlad Sejnoha.

Por supuesto, las peculiaridades del lenguaje siguen siendo un desafío para los sistemas de voz. "Piense 'bough' versus 'comprado' o 'read' versus 'read'", dice un portavoz de Google. "Pero espero que el usuario siempre pueda adivinar a qué nos referimos". Ahora que AI está enseñando a los sistemas de navegación para automóviles a hablar de manera más inteligente, a continuación buscará en el mundo en línea y descubrirá a dónde quiere ir, incluso antes de hacerlo.

Preview thumbnail for video 'Subscribe to Smithsonian magazine now for just $12

Suscríbase a la revista Smithsonian ahora por solo $ 12

Este artículo es una selección de la edición de julio / agosto de la revista Smithsonian

Comprar
Cómo el GPS aprende a hablar tu idioma