https://frosthead.com

'Mona Lisa' cobra vida en 'Living Portrait' generado por computadora

La serie de Harry Potter acostumbró al mundo a la idea de retratos vivos con sus pinturas parlantes y fotografías en movimiento. Pero la semana pasada, cuando un "retrato vivo" generado por la IA de la Mona Lisa de Leonardo da Vinci comenzó a circular en la web, muchas personas se sorprendieron cuando el famoso retrato movió sus labios y miró a su alrededor.

El retrato animado de Lisa Gherardini fue uno de varios nuevos "modelos de cabeza parlante", más comúnmente conocido como "deepfakes", creado por investigadores del Centro de Inteligencia Artificial de Samsung en Moscú y el Instituto Skolkovo de Ciencia y Tecnología. Utilizando solo unos pocos marcos de referencia o incluso una sola imagen, los investigadores también hicieron fakekes de celebridades como Oprah, dieron vida a instantáneas únicas de Marilyn Monroe y Albert Einstein, y crearon nuevas expresiones para imágenes famosas como Vermeer's Girl with a Pearl Earring .

Los investigadores publicaron su método, que denominan "aprendizaje de tiro reducido", en YouTube y en un documento que aún no se ha revisado por pares en el repositorio de preimpresión arXiv.org. Si bien los detalles se vuelven bastante técnicos, Mindy Weisberger en LiveScience informa que para producir los retratos vivos, un tipo de inteligencia artificial llamada red neuronal convolucional se entrena analizando imágenes de referencia. Luego aplica los movimientos faciales de una serie de cuadros a una imagen estática, como la Mona Lisa . Cuantos más ángulos e imágenes de referencia tenga, mejor será el retrato vivo. Según el documento, la IA podría producir un "realismo perfecto" (medido por la capacidad de los humanos para discernir cuál de los tres conjuntos de imágenes eran falsos) usando solo 32 imágenes de referencia.

La Mona Lisa, por supuesto, es solo una imagen, por lo que los tres "retratos vivos" de la obra maestra de Leonardo son un poco inquietantes. Para las breves animaciones, la red neuronal observó tres videos de entrenamiento diferentes, y las tres versiones de Mona Lisa basadas en esos marcos parecen tener diferentes personalidades. Si Leonardo hubiera pintado su famoso modelo desde diferentes ángulos, el sistema podría haber producido un retrato vivo aún más realista.

Si bien la animada Mona Lisa es entretenida, el aumento de las falsificaciones profundas ha generado la preocupación de que las imágenes generadas por computadora puedan usarse para difamar a las personas, avivar las tensiones raciales o políticas y erosionar aún más la confianza en los medios en línea. "[E] minan nuestra confianza en todos los videos, incluidos los que son genuinos", escribe John Villasenor en The Brookings Institution. "La verdad misma se vuelve esquiva, porque ya no podemos estar seguros de lo que es real y lo que no".

Mientras que la IA se está utilizando para crear falsificaciones profundas, Villasenor dice que, al menos por ahora, también se puede utilizar para identificar falsificaciones profundas buscando inconsistencias que no sean evidentes para el ojo humano.

Tim Hwang, director de la Iniciativa de Ética y Gobernanza de AI de Harvard-MIT, le dice a Gregory Barber en Wired que todavía no estamos en el punto en que los malos actores puedan crear falsificaciones profundas sofisticadas en sus computadoras portátiles personales todavía. "Nada me sugiere que solo usarás esto para generar deepfakes en casa", dice. "No a corto plazo, mediano plazo o incluso a largo plazo".

Eso es porque usar el nuevo sistema de Samsung es costoso y requiere experiencia. Pero el artículo de Barber señala que no toma un video fotorrealista súper sofisticado hecho por una red neuronal para engañar a las personas. La semana pasada, un video manipulado que se había ralentizado para hacer que la presidenta de la Cámara de Representantes de los Estados Unidos, Nancy Pelosi, pareciera borracha circulaba en las redes sociales.

Eventualmente, sin embargo, la tecnología será lo suficientemente buena como para que los malos actores puedan producir falsificaciones profundas tan convincentes que no puedan ser detectados. Cuando llegue ese día, Hwang le dice a Wired, las personas deberán confiar en la verificación de hechos y las pistas contextuales para resolver lo que es real y lo que es falso. Por ejemplo, si la media sonrisa con los labios cerrados de Mona Lisa se convierte en una sonrisa con dientes e intenta venderte pasta de dientes blanqueadora, seguramente es una falsificación profunda.

'Mona Lisa' cobra vida en 'Living Portrait' generado por computadora