Publicidad

Publicidad

Publicidad

Publicidad

Publicidad

Dall-E: la inteligencia artificial capaz de crear “arte”

¿Cuáles son las implicaciones de este generador de imágenes que se ha hecho viral?

hamster-gigante-atacando-kyoto-en-sombrero-de-mariachi.JPG
Dall-E, generador de imágenes con inteligencia artificial.
Sir Laguna

Si son asiduos de la red social Twitter, seguramente han visto las creaciones raras de Dall-E. Es bastante común encontrar a alguien publicando una serie de imágenes con un concepto inusual o cómico, las cuales lucen... “raras”, por no decirlo de otro modo.

Por: Julián Ramírez // @Sir_Laguna

Si no saben de qué estamos hablando, miren este ejemplo:

Publicidad

Es un material digno de pesadillas. Las caras están mal, las situaciones son reconocibles pero perturbadoramente extrañas. Aún así, el resultado es impresionante porque Dall-E no es un dibujante que trabaja a la velocidad de Sonic, es una inteligencia artificial.

¿Qué es Dall-E?

Publicidad

En los términos más sencillos posibles, Dall-E es un programa que crea imágenes en base a una frase u oración que le demos. Para lograrlo, es capaz de “mirar” el significado de lo que pedimos en internet, identificar sus elementos y finalmente combinarlos para presentar una serie de imágenes que creen que lo representan mejor.

Como cabe esperar, Internet está usando el poder de esta herramienta de la manera más sabia posible: ¡Para crear memes! Es difícil no descubrir Dall-E y resistir la tentación de ponerlo a prueba de inmediato con las ideas más locas que se nos ocurran. Los resultados pueden ser tan impresionantes como jocosos.

¿Quieren probarlo ustedes mismos? No hay problema, solo tienen que seguir este enlace . Tengan en cuenta que, dependiendo de la complejidad de lo que quieran crear, el resultado puede tardar hasta tres minutos en aparecer.

Publicidad

Incluso han surgido cuentas como Weird Dall-E Mini Generations que se dedican a recopilar los resultados más divertidos que encuentran.

Seguramente notaron que esta aplicación lleva el nombre ‘mini’ en su nombre (aunque recientemente cambió su nombre a Craiyon). Esto es porque lo que estamos usando no es más que una versión muy limitada del programa real, el cual es verdaderamente impresionante.

Publicidad

El poder de Dall-E 2

Puede que Dall-E mini/Craiyon no parezca más que una curiosidad o un generador de memes, pero su hermano mayor es algo completamente diferente. Dall-E 2 usa como modelo la versión 3 del transformador generativo entrenable (GPT), creado por OpenAI. Este usa 12 mil millones de parámetros para “reemplazar texto con pixeles”. Luego, otro modelo entrenable llamado CLIP se encarga de “entender y seleccionar” las imágenes generadas para presentarle al usuario las que cree más adecuadas.

Esto le permite crear imágenes tan impresionantes como esta:

Publicidad

No los estamos engañando. No es una foto ni la creación de un maestro del Photoshop, es una verdadera imagen creada por Dall-E 2.

Los responsables de esto son OpenAI, un laboratorio de investigación y desarrollo de inteligencia artificial con sede en San Francisco. Esta compañía fue fundada por Sam Altman, Elon Musk y es la responsable del controversial algoritmo de autopiloto para vehículos Tesla. El nombre del proyecto es una combinación de Wall-E, la película de Pixar, y el nombre del pintor surrealista Salvador Dalí.

Publicidad

Usando esta herramienta, el reportero de ciencia y tecnología Carlos “DotCSV” Santana, usó su propia foto para ubicarse en diferentes situaciones. Pueden ver los resultados en el siguiente hilo de Twitter:

¿Qué significa esto? ¿Se quedarán sin trabajo los artistas y diseñadores gráficos?

Las implicaciones de la generación de imágenes mediante inteligencia artificial

Publicidad

Es verdad. Muchos diseñadores y artistas visuales han demostrado preocupación sobre el futuro de esta profesión si herramientas como Dall-E 2 se perfeccionan y son puestas a disposición del gran público. Otros alegan que siempre existirán diseñadores porque una inteligencia artificial es incapaz de representar matices que exigen la intervención de un humano. También hay quienes lo ven como una simple base de creación, una herramienta para crear arte y no como un reemplazo del artista.

Pero hay otras preocupaciones más profundas. Al tomar contenido sin filtrar de Internet, la herramienta es propensa a representaciones parcializadas de ciertos temas e incluso personas. De hecho, en el pasado ya se ha visto como herramientas de inteligencia artificial entrenadas mediante Internet han replicado “opiniones” racistas y sexistas. En una publicación de TNW , OpenAI expresó que están “analizando el impacto social y potencial para la parcialización” de la herramienta antes de crear una versión para uso general.

Publicidad

Pero eso no es todo, la herramienta también es propensa a usar material protegido por derechos de autor en la generación de imágenes. Esta es probablemente la principal razón por la que no se ha masificado su uso aún. Nadie quiere ser demandado por culpa de un ‘software’ que “se robó una imagen sin darse cuenta”. También se teme que se le de un mal uso como ha ocurrido con Deepfake, que muchos han usado para poner el rostro de personas reales en escenas pornográficas .

Sin embargo, la herramienta no es perfecta. Entre más larga la frase que debe generar, más propensa a errores. También es común que confunda los adjetivos aplicados a determinados sustantivos cuando hay más de uno en la frase. Por último, algunas generaciones tienen errores incomprensibles que ni siquiera los entrenadores de la IA han logrado comprender.

La llegada de la generación de imágenes realistas e incluso “artísticas” ya está aquí. Cuando esta herramienta se perfeccione vamos a tener que convivir con ello. Ya veremos si los artistas y diseñadores se adaptarán a este nuevo mundo o si sus profesiones tienden a desaparecer.

Los dejamos con una última imagen generada por Dall-E mini/Craiyon para que reflexionen.

Publicidad

Publicidad

  • Publicidad