Apps de Aprendizaje Automático como SUNO habían delineado un camino en la IA musical –pero los resultados de UDIO son espeluznantes. La YouTuber Andrea Fryer nos deja boquiabiertos…
Actualización 03/08/2024: Tanto el vídeo objeto de este reportaje como el canal en YouTube de Andrea Fryer, fueron eliminados para siempre –parece que este asunto tuvo sus repercusiones…
La revolucionaria plataforma de Inteligencia Artificial UDIO lleva poco tiempo en funcionamiento (está en beta, de hecho) –pero ya empieza a dar mucho que hablar en este controvertido asunto de la generación automática de música.
Uno de los ejemplos recientes más escalofriantes de las posibilidades musicales de UDIO ha llegado a manos de la fotógrafa, diseñadora y manipuladora digital finesa Andrea Fryer. Y es que YouTube está que arde con el vídeo que Fryer publicó el pasado 12 de Abril (lo tienes arriba), que presenta un tema de estilo Depeche Mode generado por completo a través de la mencionada y novedosa IA.
Diferente de SUNO: La IA UDIO parece ser más… vaya, inteligente
Nuestra protagonista (la real, nada de virtual) empezó con el enfrentamiento habitual ante cualquier app de Inteligencia Artificial: «Le di algunas vueltas [a UDIO.com), y fue interesante ver cómo se comportaba cuando escribías como mensaje de prompt el nombre de una banda [musical]».
SUNO no te lo permite, pero UDIO parece manejarlo de «una forma más inteligente», y reemplaza el nombre de la banda con algunas indicaciones adecuadas, como es posible ver en esta captura de la propia Andrea…
Tras escribir sólo las dos palabras «Depeche Mode» (menudo dúo de palabras, uhm), llegó la primera gran impresión para la diseñadora. «No agregué letra de canción, aunque esta IA sí lo soporta. En lugar de eso, dejé que generase sus propias letras (y por eso son tan malas). La verdad es que me perece genial, porque convierte a este proceso en un experimento más puro, para enseñar lo que el software es capaz de conseguir».
Cada vez que solicitas a UDIO la generación, obtienes dos clips de ejemplo. Y cuando Fryer generaba esta canción, su versión gemela fue la siguiente…
No es sólo automatización: Aquí hay mucho trabajo humano, también
La autora cree que esa segunda versión «tiene mucho potencial, aunque también muchos problemas»; la verdad es que no suena tan bien como la versión publicada, y su parecido con Dave Gahan es remoto. Por tanto, la elección de Andrea focalizó sobre el otro resultado que obtuvo en primer lugar.
Todo el proceso que siguió a continuación tuvo poco de automatización, y mucho de la participación creativa humana, a pesar de que el contexto pueda sugerir una intervención exclusiva de la Inteligencia Artificial.
«Estaba tan entusiasmada con ‘The Better Twin‘ que, de inmediato, me puse a trabajar agregando extensiones para convertirla en una canción completa. Y la verdad es que invertí horas y horas, porque el 99 por ciento de las generaciones no funcionaron bien junto al clip inicial. Si no recuerdo mal, la mayoría de los clips de extensión sonaban como Gahan, pero en distintos grados…»
Al generar sus extensiones del tema musical, Fryer nunca alteraba los mensajes y el ‘Modo Depeche’ inicial todavía estaba en el campo del prompt. A veces, UDIO reemplazaba ‘Depeche Mode’ con un mensaje idéntico, pero otras veces mostraba variaciones. Y la canción final terminó por incluir seis partes, como la propia autora exploraba en este vídeo ilustrativo relacionado…
Cuestión de prompts: Cómo UDIO lograba el parecido con Depeche Mode
Resulta muy curioso, interesante y formativo conocer ahora los mensajes automatizados de prompt que UDIO empleaba, para de ese modo reemplazar el termino ‘Depeche Mode’ en cada una de las seis partes obtenidas por su IA. Aquí están al completo, sólo que en inglés…
- Male vocalist, Electronic, Synthpop, Rock, Alternative rock, Dark, Rhythmic, Melodic, Atmospheric, Nocturnal, Alternative dance, Mechanical, Passionate, Cold, Longing, Sombre
- Male vocalist, Electronic, Synthpop, Rock, Alternative rock, Dark, Rhythmic, Melodic, Atmospheric, Nocturnal, Alternative dance, Mechanical, Passionate, Cold, Longing, Sombre
- Male vocalist, Electronic, Synthpop, Rock, Alternative rock, Dark, Rhythmic, Melodic, Atmospheric, Nocturnal, Alternative dance, Mechanical, Passionate, Cold, Longing, Sombre
- Instrumental, Instrumental, Electronic, Synthpop, Rock, Alternative rock, Dark, Rhythmic, Melodic, Atmospheric, Nocturnal, Alternative dance, Mechanical, Passionate, Cold, Longing, Sombre
- Instrumental, Instrumental, Instrumental, Electronic, Synthpop, Rock, Alternative rock, Dark, Rhythmic, Melodic, Atmospheric, Nocturnal, Alternative dance, Mechanical, Passionate, Cold, Longing, Sombre
- Instrumental, Instrumental, Instrumental, Instrumental, Electronic, Synthpop, Rock, Alternative rock, Dark, Rhythmic, Melodic, Atmospheric, Nocturnal, Alternative dance
Una vez que el resultado final fue satisfactorio a oídos de Andrea, terminó su vídeo y lo compartío en el canal Discord de UDIO. Al parecer, uno de los desarrolladores estaba presente en ese momento; y lo que ocurrio después, forma parte tanto del misterio como de una posible repercusión legal, con la consecuente maniobra potencial de precauciones tomada quizá por el equipo de los desarrolladores.
Las similitudes se perdieron en el tiempo, ‘como lágrimas en la lluvia’
Al día siguiente, Fryer trató de crear más canciones, escribiendo ‘Depeche Mode‘, y dejando que UDIO hiciera su trabajo. Quizá nuestra amiga pensó entonces que tenía una máquina de éxitos en sus manos…
«Pero no importa cuántas veces lo intenté (y seguí intentándolo desde entonces), [pues] nunca más fui capaz de obtener este tipo de resultados musicales. Algunas voces sonaban como Peter Murphy, otras con voces góticas desconocidas; y sólo de vez en cuando, escuchaba una canción donde las voces sonaban a [Dave] Gahan de una forma lejana…»
Bien pudiera ser que la voz de Gahan fuese una de las muchas que los desarrolladores emplearon para entrenar la IA de UDIO, y que estuviese codificada de tal forma que era mezclada aleatoriamente con voces de diferentes bandas, en cantidades variables.
O después de todo, esta canción quizá emanó por una simple casualidad, y acabó teniendo una cantidad muy alta del sello vocal particular de Gahan. «El clip gemelo que vinculé arriba, quizá tenga un 80 por ciento de Gahan. Y otra de las canciones que generé hoy, tenía un 50 por ciento, digamos».
«Quiero decir, no tengo idea de cómo lo configuraron todo o cómo funciona, pero así es como lo acabas percibiendo», precisa Andrea frente a los resultados subsiguientes en sus muchas pruebas con el machine learning de UDIO.
Posible intervención humana, lo cual nos devuelve confianza en el Hombre
Habíamos comentado que el desarrollador estaba en Discord cuando Fryer compartió su vídeo. «¿Es posible que viesen la conmoción sobre lo parecido que esto sonaba a DM (ya que la gente comentaba sobre ello), y entonces alertaron al equipo de que era necesario marcar algunos ajustes? Tengo que planteármelo así, ya que me resultó imposible obtener los mismos resultados desde entonces», precisa la mujer creativa tras esta aventura sónico-musical, casi de Ciencia-Ficción.
Lo cierto es que, al final, el resultado sonoro es sorprendente, pero deja un enorme espacio abierto tanto a la acción creativa de un productor, como a la intervención potencial de los desarrolladores de UDIO.
Y sólo eso, con lo primero como realidad operativa y lo segundo como una gran posibilidad, debería servir como un retorno para nuestra confianza en la IA como herramienta, y jamás como una fuente de sustitución. Los cerebros creativos están a salvo, totalmente, después de todo.
Un detalle final: Quizá te preguntes por la imagen que hemos usado en la noticia, así como todas las caras inspiradas en Dave Gahan que aparecen en el vídeo. La popular app StableDiffusion AI está detrás del proceso, además de la funcionalidad de ‘Relleno Generativo‘ de Adobe Photoshop.
En realidad son simples interpretaciones del cantante universal y frontman en Depeche Mode, y esas aplicaciones son dos de los muchos modelos que encontrarás por Internet. Algunos de los resultados no son perfectos, pero eso no quita para que la Redaccción de Future Music esté usando la IA a modo de herramienta contextual de apoyo en muchas de las imágenes que publicamos.
Sí, ya ves, así están las cosas.