Lyria RealTime: ¿La muerte de la escucha?

Escrito por: José Luis Miralles Bono (tiempo de lectura: 4 ‘)

La muerte escucha, Hugo Simberg (1897)

En esta entrada muestro algunas pruebas con la generación de audio «infinita» de Lyria, y luego reflexiono sobre una posible distopía de la escucha musical que podemos empezar a intuir.

Ya hemos hecho alguna prueba con los modelos generativos de audio (aquí la primera), y más recientemente sobre el modelo Lyria:

Ahora vamos a mostrar algunas pruebas con la versión de «generación infinita» de Lyria, es decir, una versión del modelo de Lyria que genera música de forma continua mientras puedes ir cambiando el «prompt» sobre la marcha.

Aunque aun no ha saltado al gran público (y podemos afirmar que los resultados que produce aun no están preparados para ello, aunque se puedan hacer experimentos interesantes desde perspectivas más vanguardistas), desde el verano del 2025 en el blog de Magenta de Google explican el funcionamiento y de este modelo y se pueden acceder a algunas pruebas.

Una APP que te genera la Banda Sonora de tu día a día

Imagina que vas por la calle y por los auriculares escuchas una música que se adapta a lo que ves. Pues no hace falta que imagines mucho, eso ya existe. Es Lyria Camera. El funcionamiento es muy «simple» (dando por supuestas todas las complejidades del análisis de imagen mediante IA y la generación de audio mediante IA).

  • Enfocas con la cámara lo que quieras
  • Cada X segundos una IA analiza lo que ve y genera una descripción sintética
  • Esa descripción se usa como prompt para otra IA (Lyria) que genera audio.

He hecho un par de pruebas por la calle. Hay que tener en cuenta que la música no se adapta a lo que ve en cada momento, si no a lo que ha visto justo en el momento que analiza la imagen (abajo está el contador regresivo para saber cuándo se hará la captura), y luego tarda unos segundos que llegar la transición hacia el nuevo audio (suele llegar cuando quedan 15 o 14 segundos hasta la siguiente captura), y sigue así hasta que vuelve a captura y analizar otra imagen.

A continuación presento dos pruebas rápidas por la calle, en las que he intentado:

  • Primero: que no salga nadie, ya que esos datos son procesados por una IA.
  • Segundo: intentar ofrecer imágenes lo más diferentes posibles cada vez que se va a producir el análisis del entorno (algunas veces lo he conseguido, otras no me ha dado tiempo).

Y diréis,… pero esa música que ha decidido, a mi «no me pega» con esas imágenes, quizá por demasiado clichés o quizá por obviar el propio estado interno del «paseante». Y tenéis toda la razón. Si queréis «navegar» por todo un universo de estilos, para eso hace tenemos otra herramienta.

Una nave espacial para viajar por los estilos

Otro experimento compartido con el público de Google es SpaceDJ , en el que tenemos el control de una nave espacial que navega por «constelaciones» de estilos musicales relacionados. Aquí os dejo una prueba que he hecho.

Más tarde he intentado encontrar algún «tag» relacionado con la música clásica, pero me he cansado de navegar antes de encontrarlo. Si alguien encuentra el rincón de la música clásica (que seguro será muy pequeño…) que me lo diga. De nuevo, y ya comentado en nuestra entrada anterior sobre Lyria, nuestras etiquetas son ínfimas.

Una cocina de estilos

Y, aunque lo presentamos al final, pero en el blog de Magenta se presento antes, tenemos The Infinite Crate. Que no es más que una interfaz un poco más «controlable» de este modelo de Lyria. Merece la pena probarlo.

¿La muerte de la escucha?

Recientemente hemos publicado un breve ensayo propio sobre los distintos tipos de escucha.

Pero, ciertamente, esta nueva forma de escucha no está en el catálogo de escuchas que presentamos. Podríamos decir que nos encontramos frente a una nueva forma de escucha, ¿la muerte de la escucha? Me recuerda mucho a un una pequeña historia cyberpunk que he ido creando en diferentes versiones desde hace años, y que hemos publicado también recientemente en este blog. Realmente con la creación a tiempo real de Lyria se empieza a materializar esa profecía distópica que imaginaba hace unos años en esa historia.

Después de leer esta historia, que bien podría ser el futuro de tecnologías como Lyria, podemos hacernos las siguientes reflexiones:


Alienación cultural: 

Con la hegemonía de la música generada por IA, el intercambio creativo entre personas ha mermado. Las playlists no se comparten, los gustos no se discuten, y cada quien permanece aislado en su propio universo algorítmico. Esto ha roto la conexión social que antes generaban los conciertos y las reuniones improvisadas en callejones llenos de grafitis y beats humanos.

Dependencia tecnológica absoluta: 

Aquella rebeldía intrínseca a muchos tipos de música de diferentes épocas (sí, en Beethoven y muchos otros antes, hay rebeldía, no solo en el rap) se ha disuelto en forma de patrones predecibles, diseñados para agradar siempre. Su mente se ha moldeado a ritmos que le generan un disfrute constante, pero sin sorpresas, haciendo que se vuelva cada vez más dócil. ¿Qué sucede cuando la música deja de ser un acto de resistencia y se convierte en un pasatiempo perfectamente orquestado por máquinas?

Erosión de la creatividad y la identidad humana: 

La capacidad de crear y expresar emociones crudas se ve desplazada por la rapidez de la Inteligencia Artificial, capaz de componer un sencillo en cuestión de milisegundos. Las voces humanas se tornan obsoletas, reemplazadas por sintetizadores tan reales que engañan al oído, pero que nunca nacen de una experiencia vital. Y, de forma silenciosa, la sociedad va perdiendo la habilidad de identificarse con expresiones artísticas de carne y hueso.

Manipulación y extracción de datos:

Cuanto más escucha la playlist personalizada, más información obtiene el sistema de sus reacciones, de sus debilidades, de sus alegrías efímeras. La corporación encargada de proporcionar la IA musical domina una gigantesca industria de mercadeo, capaz de venderle medicamentos, entretenimiento y productos efímeros basándose en sus estados emocionales. La música que recibe no es una forma de arte, sino un instrumento de control.

Uniformidad del entorno sonoro:

El personaje principal percibe que, allá afuera, la urbe entera se mueve al compás de la misma IA. La gente deambula en la calle con los audífonos integrados, sumergida en sus propios mundos hechos a medida, pero sin ninguna chispa de improvisación. La ciudad, bajo la saturación de anuncios holográficos, suena como un solo track interminable.

¿Conseguiremos evitar esa distopía o vamos directos a ella?


José Luis Miralles Bono

Comentarios

Deja un comentario