Gemini: Google lanza Lyria 3, un generador de música IA a partir de texto, foto o video

Gemini: Google lanza Lyria 3, un generador de música IA a partir de texto, foto o vídeo

Después de la imagen (y el fenómeno viral en torno a Nano Banana), Google lleva Gemini un paso más allá: Lyria 3, el modelo de generación musical de DeepMind, llega a la app Gemini con una promesa muy accesible: crear pistas de 30 segundos a partir de un simple texto… o incluso de una foto o un vídeo.

El objetivo es claro: convertir Gemini en un taller creativo todo en uno, donde se pasa de la idea al contenido compartible sin salir de la conversación.

Introducing Lyria 3, our new music generation model in Gemini that lets you turn any idea, photo, or video into a high-fidelity track with custom lyrics.
From funny jingles to lo-fi beats, you can create custom 30-second soundtracks for any moment.
See how it works. 🧵
– Google Gemini (@GeminiApp) February 18, 2026

¿Qué es Lyria 3?

Lyria 3 es presentado por Google DeepMind como su modelo de generación musical más avanzado, diseñado para producir pistas de «alta fidelidad» y abarcar diversos estilos, con la posibilidad de agregar letras y voces según los casos de uso.

En Gemini, el uso se concibe como una “herramienta”: describes un género, un ambiente, un tempo, un tema, y el modelo genera una breve pista que puedes reutilizar como jingle, fondo sonoro o “mini-pista” para una publicación.

Lo que distingue a Lyria 3 en Gemini es su capacidad de «coincidencia de atmósferas»:

texto a música
imagen o vídeo a música que encaja con la atmósfera visual, con letras si lo deseas (o instrumental).

Es un cambio de enfoque: ya no solo pedimos a la IA que “composite”, le pedimos que traduzca una escena en una banda sonora. Y esta es exactamente la característica que alimenta los usos de TikTok/Shorts/Reels.

Disponibilidad: despliegue global, pero controlado

1) Text to Tracks:
Describe un género, estado de ánimo o tema específico para crear pistas únicas con letras o audio instrumental que se ajuste a tu atmósfera.
Por ejemplo, podrías pedir: “Crea una pista de skate punk rock de los 90 para decirle a mi compañero de cuarto Ryan que lave los platos, de alta energía, con tambores rápidos.”
– Google Gemini (@GeminiApp) February 18, 2026

Google señala que la funcionalidad llega en beta a Gemini, con un despliegue amplio accesible para usuarios mayores de 18 años, y disponible “globalmente”, con una primera lista de idiomas (incluido el español).

Google es consciente de que la música generada es un terreno delicado. Su respuesta: SynthID, una marca de agua imperceptible integrada en los contenidos, que aquí se aplica al audio generado a través de Gemini. Google afirma que todas las pistas creadas con esta función están marcadas, y Gemini también puede ayudar a detectar si un archivo de audio contiene esta marca de agua. DeepMind explica que SynthID busca ser robusto frente a transformaciones comunes (compresión, ruido, cambio de velocidad).

En cuanto a los controles, Google también busca evitar la imitación directa de artistas, un tema ya explosivo con otros actores en la generación musical.

Google se enfoca en el uso «social» más que en la producción profesional

El formato de 30 segundos es un fuerte indicio de que no se trata de una DAW, sino de un generador de pistas cortas, reutilizables y compartibles. En otras palabras, Google se dirige menos a los compositores que a los creadores de contenido, pequeñas agencias de marketing y todos aquellos que quieren música «personalizada» sin tener que recurrir a una biblioteca.

Y también es una manera de reposicionar Gemini: más que un asistente, es un estudio multimodal, donde texto + imagen + vídeo + audio se convierten en materias intercambiables.