Gemini 3.5 traducirá y hará caer la barrera de los idiomas

Con Gemini 3.5 Translate, Google aspira a traducir conversaciones en tiempo real a más de 70 idiomas, sin convertir a todos en GPS agotados.

Google quiere seguir conquistando el futuro, y esta vez se enfrenta a un viejo sueño de la ciencia ficción: comprender a alguien casi instantáneamente, incluso si habla un idioma que no dominas. Con Gemini 3.5 Translate, también conocido como Gemini 3.5 Live Translate, la empresa promete traducción oral en tiempo real en más de 70 idiomas.

La idea no es nueva; los traductores automáticos existen desde hace años. Sin embargo, Google afirma haber dado un paso adelante. Su nuevo modelo de audio ya no espera pacientemente el final de una frase para ofrecer una traducción. Ahora, escucha, procesa y reproduce el flujo de inmediato, con solo unos segundos de retraso, algo más parecido a un intérprete humano que a un viejo software estancado en un centro de llamadas.

La herramienta estará disponible en Google Traducción en Android e iOS, así como en Google Meet. Los desarrolladores también podrán acceder a través de la API Gemini Live. En resumen, Google no solo lanza una función útil para las vacaciones, sino que también establece una base para reuniones internacionales, atención al cliente, aplicaciones de movilidad y todos los lugares donde las personas necesitan comunicarse sin compartir el mismo idioma.

Gemini 3.5 Translate quiere eliminar la voz robótica

Lo más interesante de Gemini 3.5 Translate no es solo la cantidad de idiomas soportados, sino la promesa de una voz menos mecánica. Google explica que su modelo mantiene la entonación, el ritmo y la altura de la voz del hablante original. En términos simples, la traducción debe conservar parte de tu forma de hablar.

Youtube video

Una voz sintética que no suene como un repartidor de boletos de tren es un avance bienvenido. Sin embargo, habrá que juzgar su eficacia a largo plazo. Las demontraciones de IA suelen ser impecables en condiciones tranquilas, bien iluminadas y perfectamente escenificadas. No obstante, en la vida real, a menudo se asemejan más a un restaurante ruidoso, un taxi acelerado o una videoconferencia con tres micrófonos abiertos.

Google asegura haber entrenado su modelo para manejar mejor los ruidos de fondo. Gemini 3.5 Live Translate detecta automáticamente los idiomas, eliminando la necesidad de que el usuario actúe como DJ lingüístico entre frases. Ya no es necesario cambiar manualmente el ajuste cada vez que un interlocutor pasa del español al japonés. Esto es práctico y, sobre todo, menos vergonzoso en medio de una conversación.

La empresa también introduce SynthID, su tatuaje digital integrado en la señal de audio. El objetivo es identificar el contenido generado por IA, una medida necesaria, ya que una tecnología capaz de imitar el tono de un hablante plantea interrogantes. Traducir es útil, pero permitir que alguien hable con una voz demasiado creíble es un terreno más delicado.

Google Meet se convierte en un terreno de juego multilingüe

Google Meet es uno de los primeros servicios en beneficiarse. Con Gemini 3.5 Translate, la traducción de voz en Meet abarcará más de 70 idiomas y más de 2000 combinaciones lingüísticas. Anteriormente, el sistema era mucho más limitado y dependía en gran medida del inglés como lengua principal. Ahora, Google desea facilitar los intercambios más directos entre varios idiomas.

Para las empresas, la propuesta es clara. Una reunión internacional sin subtítulos improvisados, sin intérpretes externos y sin largas pausas incómodas. Es una herramienta práctica para que todos se entiendan. En la práctica, no obstante, siempre quedarán los acentos, los chistes fallidos, las expresiones locales y las frases corporativas que incluso la IA podría querer ignorar.

Google Traducción también se beneficia de esta actualización. Con auriculares, la traducción puede emitirse directamente en los oídos. En Android, un nuevo modo de escucha permitirá incluso sostener el teléfono en la oreja como si se tratara de una llamada tradicional para escuchar la traducción de forma más discreta. Una buena idea para evitar compartir toda una conversación con los vecinos de mesa.

Socios como Grab ya están probando el modelo para facilitar los intercambios entre conductores y pasajeros. Sin duda, este tipo de herramienta puede ser de gran utilidad en situaciones cotidianas donde un malentendido puede convertir una experiencia simple en un verdadero lío.

Todavía queda una pregunta importante. La traducción en tiempo real no se limita a las palabras. Abarca el contexto, los matices y, en ocasiones, la diplomacia más básica. Google avanza rápidamente, muy rápidamente. Pero para saber si Gemini 3.5 Live Translate es realmente un traductor confiable o simplemente un excelente demostrador tecnológico, será necesario escuchar cómo funciona en circunstancias que no sean un escenario.


Gemini Translate

Gemini Translate


Scroll al inicio