Xiaomi MiMo-V2.5-Pro UltraSpeed supera los 1,000 tokens por segundo
Xiaomi acelera drásticamente en la carrera por los grandes modelos de lenguaje. Con el modo UltraSpeed de MiMo-V2.5-Pro, la empresa china afirma haber superado la barrera simbólica de los 1,000 tokens por segundo en GPU convencionales.
Desarrollado con TileRT, este modelo de 1,000 millones de parámetros promete una velocidad de generación espectacular, alrededor de diez veces superior al acceso API estándar de MiMo-V2.5-Pro.
Una velocidad diseñada para usos en tiempo real
El anterior MiMo-V2-Flash ya alcanzaba los 150 tokens por segundo a finales de 2025, una cadencia más rápida que la lectura humana. Con UltraSpeed, Xiaomi cambia de escala.
En este nivel, la IA no solo responde rápidamente. Se vuelve capaz de generar código, texto o interacciones largas casi instantáneamente, allanando el camino para agentes más fluidos, asistentes en tiempo real y herramientas de desarrollo mucho más reactivas.
Un rendimiento obtenido por co-diseño
Xiaomi explica este avance por una optimización conjunta del modelo y de la infraestructura de inferencia. En otras palabras, MiMo-V2.5-Pro UltraSpeed no es solo un modelo más rápido. Está diseñado junto con el sistema que lo ejecuta, para reducir los cuellos de botella entre cálculo, memoria y generación de tokens.
Este tipo de optimización se vuelve estratégica a medida que los modelos de IA crecen.

Una opción premium, tres veces más cara
Sin embargo, esta velocidad tiene un precio. El API MiMo-V2.5-Pro-UltraSpeed cuesta tres veces más que el acceso estándar. Xiaomi presenta este compromiso como una ecuación simple: tres veces el precio por una experiencia de salida diez veces más rápida.
El modo UltraSpeed no está incluido en los planes de tokens clásicos y por ahora se limita a un acceso API experimental.
Una prueba reservada para empresas y desarrolladores avanzados
Debido a recursos de inferencia limitados, Xiaomi abrirá una fase de prueba por solicitud del 9 al 23 de junio de 2026.
Las empresas y desarrolladores profesionales con necesidades concretas tendrán prioridad. Las cuentas aprobadas disfrutarán de dos semanas de prueba gratuita, con límites estrictos: colas limitadas, sesiones de 30 minutos y liberación automática de recursos en caso de inactividad.
Xiaomi quiere destacarse ante los gigantes de la IA
Con MiMo, Xiaomi no solo se limita a integrar IA en sus teléfonos inteligentes, coches, o dispositivos conectados. El grupo está construyendo gradualmente una verdadera familia de modelos que abordan texto, voz y multimodalidad.
UltraSpeed demuestra sobre todo una clara ambición: diferenciarse no solo por el tamaño del modelo, sino por la experiencia del usuario. En la IA generativa, la velocidad se convierte en una ventaja competitiva tan importante como la precisión.




