DeepSeek lanza DSpark, una tecnología de código abierto que acelera los grandes modelos de IA

A medida que la competencia en inteligencia artificial se basa tanto en el rendimiento como en los costos operativos, DeepSeek ha presentado una innovación que podría transformar la forma en que se implementan los grandes modelos de lenguaje.

Llamado DSpark, este nuevo sistema de código abierto promete acelerar significativamente la generación de texto mientras mantiene la calidad de las respuestas producidas por los modelos existentes.

Un nuevo enfoque para que las IA sean mucho más rápidas

Una de las principales limitaciones de los Large Language Models (LLM) es su forma de generar texto. Actualmente, un modelo como DeepSeek, Llama o Qwen produce una respuesta token por token. Cada nueva palabra depende de la anterior, lo que obliga al modelo a recalcular continuamente su contexto.

Este funcionamiento garantiza una excelente coherencia… pero ralentiza considerablemente la inferencia.

Con DSpark, DeepSeek adopta una estrategia diferente.

El sistema agrega una capa de predicción intermedia capaz de anticipar varios tokens por adelantado antes de que el modelo principal los valide. Cuando estas predicciones son correctas, se ejecutan múltiples pasos simultáneamente, reduciendo drásticamente el tiempo necesario para generar una respuesta.

El objetivo es simple: obtener exactamente la misma respuesta, pero de manera mucho más rápida.

El decodificador especulativo acelera los tiempos

La técnica utilizada no es completamente nueva. El Speculative Decoding ya existe desde hace varios años y consiste en utilizar un modelo ligero que propone varias palabras por adelantado mientras el modelo principal las verifica.

La verdadera innovación de DSpark radica en otro lugar.

DeepSeek combina dos enfoques: una generación semi-autoregresiva que produce predicciones más coherentes, y un sistema de verificación dinámica que ajusta el número de tokens controlados según el nivel de confianza del modelo y la carga de los servidores.

En otras palabras, DSpark no busca únicamente predecir más palabras, sino que intenta verificar solo aquellas que tienen una alta probabilidad de ser correctas, evitando así cálculos innecesarios.

Hasta un 85 % de velocidad adicional

Según las pruebas realizadas por DeepSeek en su infraestructura de producción, las mejoras son particularmente significativas. En DeepSeek-V4-Flash, optimizado para la velocidad, DSpark permite acelerar la generación de texto entre un 60% y un 85% por usuario en condiciones comparables. En DeepSeek-V4-Pro, más orientado al razonamiento complejo, la mejora varía entre un 57% y un 78%.

En ciertos escenarios de alta demanda, DeepSeek menciona incluso un aumento global del rendimiento que supera el 600%, aunque esta cifra se refiere más a la capacidad total de los servidores que a la velocidad percibida por un usuario individual.

En la práctica, esto significa respuestas más rápidas, un mayor número de usuarios simultáneos y una mejor rentabilidad de las infraestructuras de IA.

Una innovación que va más allá del ecosistema DeepSeek

Uno de los aspectos más interesantes de DSpark es que no se limita a los modelos de DeepSeek. Los trabajos publicados también muestran resultados en varias familias de modelos de código abierto populares, incluidos Qwen de Alibaba y Gemma de Google.

Esto significa que las empresas que utilizan sus propios modelos de pesos abiertos podrán, en teoría, entrenar sus propios módulos de predicción compatibles con DSpark para mejorar su rendimiento sin modificar el modelo principal.

Este enfoque refuerza aún más la atractividad de los modelos de código abierto en comparación con las API cerradas ofrecidas por OpenAI o Anthropic.

DeepSpec: DeepSeek abre también su caja de herramientas

DeepSeek no solo publica un artículo científico. La empresa también pone a disposición DeepSpec, un conjunto completo de herramientas para entrenar un módulo de predicción, evaluar el rendimiento del decodificador especulativo, reproducir los experimentos publicados y adaptar el método a otros modelos.

Todo el conjunto se distribuye bajo licencia MIT, lo que permite tanto la investigación académica como los usos comerciales.

Esta apertura representa una señal fuerte en un contexto donde los modelos de IA de vanguardia se vuelven cada vez más difíciles de acceder.

Una tecnología destinada principalmente a grandes infraestructuras

Sin embargo, DSpark no es una herramienta que cualquier desarrollador pueda instalar en unos minutos. Los requisitos de hardware son considerables. La documentación indica que ciertos pasos de preparación de datos pueden requerir varios terabytes de almacenamiento, así como una infraestructura compuesta por múltiples GPU de alta gama.

En otras palabras, esta tecnología está dirigida principalmente a laboratorios de investigación, proveedores de la nube y grandes empresas que cuentan con sus propias infraestructuras de IA.

La optimización se convierte en el nuevo campo de batalla

Durante mucho tiempo, la carrera por la inteligencia artificial consistió principalmente en entrenar modelos cada vez más grandes. Esta lógica está evolucionando rápidamente. Los costos de inferencia representan ahora una parte importante de los gastos de los proveedores de IA. Acelerar un modelo sin aumentar su tamaño se convierte casi en una estrategia tan importante como mejorar su rendimiento.

Con DSpark, DeepSeek demuestran que los próximos avances podrían provenir menos de un número cada vez mayor de parámetros y más de una mejor utilización de los recursos existentes.

Esta publicación también se produce en un contexto geopolítico particular, donde varios modelos estadounidenses de vanguardia están sujetos a restricción de acceso. Al optar por una difusión completamente abierta, acompañada del código, los pesos de los modelos y las herramientas de entrenamiento, DeepSeek refuerza una vez más su posición como uno de los principales motores de innovación de código abierto en inteligencia artificial.

A medida que los modelos se vuelven más potentes y costosos de operar, la eficiencia de su ejecución podría convertirse en el próximo gran factor diferenciador. Y en este terreno, DSpark podría imponer rápidamente su referencia.