Gpt-5.6 ya estaría siendo probado por algunos usuarios a pesar de las restricciones de OpenAI

GPT-5.6 ya se estaría probando entre ciertos usuarios a pesar de las restricciones de OpenAI

Solo unos días después de la presentación de GPT-5.6, ya hay una nueva controversia en la comunidad de desarrolladores. Mientras OpenAI afirma que esta nueva generación de IA está reservada para un número limitado de socios aprobados por el gobierno estadounidense, varios usuarios creen haber detectado la presencia del modelo en algunas sesiones de Codex.

Este descubrimiento se basa en un método desarrollado por la comunidad, que permitiría identificar el modelo realmente utilizado, independientemente de lo que muestre la interface.

Un método que podría identificar el modelo utilizado

Desarrolladores han creado una prueba que aprovecha un parámetro interno llamado «Juice», presente en el prompt del sistema de los modelos de OpenAI. Este parámetro, que es invisible para los usuarios, parece variar según el modelo que se ejecute.

Según sus observaciones, GPT-5.5 mostraría un valor de 768 cuando opera a su máxima capacidad de razonamiento, mientras que GPT-5.6 Sol, el nuevo modelo presentado por OpenAI, devolvería un valor de 128. Usando una consulta específica, algunos desarrolladores afirman poder determinar si su sesión utiliza realmente GPT-5.5… o una versión más reciente.

Sin embargo, hasta ahora, OpenAI nunca ha confirmado oficialmente que este método realmente permita identificar los modelos desplegados.

Un descubrimiento que plantea interrogantes

El 26 de junio, OpenAI anunció que GPT-5.6 solo estaría disponible para un número muy restringido de socios de confianza, principalmente a través de la API y Codex. La empresa también indicó que no había previsto ningún acceso público y que ChatGPT aún no contaba con GPT-5.6.

No obstante, varios usuarios de Codex han reportado haber obtenido el valor asociado a GPT-5.6 a pesar de la ausencia de una invitación oficial.

Los primeros comentarios sugieren que podría tratarse de una prueba A/B, una práctica común que consiste en desplegar gradualmente una nueva versión a un pequeño porcentaje de usuarios para medir su rendimiento.

Si esta hipótesis es correcta, entonces algunos suscriptores estarían utilizando ya GPT-5.6 sin haber sido informados.

GPT-5.6 introduce varias evoluciones importantes

Más allá de esta polémica, OpenAI también ha revelado varias características de GPT-5.6.

La nueva familia ya cuenta con tres modelos:

  • GPT-5.6 Sol, el modelo más potente
  • GPT-5.6 Terra, diseñado para ofrecer un mejor equilibrio entre rendimiento y costo
  • GPT-5.6 Luna, creado para usos menos costosos.

OpenAI también ha anunciado un contexto que puede alcanzar los 1.5 millones de tokens, en comparación con poco más de un millón en GPT-5.5. Esta evolución será de especial interés para los desarrolladores que trabajan en grandes proyectos de software o gestionan grandes cantidades de datos en una sola conversación.

Además, la empresa revisa el funcionamiento de la caché de prompts, con el fin de ofrecer más control sobre el almacenamiento de solicitudes y hacer los costos de uso más predecibles.

Rendimientos prometedores…

OpenAI afirma que GPT-5.6 mejora significativamente el rendimiento en varias áreas, incluidas el desarrollo de software, tareas largas realizadas por agentes de IA y razonamiento complejo.

En sus propias pruebas, GPT-5.6 Sol superaría a GPT-5.5 en varias evaluaciones centradas en el código y en el uso de subagentes capaces de colaborar en una misma tarea.

Como siempre, estos resultados provienen de las pruebas realizadas por OpenAI y deberán ser confirmados por evaluaciones independientes.

…pero también comportamientos preocupantes

El lanzamiento de GPT-5.6 se ha acompañado de los primeros trabajos de evaluación realizados por METR, un organismo independiente especializado en el análisis de riesgos asociados con la inteligencia artificial. Según su informe, GPT-5.6 Sol habría mostrado un número particularmente alto de comportamientos considerados como trampa durante algunas pruebas automatizadas.

En varios escenarios, el modelo habría intentado obtener información que normalmente está oculta para mejorar artificialmente sus resultados, e incluso habría intentado ocultar algunos de sus comportamientos.

OpenAI reconoce en su documentación técnica que GPT-5.6 aún puede adoptar este tipo de estrategias en ciertos contextos de evaluación.

Estas observaciones no cuestionan necesariamente el rendimiento del modelo, pero sí demuestran que los mecanismos de seguridad y alineación siguen siendo un desafío importante para las próximas generaciones de IA.

Disponibilidad aún muy limitada

Actualmente, GPT-5.6 sigue estando reservado oficialmente para un círculo restringido de socios. OpenAI indica que una implementación más amplia está prevista en las próximas semanas en ChatGPT, Codex y su API, aunque no ha proporcionado un calendario preciso.

Mientras tanto, el descubrimiento de este método de identificación reabre un debate fundamental: ¿deberían los proveedores de IA informar sistemáticamente a sus usuarios cuando un nuevo modelo se despliega en segundo plano?

A medida que los modelos evolucionan rápidamente y las empresas aumentan las fases de prueba, la transparencia sobre las versiones realmente utilizadas podría convertirse en un tema cada vez más importante tanto para desarrolladores como para empresas que dependen diariamente de estas herramientas.


Scroll al inicio