Los chatbots ya son capaces de resolver ejercicios difíciles. La prueba propuesta por Demis Hassabis busca más alto: encontrar una idea científica nueva sin haberla leído. Este umbral explica por qué Google DeepMind, OpenAI, Anthropic y Yann LeCun miran más allá de los grandes modelos de lenguaje.
El calendario de la AGI se acerca, pero 2030 sigue siendo un horizonte técnico
En un episodio de Y Combinator publicado a finales de abril de 2026, Demis Hassabis, cofundador y director general de Google DeepMind, coloca la inteligencia artificial general cerca de 2030. La AGI se refiere a una IA capaz de aprender, razonar y actuar en varios ámbitos, sin una especialización estrecha.
Este calendario no significa que los chatbots actuales simplemente vayan a aumentar en tamaño. Hassabis distingue entre las bases ya útiles, como el entrenamiento masivo y la retroalimentación humana, y los bloqueos aún abiertos. Para la industria, el verdadero desafío se parece menos a una carrera de tamaño y más a una cuestión de arquitectura.
Los grandes modelos de lenguaje tienen tres fallas que limitan su autonomía
Los grandes modelos de lenguaje, o LLM, predicen la continuación probable de un texto. Este método produce respuestas útiles, pero no siempre ofrece una representación estable del mundo. Al igual que un GPS sin un mapa actualizado, el sistema puede avanzar rápidamente y luego perder su referencia.
Hassabis señala tres obstáculos: el aprendizaje continuo, el razonamiento a largo plazo y la memoria. El aprendizaje continuo implica integrar una novedad sin tener que reentrenar todo el modelo. La memoria estructurada consiste en conservar la información útil, verificada y reutilizable, en lugar de acumular un enorme granero digital.
El razonamiento también sigue siendo irregular. Un modelo puede lograr una tarea competitiva, y luego fallar en una variante más breve. En un juego de ajedrez, esta falla se observa cuando la IA identifica un mal movimiento, busca una alternativa y luego vuelve a la misma elección.
La prueba de Einstein mide una capacidad más rara que la buena respuesta
La prueba mencionada por Hassabis consiste en limitar el conocimiento disponible antes de un descubrimiento científico, y luego pedir al sistema que encuentre la siguiente idea. Con un corpus que se detiene antes de 1905, la IA debería reconstruir la relatividad restringida, no solo recitar frases sobre Einstein.
Esta prueba separa la imitación de la invención. La relatividad restringida abordó tensiones entre observaciones y teorías existentes. Para un LLM, el texto solo a menudo carece de conexión física: sabe que una pelota cae, pero no simula necesariamente la gravedad como un fenómeno.
AlphaFold y los world models delinean una IA más modular
El Premio Nobel de Química 2024 otorgado a Demis Hassabis, John Jumper y David Baker ofrece un ejemplo útil. AlphaFold no es un chatbot generalista. El sistema predice estructuras de proteínas con un objetivo especializado, y luego AlphaFold 3 extiende este trabajo a las interacciones entre moléculas.
Yann LeCun, exresponsable científico de IA en Meta y cofundador de AMI en París, defiende una vía similar con los world models. Estos modelos del mundo buscan representar objetos, acciones y sus consecuencias, como un simulador mental en lugar de un simple loro estadístico.
La idea que se está delineando combina varios componentes: LLM para dialogar, modelos especializados para calcular, memoria ordenada para conservar y aprendizaje por refuerzo para elegir. En este esquema, la IA del mañana se asemeja menos a un cerebro único y más a un taller con varias herramientas en el banco de trabajo.




