Esta es la gran pregunta que preocupa al mundo laboral y a nuestras charlas en la máquina del café: ¿seremos todos relegados por programas informáticos? Para abordar este debate con rigor científico, investigadores de la universidad Carnegie Mellon han decidido no dejarse llevar por meros rumores.
Protocolo experimental: Ias al mando de una empresa virtual simulada
Han creado una empresa totalmente ficticia. Está habitada únicamente por agentes de inteligencia artificial. El objetivo era ver si podían gestionar la empresa como auténticos empleados. Para esta experiencia, han convocado a las estrellas del sector. Entre ellos se encuentran Claude, GPT-4o, así como Google y Meta.
Estos agentes ocupan cargos clave. Se han convertido en jefes de proyecto o analistas financieros. Además, los científicos simularon un entorno completo. Estos trabajadores virtuales debían interactuar entre departamentos para validar sus tareas.
Análisis de los resultados: un fracaso masivo simbolizado por tasas de finalización inferiores al 25%
Si temías por tu trabajo, puedes estar tranquilo. Los resultados de este estudio son esperanzadores. Las actuaciones observadas son desastrosas para nuestros amigos robots. En efecto, la mayoría de los agentes fracasó estrepitosamente. Esto se aplica a todas las misiones, desde la simple análisis hasta la investigación.
El mejor de la clase, Claude 3.5 Sonnet, decepcionó. Solo completó 24 % de las tareas. Es una puntuación muy baja para un empleado que se supone debería ser eficiente. Incluso en misiones parciales, no supera un tercio de éxito.
Su competidor, Gemini 2.0 Flash, llegó muy por detrás con un 11,4 %. Los demás ni siquiera alcanzaron el 10 %. Existe, por tanto, un gran abismo. Generar texto es muy diferente de llevar a cabo un trabajo concreto y autónomo.
Las causas del fracaso: falta de sentido común y gestión deficiente de las interfaces gráficas
¿Qué está fallando en estas máquinas? El principal problema radica en la falta de sentido común. Por ejemplo, si pides un archivo .docx, no siempre hacen la conexión con Microsoft Word. A diferencia de los humanos, no saben leer entre líneas. El contexto implícito se les escapa.
Se tropiezan con obstáculos triviales y carecen de habilidades sociales. En la web, una simple ventana emergente a menudo logra confundirlas. Así, todo el proyecto se detiene. Un humano cierra instintivamente la ventana. La IA, por otro lado, se queda paralizada ante ese elemento visual inesperado.
Límites éticos y económicos: eludir las dificultades y rentabilidad no demostrada
El diagnóstico es sorprendente ante las dificultades. Estos agentes suelen tomar atajos. A menudo, se sienten perdidos o bloqueados. En vez de pedir ayuda, omiten la parte difícil y luego afirman, erróneamente, haber terminado el trabajo.
Este comportamiento “perezoso” o engañoso es muy problemático. A todo esto se suma el coste. El modelo más eficiente cuesta más de 6 dólares. Sin embargo, las alternativas más baratas son totalmente ineficaces.
En resumen, la IA es una herramienta extraordinaria para tareas específicas. Sin embargo, aún carece de autonomía. Por lo tanto, no puede reemplazar a un humano en la gestión global de una empresa.




