La IA que se automejora y se entrena a sí misma ya está aquí. O casi
Una tendencia en la investigación en inteligencia artificial que al mismo tiempo nos ilustra sobre sus actuales límites: el criterio para decidir qué problemas importan.
Hasta este vídeo, Jakub Pachocki me había parecido un personaje secundario del panorama de figuras de la inteligencia artificial. Llamado a reemplazar en OpenAI al genio investigador, a Ilya Sutskever, este polaco me resultó de un aplomo algo forzado, inesperado. Me cayó bien en su declamar incómodo, arquetipo del genio científico. Más me sorprendía conforme avanzaba en el gran tema de su intervención: la automatización de la investigación de inteligencia artificial.
Mientras le veía avanzar con sus explicaciones, con su hoja de ruta detallada, no me casaban su discurso puramente técnico con el hecho de que alguien nos estuviera anunciando la automatización de su propio puesto de trabajo. Y ese era el punto, OpenAI nos contaba que su plan era llegar al “investigador de IA totalmente automatizado” para marzo de 2028. Y en mi cabeza tenía todo el sentido estratégico, aunque seguía algo preocupado por Pachocki.
Estas últimas semanas está siendo el gran competidor, Anthropic, el que más insistentemente habla de la misma misión. Si hay dos lecturas que esté recomendando ahora mismo son el post de Jack Clark y su continuación junto a otros en el Anthropic Institute, del que es responsable.
Lo primero que deberíamos subrayar es que cuando estos laboratorios hablan de inteligencia artificial que se automejora, no se refieren a la idea intuitiva, engordada por la ciencia ficción, que muchos podríamos tener. No se refieren a un modelo que consigue realmente mejorarse a sí mismo, sino a que es capaz de diseñar, entrenar y validar a su sucesor, que a su vez haría lo mismo, creando un bucle de aceleración.
Conviene, por tanto, no hacerse trampas. La objeción escéptica que muchos podemos argumentar es clara: los LLM actuales no aprenden como aprendemos nosotros. Sus pesos están congelados desde el día que acaban de entrenarlos: recordemos que la “P” de “GPT” es de “preentrenado”. Responden sobre temas de actualidad con un truco, el de conectarse a internet cada vez, pero no aprenden.
La nueva generación de agentes mejora la cosa ya que pueden guardar notas, editar archivos y recuperar contexto, pero todo eso no deja de ser un parche: no acumulan realmente conocimiento dentro del modelo. Aunque lleguen a un rendimiento espectacular, el aprendizaje en su ciclo de vida es un problema no resuelto. Son, por así decirlo, doctorados para los que siempre es el primer día de trabajo. A lo que Clark, Anthropic y OpenAI se refieren por tanto no es la automejora de un modelo concreto sino entre generaciones.
Una virtud de los textos que recomiendo es que ponen números a dicha automejora recursiva o sistema capaz de diseñar y entrenar a su propio sucesor sin que intervenga una persona. Desde los aumentos de ese indicio (que no métrica real y rigurosa) de productividad que son las líneas de código por ingeniero (hoy uno de Anthropic mete en producción ocho veces más por trimestre que entre 2021 y 2024) a las 12 horas que puede trabajar ahora Claude en una tarea con éxito.
Otra es que separan bien dos cosas que podemos confundir: la ingeniería (el código, la infraestructura, el entrenamiento) y la investigación (decidir qué experimentos merecen la pena y cuáles no). En la primera, Claude ya es capaz de desenvolverse bien (ellos ya están utilizando Claude Mythos) con un problema pobremente definido. En la segunda hay un experimento que Anthropic repite con cada modelo y que es la pescadilla mordiéndose la cola: le dan el código que entrena un modelo pequeño y le piden que corra lo más rápido posible sin romper las comprobaciones. Opus 4 lo aceleraba tres veces en mayo de 2025; el preview de Mythos llega a cincuenta y dos un año después, cuando un humano experto tarda entre cuatro y ocho horas en sacar un cuatro.
Aquí podemos deducir en qué aspectos de la investigación y automejora de los modelos, la propia IA está por detrás de los humanos: el juicio de alto nivel, saber elegir problemas importantes, desconfiar de métricas aparentes pero no significativas, detectar callejones sin salida en los que no merece la pena profundizar, saber cuándo un resultado “funciona” pero no es relevante. Anthropic lo reconoce: la ventaja humana, de momento, sigue en el gusto y el criterio y en la visión de conjunto.
Así, la inteligencia artificial actual consigue inducir productividad en las tareas de ingeniería del proceso investigador: modelos que escriben código, preparan datos, lanzan experimentos, depuran errores, diseñan evaluaciones, interpretan resultados y proponen el siguiente intento. Están todavía lejos de tener el criterio para decidir qué problemas importan, qué grandes líneas de investigación resultan prometedoras, cuáles son los objetivos, presupuestos y criterios de aceptación.
Pero, a su manera, son optimistas. Clark y compañía argumentan que la IA casi nunca avanza por momentos “eureka”, avanza escalando algo, viendo qué se rompe y arreglándolo, justo en lo que la máquina destaca; que Edison decía que el genio es 1% de inspiración y 99% de sudor y esa transpiración ya se automatiza; que queda por ver si la inspiración no será otra capacidad que llega de golpe: “La evidencia sugiere que el papel del ser humano se está reduciendo en cada etapa del proceso de desarrollo de la IA”.
El otro día debatiendo en el último episodio de monos estocásticos sobre las salidas a bolsa se me pasó por la cabeza el bueno de Pachocki. Ha llegado a la plenitud de su disciplina, a la élite mundial, justo a tiempo de intentar automatizarla por completo y hacer su propio papel mucho menos relevante. Haciendo cuentas, si lo logra, es probable que aumenten en unos cuantos cientos de millones de dólares el valor de sus acciones de OpenAI. Ni tan mal, Jakub.





