El mes de abril de 2026 ha dejado una fotografía del sector de la inteligencia artificial que hace apenas un año habría parecido sacada de un guion de ciencia ficción. No es hipérbole: en cuestión de semanas, los grandes laboratorios lanzaron modelos que redefinen los límites de lo que una máquina puede hacer, firmaron alianzas que nadie esperaba y, de paso, protagonizaron alguna contradicción que haría sonrojar a más de uno. Si querías una semana tranquila para ponerte al día con el sector, abril definitivamente no era el momento.

Novedades de Abril

El 23 de abril, OpenAI presentó GPT-5.5, conocido internamente con el nombre en clave «Spud», y lo describió como su modelo más inteligente e intuitivo hasta la fecha. El lanzamiento fue inmediato para usuarios de ChatGPT y Codex en los niveles Plus, Pro, Business y Enterprise. Los números de benchmark son los que cabría esperar en una presentación de este tipo, aunque hay algunos que merecen atención real: en GDPval, un benchmark que evalúa el rendimiento en 44 ocupaciones de trabajo intelectual, GPT-5.5 alcanza un 84,9%, y en Tau2-bench Telecom logra un 98% sin ajuste de prompts. Para los equipos de TI que evalúan plataformas de automatización, esas cifras no son abstractas: representan tareas de soporte, documentación y análisis que un agente puede completar de forma autónoma con una tasa de error mínima.

Comparativa de modelos

El lanzamiento se produjo una semana exacta después de que Anthropic publicara Claude Opus 4.7, y el calendario no es ninguna casualidad. La industria lleva meses instalada en un ciclo de publicaciones reactivas donde cada movimiento de un laboratorio fuerza la respuesta del siguiente. En Terminal-Bench 2.0, benchmark estándar para medir la capacidad de un agente de operar autónomamente en una terminal Unix, GPT-5.5 supera a Opus 4.7 por más de 13 puntos. Es la primera vez en año y medio que OpenAI recupera el liderazgo declarado en programación agéntica, un terreno en el que Anthropic había construido buena parte de su narrativa comercial con Claude Code. Sin embargo, sería un error simplificarlo demasiado: en SWE-Bench Pro, Opus 4.7 sigue siendo superior, con un 64,3% frente al 58,6% de GPT-5.5. No existe un mejor modelo universal; lo que existe son modelos más adecuados para cada caso de uso.

Un dato que pasó algo desapercibido entre el ruido de los benchmarks: GPT-5.5 consume aproximadamente un 40% menos tokens de salida que su predecesor GPT-5.4 para tareas equivalentes en Codex. En producción, eso se traduce directamente en costes operativos, y para empresas que ya tienen pipelines agénticos en marcha es probablemente el dato más relevante de toda la presentación.

Pero el mes no se resume solo en una carrera de benchmarks. En una jugada que nadie esperaba dados sus lazos competitivos, OpenAI, Google y Anthropic anunciaron entre el 6 y el 7 de abril que comparten inteligencia a través del Frontier Model Forum para combatir el robo de modelos por parte de actores externos. Que tres compañías que se disputan cada décima en cada benchmark decidan coordinarse en materia de seguridad es una señal de que las amenazas externas, especialmente las relacionadas con actores estatales y el robo de propiedad intelectual de modelos, se han convertido en un riesgo lo suficientemente serio como para superar la rivalidad comercial.

¿Y la ciberseguridad?

El frente de la ciberseguridad, de hecho, fue uno de los más tensos de abril. Un atacante solitario utilizó Claude y ChatGPT para comprometer nueve agencias del gobierno mexicano, robando cientos de millones de registros. El caso ilustra con crudeza el dilema al que se enfrentan los laboratorios: la diferencia entre un ataque y una auditoría de seguridad legítima, en términos del código que genera un LLM, es prácticamente cero. La diferencia está en la intención del usuario, y eso ningún modelo puede verificarlo a priori. La respuesta de los laboratorios ha sido restringir el acceso a sus variantes más capaces en tareas ofensivas, aunque no sin cierta incoherencia: OpenAI terminó aplicando exactamente la misma política de acceso restringido a GPT-5.5 Cyber que días antes había criticado públicamente a Anthropic por implementar con su modelo Mythos.

Resultados espectaculares

En el plano financiero, abril deparó una sorpresa que reordena el panorama. Anthropic superó a OpenAI en ingresos anualizados: la empresa detrás de Claude alcanzó los 30.000 millones de dólares, mientras que OpenAI se ubica en torno a los 25.000 millones. Un vuelco que muy pocos analistas predijeron hace un año, y que refleja hasta qué punto la adopción enterprise de Claude Code y la familia Opus ha transformado la estructura de ingresos del sector.

Donde el mes mostró su cara más estimulante, al menos para quienes seguimos la IA desde una perspectiva científica, fue en la investigación básica. Investigadores de la Universidad de Carolina del Norte dejaron un sistema de IA investigando durante 72 horas continuas, y el sistema completó 50 experimentos, creando además una memoria de contexto largo que superó referencias humanas equivalentes. No es un laboratorio virtual ejecutando simulaciones: es un agente que diseña hipótesis, ejecuta pruebas y registra resultados en un ciclo cerrado. Las implicaciones para la investigación farmacéutica, la ciencia de materiales o la biología sintética son difíciles de exagerar.

Visto en conjunto, el panorama al cierre de abril apunta a una IA que no solo vive en la nube, sino que requiere energía, tierra, chips, redes, acuerdos estatales y cadenas de suministro robustas. El avance de modelos más capaces reabre preguntas sobre soberanía tecnológica, concentración industrial y seguridad nacional que no tienen respuestas cómodas. Y con la entrada en vigor completa del Reglamento de IA de la Unión Europea prevista para agosto de 2026, las empresas que desarrollan o usan sistemas de IA en Europa tienen cada vez menos margen para tratar estas preguntas como conversaciones hipotéticas.

Abril de 2026 no fue un mes de anuncios conceptuales. Fue un mes en el que la inteligencia artificial ejecutó experimentos científicos en modo autónomo, comprometió organismos gubernamentales, redefinió el liderazgo en programación agéntica y forzó a competidores históricos a sentarse en la misma mesa. Si esto es solo el calentamiento, como algunos en el sector sugieren, merece la pena ir ajustando las expectativas al alza.