GPT-5.5 de OpenAI iguala el rendimiento de Mythos Preview en pruebas críticas de ciberseguridad
Publicado el 03-05-2026 | Categoría: IT & Hardware
El panorama de la inteligencia artificial avanzada y su potencial riesgo en materia de ciberseguridad ha sido objeto de intenso debate. Recientemente, Anthropic generó gran expectación con su modelo Mythos Preview, restringiendo inicialmente el acceso debido a la magnitud de las amenazas que representaba. Sin embargo, nuevos hallazgos del UK’s AI Security Institute (AISI) han puesto bajo lupa al competidor directo.
Según los investigadores, el modelo GPT-5.5 de OpenAI, lanzado al público la semana pasada, ha demostrado un nivel de rendimiento en evaluaciones cibernéticas comparable al que mostró Mythos Preview hace poco tiempo. Estos resultados confirman que los modelos de vanguardia están alcanzando niveles de sofisticación preocupantes para la infraestructura digital global.
Rendimiento y Metodología de las Pruebas AISI
Desde 2023, el AISI ha sometido a diversos modelos de IA a un riguroso proceso de pruebas. Estos incluyen 95 desafíos de tipo ‘Capture the Flag’ (CTF), diseñados específicamente para evaluar capacidades en tareas críticas como la ingeniería inversa, la explotación web y la criptografía.
Los resultados obtenidos por GPT-5.5 en las tareas de nivel Experto fueron notables. A continuación, se detallan los puntos clave:
- Porcentaje promedio (Expert tasks): GPT-5.5 superó el 71.4%, ligeramente por encima del 68.6% registrado por Mythos Preview.
- Desafío de Rust Binary: En una tarea compleja que requería construir un desensamblador, GPT-5.5 resolvió el reto en 10 minutos y 22 segundos sin ayuda humana.
Análisis de Ataques Avanzados
El rendimiento se mantuvo constante al evaluar escenarios más complejos, como ‘The Last Ones’ (TLO), un test que simula un ataque de extracción de datos en 32 pasos a una red corporativa. En este frente, GPT-5.5 logró éxito en 3 de 10 intentos, mejorando el récord anterior establecido por Mythos Preview (que consiguió 2 de 10). Estos datos subrayan la capacidad creciente de los modelos para ejecutar ataques coordinados.
No obstante, AISI advierte que incluso GPT-5.5 aún falla en la simulación más difícil de ‘Cooling Tower’, un intento de interrupción del software de control de una central eléctrica, replicando el fallo observado en todos los modelos previamente probados. Esto subraya que, si bien son potentes, todavía existen límites críticos de seguridad.
En conclusión, la comparación entre GPT-5.5 y Mythos Preview establece un nuevo estándar en el campo de la IA ofensiva. La comunidad tecnológica debe prestar máxima atención a estos avances para mitigar los riesgos que representan las herramientas de ciberseguridad impulsadas por modelos tan avanzados.