Inteligencia Artificial: riesgo de seguridad y la mejor herramienta para combatirlo

Autor: Juan Manuel Camargo González

Fecha de publicación: 18/06/2026

Tema: Seguridad

Etiquetas: Inteligencia Artificial, Ciberseguridad, Anthropic, Claude 5, Seguridad Nacional, Jailbreaks, Doble Uso, Ciberdefensa, Gestión de Riesgos, Phishing, Deepfakes, Protección de Datos, Tecnología Dual, Innovación Tecnológica

Inteligencia Artificial: riesgo de seguridad y la mejor herramienta para combatirlo

Anthropic lanzó los modelos Claude Fable 5 y Claude Mythos 5 el 9 de junio de 2026. Ambos compartían la misma arquitectura base, pero con un enfoque de despliegue distinto: Claude Fable 5 incluía filtros de seguridad automáticos que redirigían las consultas de alto riesgo (como ciberseguridad ofensiva) al modelo anterior, Claude Opus 4.8, mientras que Claude Mythos 5 era una versión sin estas restricciones, limitada a organizaciones de confianza y ciberdefensores bajo el Project Glasswing.

Muy poco después del lanzamiento (el 12 de junio), Anthropic tuvo que pausar y bloquear el acceso a ambos modelos a nivel mundial debido a una orden del gobierno de Estados Unidos relacionada con controles de exportación y seguridad nacional. Según la compañía, la orden obliga a bloquear el acceso a estos modelos para cualquier ciudadano extranjero, dentro o fuera del territorio estadounidense, mientras se evalúan posibles vulnerabilidades relacionadas con técnicas de evasión de controles, conocidas como jailbreaks.

La medida resulta extraordinaria porque afecta a dos de los modelos de inteligencia artificial más avanzados disponibles comercialmente. También pone sobre la mesa una pregunta cada vez más relevante: ¿hasta qué punto la inteligencia artificial representa un riesgo para la ciberseguridad y cuándo se convierte, por el contrario, en una herramienta esencial para proteger sistemas y organizaciones?

¿Qué son Fable 5 y Mythos 5?

Fable 5 y Mythos 5 son modelos de lenguaje de última generación desarrollados por Anthropic. Aunque ambos pertenecen a la misma familia tecnológica, fueron diseñados con capacidades especialmente avanzadas para tareas complejas de razonamiento, programación y análisis técnico.

Desde su lanzamiento, la compañía reconoció que estos sistemas poseían habilidades superiores para comprender código, identificar errores de software y asistir en tareas relacionadas con la seguridad informática. Precisamente por ello, Anthropic implementó mecanismos de protección mucho más estrictos que los utilizados en generaciones anteriores.

Entre las medidas adoptadas se encontraban filtros especializados para impedir que los modelos proporcionaran instrucciones peligrosas, extensos programas de pruebas de seguridad realizados por equipos internos y externos, y sistemas de monitoreo destinados a detectar intentos de abuso.

Sin embargo, el gobierno estadounidense consideró que existían indicios de una posible técnica para eludir algunas de estas salvaguardas. Aunque Anthropic sostiene que las vulnerabilidades identificadas eran limitadas y comparables a capacidades disponibles en otros modelos comerciales, la autoridad regulatoria optó por aplicar el principio de precaución y ordenar la suspensión temporal.

Más allá de quién tenga razón en esta controversia, el episodio ilustra una realidad cada vez más evidente: los modelos avanzados de inteligencia artificial han alcanzado un nivel de capacidad que los convierte simultáneamente en herramientas de enorme valor y en potenciales factores de riesgo.

El problema de fondo: una tecnología de doble uso

La inteligencia artificial moderna pertenece a una categoría tecnológica conocida como dual use o de doble uso. Esto significa que las mismas capacidades pueden emplearse tanto para fines legítimos como para actividades maliciosas. Un modelo capaz de analizar millones de líneas de código para encontrar errores antes de que sean explotados por delincuentes también puede ayudar a descubrir vulnerabilidades que posteriormente sean utilizadas en ataques.

De forma similar, una IA que ayuda a automatizar tareas administrativas puede utilizarse para generar campañas masivas de phishing más sofisticadas. Una herramienta diseñada para resumir información puede emplearse para procesar grandes volúmenes de datos robados. Y un sistema que facilita la programación puede acelerar tanto el desarrollo de software legítimo como la creación de herramientas ofensivas.

La diferencia no reside en la tecnología, sino en quién la utiliza y con qué propósito.

Cómo la IA está transformando las amenazas de ciberseguridad

Durante años, los ciberataques requerían conocimientos técnicos relativamente especializados. La inteligencia artificial está reduciendo esa barrera de entrada.

Hoy es posible utilizar modelos avanzados para redactar correos fraudulentos convincentes en múltiples idiomas, generar código funcional con poca experiencia previa, automatizar tareas de reconocimiento sobre objetivos potenciales o analizar grandes cantidades de información pública para construir perfiles detallados de personas y organizaciones.

Además, los modelos más recientes son capaces de identificar patrones y relaciones que anteriormente exigían horas de trabajo manual. Esto permite a actores maliciosos aumentar la escala, velocidad y personalización de sus operaciones.

Otro riesgo creciente proviene de los denominados deepfakes. La capacidad de generar imágenes, videos y voces sintéticas cada vez más realistas está creando nuevos desafíos para la autenticación de identidades y la confianza en las comunicaciones digitales.

En muchos casos, la principal amenaza no consiste en que la IA descubra capacidades completamente nuevas, sino en que democratiza y acelera técnicas que antes estaban reservadas para grupos con mayores recursos.

La IA también fortalece la defensa

La historia, sin embargo, tiene otra cara. Las mismas capacidades que preocupan a los reguladores son utilizadas diariamente por equipos de seguridad para proteger infraestructuras críticas, detectar vulnerabilidades y responder a incidentes. Los modelos de inteligencia artificial pueden revisar código de forma masiva, identificar errores antes de que lleguen a producción, correlacionar eventos procedentes de múltiples fuentes y detectar comportamientos anómalos que podrían pasar inadvertidos para los analistas humanos. En los centros de operaciones de seguridad, la IA ya ayuda a clasificar alertas, reducir falsos positivos y priorizar incidentes, lo que permite que los especialistas dediquen más tiempo a amenazas reales y menos a tareas repetitivas. También está demostrando ser una herramienta valiosa para el análisis de inteligencia, puesto que puede procesar enormes volúmenes de información, resumir hallazgos, identificar patrones emergentes y acelerar investigaciones complejas.

Paradójicamente, algunos de los sistemas cuya capacidad genera preocupación son utilizados por los propios defensores para proteger redes, aplicaciones y usuarios.

Por qué la protección absoluta probablemente no existe

Uno de los aspectos más interesantes del comunicado de Anthropic es el reconocimiento explícito de una realidad técnica: la resistencia perfecta a los jailbreaks probablemente no es posible con la tecnología actual.

Un jailbreak es una técnica diseñada para persuadir o engañar a un modelo de IA para que ignore las restricciones impuestas por sus desarrolladores. En términos prácticos, equivale a encontrar una forma de que el sistema responda preguntas o ejecute tareas que normalmente rechazaría.

La industria lleva años mejorando sus mecanismos de protección, pero ningún proveedor ha demostrado una inmunidad absoluta. Cada nueva capa de seguridad genera nuevas técnicas para intentar superarla.

Por esta razón, muchos expertos consideran que la estrategia más realista no consiste en buscar sistemas perfectos, sino en implementar múltiples niveles de defensa: filtros, monitoreo, auditorías, controles de acceso, detección de abuso y respuesta rápida ante incidentes.

Es el mismo enfoque que históricamente se ha utilizado en ciberseguridad tradicional.

Qué pueden hacer las empresas para protegerse

Ante este panorama, las organizaciones no deberían asumir que la inteligencia artificial es únicamente una amenaza ni tampoco confiar ciegamente en ella.

La primera recomendación es establecer una política clara de uso de IA. Muchas filtraciones de información ocurren porque los empleados introducen datos sensibles en herramientas públicas sin comprender las implicaciones.

También es fundamental clasificar la información y definir qué datos pueden ser procesados por sistemas de inteligencia artificial y cuáles requieren controles adicionales.

La capacitación de los empleados adquiere una importancia creciente. A medida que los ataques de phishing y la ingeniería social se vuelven más sofisticados gracias a la IA, la conciencia de seguridad sigue siendo una de las mejores líneas de defensa.

Las empresas deberían además incorporar herramientas basadas en inteligencia artificial dentro de sus propias capacidades defensivas. Ignorar estas tecnologías puede generar una desventaja significativa frente a atacantes que ya las están utilizando.

Finalmente, resulta indispensable adoptar un enfoque de defensa en profundidad. No existe una única herramienta capaz de eliminar todos los riesgos. La combinación de controles técnicos, procesos organizacionales y supervisión humana continúa siendo la estrategia más efectiva.

Un debate que apenas comienza

La suspensión temporal de Fable 5 y Mythos 5 probablemente será recordada como uno de los primeros casos en que un gobierno interviene directamente para restringir el acceso a modelos de inteligencia artificial avanzados por motivos de seguridad nacional.

Independientemente de cómo evolucione este caso particular, el mensaje es claro: la discusión sobre los riesgos de la inteligencia artificial ya no es teórica. Las capacidades de estos sistemas han alcanzado un nivel suficiente para generar preocupaciones regulatorias reales.

Al mismo tiempo, las organizaciones que intenten enfrentar las amenazas modernas sin aprovechar la inteligencia artificial estarán renunciando a una de las herramientas defensivas más poderosas disponibles.

La paradoja es evidente. La IA puede ayudar a descubrir vulnerabilidades, automatizar ataques y amplificar riesgos. Pero también puede identificar esas mismas vulnerabilidades, detectar esos mismos ataques y fortalecer la resiliencia de las organizaciones. El desafío para empresas, gobiernos y desarrolladores no será decidir si utilizan inteligencia artificial o no, sino aprender a aprovechar sus beneficios mientras gestionan responsablemente los riesgos que inevitablemente la acompañan.