La convocatoria, que según fuentes cercanas fue organizada con carácter de urgencia por el Consejo de Estabilidad Financiera en coordinación con el FBI, marca un punto de inflexión en cómo el gobierno estadounidense percibe los riesgos asociados a los modelos de inteligencia artificial más avanzados. Hasta ahora, el debate sobre IA en Washington se había centrado principalmente en la desinformación, el impacto en el empleo y las implicaciones de derechos de autor. La seguridad cibernética de la infraestructura financiera había recibido comparativamente menos atención oficial.

Lo que hizo que esta reunión fuera particularmente notable fue el modelo específico bajo escrutinio: los últimos desarrollos de Anthropic, incluyendo su sistema Claude Mythos, que según análisis internos de la propia empresa demostró una capacidad inusual para identificar vulnerabilidades desconocidas en sistemas operativos y navegadores. Esa misma capacidad que hace que Claude sea valioso para investigadores de seguridad también lo hace potencialmente útil para actores que buscan explotar esas mismas vulnerabilidades.

Los ejecutivos bancarios salieron de la reunión con órdenes de evaluar cómo sus instituciones podrían estar expuestas a modelos de IA adversarios que podrían intentar manipular transacciones, identificar debilidades en sus sistemas de autenticación o generar correos electrónicos de phishing altamente convincentes. Varios bancos ya han comenzado a restringir el uso de modelos de lenguaje externos en operaciones que involucren información sensible de clientes.

El caso ilustra una paradoja fundamental de la era de la inteligencia artificial avanzada: los mismos avances que hacen que los modelos sean más útiles para proteger sistemas también los hacen más peligrosos en manos equivocadas. Anthropic ha defendido su enfoque de lanzamiento restringido, argumentando que compartir sus modelos más capaces con un grupo más amplio de partners es preferible a un lanzamiento completamente abierto, pero la presión regulatoria sugiere que esa decisión ya no es enteramente suya.

Lee la historia completa en Hacker News.