Anthropic lanza Claude Mythos con fuertes medidas de seguridad

La empresa abrió al público Claude Fable 5, basado en su modelo Mythos. Por qué mantuvo la versión más avanzada bajo acceso restringido para ciberdefensores e infraestructura crítica.

Zachary Folk Colaborador

Anthropic presentó Claude Fable 5, la primera versión pública de su esperado modelo Claude Mythos, con controles diseñados para limitar usos de alto riesgo en ciberseguridad y biología. La compañía buscó así abrir el acceso a una tecnología sensible sin resignar barreras frente a posibles abusos.

El lanzamiento llegó junto con el anuncio de Claude Mythos 5, una versión más potente que quedará disponible para un grupo reducido de ciberdefensores y proveedores de infraestructura que ya utilizaban Claude Mythos Preview. Según la empresa, ese modelo reúne las “capacidades de ciberseguridad más sólidas de cualquier modelo en el mundo”.

Claude Anthropic - Foto por Samuel Boivin/NurPhoto via Getty Images

La firma sostuvo que los nuevos sistemas superan a versiones anteriores en ingeniería de software, análisis financiero, tareas con visión y trabajos que requieren contexto extenso. Ese rendimiento apunta a usuarios corporativos que demandan precisión técnica y velocidad para resolver problemas complejos.

El precio también marcó la ambición del producto. Claude Fable 5 y Mythos 5 costarán US$ 10 por millón de tokens de entrada y US$ 25 por millón de tokens de salida. La tarifa duplica, aproximadamente, la de los modelos Claude Opus más avanzados disponibles hoy, aunque queda por debajo de la mitad del precio que tuvo la versión preliminar de Claude Mythos.

Anthropic indicó que trabaja con el gobierno de Estados Unidos para ampliar el acceso al modelo avanzado de manera progresiva.

Dario y Daniela Amodei de Anthropic (Foto: Anthropic)

¿Cómo funcionarán las medidas de seguridad de Claude Fable?

Anthropic anunció que Claude Fable llegará con nuevos sistemas para detectar usos indebidos, como los intentos de "desbloquear" el modelo para acceder a información potencialmente dañina. Estos sistemas, que la compañía denomina "clasificadores", identifican consultas sobre ciertos temas y las derivan a Claude Opus. Entre ellas figuran preguntas sobre ciberseguridad, incluidos los intentos de usar Claude para el "hackeo de agentes", además de ciertas consultas sobre biología y química que podrían ayudar al desarrollo de armas biológicas. El tercer clasificador es lo que Anthropic llama "destilación": los intentos de usar Claude para crear modelos de IA alternativos.

Antecedentes

Anthropic dio detalles durante meses sobre su próximo modelo: lo anunció en abril, pero no lo publicó por motivos de seguridad. En cambio, lanzó una versión para un grupo de empresas tecnológicas, entre ellas Apple, Microsoft y Google, a través del Proyecto Glasswing, con el objetivo de identificar vulnerabilidades de ciberseguridad. La compañía lanzó públicamente Mythos poco más de una semana después de presentar de manera confidencial su solicitud para una oferta pública inicial. Según trascendió, la empresa prevé salir a bolsa a fines de este año y hoy está valuada en US$ 965.000 millones, tras una ronda de financiación realizada en mayo.

*Este artículo fue publicado originalmente por Forbes.com.

¿Cómo funcionarán las medidas de seguridad de Claude Fable?

Antecedentes

Te puede interesar