Claude Fable 5 de Anthropic enfrenta cada vez más críticas tras su relanzamiento el 1 de julio. Los usuarios dicen que reglas más estrictas han limitado mucho su capacidad para programar, depurar y actuar como agente.
El grupo de análisis BridgeMind informó caídas importantes en sus indicadores BridgeBench. Mientras tanto, Anthropic afirma que el modelo base no ha cambiado y atribuye los problemas a nuevas reglas de seguridad más estrictas.
Colapsan los puntajes de referencia de Claude Fable 5 tras relanzamiento
BridgeMind volvió a analizar la versión de Fable 5 lanzada el 1 de julio y vio caídas muy marcadas. El puntaje en depuración bajó de 86.2 a 25.9, la refactorización cayó de 73.6 a 38.4, y el manejo de alucinaciones bajó de 75.9 a 61.7.
Importa cómo se obtuvieron esos números. Solo tres de doce tareas de depuración se completaron sin recurrir a Claude Opus 4.8, y cada vez que hubo que usar ese modelo de respaldo, el puntaje fue cero.
Por eso, el colapso se debe a tareas bloqueadas y no a un razonamiento más débil. BridgeMind resaltó que Fable 5 funciona igual que en junio cuando se permite completar la tarea.
«El modelo no empeoró. Lo enjaularon», indicaron.
La cronología aclara el conflicto. Anthropic lanzó Fable 5 el 9 de junio y Washington la retiró tres días después. Las autoridades levantaron los controles de exportación el 30 de junio, cuatro días después de que devolvieran el acceso a Mythos 5 a unas 100 instituciones estadounidenses.
El acceso restaurado también tiene límites. Fable 5 solo permite usar hasta el 50% del tope semanal hasta el 7 de julio, y después se requerirán créditos de uso pagados.
Anthropic defiende su margen de seguridad más amplio
Anthropic habló sobre este equilibrio en un comunicado el 30 de junio. La empresa explicó que amplió a propósito su margen de seguridad, por lo que sus filtros ahora bloquean algunas peticiones que probablemente son inocuas.
Un filtro mejorado impide el método para saltarse la protección, como reportaron investigadores de Amazon en más del 99% de los intentos.
Las consultas bloqueadas pasan a Opus 4.8 y los usuarios reciben una notificación. Sin embargo, Anthropic admitió que el filtro ahora marca como peligrosos más trabajos legítimos de programación y depuración que antes.
Sus propias pruebas también mostraron que Fable 5 no presenta riesgos únicos. Otros modelos como GPT-5.5 y Kimi K2.7 detectaron las mismas vulnerabilidades.
Anthropic dice que investigadores del Departamento de Comercio de Estados Unidos probaron ambos sistemas de protección y los consideraron muy sólidos.
Lo que está en juego va más allá de un solo ciclo de producto. La suspensión llevó a que Europa busque atraer a Anthropic, mientras modelos de IA chinos están ganando terreno a laboratorios avanzados de Estados Unidos.
Actualmente, Anthropic está creando junto con Amazon, Microsoft y Google un marco de evaluación de la gravedad de los jailbreaks. Si sus filtros logran reducir los falsos positivos rápidamente, podría definir si los usuarios avanzados se quedan o se van a otra plataforma.
El post Aumentan las críticas contra Claude Fable 5: usuarios denincian que Anthropic “enjauló” su principal IA fue visto por primera vez en BeInCrypto.
