Anthropic lanza Claude Fable 5 y Mythos 5 — 2026-06-09

1. Anthropic lanza Claude Fable 5 y Mythos 5

Anthropic ha lanzado oficialmente Claude Fable 5, marcando la primera disponibilidad pública de sus modelos de gama alta de clase Mythos. Diseñado para la ingeniería de software avanzada y el trabajo de conocimiento complejo, Fable 5 introduce una arquitectura de seguridad única: cuando los clasificadores detectan consultas relacionadas con dominios de alto riesgo como la ciberseguridad o la biología, el sistema redirige automáticamente la solicitud a Claude Opus 4.8. Para casos de uso especializados, Anthropic también está desplegando Claude Mythos 5 —que carece de estas salvaguardas— exclusivamente para ciberdefensores e investigadores autorizados.

• Claude Fable 5 está disponible para el público a través de la API de Claude, mientras que Claude Mythos 5 está restringido a socios aprobados en el Proyecto Glasswing.
• Ambos modelos tienen un precio de 10 dólares por millón de tokens de entrada y 50 dólares por millón de tokens de salida.
• Fable 5 incluye clasificadores de seguridad que redirigen automáticamente las consultas sobre ciberseguridad, biología, química y destilación a Claude Opus 4.8.
• El mecanismo de seguridad de respaldo se activa en menos del 5% de las sesiones de usuario en promedio.
• Los modelos obtuvieron una puntuación del 80,3% en el benchmark SWE-bench Pro, superando al GPT-5.5 de OpenAI.
• Anthropic exige una política de retención de datos de 30 días para todo el tráfico de Fable 5 y Mythos 5 con el fin de monitorear la seguridad y posibles jailbreaks.

Los desarrolladores ahora pueden crear aplicaciones utilizando la clase de modelo más potente de Anthropic para tareas complejas de codificación y conocimiento sin preocuparse de que las consultas de alto riesgo provoquen fallos totales.

SOURCES

[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19]

2. Apple presenta AFM 3 y CoreAI para inferencia en el dispositivo

En la WWDC26, Apple presentó sus modelos fundacionales de tercera generación (AFM 3) junto con CoreAI, un nuevo motor de inferencia local diseñado para reemplazar a CoreML. Para evitar los estrictos límites de memoria de los dispositivos móviles, el modelo AFM 3 Core Advanced de 20 mil millones de parámetros almacena su conjunto de pesos en memoria flash NAND en lugar de DRAM. Utiliza una arquitectura de poda de seguimiento de instrucciones (IFP) para enrutar expertos una vez por prompt, lo que permite al sistema escalar dinámicamente los parámetros activos de 1 mil millones a 4 mil millones sin agotar el ancho de banda de la memoria.

• La familia AFM 3 incluye cinco modelos, destacando el AFM 3 Core Advanced de 20 mil millones de parámetros diseñado para su implementación en el dispositivo.
• AFM 3 Core Advanced almacena sus pesos en memoria flash NAND en lugar de DRAM.
• El modelo escala dinámicamente los parámetros activos de 1 mil millones a 4 mil millones según la complejidad de la tarea.
• Utiliza la poda de seguimiento de instrucciones (IFP) para enrutar expertos una vez por prompt.
• Apple introdujo CoreAI como reemplazo de CoreML, ofreciendo una inferencia local optimizada en Apple Silicon con APIs de Swift.
• CoreAI requiere que los pesos del modelo se conviertan utilizando un script de Python.

Los desarrolladores pueden implementar modelos altamente capaces de 20 mil millones de parámetros directamente en los dispositivos de los usuarios sin agotar la memoria del sistema.

SOURCES

[1] [2]

3. Cohere lanza el modelo de código North Mini con pesos abiertos

Cohere ha lanzado North Mini Code, un modelo de mezcla de expertos (MoE) de 30 mil millones de parámetros diseñado específicamente para tuberías de codificación agentica. Operando con solo 3 mil millones de parámetros activos por token, el modelo es altamente eficiente, capaz de ejecutarse en una sola GPU H100 o localmente en un Mac Studio. Cuenta con una amplia ventana de contexto de 256k y tiene licencia Apache 2.0, lo que lo convierte en una potente opción de pesos abiertos para desarrolladores que construyen agentes de ingeniería de software autónomos.

• North Mini Code es un modelo de mezcla de expertos de 30B de parámetros que utiliza 3B de parámetros activos por token.
• El modelo se lanza bajo la licencia Apache 2.0, con pesos disponibles en Hugging Face en formatos estándar y fp8.
• Admite una ventana de contexto de 256.000 tokens y una longitud máxima de generación de 64.000 tokens.
• El modelo obtuvo una puntuación de 33,4 en el Artificial Analysis Coding Index.
• La implementación a través de vLLM requiere usar la rama principal de vLLM e instalar la biblioteca cohere_melody versión 0.9.0 o superior.

Los desarrolladores pueden alojar por sí mismos un modelo de codificación altamente competitivo bajo una licencia Apache 2.0 que se ejecuta eficientemente en una sola GPU H100 o un Mac Studio local.

SOURCES

[1] [2] [3] [4]

4. Google lanza la vista previa de la API Gemini 3.5 Live Translate

Google ha presentado Gemini 3.5 Live Translate, un modelo de traducción de voz a voz en tiempo real ahora disponible en vista previa pública. Accesible a través de la API de Gemini Live y Google AI Studio, el modelo procesa flujos de audio continuos para traducir el lenguaje hablado sobre la marcha con solo unos segundos de latencia. Detecta automáticamente más de 70 idiomas mientras preserva el ritmo, el tono y la entonación del hablante original, emitiendo audio PCM de 24kHz de alta calidad incrustado con marcas de agua SynthID.

• Gemini 3.5 Live Translate es un modelo de voz a voz de streaming continuo que detecta y traduce automáticamente más de 70 idiomas.
• El modelo está disponible en vista previa pública para desarrolladores a través de la API de Gemini Live y Google AI Studio.
• Utiliza procesamiento de flujo continuo para traducir con solo unos segundos de latencia.
• La tubería acepta audio PCM crudo de 16 bits a 16kHz y emite audio PCM crudo de 16 bits a 24kHz.
• Todo el audio generado incluye una marca de agua SynthID imperceptible para seguridad y detectabilidad.

Los desarrolladores pueden integrar funciones de traducción de voz en tiempo real y baja latencia en sus aplicaciones con detección automática de idioma y preservación natural de la voz.

SOURCES

[1] [2]

5. NPM v12 introducirá cambios de seguridad predeterminados en julio de 2026

El próximo lanzamiento principal de npm v12, programado para julio de 2026, introducirá cambios significativos en los comportamientos de seguridad predeterminados. Para mitigar los ataques a la cadena de suministro, la configuración allowScripts estará desactivada por defecto, bloqueando automáticamente los scripts preinstall, install y postinstall de las dependencias. Este cambio bloqueará las compilaciones nativas de node-gyp y los scripts de preparación de dependencias de git, archivos y enlaces, a menos que se aprueben explícitamente. Los desarrolladores pueden prepararse para la transición y auditar sus dependencias utilizando npm versión 11.16.0 o superior, que muestra advertencias sobre estos próximos valores predeterminados.

• npm v12 está programado para su lanzamiento en julio de 2026 e introducirá cambios predeterminados relacionados con la seguridad.
• La configuración allowScripts estará desactivada por defecto, bloqueando la ejecución automática de scripts preinstall, install y postinstall.
• Las compilaciones nativas de node-gyp y los scripts de preparación de dependencias de git, archivos y enlaces serán bloqueados por defecto.
• Los desarrolladores pueden gestionar los permisos de script a través de npm approve-scripts y npm deny-scripts, guardando la lista de permitidos en package.json.
• Las banderas --allow-git y --allow-remote estarán desactivadas por defecto, requiriendo permiso explícito para resolver dependencias de Git y URLs remotas.
• Los desarrolladores pueden probar y prepararse para estos cambios utilizando npm versión 11.16.0 o superior.

Los desarrolladores deben preparar sus tuberías de compilación y entornos locales ahora para evitar instalaciones rotas de compilaciones nativas de node-gyp y dependencias de git.

SOURCES

[1]

6. Investigadores lanzan ntkMirror para la mitigación de alucinaciones locales

Los investigadores han publicado ntkMirror, una implementación sin entrenamiento de una puerta de respuesta/abstención diseñada para mitigar las alucinaciones predecibles en modelos locales de pesos abiertos. Basada en una investigación aceptada en ICML 2026, la herramienta aborda la "dispersión de permutación", donde el orden de presentación de la evidencia altera las probabilidades de salida del modelo. Al utilizar un verificador de margen de orden y un kernel fusionado personalizado que acelera el paso hacia adelante de la permutación hasta 10 veces, la puerta limita con éxito las alucinaciones a menos del 0,7% en conjuntos de datos auditados al abstenerse selectivamente de afirmaciones de baja confianza.

• La implementación de ntkMirror se basa en un artículo de ICML 2026 sobre alucinaciones predecibles y dispersión de permutación.
• La herramienta es una puerta de respuesta/abstención sin entrenamiento para modelos locales de pesos abiertos que utiliza un verificador de margen de orden.
• En las auditorías, la puerta logró entre un 0,0% y un 0,7% de alucinación con aproximadamente un 24% de abstención y un 80,5% de precisión.
• ntkMirror incluye un kernel fusionado que acelera el paso hacia adelante de la permutación de 2,6 a 10 veces en comparación con un bucle ingenuo.
• La implementación está disponible en GitHub y admite modelos como Qwen2.5 y Gemma.

Los desarrolladores que ejecutan modelos locales de pesos abiertos pueden integrar una puerta sin entrenamiento para reducir drásticamente las alucinaciones en tareas basadas en evidencia.

SOURCES

[1]

1. Anthropic lanza Claude Fable 5 y Mythos 5

2. Apple presenta AFM 3 y CoreAI para inferencia en el dispositivo

3. Cohere lanza el modelo de código North Mini con pesos abiertos

4. Google lanza la vista previa de la API Gemini 3.5 Live Translate

5. NPM v12 introducirá cambios de seguridad predeterminados en julio de 2026

6. Investigadores lanzan ntkMirror para la mitigación de alucinaciones locales

Inference Brew en tu correo