Zhipu AI lanza el modelo de código abierto GLM-5.1 de 754B

1. Zhipu AI lanza el modelo de código abierto GLM-5.1 de 754B

Zhipu AI ha lanzado GLM-5.1, un modelo de 754 mil millones de parámetros optimizado para tareas de agentes de largo horizonte, disponible en Hugging Face bajo una licencia de código abierto permisiva. El modelo está diseñado para operar de forma autónoma hasta ocho horas en una sola tarea. Actualmente alcanza un rendimiento de vanguardia en SWE-Bench Pro, superando a modelos propietarios como Claude Opus 4.6 y GPT-5.4. Los desarrolladores pueden descargarlo y personalizarlo para uso comercial o acceder a él mediante HuggingChat.

2. Anthropic presenta Claude Mythos para un consorcio privado de ciberseguridad

Anthropic ha anunciado Claude Mythos Preview, un modelo de alta capacidad que no se lanzará al público por motivos de seguridad. El modelo se comparte de forma privada con un consorcio de 12 grandes empresas tecnológicas, incluidas AWS, Google y Microsoft, bajo el Project Glasswing. Mythos descubrió de forma autónoma miles de vulnerabilidades zero-day de alta gravedad en los principales sistemas operativos y navegadores sin intervención humana. Esto marca un cambio importante en cómo se restringirán y desplegarán los modelos de frontera para operaciones defensivas de ciberseguridad.

3. AWS lanza Amazon S3 Files para espacios de trabajo nativos de agentes

AWS ha introducido Amazon S3 Files, una función que proporciona a los agentes de IA un espacio de trabajo de sistema de archivos nativo directamente sobre el almacenamiento de objetos S3. Esto elimina la necesidad de que los desarrolladores creen capas de sistemas de archivos independientes o canalizaciones de sincronización de datos para cerrar la brecha entre los almacenes de objetos basados en API y los agentes que dependen de rutas de archivos. Los equipos de ingeniería ahora pueden dirigir herramientas como Claude Code directamente a los datos de S3 sin perder el estado de la sesión ni reducir las ventanas de contexto durante las descargas locales.

4. OpenAI presenta un avance del modelo de próxima generación Image V2

OpenAI está probando tres variantes de su modelo de próxima generación Image V2 en ChatGPT y LM Arena. Las pruebas iniciales indican mejoras en el seguimiento de instrucciones (prompt adherence), comprensión compositiva y renderizado de diseño de interfaces de usuario. Este avance de acceso limitado señala una próxima actualización de las capacidades de la API de generación de imágenes de OpenAI.

5. Google presenta el agente de codificación autónomo Jules V2

Google está desarrollando Jules V2, un agente de codificación diseñado para gestionar objetivos de desarrollo de alto nivel de forma autónoma, en lugar de ejecutar comandos específicos basados en tareas. El agente se está lanzando mediante una lista de espera para pruebas iniciales. Este enfoque basado en KPI busca ayudar a los equipos a gestionar grandes bases de código, aunque introduce nuevos retos relacionados con cambios de código impredecibles y su verificación.

6. Google libera Scion, un entorno de pruebas para la orquestación de agentes

Google ha publicado como código abierto Scion, un entorno de pruebas experimental para la orquestación de agentes. El framework proporciona a los desarrolladores un entorno estructurado para construir, probar y evaluar flujos de trabajo multi-agente. Este lanzamiento ofrece una nueva arquitectura de referencia para equipos que diseñan sistemas de agentes complejos en Google Cloud.

7. Fine-Tuner multimodal de código abierto para Gemma 4 en Apple Silicon

Un nuevo proyecto de código abierto ofrece una canalización de ajuste fino (fine-tuning) local para Gemma 4 optimizada específicamente para Apple Silicon. La herramienta permite a los desarrolladores transmitir datos de entrenamiento directamente desde Google Cloud Storage, evitando las limitaciones de almacenamiento local para grandes conjuntos de datos. Incluye optimizaciones específicas para el ajuste fino multimodal y de audio en hardware Mac, aunque se recomienda vigilar el uso de memoria en secuencias largas para evitar errores de falta de memoria.

8. Lanzamiento de ACE-Step 1.5 XL, un modelo abierto de generación de música

Un nuevo modelo de generación de música de 4B de parámetros, ACE-Step 1.5 XL, ya está disponible en Hugging Face bajo licencia MIT. El modelo admite tareas de texto a música, generación de covers, repintado y extracción de audio. Fue entrenado con conjuntos de datos legalmente conformes, lo que lo hace apto para la integración comercial en aplicaciones de audio.

9. AutoAgent libera un entorno de agentes con capacidad de automejora

AutoAgent es un nuevo framework con licencia MIT que permite a un meta-agente diseñar y optimizar de forma autónoma su propio entorno de ejecución. El sistema utiliza técnicas de hill-climbing para mejorar iterativamente el uso de herramientas y las estructuras de memoria durante la noche. El framework afirma tener el mejor rendimiento en TerminalBench y SpreadsheetBench, ofreciendo a los desarrolladores un enfoque novedoso para construir arquitecturas de agentes que se perfeccionan a sí mismas.

10. GitNexus indexa bases de código para el contexto de agentes de IA

GitNexus es una nueva herramienta que indexa bases de código completas en grafos de conocimiento para proporcionar un contexto profundo a agentes de IA como Cursor y Claude Code. Al mapear dependencias y cadenas de llamadas, ayuda a los agentes a comprender las relaciones del repositorio antes de realizar ediciones. La herramienta incluye una CLI para integración con editores y una interfaz web, reduciendo el riesgo de que los agentes introduzcan cambios que rompan el código debido a ventanas de contexto limitadas.

11. Nia monta documentación web como sistemas de archivos virtuales para agentes

Nia es una nueva herramienta que monta sitios de documentación en línea como sistemas de archivos virtuales, permitiendo que los agentes de IA los naveguen mediante comandos estándar de terminal como grep y tree. Este shell en memoria del lado del cliente funciona con Claude Code, Copilot y Gemini para proporcionar acceso en tiempo real a las API actuales. Al tratar la web como un sistema de archivos, los desarrolladores pueden reducir las alucinaciones de código causadas por datos de entrenamiento obsoletos sin necesidad de construir esquemas de herramientas complejos.