Meta presenta el modelo propietario Muse Spark con capacidades multimodales y de razonamiento

1. Meta presenta el modelo propietario Muse Spark con capacidades multimodales y de razonamiento

Meta ha presentado Muse Spark, un modelo multimodal propietario desarrollado por sus Superintelligence Labs. El modelo incluye uso nativo de herramientas, visual chain of thought y un "Contemplating mode" para razonamiento agéntico paralelo. Los resultados de los benchmarks lo sitúan cerca de modelos de vanguardia como Gemini 3.1 Pro y GPT-5.4. Meta ofrece actualmente una vista previa privada de la API a socios seleccionados, con planes para un acceso de pago más amplio en el futuro. Esto marca un cambio estratégico respecto al enfoque previo de Meta en los modelos Llama de pesos abiertos.

2. Anthropic lanza Claude Managed Agents en beta pública para el despliegue de agentes en la nube

Anthropic ha lanzado Claude Managed Agents en beta pública, ofreciendo un conjunto de APIs componibles diseñadas para construir y desplegar agentes de IA a escala. La plataforma proporciona infraestructura integrada para sandboxing seguro, autenticación, gestión de estados y ejecución de herramientas. Los desarrolladores pueden ejecutar sesiones autónomas que persisten tras desconexiones y coordinar múltiples agentes en paralelo. El servicio tiene un precio basado en las tarifas estándar de tokens de Claude Platform más una tarifa de tiempo de ejecución activo de 0,08 USD por hora de sesión.

3. Alibaba lanza Qwen3.6 Plus vía API con contexto de 1M y visión nativa

Alibaba ha lanzado Qwen3.6 Plus, un modelo multimodal propietario disponible a través de la Alibaba Cloud API. El modelo admite una ventana de contexto de 1 millón de tokens y entrada de visión nativa, mostrando un rendimiento mejorado en tareas agénticas y recuperación de contexto largo frente a Qwen3.5. El precio se ha fijado en 0,50 USD por millón de tokens de entrada y 3,00 USD por millón de tokens de salida para secuencias de hasta 256K. Alibaba no ha liberado los pesos del modelo para despliegue propio.

4. La herramienta de CLI Skrun convierte habilidades de agentes en APIs REST invocables

Skrun es una nueva herramienta de CLI de código abierto que permite a los desarrolladores desplegar habilidades de agentes como APIs invocables. Al definir instrucciones en un archivo SKILL.md estándar y la configuración en un archivo agent.yaml, los desarrolladores pueden exponer agentes a través de un endpoint POST local. La herramienta admite múltiples proveedores de modelos, incluidos Anthropic, OpenAI y Google, con capacidades de fallback automático. También incluye gestión de estados integrada y admite llamadas a herramientas mediante scripts locales o servidores MCP estándar.

5. Tencent lanza el modelo de lenguaje y visión Hunyuan Embodied AI de 2B de parámetros

Tencent ha publicado el modelo Hunyuan Embodied AI en Hugging Face. El lanzamiento consiste en un modelo de lenguaje y visión de 2.000 millones de parámetros que utiliza una arquitectura Mixture-of-Transformers. Está diseñado para tareas de comprensión incorporada (embodied) y logra resultados destacados en benchmarks como CV-Bench y DA-2K. Los desarrolladores pueden descargar e integrar el modelo para aplicaciones locales de visión y robótica.

6. La extensión oficial de Swift amplía su soporte a Cursor y otros editores de Open VSX

La extensión oficial de Swift ya está disponible en el Open VSX Registry. Este lanzamiento permite el soporte nativo del lenguaje Swift, incluyendo completado de código, depuración y refactorización, en editores como Cursor, VSCodium y AWS Kiro. Los desarrolladores que utilizan IDEs agénticos ahora pueden instalar la extensión automáticamente sin descargas manuales. La actualización facilita el desarrollo multiplataforma de Swift en macOS, Linux y Windows dentro de una gama más amplia de entornos.

7. El framework Memento-Skills permite a los agentes actualizar capacidades mediante memoria persistente

Un grupo de investigadores ha lanzado Memento-Skills, un framework de código abierto que permite a los agentes de modelos de lenguaje de gran tamaño construir y adaptar capacidades específicas para tareas de forma autónoma. El sistema utiliza un enfoque de aprendizaje por refuerzo basado en memoria con prompts con estado y archivos markdown estructurados para almacenar habilidades reutilizables. Esto permite a los agentes mejorar su rendimiento mediante un mecanismo de aprendizaje reflexivo de lectura y escritura sin necesidad de actualizar los parámetros del modelo base. El framework está disponible en GitHub para su integración en flujos de trabajo de agentes personalizados.

8. ThreadWeaver libera un método de razonamiento paralelo para un Chain-of-Thought tres veces más rápido

El proyecto ThreadWeaver se ha publicado como código abierto, proporcionando un nuevo método para paralelizar tareas de razonamiento en modelos de lenguaje de gran tamaño. La técnica logra un rendimiento de razonamiento comparable al de los modelos estándar de Chain-of-Thought (CoT) secuencial largo, ofreciendo una velocidad hasta 3 veces superior en tareas complejas. El lanzamiento incluye recetas para la generación de datos, ajuste fino supervisado y aprendizaje por refuerzo. Los desarrolladores pueden usar estos recursos para optimizar la latencia de inferencia en aplicaciones con alta carga de razonamiento.

9. Upstage lanza el modelo MoE Solar Pro 3 de 102B vía API

El laboratorio de IA surcoreano Upstage ha lanzado Solar Pro 3, un modelo Mixture of Experts de 102.000 millones de parámetros con 12.000 millones de parámetros activos. El modelo cuenta con una ventana de contexto de 128K y demuestra un sólido rendimiento en el seguimiento de instrucciones y el uso de herramientas agénticas. Actualmente está disponible como modelo propietario a través de la API de Upstage. Las evaluaciones de benchmarks indican un alto uso de tokens para tareas de razonamiento y una precisión modesta en comparación con los modelos de vanguardia.