1. Investigadores identifican fallo de ejecución de comandos en Model Context Protocol
Investigadores de seguridad de OX Security han identificado un fallo arquitectónico en el transporte STDIO de Model Context Protocol (MCP). El transporte predeterminado para conectar agentes de IA con herramientas locales ejecuta comandos del sistema operativo recibidos sin saneamiento ni límites de ejecución. Los comandos maliciosos se ejecutan antes de devolver un error y el toolchain de desarrollo no genera alertas. Los desarrolladores que utilicen MCP para la comunicación entre agentes y herramientas deben revisar de inmediato sus permisos de ejecución de herramientas locales.
2. PyTorch lanza Shepherd Model Gateway para el servicio de LLM
PyTorch ha presentado Shepherd Model Gateway (SMG), una pasarela de enrutamiento de modelos de alto rendimiento para despliegues de LLM a gran escala. Esta pasarela basada en Rust desagrega tareas limitadas por la CPU, como la tokenización, el análisis de salida y la orquestación de herramientas MCP, de la inferencia en GPU. SMG admite backends como SGLang, vLLM y TensorRT-LLM, ofreciendo compatibilidad total con las API de OpenAI y Anthropic. Esta arquitectura minimiza el bloqueo de la CPU y reduce los límites de gRPC, permitiendo que las GPU dediquen sus recursos por completo al cálculo de tensores.
3. OpenAI restringe el acceso al modelo GPT-5.5 Cyber
OpenAI ha restringido el acceso a su nuevo modelo GPT-5.5 Cyber, limitando su disponibilidad a profesionales de ciberseguridad verificados. El modelo está diseñado para pruebas de penetración, identificación de vulnerabilidades e ingeniería inversa de malware. Los desarrolladores deben solicitar el acceso a través del programa Trusted Access for Cyber (TAC) para utilizar las capacidades permisivas del modelo. Esto refleja la reciente decisión de Anthropic de restringir el acceso general vía API a su modelo competidor, Mythos.
4. Z.ai y la Universidad de Tsinghua lanzan GLM-5V-Turbo
Z.ai y la Universidad de Tsinghua han publicado el informe técnico de GLM-5V-Turbo, un modelo fundacional multimodal nativo. El modelo integra la percepción visual directamente en el razonamiento central, la planificación y el uso de herramientas, en lugar de depender de interfaces auxiliares. Utiliza un codificador de visión CogViT para una percepción espacial detallada y una estrategia de Multimodal Multi-Token Prediction. El lanzamiento ofrece a los desarrolladores un nuevo modelo optimizado para tareas agénticas en entornos digitales como OSWorld y AndroidWorld.
5. Salesforce lanza la plataforma de flujo de trabajo Agentforce Operations
Salesforce ha presentado Agentforce Operations, una nueva capa arquitectónica diseñada para imponer una estructura determinante en los flujos de trabajo de IA empresarial. La plataforma convierte los procesos de back-office en un conjunto específico de tareas para que las ejecuten agentes especializados. Los desarrolladores pueden cargar procesos personalizados o utilizar esquemas predefinidos para evitar fallos en las tareas y transferencias interrumpidas. Esto proporciona un plano de control para organizaciones que despliegan agentes de forma profunda en sistemas de back-office existentes.
6. Meta presenta el framework Autodata
Meta ha introducido Autodata, un framework agéntico que despliega agentes de IA para construir, evaluar y perfeccionar conjuntos de datos de entrenamiento de forma iterativa. El sistema opera mediante un pipeline de bucle cerrado donde los agentes generan datos a partir de documentos fuente y analizan la calidad de los ejemplos. Perfecciona los datos hasta que son lo suficientemente discriminativos, reduciendo la dependencia de la anotación humana. Esto proporciona a los desarrolladores una herramienta para automatizar la creación de datasets de alta calidad para el ajuste fino de modelos.
7. Intel actualiza el kit de herramientas de cuantización AutoRound
Intel ha actualizado su kit de herramientas de cuantización AutoRound para Large Language Models y Vision-Language Models. El kit ahora admite cuantización FP8 por bloques y cuantización de capas MTP. Se integra directamente con Transformers, vLLM y SGLang, permitiendo a los desarrolladores exportar modelos en formatos AutoAWQ, AutoGPTQ y GGUF. Esto permite alcanzar una alta precisión con anchos de 2 a 4 bits con una sobrecarga de ajuste mínima para el despliegue de modelos locales.