1. El gusano Shai-Hulud ataca a los agentes de codificación de IA
El gusano "Mini Shai-Hulud", activo desde el 11 de mayo de 2026, ha comprometido más de 170 paquetes de npm y PyPI. El malware se dirige específicamente a las configuraciones de los agentes de codificación de IA, incluidos los tokens de autenticación del servidor Kiro MCP y Claude, para obtener acceso a servicios externos. Establece persistencia a través de archivos de configuración comunes y puede activar comandos destructivos si se revocan las credenciales. Los investigadores de seguridad aconsejan aislar las máquinas afectadas y crear imágenes de ellas antes de revocar cualquier credencial para evitar la pérdida de datos.
- • Comprometió 172 paquetes de npm/PyPI
- • Se dirige a los tokens de autenticación de agentes de IA
- • Establece persistencia en archivos de configuración
- • Puede activar comandos destructivos si se revocan las credenciales
Los desarrolladores que utilizan agentes de codificación de IA corren el riesgo de sufrir robo de credenciales y compromiso del sistema a través de paquetes infectados.
2. Perceptron lanza el modelo de análisis de video Mk1
Perceptron Inc. ha presentado Mk1, un modelo de razonamiento capaz de comprender la dinámica del mundo físico, la identidad de los objetos y la continuidad temporal en video. El modelo procesa video nativo a hasta 2 fotogramas por segundo y tiene un precio significativamente menor que los líderes actuales de la industria. Incluye funciones especializadas para recorte, conteo denso de escenas y aprendizaje en contexto. Perceptron también ofrece una serie de pesos abiertos llamada Isaac para desarrolladores.
- • Procesa video a 2 FPS
- • Precio de 0,15 dólares por millón de tokens de entrada
- • Incluye funciones especializadas para recorte y conteo
- • Serie Isaac de pesos abiertos disponible
Proporciona una alternativa rentable para tareas de razonamiento de video con funciones especializadas para desarrolladores.
3. Statewright utiliza máquinas de estado para mejorar la fiabilidad de los agentes
Statewright aborda la fragilidad de la resolución de problemas mediante agentes utilizando máquinas de estado formales para restringir los espacios de herramientas y soluciones de los LLM. Al aplicar transiciones válidas y acceso a herramientas a través de un motor basado en Rust, el sistema evita que los modelos omitan pasos o utilicen herramientas incorrectas. La plataforma se integra con herramientas como Claude Code a través del Model Context Protocol y proporciona un editor visual para definir flujos de trabajo, incluidos estados, transiciones y protecciones.
- • Utiliza máquinas de estado formales para restringir el comportamiento de los LLM
- • Motor basado en Rust
- • Se integra con Claude Code a través de MCP
- • Editor visual para la definición de flujos de trabajo
Ofrece una forma estructurada de aplicar barreras de seguridad y fiabilidad en los flujos de trabajo de los agentes.
4. DuckDB presenta el protocolo cliente-servidor Quack
DuckDB ha lanzado el protocolo Quack, un sistema de comunicación cliente-servidor diseñado para permitir que múltiples instancias de DuckDB interactúen y admitan escritores concurrentes. Construido sobre HTTP con un formato de serialización personalizado, el protocolo está disponible en DuckDB v1.5.2. Cuenta con mecanismos extensibles de autenticación y autorización y ha demostrado un alto rendimiento en pruebas comparativas de escritura pequeña, superando a PostgreSQL en pruebas de hilos paralelos.
- • Permite escritores concurrentes
- • Construido sobre HTTP
- • Disponible en la versión 1.5.2
- • Alto rendimiento en pruebas comparativas de escritura pequeña
Mejora las capacidades de infraestructura de datos para aplicaciones que requieren acceso concurrente a DuckDB.
5. Artificial Analysis evalúa modelos de voz a voz
Artificial Analysis ha lanzado 𝜏-Voice, un benchmark diseñado para medir el rendimiento de los modelos de voz a voz (S2S) en interacciones de servicio al cliente de varios turnos. El benchmark evalúa los modelos en cuanto a llamadas a herramientas y seguimiento de instrucciones en 278 escenarios, simulando complejidades del mundo real en canales de voz como el ruido de fondo y la pérdida de paquetes. Grok Voice Think Fast 1.0 de xAI lidera actualmente el benchmark con una tasa de éxito del 52,1%.
- • Evalúa el seguimiento de instrucciones de varios turnos y el uso de herramientas
- • Simula ruido en canales de voz y pérdida de paquetes
- • Cubre los sectores de aerolíneas, comercio minorista y telecomunicaciones
Proporciona una forma estandarizada de evaluar agentes de voz en entornos complejos y reales.
6. La plataforma Claude en AWS ya está disponible de forma general
La plataforma Claude en AWS ya está disponible de forma general, lo que permite a los clientes de AWS acceder al conjunto completo de funciones de Claude, incluidos los agentes gestionados, la estrategia de asesoramiento y la ejecución de código. La plataforma se integra con AWS IAM para la autenticación, CloudTrail para el registro de auditoría y la facturación de AWS. Anthropic opera la plataforma fuera del límite de AWS, mientras que Amazon Bedrock continúa operando dentro del límite de AWS.
- • Se integra con AWS IAM, CloudTrail y facturación
- • Admite agentes gestionados de Claude y ejecución de código
- • Disponible en la mayoría de las regiones comerciales de AWS
Simplifica la adopción empresarial de Claude al integrarse directamente con la infraestructura de seguridad y facturación de AWS.