Anthropic se asocia con SpaceX para una expansión masiva de cómputo

1. Anthropic se asocia con SpaceX para una expansión masiva de cómputo

Anthropic ha firmado una asociación con SpaceX para utilizar el superordenador Colossus 1 en Memphis, Tennessee. Este acuerdo proporciona a Anthropic más de 300 megavatios de capacidad de cómputo y acceso a más de 220,000 GPU de NVIDIA, incluyendo los modelos H100, H200 y GB200. Como resultado, Anthropic está duplicando los límites de tasa de cinco horas para Claude Code y aumentando los límites de API para su modelo Opus. La compañía también está explorando futuras colaboraciones con SpaceX para desarrollar capacidad de cómputo de IA orbital.

• Acceso a más de 300 megavatios de capacidad de cómputo a través de Colossus 1.
• Límites de tasa de cinco horas duplicados para Claude Code.
• Aumento de los límites de tasa de API para Claude Opus.
• Planes futuros para capacidad de cómputo de IA orbital.

El aumento de la capacidad de cómputo se traduce directamente en límites de uso más altos y un mejor rendimiento para los desarrolladores que dependen de los modelos y herramientas agenticas de Anthropic.

2. La administración de EE. UU. avanza hacia la evaluación obligatoria de seguridad de la IA

El Instituto de Seguridad de IA de EE. UU., renombrado como Centro para Estándares e Innovación de IA (CAISI), ha firmado acuerdos con Google DeepMind, Microsoft y xAI para realizar comprobaciones de seguridad previas al despliegue en modelos de IA de frontera. La administración está considerando una orden ejecutiva que podría exigir la evaluación gubernamental antes del lanzamiento público, impulsada por preocupaciones de seguridad nacional. Este cambio de política sigue a recientes enfrentamientos en la industria sobre los riesgos potenciales de ciberseguridad de los modelos no lanzados.

• CAISI estableció acuerdos de pruebas previas al despliegue con xAI, Microsoft y Google DeepMind.
• Posible orden ejecutiva para la evaluación gubernamental obligatoria de modelos de frontera.
• Enfoque en la seguridad nacional y los riesgos de ciberseguridad.

Los desarrolladores que construyen sobre modelos de frontera pueden enfrentar nuevos obstáculos regulatorios y requisitos de evaluación previos al lanzamiento que podrían afectar los cronogramas de despliegue.

3. Subquadratic debuta con una ventana de contexto de 12 millones de tokens

Subquadratic ha introducido un modelo de IA con una ventana de contexto de 12 millones de tokens, expandiendo significativamente la cantidad de información que un modelo puede procesar a la vez. La compañía afirma que este modelo supera a GPT-5.5 en benchmarks de recuperación y ha resuelto los problemas de escalado cuadrático típicamente asociados con la atención de contexto largo. Subquadratic planea lanzar una versión de 50 millones de tokens en el futuro.

• Ventana de contexto de 12 millones de tokens.
• Afirma superar a GPT-5.5 en benchmarks de recuperación.
• Planes para un modelo de 50 millones de tokens.

Las ventanas de contexto masivas permiten a los desarrolladores procesar bases de código completas o grandes repositorios de documentos en un solo prompt, reduciendo la necesidad de arquitecturas RAG complejas.

4. Anthropic introduce 'Dreaming' para agentes gestionados

Anthropic ha introducido una función de vista previa de investigación llamada 'dreaming' para sus Claude Managed Agents. Este proceso permite a los agentes revisar eventos recientes y registros de actividad para identificar y almacenar información clave, mitigando eficazmente las limitaciones de la ventana de contexto durante proyectos largos. Al curar datos importantes entre sesiones, la función tiene como objetivo mejorar el rendimiento del agente y la retención de memoria para flujos de trabajo complejos de varios pasos.

• La función permite a los agentes revisar y almacenar información clave de los registros.
• Mitiga las limitaciones de la ventana de contexto para tareas de larga duración.
• Actualmente disponible como vista previa de investigación para agentes gestionados.

Esta función proporciona una forma nativa de gestionar la memoria a largo plazo para los agentes, simplificando el desarrollo de flujos de trabajo de automatización complejos y de varios pasos.

5. Cloudflare y Stripe permiten el aprovisionamiento autónomo de agentes

Cloudflare y Stripe se han asociado para permitir que los agentes de codificación creen cuentas, gestionen suscripciones y registren dominios automáticamente. La integración utiliza un nuevo protocolo que permite a los agentes desplegar aplicaciones de producción directamente. Para evitar gastos no autorizados, el sistema incluye un límite mensual predeterminado de $100 para los agentes, y la función está actualmente disponible en beta abierta a través de la CLI de Stripe.

• Los agentes ahora pueden aprovisionar servicios de Cloudflare y registrar dominios.
• La integración utiliza un nuevo protocolo para la tokenización segura de pagos.
• Límite de gasto mensual predeterminado de $100 para agentes.

Esta integración elimina la fricción manual del proceso de despliegue, permitiendo a los agentes manejar la configuración de la infraestructura y la facturación de forma autónoma.

6. CopilotKit lanza una plataforma empresarial para la memoria persistente de agentes

CopilotKit ha lanzado su Enterprise Intelligence Platform, que proporciona una capa de infraestructura gestionada para aplicaciones agenticas. La plataforma introduce 'Threads' como una primitiva central, permitiendo a los agentes mantener un contexto persistente entre diferentes usuarios, dispositivos y sesiones. Admite varios tipos de interacción, incluyendo interfaz generativa, voz y entradas multimodales, y está diseñada para entornos empresariales con soporte para cumplimiento SOC 2 y despliegues aislados.

• Introduce 'Threads' para la memoria de sesión persistente.
• Admite interacciones de interfaz generativa, voz y multimodales.
• Preparado para empresas con cumplimiento SOC 2 y soporte para despliegues aislados.

La memoria persistente es un requisito crítico para los agentes de nivel de producción; esta plataforma proporciona una forma estandarizada de manejar el estado entre sesiones.

7. Harvey y Artificial Analysis lanzan un benchmark para agentes legales

Artificial Analysis se ha asociado con Harvey para lanzar el Legal Agent Benchmark (LAB), diseñado para medir el rendimiento de la IA en tareas legales complejas. El benchmark incluye 1,200 tareas agenticas que cubren 24 áreas diferentes de práctica legal, proporcionando una forma estandarizada de rastrear y analizar las capacidades de los agentes de IA en el sector legal a partir de 2026.

• El benchmark incluye 1,200 tareas agenticas.
• Cubre 24 áreas distintas de práctica legal.
• Diseñado para rastrear el rendimiento de los agentes legales de la era 2026.

Los benchmarks estandarizados para agentes específicos de dominio ayudan a los desarrolladores a evaluar la idoneidad del modelo para flujos de trabajo profesionales de alto riesgo.