1. Anthropic supera a OpenAI en adopción empresarial
Los datos del Ramp AI Index de mayo de 2026 indican un cambio significativo en el gasto en IA empresarial, con un 34,4% de las empresas participantes pagando por los servicios de Anthropic en comparación con el 32,3% de OpenAI. Aunque OpenAI mantiene una base de consumidores masiva, la adopción empresarial de Anthropic se ha cuadruplicado durante el último año, impulsada en gran medida por la popularidad de sus herramientas de codificación agentica. Este cambio destaca la creciente preferencia empresarial por flujos de trabajo agenticos especializados sobre los modelos de consumo de propósito general.
- • La adopción empresarial de Anthropic alcanzó el 34,4% en abril, superando el 32,3% de OpenAI.
- • La adopción empresarial de Anthropic se ha cuadruplicado en el último año.
- • Se estima que Claude Code es responsable de la autoría del 4% de todas las confirmaciones (commits) públicas en GitHub.
Este hito señala un posible punto de inflexión en el mercado de IA empresarial, sugiriendo que el enfoque de Anthropic en herramientas de codificación agentica está capturando con éxito presupuestos empresariales que antes estaban dominados por OpenAI.
2. Anthropic introduce créditos para el SDK de agentes
Anthropic ha revertido su prohibición de abril de 2026 sobre el uso de suscripciones de Claude para agentes autónomos de terceros. Los suscriptores ahora recibirán créditos mensuales fijos y no acumulables para el SDK de agentes, que oscilan entre $20 y $200, dependiendo de su plan. Estos créditos se facturan a tarifas de API y son independientes del uso estándar de chat, lo que soluciona las ineficiencias de cómputo anteriores causadas por agentes que omitían los mecanismos de almacenamiento en caché de prompts. La política se implementará por completo antes del 15 de junio de 2026.
- • Los créditos del SDK de agentes son asignaciones mensuales fijas y no acumulables.
- • El uso programático se factura a tarifas de API, separado de los límites de chat interactivo.
- • El cambio de política aborda las ineficiencias técnicas relacionadas con el almacenamiento en caché de prompts.
Este cambio proporciona un camino claro para que los desarrolladores integren agentes de terceros con Claude, al tiempo que permite a Anthropic gestionar los costos de cómputo y la estabilidad de la infraestructura.
3. Fastino Labs lanza el modelo de moderación GLiGuard
GLiGuard es un modelo de moderación de seguridad basado en codificadores que trata la moderación como una tarea de clasificación de texto en lugar de una tarea de generación. Al centrarse en la clasificación, el modelo logra un rendimiento significativamente mayor y una latencia menor que los modelos más grandes solo de decodificador. Evalúa cuatro dimensiones de seguridad (clasificación de seguridad, detección de jailbreak, detección de categorías de daño y detección de rechazo) en una sola pasada, lo que lo hace adecuado para barreras de seguridad de IA de nivel de producción.
- • Modelo de 300M de parámetros optimizado para la clasificación de texto.
- • Logra un rendimiento 16,2 veces mayor que los modelos más grandes solo de decodificador.
- • Evalúa cuatro dimensiones de seguridad en una sola pasada.
Para los desarrolladores que crean aplicaciones de IA, GLiGuard ofrece una alternativa ligera y eficiente a los modelos más grandes para la moderación de seguridad en tiempo real, reduciendo tanto la latencia como los costos operativos.
4. Ardent lanza entornos de pruebas (sandboxes) de Postgres para agentes de IA
Ardent permite a los desarrolladores crear entornos de pruebas de bases de datos en menos de seis segundos, incluso para conjuntos de datos a escala de terabytes. La plataforma utiliza un flujo de replicación y tecnología de copia en escritura (copy-on-write) para crear entornos aislados que reflejan las bases de datos de producción. Incluye funciones para control de acceso granular, protección de credenciales y redacción automatizada de PII, lo que permite a los agentes de IA probar de forma segura las interacciones con la base de datos en un entorno similar al de producción.
- • Los entornos de pruebas se inician en menos de 6 segundos.
- • Compatible con cualquier base de datos PostgreSQL alojada.
- • Incluye redacción de PII y control de acceso integrados.
Probar agentes de IA contra esquemas de bases de datos reales suele ser lento y arriesgado; el enfoque de Ardent permite una iteración más rápida y segura para los flujos de trabajo agenticos que requieren acceso a bases de datos.
5. Modal optimiza el escalado de GPU sin servidor (serverless)
La computación sin servidor es cada vez más vital para la inferencia de IA, donde las cargas de trabajo son altamente variables. Modal ha optimizado su infraestructura para iniciar nuevas réplicas rápidamente, reduciendo el tiempo necesario para escalar la capacidad de inferencia de varios kilosegundos a solo decenas de segundos. Esta mejora permite a los desarrolladores manejar picos de tráfico impredecibles de manera más efectiva sin mantener capacidad de GPU inactiva.
- • Tiempo de escalado reducido de kilosegundos a decenas de segundos.
- • Optimizado para cargas de trabajo de inferencia variables.
- • Reduce la necesidad de sobreaprovisionar la capacidad de GPU.
El escalado rápido es fundamental para una inferencia de IA rentable; las mejoras en la infraestructura de Modal permiten a los desarrolladores crear aplicaciones más receptivas mientras minimizan el desperdicio de cómputo.
6. Cactus Needle: Un modelo abierto de 26M de parámetros
Cactus Needle es una red de atención simple (SAN) destilada de Gemini 3.1. Con solo 26 millones de parámetros, está diseñado para ejecutarse localmente en hardware Mac o PC, alcanzando velocidades de 6.000 tokens por segundo para prellenado (prefill) y 1.200 tokens por segundo para decodificación (decode). Los pesos del modelo son totalmente abiertos, con el objetivo de redefinir las capacidades de IA para dispositivos de borde (edge) como teléfonos y dispositivos portátiles.
- • Modelo de 26M de parámetros destilado de Gemini 3.1.
- • Capaz de ajuste fino (fine-tuning) local en hardware de consumo.
- • Logra un alto rendimiento de tokens para prellenado y decodificación.
Este modelo demuestra el potencial de los modelos a pequeña escala altamente eficientes para realizar tareas específicas localmente, evitando la necesidad de llamadas a API basadas en la nube para interacciones simples.
7. Notion lanza una plataforma de desarrollo para agentes de IA
Notion está expandiendo su software de productividad hacia el espacio agentico con una nueva plataforma de desarrollo. Esta actualización permite a los equipos conectar fuentes de datos externas, código personalizado y agentes de IA directamente en sus espacios de trabajo de Notion. El movimiento señala la intención de Notion de convertirse en un centro central para flujos de trabajo agenticos, permitiendo a los usuarios automatizar tareas e interactuar con datos sin salir de la aplicación.
- • La nueva plataforma admite la integración de datos externos y código personalizado.
- • Permite a los equipos integrar agentes de IA directamente en los espacios de trabajo de Notion.
- • Expansión estratégica hacia el software de productividad agentica.
Al convertir su espacio de trabajo en un centro de agentes, Notion se posiciona como una interfaz principal para la IA empresarial, permitiendo a los desarrolladores crear herramientas agenticas personalizadas que viven donde ocurre el trabajo.
8. El Instituto de Seguridad de IA del Reino Unido informa un rápido crecimiento de la capacidad cibernética
El Instituto de Seguridad de IA del Reino Unido (AISI) informa que los modelos de IA están avanzando rápidamente en su capacidad para completar tareas cibernéticas complejas. Las pruebas en modelos como Claude Mythos Preview y GPT-5.5 muestran un tiempo de duplicación de capacidad de aproximadamente 4,5 meses, una aceleración respecto a estimaciones anteriores. Estos modelos ahora son capaces de resolver rangos cibernéticos complejos, con un rendimiento que parece limitado principalmente por el uso de tokens en lugar de por la capacidad inherente.
- • El tiempo de duplicación de la capacidad cibernética se estima en 4,5 meses.
- • Los nuevos modelos están resolviendo con éxito rangos cibernéticos complejos.
- • El rendimiento parece limitado por el uso de tokens en lugar de por la capacidad inherente.
El rápido avance de las capacidades cibernéticas de la IA requiere nuevos marcos de seguridad y estrategias de monitoreo para los desarrolladores que crean sistemas agenticos que interactúan con infraestructura sensible.