Anthropic hace que la ventana de contexto de 1M esté disponible de forma general para Claude 4.6

1. Anthropic hace que la ventana de contexto de 1M esté disponible de forma general para Claude 4.6

Anthropic ha puesto a disposición general la ventana de contexto de 1 millón de tokens para Claude Opus 4.6 y Sonnet 4.6 con precios estándar y sin recargos por contexto largo. La actualización también amplía los límites de medios para admitir hasta 600 imágenes o páginas PDF, facilitando el análisis de documentos a gran escala y tareas de recuperación multimodal.

2. Claude introduce una interfaz de usuario generativa para gráficos y diagramas interactivos

Anthropic lanzó una función beta que permite a Claude generar visualizaciones interactivas, incluidos diagramas de flujo, gráficos de barras y tablas periódicas clicables, directamente dentro de la interfaz de chat. El sistema utiliza análisis incremental para transmitir widgets HTML y puede activarse mediante el nuevo comando /btw para consultas en el panel lateral que no interrumpen las tareas activas del agente.

3. Los benchmarks de GPT-5.4 muestran un rendimiento superior en tareas de codificación del mundo real

Nuevas evaluaciones utilizando CursorBench, que emplea sesiones de desarrolladores reales, indican que GPT-5.4 supera a otros modelos de frontera utilizando menos de 16K tokens. Se informa que el modelo alcanza o supera los niveles de expertos humanos en razonamiento complejo, lo que marca un salto significativo en las capacidades técnicas autónomas.

4. NanoClaw y Docker se asocian para el sandboxing seguro de agentes de IA

La plataforma de agentes de IA de código abierto NanoClaw se ha asociado con Docker para ejecutar agentes dentro de Docker Sandboxes, proporcionando un entorno seguro para la ejecución autónoma de código. Esta integración aborda las preocupaciones de seguridad empresarial al aislar las acciones de los agentes de los sistemas host, permitiéndoles al mismo tiempo compilar, probar y verificar código.

5. Axiom Math recauda 200 millones de dólares para la verificación formal impulsada por IA

Axiom Math obtuvo 200 millones de dólares en financiación de serie A para desarrollar sistemas de 'IA verificada' que producen razonamientos verificables por máquina en el lenguaje de programación Lean. La startup tiene como objetivo pasar de la verificación de pruebas matemáticas a la verificación determinista de código, garantizando la corrección del software mediante métodos formales en lugar de probabilidad estadística.

6. Perplexity lanza un agente de 'computadora personal' y APIs de pila completa

Perplexity presentó un sistema de agente de IA persistente para Mac mini que mantiene acceso continuo a archivos y aplicaciones locales para ejecutar tareas de forma autónoma. Junto con la integración de hardware, la empresa lanzó una plataforma API de pila completa que incluye APIs de búsqueda, agentes y embeddings para la orquestación de múltiples pasos y la recuperación a escala web.

7. Google DeepMind presenta Aletheia para la investigación autónoma

Aletheia es un agente de IA especializado diseñado para cerrar la brecha entre las matemáticas de nivel competitivo y la investigación profesional mediante la navegación por una vasta literatura y la construcción de pruebas de largo alcance. El sistema utiliza un proceso iterativo de generación, verificación y revisión en lenguaje natural para descubrir nuevos conocimientos matemáticos.

8. NVIDIA lanza el modelo Nemotron 3 Super Hybrid Mamba-Transformer

El nuevo Nemotron 3 Super de NVIDIA es un modelo híbrido de 120B de parámetros que utiliza solo 12B de parámetros activos para ofrecer un rendimiento 5 veces mayor para sistemas multi-agente. Cuenta con una ventana de contexto nativa de 1 millón de tokens y está optimizado específicamente para cargas de trabajo de alto volumen, como el desarrollo de software y la clasificación de ciberseguridad.

9. AWS resuelve la vulnerabilidad de 'bucketsquatting' en S3 que existía desde hace una década

AWS ha implementado una solución para el 'bucketsquatting' o 'bucketsniping', un problema de seguridad donde los atacantes podían reclamar nombres de buckets eliminados para interceptar tráfico o datos. El nuevo mecanismo cambia la forma en que se gestionan los nombres de los buckets, eliminando efectivamente un riesgo de seguridad recurrente para los usuarios de S3.

10. Un agente de IA vulnera el chatbot 'Lilli' de McKinsey en dos horas

La startup de seguridad CodeWall demostró que un agente de IA podía obtener acceso completo de lectura y escritura a la base de datos interna 'Lilli' de McKinsey al explotar 22 endpoints de API no autenticados. La brecha expuso mensajes de chat confidenciales y archivos de clientes en texto plano, destacando vulnerabilidades críticas en despliegues de agentes a nivel empresarial.

11. Meta retrasa el modelo 'Avocado' tras brechas de rendimiento internas

Meta habría retrasado el lanzamiento de su modelo de IA de próxima generación, 'Avocado', hasta al menos mayo después de que no lograra igualar el rendimiento de los modelos líderes de OpenAI, Google y Anthropic. Aunque superó a las versiones internas anteriores, el retraso refleja la creciente presión por cumplir con los benchmarks de nivel de frontera.

12. Google lanza el conjunto de datos Groundsource para la predicción de inundaciones urbanas

Google AI Research presentó Groundsource, una metodología que utiliza Gemini para extraer datos históricos estructurados de 5 millones de informes de noticias no estructurados. El proyecto ha producido un conjunto de datos de código abierto de 2,6 millones de eventos de inundaciones repentinas urbanas, lo que permite a los modelos predecir inundaciones con hasta 24 horas de antelación.

13. Slate V1 debuta como un agente de codificación 'nativo de enjambre'

Random Labs lanzó Slate V1, un agente de frontera diseñado para orquestar programáticamente una gran cantidad de sub-agentes dentro de un entorno de código unificado. El marco se centra en resolver el 'problema de sistemas' de gestionar contextos profundos y tareas de largo alcance a través de una novedosa ingeniería de contexto y almacenamiento en caché maximizado.

14. Context Gateway permite la compresión de prompts en segundo plano para agentes

Context Gateway es una nueva utilidad que se sitúa entre los agentes de IA y las APIs de LLM para comprimir el historial de conversaciones en segundo plano. Esta herramienta permite a los desarrolladores mantener sesiones de contexto largo en herramientas como Claude Code o Cursor sin esperar a la compactación manual del historial ni alcanzar los límites de tokens.

15. Stanford lanza el marco de agentes local-first OpenJarvis

OpenJarvis es un marco de IA personal en el dispositivo desarrollado en Stanford que utiliza cinco primitivas componibles para inteligencia, inferencia y memoria. El sistema admite casos de uso de CLI, navegador y escritorio, garantizando que todos los datos permanezcan en la máquina local y utilizando bucles de auto-mejora para refinar el rendimiento del agente.

16. Claves de administrador de Algolia expuestas en 39 sitios de documentación de código abierto

Un investigador de seguridad descubrió 39 claves de API de administrador de Algolia expuestas en sitios de documentación importantes, incluido Vue.js, que otorgaban permisos completos para agregar, eliminar o modificar índices de búsqueda. La exposición destaca un error de configuración generalizado en cómo se despliegan las implementaciones de DocSearch en todo el ecosistema de código abierto.

17. Filtrado el código fuente de la plataforma de gobierno electrónico de Suecia

El código fuente completo de la plataforma de gobierno electrónico de Suecia fue filtrado tras un compromiso de la infraestructura de CGI Sverige AB. La filtración, atribuida al actor de amenazas ByteToBreach, incluye código de servicios digitales críticos gestionados para el gobierno sueco.

18. El cierre de la planta de helio en Qatar amenaza la cadena de suministro global de chips

Un cierre en el complejo de helio Ras Laffan de Qatar tras un ataque con drones iraníes ha eliminado el 30% del suministro mundial de helio del mercado. Sin una reapertura a la vista, los principales fabricantes de semiconductores como SK hynix se ven obligados a diversificar sus cadenas de suministro para evitar paradas de producción.

19. Gigantes de la IA firman el 'Compromiso de Protección al Contribuyente' para la energía de centros de datos

Amazon, Google, Meta, Microsoft, OpenAI, Oracle y xAI han firmado un compromiso para proteger a los consumidores estadounidenses de los aumentos en los precios de la electricidad impulsados por la demanda de los centros de datos. El acuerdo compromete a estas empresas a financiar la nueva generación y las actualizaciones de la red necesarias para alimentar su creciente infraestructura de IA.

20. Los benchmarks del MacBook Neo confirman la compatibilidad con máquinas virtuales de Windows

Las pruebas iniciales del MacBook Neo de 599 dólares de Apple confirman que Parallels Desktop puede ejecutar con éxito Windows 11 en una máquina virtual en el dispositivo con chip A18 Pro. Aunque la usabilidad básica es estable, la validación completa del rendimiento está en curso para determinar la idoneidad del hardware para cargas de trabajo intensivas de bases de datos y desarrollo.

21. Microsoft presenta Copilot Health para obtener información médica personalizada

Microsoft lanzó Copilot Health, un entorno de IA seguro que sintetiza datos de más de 50 dispositivos portátiles, registros de salud electrónicos de 50.000 hospitales y resultados de laboratorio. La herramienta tiene como objetivo proporcionar una 'historia de salud' coherente mediante el análisis de datos médicos aislados para ofrecer información personalizada directamente a los usuarios.

22. Spine Swarm lanza un lienzo visual para la colaboración multi-agente

Spine Swarm es un nuevo sistema multi-agente que opera en un lienzo visual infinito para ejecutar proyectos complejos que no son de codificación, como modelos financieros y auditorías SEO. La plataforma permite a los usuarios orquestar múltiples agentes simultáneamente para manejar tareas de largo alcance que requieren planificación y visualización estructuradas.

23. TUI Studio proporciona un entorno de diseño visual para aplicaciones de terminal

TUI Studio es un nuevo editor visual para aplicaciones de Interfaz de Usuario de Terminal (TUI), que ofrece un lienzo de arrastrar y soltar al estilo Figma con vistas previas ANSI en tiempo real. La herramienta admite modos de diseño como Flexbox y Grid, y puede exportar diseños a seis marcos TUI diferentes con un solo clic.

24. xAI recluta a líderes de producto de Cursor para construir el producto de codificación de Grok

xAI, la empresa de Elon Musk, ha contratado a los ingenieros de producto senior Andrew Milich y Jason Ginsberg de Cursor para acelerar las capacidades de codificación de Grok. El movimiento señala la intención de xAI de ingresar al mercado de desarrolladores con alta disposición a pagar, que actualmente se estima en más de 5 mil millones de dólares.

25. Google Maps integra Gemini para búsqueda conversacional y navegación 3D

Google Maps lanzó 'Ask Maps', una interfaz conversacional para consultas de ubicación matizadas, y 'Immersive Navigation', que utiliza vistas 3D y análisis de Street View en tiempo real para la guía de carriles. Estas actualizaciones utilizan Gemini para sintetizar datos de 300 millones de lugares y reseñas para proporcionar una planificación de viajes personalizada.