1. DeepSeek presenta un avance de la serie de modelos DeepSeek-V4
DeepSeek ha lanzado un avance de su serie DeepSeek-V4, que incluye el modelo V4-Pro de 1,6 billones de parámetros y el V4-Flash de 284.000 millones. Ambos modelos admiten una ventana de contexto de un millón de tokens y están disponibles bajo licencia MIT o mediante una API propia. Utilizan una nueva arquitectura de atención híbrida para reducir el cómputo de inferencia y los requisitos de KV cache en contextos largos. El precio de la API se ha fijado en 1,74 $ por millón de tokens de entrada para V4-Pro y 0,14 $ para V4-Flash, aunque los primeros benchmarks indican un alto uso de tokens de salida en tareas de razonamiento.
2. Sakana AI lanza la beta de la API de orquestación multiagente Fugu
Sakana AI ha presentado la versión beta de Sakana Fugu, un sistema de orquestación multiagente diseñado para coordinar modelos fundacionales de vanguardia. El sistema selecciona dinámicamente combinaciones de agentes y roles óptimos para tareas como programación y razonamiento científico, en lugar de depender de reglas estáticas. Fugu es accesible a través de una API compatible con OpenAI para facilitar su integración en los flujos de trabajo de desarrollo existentes. El servicio se ofrece en dos variantes: Fugu Mini para aplicaciones de baja latencia y Fugu Ultra para tareas de razonamiento complejo.
3. Lanzamiento de la librería Browser Harness para la automatización de navegadores con LLM
Se ha publicado Browser Harness, una librería de código abierto que proporciona a los LLM acceso directo al Chrome DevTools Protocol (CDP) para la automatización de navegadores. A diferencia de otros frameworks que restringen los modelos a funciones predefinidas, esta herramienta permite que el LLM escriba sus propios asistentes de clic, gestione objetivos y maneje casos especiales como iframes de origen cruzado de forma dinámica. El sistema se basa en un demonio websocket de CDP persistente y asistentes básicos en Python que el modelo puede modificar sobre la marcha. Este enfoque reduce los fallos silenciosos al proporcionar al modelo un contexto perfecto sobre cómo interactúan sus herramientas con el DOM.
4. AI2 añade exportación de embeddings personalizados a OlmoEarth Studio
AI2 ha incorporado una función en OlmoEarth Studio que permite a los desarrolladores calcular y exportar vectores de embeddings personalizados desde sus modelos fundacionales de código abierto OlmoEarth. Los usuarios pueden configurar parámetros como el área de interés, el rango de tiempo y las fuentes de imágenes a través de la interfaz de usuario de Studio o su API. El sistema genera representaciones numéricas compactas de datos de observación terrestre que se descargan como Cloud-Optimized GeoTIFFs (COGs) ligeros. Estos embeddings están optimizados para aplicaciones posteriores como búsqueda por similitud, detección de cambios y mapeo few-shot.