La API de Anthropic Claude añade la herramienta Advisor para el enrutamiento de modelos híbridos

1. La API de Anthropic Claude añade la herramienta Advisor para el enrutamiento de modelos híbridos

Anthropic ha lanzado una herramienta Advisor para la API de la plataforma Claude que permite a los desarrolladores combinar diferentes modelos en un mismo flujo de trabajo. Esta función permite que un modelo ejecutor más rápido y rentable, como Sonnet o Haiku, consulte a un modelo asesor de alta inteligencia como Opus durante la tarea. Este enfoque híbrido está integrado directamente en la solicitud de la API de Messages. Los desarrolladores pueden lograr un razonamiento cercano al nivel de Opus manteniendo costes operativos más bajos al invocar al modelo más grande solo para orientación estratégica.

2. NVIDIA lanza el modelo Nemotron 3 Super 120B para flujos de trabajo de agentes

NVIDIA ha publicado el código abierto de Nemotron 3 Super, un modelo híbrido de mezcla de expertos (Mixture-of-Experts) de 120 mil millones de parámetros con 12 mil millones de parámetros activos. El modelo utiliza una arquitectura Mamba-Transformer y cuenta con una ventana de contexto de 1 millón de tokens diseñada específicamente para aplicaciones multiagente de alto rendimiento. Está disponible con pesos, conjuntos de datos y recetas de entrenamiento abiertos. Los desarrolladores pueden acceder al modelo inmediatamente a través de plataformas como LM Studio, Together AI y OpenRouter.

3. Sentence Transformers v5.4 introduce modelos de incrustación multimodal y reranker

La actualización v5.4 de la biblioteca Sentence Transformers añade soporte para modelos de incrustación (embedding) multimodal y reranker. Esto permite a los desarrolladores codificar y comparar texto, imágenes, audio y vídeo dentro de un espacio de incrustación compartido. La actualización permite específicamente flujos de trabajo de búsqueda intermodal y generación aumentada por recuperación (RAG). La inclusión de rerankers multimodales permite una puntuación de alta calidad de pares de modalidades mixtas para mejorar la precisión de la recuperación.

4. NVIDIA publica el código abierto del modelo de difusión de movimiento 3D Kimodo

NVIDIA Research ha lanzado Kimodo, un modelo de difusión de movimiento cinemático de código abierto, en Hugging Face. El modelo genera movimientos humanos y robóticos en 3D de alta calidad y fue entrenado con 700 horas de datos de captura de movimiento óptico. Los desarrolladores pueden controlar las salidas generadas mediante prompts de texto y restricciones cinemáticas específicas. Esto proporciona una herramienta programática directa para integrar la generación de movimiento 3D en aplicaciones espaciales o de robótica.

5. Hugging Face Hub añade soporte nativo para kernels de hardware optimizados

Hugging Face ha introducido "Kernels" como un nuevo tipo de repositorio en su Hub. Esta función permite a los desarrolladores compartir e integrar colecciones de operaciones binarias optimizadas adaptadas a proveedores de hardware específicos. La plataforma trata el soporte para CUDA, ROCm, Apple Silicon e Intel XPU como ciudadanos de primera clase. El lanzamiento inicial cuenta con el kernel Flash Attention del equipo del proyecto SGLang.

6. Twill.ai lanza sandboxes en la nube para agentes de codificación autónomos

Twill.ai ha lanzado una plataforma que ejecuta CLI de codificación como Claude Code y Codex dentro de sandboxes en la nube aislados. Los desarrolladores pueden delegar tareas a través de Slack, GitHub, Linear o una CLI, y los agentes devolverán solicitudes de extracción (pull requests) o diagnósticos. El servicio resuelve problemas de paralelización local y persistencia al permitir que los agentes se ejecuten sin supervisión sin requerir acceso completo al sistema de archivos local. Un nivel gratuito ofrece 10 créditos al mes, con planes de pago que admiten configuraciones de clave propia (BYOK).

7. La comunidad lanza el ajuste fino Gemopus-4 26B para despliegue en el borde

Un nuevo ajuste fino de la comunidad llamado Gemopus-4-26B-A4B-it ya está disponible en Hugging Face. Basado en la arquitectura de mezcla de expertos Gemma 4 26B, el modelo utiliza 4 mil millones de parámetros activos y cuenta con una ventana de contexto de 131k. Fue entrenado utilizando técnicas de destilación de razonamiento para imitar las salidas al estilo de Claude Opus. El modelo está optimizado para el despliegue local y en el borde (edge), requiriendo aproximadamente 22.7 GB de VRAM en cuantización Q6_K.

8. Alibaba presenta el modelo de generación de vídeo multimodal HappyHorse-1.0

Alibaba ha revelado HappyHorse-1.0, un nuevo modelo de generación de vídeo que admite modalidades de texto a vídeo e imagen a vídeo con y sin audio nativo. El modelo alcanzó recientemente los primeros puestos en las tablas de clasificación de Artificial Analysis Video Arena. Aunque actualmente no se ha lanzado, Alibaba planea lanzar el acceso a la API pública para desarrolladores el 30 de abril.