NVIDIA lanza el modelo híbrido Nemotron 3 Super 120B

1. NVIDIA lanza el modelo híbrido Nemotron 3 Super 120B

NVIDIA lanzó Nemotron 3 Super, un modelo híbrido de 120B de parámetros que combina modelos de espacio de estados y transformadores con solo 12B de parámetros activos. Cuenta con una ventana de contexto de 1M de tokens y ofrece un rendimiento 5 veces mayor que las versiones anteriores, optimizado específicamente para sistemas multi-agente de alto volumen.

2. Google lanza Gemini Embedding 2 multimodal

Google lanzó Gemini Embedding 2, un modelo multimodal que unifica texto, imágenes, video y audio en un único espacio numérico. Admite Matryoshka Representation Learning para dimensiones de salida personalizables y está diseñado para optimizar los pipelines de RAG para la recuperación a nivel de producción.

3. Amazon gana una orden judicial contra el agente de compras de Perplexity

Un juez estadounidense emitió una orden judicial preliminar que prohíbe al navegador Comet de Perplexity realizar compras en Amazon en nombre de los usuarios. El fallo exige que Perplexity deje de usar sus agentes para eludir las restricciones del sitio de Amazon y destruya las copias de los datos extraídos, citando riesgos para los datos de los clientes y la publicidad.

4. Un análisis de METR revela que la mitad de los PR de SWE-bench no son fusionables

Una investigación de METR indica que aproximadamente la mitad de los PR que superan el benchmark SWE-bench Verified no serían fusionados por los mantenedores en escenarios del mundo real. El estudio sugiere que los benchmarks actuales pueden sobreestimar la preparación de los agentes al no tener en cuenta la iteración humana y los bucles de retroalimentación necesarios en producción.

5. Perplexity presenta el sistema operativo de IA 'Personal Computer'

Perplexity presentó 'Personal Computer', un proxy de sistema operativo nativo de IA que se ejecuta localmente en un Mac mini. El sistema proporciona un agente siempre activo con acceso a archivos y aplicaciones locales, lo que le permite ejecutar objetivos de forma autónoma entre sesiones, aunque requiere la aprobación del usuario para acciones sensibles.

6. Microsoft lanza bitnet.cpp para inferencia de LLM de 1 bit

Microsoft lanzó bitnet.cpp, un marco de inferencia oficial para LLMs de 1 bit como BitNet b1.58. El marco permite una inferencia sin pérdidas en CPUs estándar, logrando aceleraciones de hasta 5 veces en arquitecturas ARM y haciendo que los modelos a gran escala sean más accesibles para el despliegue local.

7. Actualizaciones de Claude Code: memoria automática y contexto entre aplicaciones

Anthropic actualizó Claude Code con memoria automática a través de archivos markdown persistentes y un contexto compartido ampliado entre Microsoft Excel y PowerPoint. La herramienta también introdujo un sistema multi-agente de 'Code Review' para el análisis automatizado de pull requests y la búsqueda de errores.

8. Investigación de Google: los agentes aprenden a cooperar mediante oponentes diversos

Investigadores de Google descubrieron que los agentes de LLM pueden aprender a cooperar en sistemas multi-agente cuando se entrenan contra un grupo diverso de oponentes impredecibles. Este enfoque evita reglas de coordinación codificadas, ofreciendo un modelo más escalable y computacionalmente eficiente para despliegues de agentes empresariales.

9. Financiación en robótica industrial: Mind Robotics y Rhoda AI

Mind Robotics, una escisión de Rivian, recaudó 500 millones de dólares para desarrollar robots de IA industrial, mientras que Rhoda AI obtuvo 450 millones de dólares para modelos entrenados con videos públicos de internet. Ambas startups buscan desplegar sistemas autónomos avanzados en entornos de fabricación y logística para automatizar tareas físicas complejas.

10. ElevenLabs lanza la plataforma multimodal ElevenCreative

ElevenLabs lanzó ElevenCreative, una plataforma basada en navegador para generar y localizar audio y video. El sistema integra clonación de voz, conversión de texto a voz y generación de video por IA con soporte para más de 70 idiomas en una interfaz unificada.

11. Fish Audio S2-Pro logra una latencia de TTS inferior a 150 ms

Fish Audio lanzó S2-Pro, un modelo de audio grande (LAM) capaz de realizar síntesis de voz expresiva con una latencia inferior a 150 ms. El modelo admite clonación de voz zero-shot y etiquetado granular de emociones, lo que representa un cambio hacia arquitecturas de audio integradas.

12. Lanzan un protector de permisos consciente del contexto para Claude Code

La herramienta 'nah' fue lanzada como un protector de permisos consciente del contexto para Claude Code, yendo más allá de los permisos simples de permitir o denegar. Permite a los desarrolladores definir reglas granulares para acciones sensibles como eliminaciones de archivos o git checkouts para evitar que los agentes autónomos causen cambios catastróficos en el sistema.

13. Infraestructura de red de IA: Nexthop AI y Eridu

Nexthop AI recaudó 500 millones de dólares para switches especializados diseñados para reducir el consumo de energía y la latencia en centros de datos a hiperescala. Simultáneamente, Eridu salió del modo sigiloso con 200 millones de dólares para construir equipos de red de IA de alto rendimiento para clústeres de GPU a gran escala.

14. La utilidad LLMfit clasifica los modelos según la compatibilidad de hardware

LLMfit es una nueva utilidad que escanea el hardware local para clasificar los LLMs según su compatibilidad con configuraciones específicas de CPU, RAM y GPU. La herramienta ayuda a los desarrolladores a seleccionar los modelos más eficientes para la ejecución en el dispositivo mediante el análisis de las limitaciones de memoria y cómputo.

15. Dify obtiene 30 millones de dólares para una plataforma de flujo de trabajo de agentes de código abierto

Dify recaudó 30 millones de dólares para su plataforma de código abierto diseñada para construir y operar flujos de trabajo de agentes. La plataforma proporciona un entorno estructurado para desplegar aplicaciones de IA con memoria integrada, gestión de herramientas y controles de seguridad.

16. Expo Agent compila aplicaciones nativas a partir de lenguaje natural

Expo Agent es una nueva herramienta que genera y compila aplicaciones nativas para iOS y Android a partir de prompts en lenguaje natural. Es compatible con React Native, SwiftUI y Jetpack Compose, lo que permite el despliegue y las pruebas de aplicaciones móviles basadas en navegador.

17. NotebookLM-py proporciona una API de Python para la herramienta de investigación

NotebookLM-py proporciona una API de Python y una CLI para NotebookLM de Google, lo que permite el acceso programático a funciones no expuestas en la interfaz web. Esto permite a los investigadores integrar las capacidades de resumen y recuperación de NotebookLM en pipelines de procesamiento de datos automatizados.

18. Anthropic lanza un instituto de investigación para la política de IA

El cofundador de Anthropic, Jack Clark, dirige un nuevo instituto de investigación para estudiar el impacto de la IA en las economías, el derecho y la gobernanza. El instituto tendrá acceso directo a datos de modelos de frontera para informar las discusiones políticas y regulatorias sobre el papel social de la IA.

19. WiFi-DensePose reconstruye la posición corporal mediante señales WiFi

Investigadores desarrollaron WiFi-DensePose, un sistema que utiliza señales WiFi estándar para reconstruir posiciones de cuerpo completo en tiempo real. La tecnología mapea segmentos corporales a través de paredes sin cámaras ni dispositivos portátiles mediante el análisis de la información del estado del canal ya presente en el hardware estándar.

20. La implementación de la API Temporal soluciona el manejo de fechas en JavaScript

Ingenieros de Bloomberg detallaron un esfuerzo de nueve años para implementar la API Temporal en JavaScript para solucionar problemas persistentes con el objeto Date. La nueva API proporciona una forma más robusta y segura de manejar fechas, horas y zonas horarias, mejorando la fiabilidad de los sistemas de software globales.

21. Mozilla describe la hoja de ruta de WebAssembly como lenguaje de primera clase

Mozilla describió sus planes para convertir a WebAssembly en un lenguaje de primera clase en la web, ampliando sus capacidades para lenguajes de alto nivel. Las actualizaciones recientes incluyen soporte para memorias compartidas, SIMD y manejo de excepciones para mejorar el rendimiento de aplicaciones web complejas y de gran carga computacional.

22. Replit alcanza una valoración de 9 mil millones de dólares en el auge de la infraestructura de IA

Replit alcanzó una valoración de 9 mil millones de dólares tras una ronda de financiación de 400 millones de dólares, con el objetivo de alcanzar 1 mil millones de dólares en ARR para finales de año. La empresa continúa expandiendo su entorno de desarrollo impulsado por IA, posicionándose como una plataforma principal para la codificación colaborativa y de agentes.

23. Oracle reporta un crecimiento del 44% en ingresos en la nube impulsado por la IA

Oracle reportó un aumento del 44% en los ingresos en la nube, alcanzando los 8.9 mil millones de dólares, impulsado por la demanda de infraestructura de IA. Los ingresos totales del tercer trimestre de la compañía alcanzaron los 17.19 mil millones de dólares, lo que refleja su creciente papel en el alojamiento de cargas de trabajo de IA a gran escala y la provisión del cómputo necesario para el entrenamiento de modelos de frontera.

24. Zendesk adquiere Forethought para el servicio al cliente basado en agentes

Zendesk adquirió Forethought, una startup de servicio al cliente basado en agentes, para reforzar sus capacidades de soporte impulsadas por IA. La adquisición integra la tecnología de resolución autónoma de Forethought en la plataforma de servicio de Zendesk para automatizar interacciones complejas con los clientes.

25. WordPress lanza el espacio de trabajo privado my.WordPress.net

WordPress lanzó my.WordPress.net, un espacio de trabajo privado basado en navegador que permite a los usuarios crear sitios sin necesidad de alojamiento ni registro. El servicio está diseñado como un entorno personal para escribir, investigar e integrar herramientas de IA directamente dentro del navegador.