GitHub Copilot actualiza su política de datos de entrenamiento

1. GitHub Copilot actualiza su política de datos de entrenamiento

GitHub anunció que, a partir del 24 de abril, utilizará datos de interacción de los usuarios para entrenar sus modelos de IA. Estos datos incluyen entradas, salidas, fragmentos de código y el contexto asociado de los usuarios de Copilot Free, Pro y Pro+. Los desarrolladores deben optar por no participar activamente si no desean que su código se utilice para el entrenamiento de modelos.

2. Anthropic lanza Claude 4.6

Anthropic ha lanzado Claude 4.6, que cuenta con una ventana de contexto de 1 millón de tokens y cuatro modos distintos: Chat, Cowork, Code y Projects. La actualización incluye una suite Cowork para automatizar flujos de trabajo mediante tareas programadas y conectores. El entorno de código ahora utiliza la jerarquía CLAUDE.md, protocolos MCP y equipos de agentes para el desarrollo autónomo.

3. Google presenta el algoritmo de compresión de memoria TurboQuant

Google Research ha lanzado TurboQuant, un nuevo conjunto de algoritmos de cuantización para modelos de lenguaje grandes y búsqueda vectorial. La técnica reduce la memoria caché de clave-valor de los LLM en 6 veces y ofrece una aceleración de hasta 8 veces. Google informa que estas ganancias masivas de compresión se logran sin pérdida de precisión.

4. Lanzamiento de la biblioteca Ray Data LLM para inferencia por lotes

Se ha lanzado una nueva biblioteca llamada Ray Data LLM para la inferencia por lotes a gran escala. Está diseñada para cargas de trabajo que priorizan el rendimiento sobre la latencia por solicitud. La biblioteca proporciona ejecución escalable, tolerancia a fallos y, según se informa, permite el doble de rendimiento que el motor síncrono de vLLM a escala de producción.

5. Anthropic detalla la arquitectura multiagente para el desarrollo de aplicaciones

Anthropic ha compartido una arquitectura multiagente diseñada para mejorar el diseño de frontend impulsado por IA y la codificación de aplicaciones full-stack. Inspirado en las redes generativas antagónicas (GAN), el enfoque utiliza agentes planificadores, generadores y evaluadores distintos. Esta descomposición ayuda a abordar problemas de coherencia y autoevaluación en tareas de desarrollo de larga duración.

6. Ossature, un arnés de código abierto para la generación de código basada en especificaciones

Ossature es un nuevo arnés de código abierto para la generación de código basada en especificaciones. Los desarrolladores escriben especificaciones de software, que Ossature valida y audita en busca de ambigüedades utilizando un LLM. Luego, produce un plan editable y genera código tarea por tarea, proporcionando a cada una solo el contexto necesario.

7. Ataques a la ventana de contexto "Disregard That"

Investigadores de seguridad han destacado los riesgos de los ataques "Disregard That" en ventanas de contexto compartidas. La vulnerabilidad ocurre cuando un atacante inyecta un comando en la ventana de contexto instruyendo a la IA para que ignore las instrucciones anteriores. Esto resalta el peligro de compartir ventanas de contexto con usuarios no confiables o entradas externas.

8. La técnica xMemory reduce los costos de tokens en agentes de IA

Investigadores del King's College de Londres y el Instituto Alan Turing han desarrollado xMemory, una nueva técnica para gestionar el contexto en agentes de IA a largo plazo. Las tuberías RAG estándar a menudo fallan durante implementaciones de múltiples sesiones debido a la hinchazón del contexto. xMemory resuelve esto organizando la información de manera más eficiente, reduciendo los costos de tokens y manteniendo el rendimiento durante interacciones prolongadas.

9. NVIDIA presenta el marco PivotRL

NVIDIA AI ha presentado PivotRL, un nuevo marco para el post-entrenamiento de LLM en tareas de agentes de largo horizonte, como la ingeniería de software y la navegación web. El marco aborda el equilibrio entre la eficiencia computacional y la generalización del modelo. Logra una alta precisión de agente mientras requiere 4 veces menos turnos de despliegue.

10. Hugging Face lanza la CLI HF Papers

Hugging Face ha introducido la interfaz de línea de comandos `hf papers`. La herramienta permite a los agentes de IA realizar búsquedas semánticas y recuperación de archivos markdown de arXiv. Está diseñada para servir como infraestructura para flujos de trabajo de investigación automatizados.

11. Extensión comunitaria de DuckDB para HNSW prefiltrado

Una nueva extensión comunitaria para DuckDB implementa la búsqueda vectorial Hierarchical Navigable Small World (HNSW) prefiltrada utilizando ACORN-1. La extensión modifica la extensión VSS de DuckDB y el uso de usearch para proporcionar una experiencia similar a pgvector. Permite a los desarrolladores realizar búsquedas híbridas eficientes con vecinos más cercanos aproximados prefiltrados reales.

12. Oracle converge la pila de datos de IA para agentes empresariales

Oracle ha actualizado sus ofertas de bases de datos para abordar los problemas de sincronización de datos en implementaciones de IA de agentes. La pila convergente tiene como objetivo proporcionar a los agentes empresariales una única versión de la verdad en almacenes vectoriales, bases de datos relacionales, almacenes de grafos y lakehouses. Esto elimina la necesidad de tuberías de sincronización complejas que a menudo causan que el contexto quede obsoleto bajo cargas de producción.

13. Reddit implementa verificación humana para bots sospechosos

Reddit está introduciendo nuevas políticas para frenar el spam impulsado por bots y la manipulación de la plataforma. La compañía ahora requerirá que las cuentas sospechosas de ser automatizadas verifiquen que son humanas. Además, Reddit etiquetará explícitamente las cuentas automatizadas que brindan servicios a los usuarios.

14. Google establece el plazo de 2029 para la criptografía poscuántica

Google ha acortado su plazo de preparación para la migración a la criptografía poscuántica hasta 2029. La compañía tiene como objetivo asegurar sus sistemas contra la posible llegada de computadoras cuánticas capaces de romper el cifrado actual. Google señaló que las fronteras de la computación cuántica pueden estar más cerca de lo previsto.

15. La Fundación ARC Prize presenta el benchmark ARC-AGI-3

La Fundación ARC Prize ha lanzado ARC-AGI-3, un nuevo benchmark de IA diseñado para medir el razonamiento sobre la marcha en lugar de la recuperación de memoria. El benchmark utiliza escenarios simples similares a los videojuegos para probar las capacidades del modelo. Su objetivo es evaluar mejor los verdaderos límites de razonamiento de los modelos de frontera.

16. Google lanza el modelo de generación de música Lyria 3 Pro

Google ha lanzado Lyria 3 Pro, un modelo de generación de música por IA mejorado. La nueva versión extiende la duración máxima de la pista de 30 segundos a tres minutos. También ofrece a los usuarios un mayor control creativo sobre el audio generado.

17. Lanzamiento del marco EVA para la evaluación de agentes de voz

Se ha lanzado un nuevo marco llamado EVA para evaluar agentes de voz. EVA evalúa conversaciones habladas completas de varios turnos. Utiliza una arquitectura realista de bot a bot para probar y medir el rendimiento del agente de voz.

18. Bland.ai lanza Norm para agentes de voz

Bland.ai ha introducido Norm, una nueva herramienta diseñada para simplificar la creación de agentes telefónicos robustos. Norm permite a los desarrolladores crear agentes de voz simplemente describiendo la funcionalidad deseada, automatizando las complejidades subyacentes de la IA de voz.

19. Databricks lanza la plataforma de seguridad Lakewatch

Databricks ha introducido Lakewatch, una plataforma de gestión de eventos e información de seguridad (SIEM) impulsada por IA. El sistema utiliza agentes de IA para la detección de amenazas. El lanzamiento sigue a las adquisiciones de Antimatter y SiftD.ai por parte de Databricks para respaldar el despliegue seguro de agentes.

20. RLVR mejora el rendimiento de razonamiento de los LLM

Una nueva investigación demuestra que las actualizaciones direccionales en el aprendizaje por refuerzo con recompensas verificables (RLVR) mejoran el rendimiento del razonamiento en los LLM. La técnica identifica mejor los tokens críticos para el razonamiento durante el procesamiento. Esto permite tanto la extrapolación en tiempo de prueba como la reponderación en tiempo de entrenamiento para aumentar la precisión general.

21. La investigación destaca la calibración semántica en los LLM

Una nueva investigación indica que la calibración semántica surge como un subproducto natural de la predicción del siguiente token en modelos de lenguaje grandes. El estudio encontró que los modelos base están notablemente bien calibrados cuando se utiliza una noción de calibración semántica basada en muestreo. Esto permite a los modelos evaluar significativamente su propia confianza en tareas de respuesta a preguntas de dominio abierto sin entrenamiento explícito.

22. Actualización de la tabla de clasificación de texto a voz

La última tabla de clasificación de texto a voz muestra a Inworld, ElevenLabs y MiniMax como los modelos más preferidos. Los puntos de control recientes de estos laboratorios han impulsado la frontera de la calidad de TTS, con cuatro de los cinco mejores modelos lanzados este año. Los modelos líderes demuestran una generación de audio cada vez más realista.