OpenTelemetry Profiles entra en fase alfa pública

1. OpenTelemetry Profiles entra en fase alfa pública

El SIG de perfilado de OpenTelemetry ha lanzado oficialmente Profiles en fase alfa pública. Esto establece un estándar industrial unificado para el perfilado continuo en producción, situándolo junto a los estándares existentes para trazas, métricas y registros.

2. Google lanza la vista previa en vivo de Gemini 3.1 Flash

Google ha presentado la vista previa en vivo de Gemini 3.1 Flash, que ahora cuenta con niveles de razonamiento configurables. Cuando se ajusta al nivel alto, el modelo obtiene un 95,9% en el benchmark Big Bench Audio Speech to Speech, convirtiéndose en el segundo modelo de razonamiento de voz con mayor puntuación.

3. Mistral publica el código abierto de su modelo de texto a voz

Mistral AI ha lanzado un nuevo modelo de texto a voz de código abierto, ofreciendo los pesos de forma gratuita. La empresa afirma que el nuevo modelo de generación de voz supera a ElevenLabs en capacidades de síntesis de voz.

4. Cohere lanza el modelo ASR Transcribe

Cohere ha lanzado Cohere Transcribe, un modelo de reconocimiento automático de voz (ASR) de última generación diseñado para la inteligencia de voz empresarial. El modelo de voz de código abierto tiene como objetivo simplificar la extracción de texto procesable a partir de audio no estructurado.

5. Intercom presenta el modelo Fin Apex 1.0 diseñado específicamente

La plataforma de atención al cliente Intercom ha anunciado Fin Apex 1.0, un modelo de IA pequeño y diseñado específicamente, entrenado internamente. La empresa afirma que el modelo supera a modelos de frontera como GPT-5.4 y Claude Sonnet 4.6 específicamente en métricas de resolución de atención al cliente.

6. Cursor detalla el aprendizaje por refuerzo en tiempo real para Composer

Cursor ha compartido información sobre cómo mejora su función Composer utilizando aprendizaje por refuerzo en tiempo real. El equipo está extrayendo señales de entrenamiento de billones de tokens de volumen de inferencia generados por los usuarios en el mundo real.

7. La reescritura de JSONata mediante IA ahorra 500.000 dólares anuales

Un equipo de ingeniería utilizó con éxito la IA para reescribir la superficie de la API de JSONata en un solo día. Según se informa, la reimplementación ahorró a la empresa 500.000 dólares al año en costes operativos.

8. Turbolite: VFS de SQLite para consultas a S3 en menos de un segundo

Un desarrollador ha lanzado Turbolite, un sistema de archivos virtual (VFS) de SQLite experimental escrito en Rust. La herramienta está diseñada para realizar consultas JOIN en frío directamente desde el almacenamiento de objetos S3 con un rendimiento inferior a 250 ms.

9. Stripe presenta la CLI de Projects

Stripe ha lanzado Stripe Projects, una nueva herramienta de interfaz de línea de comandos. La CLI permite a los desarrolladores aprovisionar y gestionar los servicios de Stripe directamente desde su terminal.

10. Chroma publica herramientas de búsqueda agentica de código abierto

Chroma ha publicado su primer lanzamiento de código abierto en Hugging Face. La publicación incluye un informe técnico y detalles exhaustivos sobre el entrenamiento de un agente de búsqueda agentica.

11. Lanzamiento del conjunto de datos VideoCUA para agentes de uso informático

Investigadores han publicado en código abierto VideoCUA, un conjunto de datos de vídeo a gran escala diseñado para avanzar en los agentes de uso informático a nivel humano. Alojado en Hugging Face, el conjunto de datos contiene 55 horas de metraje, 6 millones de fotogramas y 10.000 tareas demostradas por humanos en 87 aplicaciones de escritorio.

12. El marco ATLAS lleva a un modelo de 14B a superar a Claude Sonnet en programación

El marco de aprendizaje adaptativo en tiempo de prueba y especialización autónoma (A.T.L.A.S) ha logrado una tasa de pass@1 del 74,6% en LiveCodeBench utilizando un modelo congelado de 14B en una sola GPU de consumo. El sistema utiliza generación basada en restricciones y refinamiento iterativo autoverificado para superar a modelos más grandes como Claude Sonnet.

13. Tencent publica el código abierto del modelo Covo-Audio de 7B

Tencent AI Lab ha lanzado Covo-Audio, un modelo de lenguaje de audio grande de extremo a extremo con 7.000 millones de parámetros. La arquitectura unifica el procesamiento de voz y la inteligencia lingüística, permitiéndole procesar directamente entradas de audio continuas y generar salidas de audio para conversaciones en tiempo real.

14. Modelo Voxtral-4B-TTS lanzado en Hugging Face

Se ha lanzado un nuevo modelo de texto a voz, Voxtral-4B-TTS, con una demostración disponible en Hugging Face. El modelo de 4.000 millones de parámetros tiene como objetivo competir directamente con las APIs de generación de voz de código cerrado.

15. Las empresas tecnológicas se inclinan hacia modelos abiertos internos

Empresas como Pinterest, Airbnb, Notion, Cursor e Intercom están entrenando y desplegando cada vez más modelos abiertos internamente. Los líderes de ingeniería informan que, para muchas tareas, el autoalojamiento y el ajuste fino de modelos abiertos están resultando mejores, más baratos y más rápidos que depender de APIs propietarias.

16. Lanzamiento de Swift 6.3

Apple ha lanzado Swift 6.3, continuando la expansión del lenguaje a través de la pila de software. La actualización mantiene el enfoque de Swift en sólidas garantías de seguridad y control de rendimiento para todo, desde firmware integrado hasta servicios a escala de internet.