Google lanza Gemma 4 bajo la licencia Apache 2.0

1. Google lanza Gemma 4 bajo la licencia Apache 2.0

Google ha lanzado la familia de modelos multimodales de pesos abiertos Gemma 4, que incluye variantes de 2B, 4B, 31B y una variante MoE de 26B. Los modelos admiten entradas de texto, imagen, audio y video, y cuentan con ventanas de contexto de hasta 256k tokens. Cabe destacar que, para los desarrolladores empresariales, Google ha eliminado sus restricciones de uso personalizadas y ha lanzado toda la familia bajo la licencia estándar Apache 2.0. Los modelos de 31B y 26B pueden ejecutarse en una sola H100 y muestran un rendimiento de razonamiento altamente competitivo frente a pares como Qwen3.5.

2. Cursor 3 introduce un espacio de trabajo multi-agente y transferencia de la nube al entorno local

Cursor ha lanzado la versión 3, reconstruyendo completamente su interfaz para centrarse en el desarrollo de software multi-agente. La actualización introduce un espacio de trabajo unificado que permite a los desarrolladores ejecutar múltiples agentes locales y en la nube en paralelo a través de diferentes repositorios. Una nueva función de transferencia permite transiciones fluidas de sesiones de agentes entre entornos en la nube y escritorios locales para pruebas e iteración. El lanzamiento también añade un navegador integrado para realizar prompts contra sitios web locales y un mercado para plugins MCP.

3. Arcee AI lanza el modelo de razonamiento Trinity Large Thinking

Arcee AI ha lanzado Trinity Large Thinking, un modelo de razonamiento de pesos abiertos diseñado para agentes complejos de largo alcance y llamadas a herramientas de múltiples turnos. El modelo se centra en mantener la coherencia entre turnos y cumplir con restricciones estrictas durante el uso de herramientas sin degradar la calidad de la salida. Está disponible a través de la API de Arcee y como pesos descargables en Hugging Face bajo la licencia Apache 2.0.

4. Una investigación destaca vulnerabilidades de inyección de prompts en flujos de trabajo de LLM-as-a-Judge

Un nuevo informe demuestra que los solicitantes pueden utilizar con éxito inyecciones de prompts en documentos como CVs y artículos para manipular LLMs que actúan como jueces automatizados. Las pruebas revelaron que, si bien los modelos más antiguos y pequeños son altamente susceptibles a estos ataques, la mayoría de los modelos de frontera actuales los resisten con éxito. Sin embargo, Gemini 3 fue identificado como el único modelo de clase frontera vulnerable a este tipo específico de inyección. Los desarrolladores que dependen de LLMs para la evaluación automatizada deben verificar la resistencia de su modelo a ataques de prompts incrustados.

5. IBM lanza Granite 4.0 3B Vision para la extracción de documentos

IBM ha lanzado Granite 4.0 3B Vision, un modelo de lenguaje visual diseñado específicamente para la extracción de datos de documentos empresariales. En lugar de utilizar una arquitectura multimodal monolítica, el modelo funciona como un adaptador especializado conectado a la base de lenguaje Granite 4.0 Micro. Este diseño apunta al razonamiento visual de alta fidelidad para tareas de extracción de datos estructurados.

6. Fujitsu libera el código abierto de la biblioteca One Compression para la cuantización de LLMs

Fujitsu ha lanzado One Compression (OneComp), una biblioteca de Python de código abierto para la cuantización post-entrenamiento de grandes modelos de lenguaje. La biblioteca implementa algoritmos de cuantización actuales, incluidos GPTQ y DBF. Ha sido verificada oficialmente para funcionar con modelos como TinyLlama, Llama-2, Llama-3 y la familia Qwen3 de hasta 32B de parámetros.