Audesso | Daily: AI

Google lanza el modelo de imagen Nano Banana 2

00:00 / --:--

No hay audio disponible para este resumen.

← Volver al inicio

Google lanza el modelo de imagen Nano Banana 2

1. Google lanza el modelo de imagen Nano Banana 2

Google lanzó Nano Banana 2 (Gemini 3.1 Flash Image), un modelo de imagen mejorado que es significativamente más rápido y económico que su predecesor. Admite resolución 4K, renderizado de texto mejorado y generación consistente de personajes para hasta cinco sujetos, alcanzando el primer puesto en los principales rankings de texto a imagen.

2. Anthropic rechaza la demanda del Pentágono de acceso sin restricciones a sus modelos

El CEO de Anthropic, Dario Amodei, rechazó la solicitud del Pentágono de acceso sin restricciones a Claude, citando preocupaciones sobre la vigilancia masiva nacional y las armas autónomas letales. Aunque rivales como OpenAI y xAI habrían aceptado términos similares, Anthropic sostiene que estos casos de uso socavan los valores democráticos.

3. Actualizaciones de Claude Code: memoria automática y revisiones de planificación

Anthropic introdujo la memoria automática para Claude Code, permitiendo al agente mantener el contexto y las preferencias del proyecto entre sesiones mediante archivos MEMORY.md y CLAUDE.md. Además, nuevos comandos impulsados por la comunidad como /plan-exit-review permiten a los desarrolladores obligar al agente a criticar sus planes de implementación antes de escribir código.

4. La API Realtime de OpenAI alcanza disponibilidad general

OpenAI anunció la disponibilidad general de su API Realtime y el modelo gpt-realtime, que ofrece capacidades mejoradas de voz a voz. La actualización incluye un mejor seguimiento de instrucciones, menor latencia y una nueva guía de prompts diseñada específicamente para sistemas basados en voz.

5. Los agentes de Cursor obtienen control de máquinas virtuales y escritorio

Cursor actualizó sus agentes basados en la nube con máquinas virtuales dedicadas y control de escritorio, permitiéndoles construir, probar y validar código de forma autónoma. Esta capacidad permite a los agentes verificar su propio trabajo dentro de un entorno aislado antes de enviar solicitudes de extracción (pull requests).

6. OpenAI contrata a Ruoming Pang, exlíder de infraestructura en Meta y Apple

OpenAI contrató a Ruoming Pang, exlíder de infraestructura de IA en Meta y Apple, para unirse a su equipo de investigación. Pang dirigió anteriormente el grupo de modelos de Apple y fue una figura clave en el desarrollo de Apple Intelligence y los Superintelligence Labs de Meta.

7. Nous Research lanza Hermes Agent como código abierto

Nous Research lanzó como código abierto Hermes Agent, un agente de IA personal diseñado para vivir en plataformas de mensajería como Telegram, Slack y Discord. El agente cuenta con más de 40 herramientas integradas y está diseñado para aprender y desarrollar habilidades reutilizables con el tiempo.

8. Google AI Edge Gallery se expande a iOS con FunctionGemma

Google expandió su AI Edge Gallery a iOS, presentando el modelo FunctionGemma, que realiza llamadas a funciones en el dispositivo con solo 270 millones de parámetros. La aplicación incluye herramientas de evaluación comparativa para medir el rendimiento de LiteRT en CPUs y GPUs móviles.

9. Cofundador de xAI abandona la empresa mientras avanza la fusión con SpaceX

El cofundador de xAI, Toby Pohlen, ha dejado la compañía, convirtiéndose en el séptimo cofundador en marcharse desde su creación. El movimiento sigue a la reciente fusión de xAI con SpaceX, que supuestamente se prepara para una importante oferta pública inicial.

10. Perplexity suministra APIs a un importante fabricante de dispositivos Android

Perplexity ahora proporciona sus APIs de investigación y recuperación a un importante fabricante de dispositivos Android para potenciar funciones de IA en el dispositivo. Esta asociación tiene como objetivo integrar capacidades de búsqueda profunda y resumen directamente en el ecosistema de telefonía móvil.

11. QuiverAI lanza el modelo de generación SVG Arrow 1.0

QuiverAI salió del modo oculto para lanzar Arrow 1.0, un modelo especializado en la generación de archivos SVG. El modelo ocupa actualmente el primer lugar en el ranking de SVG de Design Arena y ya está disponible en versión beta pública.

12. El plan gratuito de Claude obtiene más de 150 conectores de terceros

Anthropic añadió más de 150 conectores de terceros al plan gratuito de Claude, incluyendo integraciones para Slack, Figma y Asana. Esta actualización permite a los usuarios incorporar datos externos directamente en sus flujos de trabajo de chat sin necesidad de una suscripción de pago.

13. Se proyecta que el gasto de capital en IA de los hiperescaladores alcance los 770 mil millones de dólares en 2026

Un informe de Epoch AI indica que el gasto de capital de los hiperescaladores se ha cuadruplicado desde el lanzamiento de GPT-4, con una inversión total en IA cercana a los 500 mil millones de dólares en 2025. Se proyecta que Alphabet, Amazon, Meta, Microsoft y Oracle gasten un total combinado de 770 mil millones de dólares en infraestructura en 2026.

14. Scrapling, un framework para web scraping escalable

Scrapling es un nuevo framework de web scraping basado en Python diseñado para manejar rastreos a gran escala y adaptarse automáticamente a los cambios en los sitios web. Incluye funciones para eludir sistemas anti-bot comunes y gestionar lógica de solicitudes compleja con un código mínimo.

15. Nuevos frameworks para patrones de ingeniería de agentes

Simon Willison y otros líderes de la industria abogan por nuevos patrones de ingeniería de agentes, como el uso de 'módulos profundos' para ocultar lógica compleja detrás de interfaces simples. Estos patrones tienen como objetivo hacer que las bases de código sean más navegables para los agentes de IA a medida que el costo de escribir código tiende a cero.

La señal diaria de IA en tu correo

5 minutos al día. Gratis, cancela cuando quieras.