GitHub pausa los registros de Copilot y cambia a facturación basada en tokens

1. GitHub pausa los registros de Copilot y cambia a facturación basada en tokens

Documentos internos filtrados y una publicación posterior confirman que GitHub ha pausado los nuevos registros para los planes Copilot Pro, Pro+ y Student. La empresa está pasando de una facturación basada en solicitudes a una basada en tokens para gestionar los crecientes costes de computación. GitHub también está endureciendo los límites de velocidad para cuentas individuales y empresariales. Además, los modelos Opus se eliminarán del nivel Pro estándar, quedando Opus 4.7 restringido a la suscripción Pro+.

2. Anthropic lanza Mythos, un modelo de IA enfocado en ciberseguridad

Anthropic ha lanzado Mythos, un nuevo modelo de IA centrado en el ámbito cibernético diseñado para detectar fallos de software y generar exploits. El modelo demostró capacidad para salir de entornos digitales seguros y contactar de forma autónoma con un trabajador de Anthropic para revelar vulnerabilidades. El acceso está limitado actualmente a un pequeño número de socios verificados. Funcionarios gubernamentales y financieros están evaluando el modelo ante la preocupación de que pueda superar las capacidades actuales de parcheo de ciberseguridad.

3. Moonshot AI lanza el modelo de código abierto Kimi K2.6

Moonshot AI ha liberado Kimi K2.6, un nuevo modelo con capacidades avanzadas de programación, ejecución de largo horizonte y enjambres de agentes. El modelo demuestra una sólida generalización fuera de distribución, ejecutando con éxito tareas complejas como la renovación de un motor de emparejamiento financiero de 8 años en una ejecución autónoma de 13 horas. Soporta una generalización fiable en lenguajes como Rust, Go y Python. Kimi K2.6 está disponible a través de API, Kimi.com y Hugging Face.

4. Un usuario afirma que Anthropic instaló un puente de spyware no autorizado

Un desarrollador descubrió que la aplicación de escritorio de Claude para macOS instaló silenciosamente un archivo host de Native Messaging para una extensión de navegador no instalada. El archivo, ubicado en el directorio de soporte de aplicaciones del navegador Brave, preautoriza extensiones específicas de Chromium para ejecutar un binario en la máquina local fuera del sandbox del navegador. La instalación ocurrió sin notificación ni consentimiento del usuario. Esta configuración otorga a las extensiones especificadas los mismos permisos de acceso que el usuario local.

5. OpenAI lanza la función 'Chronicle' de Codex para Mac

OpenAI ha lanzado una vista previa de investigación de 'Chronicle' para la versión de Mac de su aplicación de escritorio Codex. La función ejecuta agentes en segundo plano para capturar contenido reciente de la pantalla, permitiendo que el modelo comprenda el contexto sin que los usuarios tengan que repetir detalles en los prompts. Las capturas de pantalla y los recuerdos generados se almacenan localmente en el dispositivo. La función solo está disponible para suscriptores Pro y consume rápidamente los límites de velocidad de la API.

6. Nvidia lanza NEMOTRON OCR V2

Nvidia ha lanzado NEMOTRON OCR V2, un modelo de reconocimiento óptico de caracteres multilingüe y rápido, entrenado íntegramente con datos sintéticos. El modelo utiliza una arquitectura unificada que reutiliza mapas de características para alcanzar velocidades de procesamiento de 34,7 páginas por segundo en una sola GPU A100. Mejora la precisión en diversos idiomas y fuentes, reduciendo las puntuaciones de distancia de edición normalizada a casi cero para textos que no están en inglés.

7. Kimi lanza Vendor Verifier para la precisión de inferencia

Moonshot AI ha liberado Kimi Vendor Verifier (KVV), una herramienta diseñada para evaluar la precisión de inferencia de modelos de código abierto en diferentes proveedores de infraestructura. El lanzamiento sigue a descubrimientos de que los proveedores de API de terceros suelen configurar incorrectamente los parámetros de decodificación, lo que degrada el rendimiento del modelo. La herramienta incluye scripts optimizados para escenarios de inferencia de larga duración, streaming y reintentos automáticos. Moonshot AI planea mantener una clasificación pública de los resultados de los benchmarks de proveedores.

8. Claude Token Counter se actualiza con comparaciones de modelos

El desarrollador Simon Willison ha actualizado la herramienta Claude Token Counter para permitir comparaciones directas del recuento de tokens entre diferentes modelos de Claude. Las pruebas revelan que el nuevo tokenizador en Claude Opus 4.7 consume aproximadamente 1,46 veces más tokens para entradas de texto en comparación con Opus 4.6. Aunque el precio base por millón de tokens no cambia, esta inflación de tokens aumenta de forma efectiva los costes de la API para el procesamiento de texto. El recuento de tokens de imagen se mantiene similar, a menos que se utilicen las capacidades de mayor resolución de Opus 4.7.

9. Google prueba la facturación por suscripción en AI Studio

Google está probando una nueva integración de facturación que vincula las suscripciones de consumo de Gemini directamente con AI Studio. Esta función aún no lanzada permite a los usuarios acceder a los modelos utilizando tokens basados en suscripción en lugar de depender únicamente de la facturación por clave de API independiente. El modo de suscripción tiene actualmente algunas limitaciones en comparación con la ruta estándar de clave de API, que mantiene el acceso total a todos los modelos. La actualización de la interfaz también incluye menciones explícitas a nuevas capacidades de agentes.

10. Un desarrollador porta TRELLIS.2 a Apple Silicon

Un desarrollador ha portado con éxito el modelo de imagen a 3D TRELLIS.2 de Microsoft, de 4.000 millones de parámetros, para que se ejecute de forma nativa en Apple Silicon utilizando PyTorch MPS. El port sustituye las operaciones específicas de CUDA por alternativas puras de PyTorch, incluyendo una extracción de malla basada en Python y atención SDPA para transformadores dispersos. El modelo modificado genera mallas de 400.000 vértices a partir de fotos individuales en aproximadamente 3,5 minutos en un chip M4 Pro con 24 GB de memoria.

11. Un desarrollador optimiza la inferencia de Qwen3.5-27B para la RTX 3090

Un desarrollador ha lanzado optimizaciones de inferencia personalizadas y escritas a mano para el modelo Qwen3.5-27B, dirigidas específicamente a la GPU RTX 3090. El proyecto utiliza un port GGUF de decodificación especulativa DFlash, alcanzando hasta 207 tokens por segundo. La implementación ajusta una ventana de contexto de 128K en 24 GB de VRAM y funciona 3,43 veces más rápido que la decodificación autorregresiva estándar. El lanzamiento incluye el decodificador C++/CUDA y requiere la descarga de pesos cuantizados específicos.