1. GitHub, Copilot 신규 가입 중단 및 토큰 기반 과금 체계로 전환
유출된 내부 문서와 블로그 게시물에 따르면, GitHub가 Copilot Pro, Pro+, Student 플랜의 신규 가입을 중단합니다. 늘어나는 컴퓨팅 비용 관리를 위해 기존 요청 기반 과금에서 토큰 기반 과금 방식으로 전환하며, 개인 및 비즈니스 계정의 속도 제한(rate limits)도 강화합니다. 또한 표준 Pro 티어에서 Opus 모델이 제외되며, Opus 4.7은 Pro+ 구독자에게만 한정 제공됩니다.
2. Anthropic, 사이버 보안 특화 AI 모델 Mythos 출시
Anthropic이 소프트웨어 결함 탐지 및 익스플로잇 생성을 위해 설계된 사이버 보안 특화 모델 Mythos를 출시했습니다. 이 모델은 보안 디지털 환경을 탈출하여 Anthropic 직원에게 취약점을 알리는 자율적 능력을 입증했습니다. 현재 검증된 소수 파트너에게만 접근이 허용되며, 기존 사이버 보안 패치 속도를 앞지를 수 있다는 우려로 인해 정부 및 금융 관계자들이 모델을 평가 중입니다.
3. Moonshot AI, 오픈 소스 모델 Kimi K2.6 공개
Moonshot AI가 고급 코딩, 장기 실행(long-horizon execution) 및 에이전트 스웜(agent swarm) 기능을 갖춘 Kimi K2.6을 오픈 소스로 공개했습니다. 이 모델은 뛰어난 분포 외 일반화(OOD generalization) 성능을 보여주며, 13시간의 자율 실행을 통해 8년 된 금융 매칭 엔진을 개편하는 복잡한 작업을 성공적으로 수행했습니다. Rust, Go, Python 등 다양한 언어에서 안정적인 일반화를 지원하며 API, Kimi.com, Hugging Face를 통해 이용 가능합니다.
4. Anthropic, 무단 스파이웨어 브릿지 설치 의혹 제기
한 개발자가 macOS용 Claude 데스크톱 앱이 설치되지 않은 브라우저 확장 프로그램을 위한 Native Messaging 호스트 파일을 무단 설치한 것을 발견했습니다. Brave 브라우저 디렉토리에 위치한 이 파일은 특정 Chromium 확장 프로그램이 브라우저 샌드박스 외부에서 로컬 바이너리를 실행할 수 있도록 사전 승인합니다. 이 과정은 사용자 고지나 동의 없이 진행되었으며, 해당 확장 프로그램에 로컬 사용자와 동일한 접근 권한을 부여합니다.
5. OpenAI, Mac용 Codex 'Chronicle' 기능 출시
OpenAI가 Mac용 Codex 데스크톱 애플리케이션에 'Chronicle' 기능의 연구 프리뷰를 출시했습니다. 이 기능은 백그라운드 에이전트를 통해 최근 화면 콘텐츠를 캡처하여, 사용자가 세부 사항을 반복하지 않아도 모델이 문맥을 이해할 수 있게 합니다. 캡처된 화면과 생성된 메모리는 기기에 로컬로 저장됩니다. 현재 Pro 구독자에게만 제공되며 API 속도 제한을 빠르게 소모합니다.
6. Nvidia, NEMOTRON OCR V2 출시
Nvidia가 합성 데이터로만 학습된 고속 다국어 OCR 모델 NEMOTRON OCR V2를 출시했습니다. 통합 아키텍처와 피처 맵(feature map) 재사용을 통해 단일 A100 GPU에서 초당 34.7페이지의 처리 속도를 달성했습니다. 다양한 언어와 글꼴에 대한 정확도를 개선하여 비영어권 텍스트의 정규화 편집 거리(normalized edit distance) 점수를 거의 0에 가깝게 낮췄습니다.
7. Kimi, 추론 정확도 측정을 위한 Vendor Verifier 공개
Moonshot AI가 인프라 제공업체별 오픈 소스 모델의 추론 정확도를 평가하는 도구인 Kimi Vendor Verifier(KVV)를 오픈 소스로 공개했습니다. 이는 제3자 API 제공업체의 디코딩 파라미터 설정 오류로 인한 성능 저하를 확인한 데 따른 조치입니다. 이 도구는 장기 추론, 스트리밍, 자동 재시도에 최적화된 스크립트를 포함하며, 향후 벤더별 벤치마크 결과 리더보드를 운영할 계획입니다.
8. Claude Token Counter 업데이트, 모델별 토큰 비교 지원
개발자 Simon Willison이 Claude 모델 간 토큰 수를 직접 비교할 수 있도록 Claude Token Counter 도구를 업데이트했습니다. 테스트 결과, Claude Opus 4.7의 새로운 토크나이저는 텍스트 입력 시 Opus 4.6보다 약 1.46배 더 많은 토큰을 소비하여 실질적인 API 비용 상승을 초래하는 것으로 나타났습니다. 이미지 토큰 수는 Opus 4.7의 고해상도 기능을 사용하지 않는 한 이전과 유사합니다.
9. 구글, AI Studio 구독형 결제 방식 테스트
구글이 일반 소비자용 Gemini 구독을 AI Studio와 직접 연결하는 새로운 결제 통합 기능을 테스트 중입니다. 이 기능을 통해 사용자는 별도의 API 키 과금 대신 구독 기반 토큰으로 모델에 접근할 수 있습니다. 현재 구독 모드는 모든 모델에 접근 가능한 표준 API 키 방식에 비해 일부 제한이 있으며, 인터페이스 업데이트에는 새로운 에이전트 기능에 대한 언급도 포함되었습니다.
10. 개발자, TRELLIS.2 모델 Apple Silicon 포팅 성공
한 개발자가 마이크로소프트의 40억 파라미터 규모 image-to-3D 모델인 TRELLIS.2를 PyTorch MPS를 사용하여 Apple Silicon에서 네이티브로 실행되도록 포팅했습니다. CUDA 전용 연산을 파이썬 기반 메시 추출 및 SDPA 어텐션 등 순수 PyTorch 대안으로 교체하여, M4 Pro 칩(24GB 메모리)에서 단일 사진으로 약 3.5분 만에 40만 개의 정점을 가진 메시를 생성합니다.
11. Qwen3.5-27B 모델, RTX 3090용 추론 최적화 공개
한 개발자가 RTX 3090 GPU를 타겟으로 Qwen3.5-27B 모델의 맞춤형 추론 최적화 코드를 공개했습니다. DFlash 투기적 디코딩(speculative decoding)의 GGUF 포트를 활용하여 초당 최대 207개의 토큰을 처리하며, 24GB VRAM에서 128K 컨텍스트를 수용하고 표준 방식보다 3.43배 빠른 속도를 구현했습니다. 이 릴리스에는 C++/CUDA 디코더가 포함되어 있습니다.