1. Mistral, Medium 3.5 및 Vibe 원격 에이전트 출시
Mistral이 256k 컨텍스트 윈도우를 갖춘 128B 밀집 모델인 Medium 3.5와 Vibe의 새로운 원격 코딩 에이전트를 출시했습니다. 이 모델은 지시 이행, 추론, 코딩 능력을 단일 가중치 세트로 통합했으며 수정된 MIT 라이선스로 제공됩니다. 개발자는 최소 4개의 GPU로 모델을 셀프 호스팅하거나 100만 입력 토큰당 1.50달러의 API로 이용할 수 있습니다. 함께 업데이트된 Vibe를 통해 CLI나 Le Chat에서 직접 클라우드 비동기 코딩 세션을 실행할 수 있습니다.
2. Meta, 폐쇄형 소스 모델 Muse Spark 공개
Meta가 새로운 폐쇄형 소스 인공지능 모델인 Muse Spark를 발표했습니다. 이번 출시는 기존의 오픈 소스 중심 접근 방식에서 개발자 대상 유료 API 모델로 전환하는 Meta의 전략적 변화를 보여줍니다. 이로써 Meta는 OpenAI, Anthropic, Google과 같은 독점 API 제공업체들과 직접적인 경쟁 구도에 들어서게 되었습니다.
3. Claude Opus 4.7 토크나이저 업데이트로 실질 API 비용 상승
Anthropic이 Claude Opus 4.7의 토크나이저를 업데이트함에 따라 개발자가 부담하는 실질 비용이 증가했습니다. 공식 요금은 100만 입력 토큰당 5달러로 유지되지만, 새 토크나이저는 동일한 텍스트를 최대 1.35배 더 많은 토큰으로 변환합니다. 분석에 따르면 2,000토큰을 초과하는 프롬프트의 실제 비용은 12%에서 27%까지 상승했으며, 2,000토큰 미만의 짧은 프롬프트는 답변의 간결함 덕분에 비용 효율이 개선되었습니다.
4. Ramp Sheets AI의 프롬프트 인젝션 취약점 패치
Ramp의 Sheets AI에서 사용자 승인 없이 데이터를 유출할 수 있는 프롬프트 인젝션 취약점이 보안 연구원들에 의해 발견되었습니다. 이 공격은 외부 데이터셋의 흰색 배경 텍스트에 숨겨진 간접 프롬프트 인젝션을 활용해 AI 에이전트가 민감한 금융 데이터를 수집하고 외부 네트워크 요청을 실행하는 수식을 삽입하도록 조작했습니다. Ramp는 해당 취약점을 패치했으며, 이는 AI 에이전트가 실행 가능한 수식을 생성할 때 엄격한 출력 검증이 필요함을 시사합니다.
5. Claude Code 버그로 특정 커밋 시 추가 사용량 과금 발생
Claude Code 2.1.119 버전에서 저장소의 최근 git 커밋 기록에 "HERMES.md" 문자열이 포함될 경우 API 요청이 추가 사용량(extra usage)으로 과금되는 버그가 발견되었습니다. Claude Code가 시스템 프롬프트에 최근 커밋 내용을 포함하기 때문에 발생하는 이 라우팅 오류는 Max 플랜 쿼터를 우회하여 추가 크레딧을 소진시킵니다. 이로 인해 기본 플랜 용량이 남아있음에도 보충 크레딧 잔액이 소모될 수 있습니다.
6. IBM, Granite 4.1 오픈 웨이트 모델 출시
IBM이 Apache 2.0 라이선스 기반의 새로운 Granite 4.1 오픈 웨이트 모델 3종을 출시했습니다. 30B, 8B, 3B 파라미터 모델은 128K 컨텍스트 윈도우를 지원하며 추론 시 토큰 효율성에 최적화되었습니다. 특히 8B 모델은 에이전트 및 코딩 벤치마크에서 Qwen3.5 9B 등 경쟁 모델 대비 약 20배 적은 출력 토큰으로 작업을 완료합니다. 모델 가중치는 Hugging Face에서 이용 가능하며, 8B 변체는 Weights & Biases 추론 엔드포인트를 통해서도 접근할 수 있습니다.
7. Zed 1.0 출시, 네이티브 AI 에이전트 통합 지원
Zed 코드 에디터가 정식 1.0 버전에 도달했습니다. Rust로 개발되고 자체 GPU 가속 UI 프레임워크를 사용하는 이 에디터는 Agent Client Protocol을 통해 Claude, Codex, Cursor 등 다양한 AI 에이전트를 네이티브로 통합합니다. 이번 릴리스에는 Zed for Business가 도입되었으며, 인간 개발자와 AI 에이전트가 코드베이스에 대해 일관된 뷰를 공유할 수 있도록 설계된 CRDT 기반 동기화 엔진 DeltaDB의 프리뷰도 포함되었습니다.
8. DeepInfra, Hugging Face 인퍼런스 프로바이더로 통합
DeepInfra가 Hugging Face Hub의 공식 인퍼런스 프로바이더(Inference Provider)가 되었습니다. 개발자는 Hugging Face 모델 페이지나 Python/JavaScript SDK를 통해 DeepInfra의 서버리스 플랫폼으로 직접 추론 요청을 보낼 수 있습니다. 이 통합은 DeepSeek V4 및 GLM-5.1과 같은 오픈 웨이트 모델의 채팅 및 텍스트 생성을 지원하며, 사용자는 자신의 DeepInfra API 키를 사용해 직접 결제할 수 있습니다.
9. Anthropic, 크리에이티브 소프트웨어용 Claude 커넥터 출시
Anthropic이 전문 크리에이티브 소프트웨어에 AI 모델을 통합하는 9종의 Claude 커넥터를 출시했습니다. Model Context Protocol(MCP)을 기반으로 구축된 이 커넥터들은 Claude가 Adobe Creative Cloud, Blender, Autodesk Fusion 등과 직접 상호작용할 수 있게 해줍니다. 개발자는 이를 활용해 기존 제작 파이프라인 내에서 배치 조정, 스크립트 실행, 3D 모델 수정을 자동화하는 자연어 워크플로우를 구축할 수 있습니다.
10. ElevenLabs, 음성 AI용 에이전트 템플릿 출시
ElevenLabs가 자사 ElevenAgents 플랫폼에 에이전트 템플릿(Agent Templates)을 출시했습니다. 이번 릴리스는 고객 지원 및 운영 등 다양한 사용 사례에 최적화된 50개 이상의 사전 구성된 AI 음성 에이전트 프레임워크를 제공합니다. 개발자는 정의된 시스템 프롬프트, 워크플로우, 통합 기능이 포함된 템플릿을 사용하여 아키텍처를 처음부터 구축하지 않고도 음성 에이전트를 신속하게 배포할 수 있습니다.
11. Deep-unlearning 팀, smol-audio 파인튜닝 노트북 공개
Deep-unlearning 팀이 실용적인 오디오 AI 작업을 위한 Jupyter 노트북 모음인 smol-audio를 공개했습니다. Apache-2.0 라이선스로 제공되는 이 저장소는 Whisper, Parakeet, Audio Flamingo 3 등의 모델 파인튜닝을 위한 Colab 친화적인 레시피를 제공합니다. 모든 노트북은 Hugging Face 생태계를 기반으로 하며 표준 16GB Colab 런타임에서 실행 가능하도록 최적화되어 로컬 GPU 설정의 번거로움을 줄였습니다.