1. OpenAI와 Microsoft, 독점 클라우드 파트너십 종료
OpenAI와 Microsoft가 파트너십 계약을 수정하여 Microsoft의 독점 클라우드 호스팅 권한을 종료했습니다. 이제 OpenAI는 AWS와 Google Cloud를 포함한 모든 클라우드 제공업체를 통해 고객에게 제품을 서비스할 수 있습니다. Microsoft는 2032년까지 OpenAI의 지적 재산 및 모델에 대한 비독점 라이선스를 유지하며 주요 클라우드 파트너로 남습니다. 이번 재협상에서는 범용 인공지능(AGI) 조항이 삭제되었으며, 2030년까지만 보장되는 Microsoft의 수익 공유 지급액 한도도 설정되었습니다.
2. Anthropic, Claude Managed Agents를 위한 Memory 기능 출시
Anthropic이 Claude Managed Agents를 위한 영구 메모리(persistent memory) 기능을 퍼블릭 베타로 출시했습니다. 이 기능을 통해 AI 에이전트는 세션 간 정보를 유지하고, 개발자가 수동으로 프롬프트를 업데이트하지 않아도 지식을 축적할 수 있습니다. Memory는 데이터가 파일로 저장되는 파일 시스템 기반 계층으로 구현되며, API를 통해 관리하거나 Claude Console에서 편집 및 내보내기가 가능합니다. 이 시스템은 여러 에이전트의 동시 접속을 지원하며, 정보 추적, 롤백 또는 삭제를 위한 상세 감사 로그를 포함합니다.
3. Google, 로컬 Gemini Nano용 Chrome Prompt API 출시
Google이 Chrome 브라우저에서 로컬로 실행되는 Gemini Nano 모델에 직접 자연어 요청을 보낼 수 있는 Prompt API를 출시했습니다. 이 API는 서버 측 추론 없이도 콘텐츠 요약, 분류, 추출과 같은 작업을 지원합니다. 현재 특정 RAM 및 GPU 요구 사항을 충족하는 Windows, macOS, Linux, ChromeOS 데스크톱 버전에서 작동합니다. 개발자는 추론 세션을 관리하고, 효율성을 위해 기존 세션을 복제하거나 로컬 시스템 리소스 확보를 위해 세션을 종료할 수 있습니다.
4. OpenMOSS, MOSS-Audio 파운데이션 모델 출시
OpenMOSS 팀이 음성, 환경음, 음악 및 시간적 추론을 통합한 오픈 소스 파운데이션 모델인 MOSS-Audio를 출시했습니다. 이 아키텍처는 오디오 캡셔닝, 시간 인식 질의응답, 실제 오디오 입력에 대한 복잡한 추론을 지원합니다. 이번 출시에는 다양한 추론 작업에 최적화된 Instruct 및 Thinking 버전을 포함한 4가지 모델 변형이 포함되었습니다.
5. EvanFlow, Claude Code용 TDD 플러그인 출시
EvanFlow가 Claude Code 에이전트를 위한 테스트 주도 개발(TDD) 플러그인을 출시했습니다. 이 도구는 브레인스토밍, 계획, 실행 단계에서 사용자의 필수 승인 체크포인트를 거치도록 유도하는 반복적 피드백 루프를 강제합니다. 실행 단계에서는 수직 슬라이스(vertical-slice) TDD 방식을 적용하여, 에이전트가 실패하는 테스트를 작성하고 최소한의 코드를 구현한 뒤 리팩토링을 거쳐 다음 단계로 진행하도록 합니다. 이 플러그인은 Claude Code 플러그인 마켓플레이스에서 직접 이용할 수 있습니다.
6. Anthropic, Claude Code의 Bugcrawl 기능 테스트
Anthropic이 Claude Code 도구 내에서 실험적인 Bugcrawl 기능을 테스트 중입니다. 이 기능을 통해 개발자는 전체 코드 저장소에서 버그를 스캔하고 자동 수정 제안을 받을 수 있습니다. 현재 사이드 네비게이션의 전용 항목을 통해 접근 가능하며, 일반적인 코드의 정확성과 품질에 집중합니다. Anthropic은 이 도구가 많은 양의 토큰을 소비하므로, 테스트 단계에서는 소규모 저장소에 사용하는 것이 가장 적합하다고 권고했습니다.
7. Utilyze, 오픈 소스 GPU 모니터링 도구 출시
Utilyze가 nvtop이나 nvidia-smi와 같은 표준 도구보다 더 정확한 사용률 지표를 제공하도록 설계된 오픈 소스 GPU 모니터링 도구를 출시했습니다. Utilyze는 커널 실행 시간의 비율을 보고하는 대신, 하드웨어 성능 카운터를 샘플링하여 이론적 하드웨어 한계 대비 실제 연산 및 메모리 처리량을 측정합니다. 또한 이 도구는 특정 워크로드에 대해 달성 가능한 최대 사용률 한도를 추정합니다.