Anthropic, Claude를 위한 'Computer Use' 기능 출시

1. Anthropic, Claude를 위한 'Computer Use' 기능 출시

Anthropic이 Claude가 사용자의 마우스, 키보드, 화면을 직접 제어할 수 있는 'Computer Use' 기능을 선보였습니다. 현재 macOS용 Claude Cowork 및 Claude Code 데스크톱 앱을 통해 Pro 및 Max 구독자를 대상으로 리서치 프리뷰가 제공되고 있으며, 새로운 Dispatch 도구와 결합해 원격 모바일 제어도 가능합니다.

2. 자율 에이전트 구축을 위한 OpenHarness 프레임워크

범용 AI 에이전트 개발을 위한 빌딩 블록을 제공하는 OpenHarness가 출시되었습니다. 이 프레임워크는 AGENTS.md 사양을 지원하고 Model Context Protocol 서버에 연결되며, 에이전트가 다른 에이전트에게 자율적으로 업무를 위임할 수 있도록 지원합니다.

3. NVIDIA Kimodo, 텍스트로 3D 애니메이션 생성

NVIDIA가 텍스트 프롬프트에서 몇 초 만에 3D 캐릭터 애니메이션을 생성하는 도구인 Kimodo를 공개했습니다. 700시간 분량의 전문 모션 캡처 데이터로 학습된 이 시스템은 인간과 로봇 스켈레톤 모두에 적용 가능하며, Hugging Face에서 무료로 사용할 수 있습니다.

4. MiniMax M2.7, Claude Opus 성능의 90%를 7% 비용으로 구현

최근 테스트에서 MiniMax M2.7 모델이 Claude Opus 4.6 대비 7%의 비용으로 90% 수준의 성능을 제공하는 것으로 나타났습니다. MiniMax는 버그 탐지 및 부동 소수점 계산에서 강점을 보였으나, 종합적인 수정 및 취약점 해결 능력에서는 여전히 Claude가 더 우수한 것으로 평가되었습니다.

5. Claude Code, 클라우드 기반 반복 작업 기능 추가

Claude Code가 클라우드 기반의 반복 작업 예약 기능을 지원합니다. 이번 업데이트를 통해 사용자가 로컬 데스크톱 앱을 실행해 두지 않아도 Claude가 클라우드 인프라를 통해 예약된 작업을 독립적으로 수행할 수 있습니다.

6. Luma AI, 이미지 생성 모델 Uni-1 출시

Luma AI가 Google과 OpenAI의 경쟁 모델을 능가하는 성능을 기록한 새로운 이미지 생성 모델 Uni-1을 출시했습니다. Luma AI는 이 모델이 뛰어난 성능을 제공하면서도 운영 비용은 최대 30% 더 저렴하다고 강조했습니다.

7. MiniMax, AI 코딩 에이전트 스킬 저장소 공개

MiniMax가 AI 코딩 에이전트에 즉시 연결해 사용할 수 있는 개발 스킬 저장소(repository)를 공개했습니다. 프론트엔드, 풀스택, Android, iOS, 셰이더 개발을 위한 구조화된 가이드를 제공하며 Claude Code, Cursor, Codex 등 주요 도구에 대한 설치 지침이 포함되어 있습니다.

8. Mozilla.ai, 에이전트 학습을 위한 Cq 도입

Mozilla.ai가 AI 코딩 에이전트 간의 공유 학습 표준을 구축하기 위한 프로젝트 Cq를 발표했습니다. 에이전트용 Stack Overflow와 같은 개념으로, 모든 모델이나 에이전트가 '지식 단위(knowledge units)'를 제안하여 집단적인 역량을 강화할 수 있도록 설계되었습니다.

9. Alibaba, 비디오 생성 프레임워크 LumosX 공개

Alibaba가 개인화된 다중 피사체 비디오 생성을 위한 ICLR 2026 프레임워크 LumosX를 Hugging Face에 출시했습니다. 이 시스템은 관계형 어텐션 메커니즘을 활용해 특정 정체성과 그에 대응하는 속성을 정교하게 연결합니다.

10. Pi 에이전트, Hugging Face에서 사용 가능

Pi 에이전트를 이제 호환되는 MLX 모델에 대해 Hugging Face에서 직접 이용할 수 있습니다. 개발자는 플랫폼의 'Use this model' 메뉴를 통해 에이전트에 즉시 액세스하고 배포할 수 있습니다.

11. Hugging Face, 이미지 향상을 위한 배치 작업 추가

Hugging Face Pro 사용자는 이제 Hugging Face Jobs를 통해 대량의 이미지 향상 작업을 실행할 수 있습니다. 이 기능을 통해 개발자는 플랫폼 인프라에서 직접 이미지 처리 워크플로우를 효율적으로 확장할 수 있습니다.

12. 비디오 모델을 위한 강화 학습 연구 'Astrolabe' 발표

순방향 프로세스 강화 학습(forward-process RL)의 제어 방법을 상세히 다룬 논문 'Astrolabe'가 발표되었습니다. 이 연구는 특히 증류된 자기회귀 비디오 모델의 성능 개선을 목표로 하고 있습니다.

13. HopChain, 멀티홉 데이터 합성 방식 도입

'HopChain'이라는 제목의 새 논문에서 멀티홉 데이터 합성 접근 방식을 제안했습니다. 이 방법은 AI 모델의 일반화 가능한 시각-언어 추론 능력을 향상시키기 위해 고안되었습니다.