Meta, 멀티모달 및 추론 능력을 갖춘 독자 모델 Muse Spark 공개

1. Meta, 멀티모달 및 추론 능력을 갖춘 독자 모델 Muse Spark 공개

Meta가 Superintelligence Labs에서 개발한 독자 멀티모달 모델 Muse Spark를 공개했습니다. 이 모델은 네이티브 도구 사용(tool-use), 시각적 사고의 사슬(visual chain of thought), 병렬 에이전트 추론을 위한 'Contemplating mode'를 특징으로 합니다. 벤치마크 결과 Gemini 3.1 Pro 및 GPT-5.4와 같은 프런티어 모델에 근접한 성능을 보였습니다. Meta는 현재 일부 파트너에게 프라이빗 API 프리뷰를 제공 중이며, 향후 유료 API 액세스를 확대할 계획입니다. 이는 기존 오픈 웨이트 Llama 모델 중심 전략에서의 변화를 시사합니다.

2. Anthropic, 클라우드 기반 에이전트 배포를 위한 Claude Managed Agents 퍼블릭 베타 출시

Anthropic이 대규모 AI 에이전트 구축 및 배포를 위한 구성 가능한 API 세트인 Claude Managed Agents를 퍼블릭 베타로 출시했습니다. 이 플랫폼은 보안 샌드박싱, 인증, 상태 관리, 도구 실행을 위한 내장 인프라를 제공합니다. 개발자는 연결이 끊겨도 유지되는 자율 세션을 실행하고 여러 에이전트를 병렬로 조정할 수 있습니다. 서비스 요금은 표준 Claude Platform 토큰 요율에 세션 시간당 0.08달러의 활성 런타임 비용이 추가됩니다.

3. 알리바바, 100만 컨텍스트 및 네이티브 비전 지원하는 Qwen3.6 Plus API 출시

알리바바가 알리바바 클라우드 API를 통해 독자 멀티모달 모델 Qwen3.6 Plus를 출시했습니다. 이 모델은 100만 토큰 컨텍스트 윈도우와 네이티브 비전 입력을 지원하며, 에이전트 작업 및 긴 컨텍스트 검색에서 Qwen3.5 대비 향상된 성능을 보여줍니다. 가격은 256K 시퀀스까지 입력 토큰 100만 개당 0.50달러, 출력 토큰 100만 개당 3.00달러로 책정되었습니다. 알리바바는 자체 배포를 위한 모델 가중치는 공개하지 않았습니다.

4. 에이전트 스킬을 호출 가능한 REST API로 변환하는 Skrun CLI 도구

개발자가 에이전트 스킬을 호출 가능한 API로 배포할 수 있게 해주는 오픈 소스 CLI 도구 Skrun이 출시되었습니다. 표준 SKILL.md 파일에 지침을 정의하고 agent.yaml 파일에 설정을 구성하면 로컬 POST 엔드포인트를 통해 에이전트를 노출할 수 있습니다. 이 도구는 Anthropic, OpenAI, Google 등 다양한 모델 제공업체를 지원하며 자동 폴백 기능을 갖추고 있습니다. 또한 내장된 상태 관리 기능과 로컬 스크립트 또는 표준 MCP 서버를 통한 도구 호출을 지원합니다.

5. 텐센트, 20억 파라미터 규모의 Hunyuan Embodied AI 비전-언어 모델 출시

텐센트가 Hunyuan Embodied AI 모델을 Hugging Face에 공개했습니다. 이 모델은 Mixture-of-Transformers 아키텍처를 사용하는 20억 파라미터 규모의 비전-언어 모델입니다. 임보디드(embodied) 이해 작업을 위해 설계되었으며 CV-Bench 및 DA-2K와 같은 벤치마크에서 높은 성적을 거두었습니다. 개발자는 로컬 비전 및 로보틱스 애플리케이션을 위해 모델을 다운로드하여 통합할 수 있습니다.

6. 공식 Swift 확장 프로그램, Cursor 및 기타 Open VSX 편집기로 지원 확대

공식 Swift 확장 프로그램을 이제 Open VSX Registry에서 사용할 수 있습니다. 이번 출시를 통해 Cursor, VSCodium, AWS Kiro와 같은 편집기에서 코드 완성, 디버깅, 리팩토링을 포함한 네이티브 Swift 언어 지원이 가능해졌습니다. 에이전트 기반 IDE를 사용하는 개발자는 이제 수동 다운로드 없이 확장 프로그램을 자동으로 설치할 수 있습니다. 이번 업데이트는 macOS, Linux, Windows 등 다양한 환경에서 크로스 플랫폼 Swift 개발을 용이하게 합니다.

7. 영구 메모리를 통해 에이전트 능력을 업데이트하는 Memento-Skills 프레임워크

연구진이 LLM 에이전트가 작업별 능력을 자율적으로 구축하고 적응시킬 수 있게 해주는 오픈 소스 프레임워크 Memento-Skills를 공개했습니다. 이 시스템은 상태 저장 프롬프트(stateful prompts)와 구조화된 마크다운 파일을 사용하여 재사용 가능한 스킬을 저장하는 메모리 기반 강화 학습 방식을 사용합니다. 이를 통해 에이전트는 기본 모델 파라미터를 업데이트하지 않고도 읽기-쓰기 성찰 학습 메커니즘을 통해 성능을 개선할 수 있습니다. 이 프레임워크는 커스텀 에이전트 워크플로우 통합을 위해 GitHub에서 제공됩니다.

8. ThreadWeaver, 3배 빠른 Chain-of-Thought를 위한 병렬 추론 방식 오픈 소스 공개

LLM의 추론 작업을 병렬화하는 새로운 방법인 ThreadWeaver 프로젝트가 오픈 소스로 공개되었습니다. 이 기술은 표준 순차적 롱 Chain-of-Thought(CoT) 모델과 대등한 추론 성능을 유지하면서 복잡한 작업에서 최대 3배의 속도 향상을 제공합니다. 이번 릴리스에는 데이터 생성, 지도 미세 조정(SFT), 강화 학습을 위한 레시피가 포함되어 있습니다. 개발자는 이러한 리소스를 활용하여 추론 집약적인 애플리케이션의 추론 지연 시간을 최적화할 수 있습니다.

9. 업스테이지, API를 통해 Solar Pro 3 102B MoE 모델 출시

국내 AI 기업 업스테이지가 1,020억 개의 파라미터와 120억 개의 활성 파라미터를 가진 Mixture of Experts(MoE) 모델 Solar Pro 3를 출시했습니다. 이 모델은 128K 컨텍스트 윈도우를 갖추고 있으며 지시어 이행 및 에이전트 도구 사용에서 강력한 성능을 보여줍니다. 현재 업스테이지의 자체 API를 통해 독자 모델로 제공됩니다. 벤치마크 평가에 따르면 추론 작업에서 높은 토큰 사용량을 보이며, 프런티어 모델 대비 적정한 수준의 정확도를 기록했습니다.