Meta、マルチモーダル推論モデル「Muse Spark」をプレビュー公開

1. Meta、マルチモーダル推論モデル「Muse Spark」をプレビュー公開

MetaのSuperintelligence Labsは、独自のマルチモーダルモデル「Muse Spark」を公開しました。このモデルは、ネイティブなツール利用機能や視覚的なChain of Thoughtに加え、並列的なエージェント推論を可能にする「Contemplating mode（熟考モード）」を搭載しています。ベンチマーク結果ではGemini 3.1 ProやGPT-5.4に匹敵する性能を示しており、現在は一部のパートナー向けにプライベートAPIが提供されています。これは、従来のLlamaシリーズのようなオープンウェイト戦略からの転換を意味しています。

2. Anthropic、AIエージェントの構築・運用を支援する「Claude Managed Agents」をベータ公開

Anthropicは、AIエージェントを大規模に構築・デプロイするためのAPI群「Claude Managed Agents」のパブリックベータ版をリリースしました。このプラットフォームには、安全なサンドボックス、認証、状態管理、ツール実行のためのインフラが組み込まれています。開発者は、切断後も継続可能な自律セッションの実行や、複数のエージェントの並列連携が可能です。料金は標準のClaude Platformトークン料金に加え、アクティブな実行時間1時間あたり0.08ドルのセッション料が適用されます。

3. Alibaba、100万コンテキストとネイティブビジョン対応の「Qwen3.6 Plus」をAPI提供

Alibabaは、Alibaba Cloud APIを通じて独自マルチモーダルモデル「Qwen3.6 Plus」の提供を開始しました。100万トークンのコンテキストウィンドウとネイティブなビジョン入力をサポートし、エージェントタスクや長文コンテキストの検索性能においてQwen3.5を上回る成果を示しています。価格は100万入力トークンあたり0.50ドル、100万出力トークンあたり3.00ドル（256Kシーケンスまで）に設定されています。なお、本モデルの重みは公開されていません。

4. エージェントのスキルをREST API化するCLIツール「Skrun」が登場

開発者が定義したエージェントのスキルを、呼び出し可能なAPIとしてデプロイできるオープンソースのCLIツール「Skrun」がリリースされました。SKILL.mdファイルで指示を、agent.yamlで設定を定義するだけで、ローカルのPOSTエンドポイントとしてエージェントを公開できます。Anthropic、OpenAI、Googleなど複数のプロバイダーに対応し、自動フォールバック機能も備えています。また、状態管理機能や、ローカルスクリプト・標準MCPサーバーを介したツール呼び出しもサポートしています。

5. Tencent、20億パラメータの身体性AI向け視覚言語モデル「Hunyuan Embodied AI」を公開

Tencentは、身体性AI（Embodied AI）モデル「Hunyuan Embodied AI」をHugging Faceで公開しました。Mixture-of-Transformersアーキテクチャを採用した20億パラメータの視覚言語モデルで、物理環境における理解タスクに特化しており、CV-BenchやDA-2Kなどのベンチマークで高いスコアを記録しています。開発者はこのモデルをダウンロードし、ローカル環境でのビジョン処理やロボティクス応用に統合することが可能です。

6. Swift公式拡張機能がOpen VSXに対応、Cursorなどのエディタで利用可能に

Swiftの公式拡張機能がOpen VSX Registryで公開されました。これにより、Cursor、VSCodium、AWS Kiroなどのエディタにおいて、コード補完、デバッグ、リファクタリングといったSwiftのネイティブな言語サポートが利用可能になります。エージェント型IDEを使用している開発者は、手動でダウンロードすることなく拡張機能を自動インストールできるようになります。このアップデートにより、macOS、Linux、Windowsにわたる幅広い環境でのSwift開発が促進されます。

7. 永続メモリでエージェントの能力を拡張するフレームワーク「Memento-Skills」公開

LLMエージェントがタスク固有の能力を自律的に構築・適応させることができるオープンソースフレームワーク「Memento-Skills」が発表されました。このシステムは、メモリベースの強化学習アプローチを採用し、ステートフルなプロンプトと構造化されたMarkdownファイルを使用して再利用可能なスキルを保存します。これにより、モデル自体のパラメータを更新することなく、読み書き可能な内省的学習メカニズムを通じてエージェントの性能を向上させることが可能です。

8. 推論を3倍高速化する並列手法「ThreadWeaver」がオープンソース化

LLMの推論タスクを並列化する新しい手法「ThreadWeaver」がオープンソースとして公開されました。この技術は、従来の逐次的な長いChain-of-Thought（CoT）モデルと同等の推論性能を維持しながら、複雑なタスクにおいて最大3倍の高速化を実現します。公開内容には、データ生成、教師あり微調整（SFT）、強化学習のためのレシピが含まれており、開発者はこれらを利用して推論負荷の高いアプリケーションのレイテンシを最適化できます。

9. Upstage、1020億パラメータのMoEモデル「Solar Pro 3」をAPIで提供開始

韓国のAIラボUpstageは、1020億パラメータ（アクティブパラメータは120億）のMixture of Experts（MoE）モデル「Solar Pro 3」をリリースしました。128Kのコンテキストウィンドウを備え、指示遂行やエージェントによるツール利用において高い性能を発揮します。現在はUpstage独自のAPIを通じて提供されています。ベンチマーク評価では、推論タスクにおけるトークン消費量が多い一方で、最先端モデルと比較すると精度は控えめな結果となっています。