Anthropic、Claude APIにハイブリッドモデル運用を可能にする「Advisor」ツールを追加

1. Anthropic、Claude APIにハイブリッドモデル運用を可能にする「Advisor」ツールを追加

Anthropicは、Claude Platform API向けに、1つのワークフロー内で複数のモデルを組み合わせて利用できる「Advisor」ツールを公開しました。これにより、SonnetやHaikuといった高速・低コストな実行モデルが、タスクの途中でOpusのような高知能モデルに助言を求めることが可能になります。このハイブリッドアプローチはMessages APIに直接統合されており、戦略的なガイダンスが必要な場面のみ大型モデルを呼び出すことで、運用コストを抑えつつOpus級の推論性能を実現できます。

2. NVIDIA、エージェントワークフロー向け120Bモデル「Nemotron 3 Super」を公開

NVIDIAは、1,200億パラメータを持つハイブリッドMixture-of-Experts（MoE）モデル「Nemotron 3 Super」をオープンソースで公開しました。アクティブパラメータ数は120億で、Mamba-Transformerアーキテクチャを採用し、100万トークンのコンテキストウィンドウを備えています。マルチエージェントアプリケーション向けに設計されており、重み、データセット、トレーニングレシピが公開されています。LM Studio、Together AI、OpenRouterなどのプラットフォームから即座に利用可能です。

3. Sentence Transformers v5.4公開、マルチモーダル埋め込みとリランカーに対応

Sentence Transformersライブラリのバージョン5.4がリリースされ、マルチモーダル埋め込みモデルとリランカーモデルのサポートが追加されました。これにより、テキスト、画像、音声、動画を単一の共有埋め込み空間内でエンコードし、比較することが可能になります。このアップデートは特にクロスモーダル検索やRAG（検索拡張生成）のワークフローを強化するもので、マルチモーダルリランカーの導入により、異なるモダリティ間のペアに対しても精度の高いスコアリングが可能になり、検索精度が向上します。

4. NVIDIA、3Dモーション生成モデル「Kimodo」をオープンソース化

NVIDIA Researchは、キネマティック・モーション拡散モデル「Kimodo」をHugging Faceで公開しました。このモデルは、700時間の光学式モーションキャプチャデータで学習されており、高品質な人間やロボットの3Dモーションを生成できます。開発者はテキストプロンプトや特定の運動学的制約を用いて出力を制御でき、空間コンピューティングやロボティクスアプリケーションへの3Dモーション生成の統合を容易にします。

5. Hugging Face Hub、最適化済みハードウェア「Kernels」のネイティブサポートを開始

Hugging Faceは、特定のハードウェア向けに最適化されたバイナリ演算セットを共有・統合できる新しいリポジトリタイプ「Kernels」を導入しました。CUDA、ROCm、Apple Silicon、Intel XPUのサポートをプラットフォームの主要機能として扱います。初期リリースでは、SGLangプロジェクトチームによるFlash Attentionカーネルが公開されています。

6. Twill.ai、自律型コーディングエージェント用のクラウドサンドボックスを提供開始

Twill.aiは、Claude CodeやCodexなどのコーディングCLIを隔離されたクラウドサンドボックス内で実行できるプラットフォームを立ち上げました。開発者はSlack、GitHub、Linear、またはCLI経由でタスクを依頼でき、エージェントがプルリクエストや診断結果を返します。ローカル環境での並列実行や永続性の問題を解決し、ローカルファイルシステムへのフルアクセスを必要とせずにエージェントを放置実行できます。月10クレジットの無料枠のほか、独自のAPIキーを使用できる有料プランも用意されています。

7. エッジ展開向けに最適化された26Bモデル「Gemopus-4」がコミュニティから登場

新しいコミュニティファインチューンモデル「Gemopus-4-26B-A4B-it」がHugging Faceで公開されました。Gemma 4 26BのMixture-of-Experts（MoE）アーキテクチャをベースにしており、アクティブパラメータ数は40億、コンテキストウィンドウは131kです。Claude Opusスタイルの出力を模倣する推論蒸留技術を用いて学習されています。ローカルおよびエッジ環境への展開に最適化されており、Q6_K量子化で約22.7GBのVRAMを必要とします。

8. アリババ、マルチモーダル動画生成モデル「HappyHorse-1.0」をプレビュー公開

アリババは、テキストおよび画像からの動画生成に対応し、ネイティブオーディオの有無も選択可能な新しい動画生成モデル「HappyHorse-1.0」を発表しました。このモデルは、Artificial Analysis Video Arenaのリーダーボードで最近トップランクを獲得しています。現在は未公開ですが、アリババは4月30日に開発者向けのパブリックAPIアクセスを開始する予定です。