1. Hermes Agentが大規模MCPカタログに対応するツール検索機能を導入
Nous ResearchのHermes Agentに、大規模なModel Context Protocol(MCP)ツールキットを統合する際のコンテキストウィンドウ制限を回避するための「ツール検索」機能が追加されました。完全なツールスキーマを段階的な開示レイヤーに置き換えることで、エージェントはBM25アルゴリズムを使用してクエリとツール説明を照合します。Anthropicのモデルで評価されたこのシステムは、ツールカタログをステートレスに保ち同期のズレを防ぎつつ、タスクの精度を劇的に向上させます。
- • tool_search、tool_describe、tool_callという3つのブリッジツールを導入し、必要な時のみ動的にスキーマを取得します。
- • BM25検索アルゴリズムを活用してツールメタデータとクエリを照合し、サブストリングによるフォールバックも備えています。
- • Anthropicの評価において、Claude Opus 4では精度が49%から74%へ、Claude Opus 4.5では79.5%から88.1%へと向上しました。
- • 遅延可能なツールスキーマがアクティブなモデルのコンテキストの10%を超えると自動的に有効化されます。
- • コアとなるターミナルツールやウェブ検索ツールは直接アクセスできるよう除外され、ステートレスなツールカタログはターンごとに再構築されます。
大規模なModel Context Protocol(MCP)カタログを使用して開発を行うエンジニアは、コンテキストの肥大化を防ぎながら、エージェントの精度を大幅に向上させることが可能になります。
2. テキスト読み上げ(TTS)リーダーボードが主要APIおよびオープンウェイトモデルをランク付け
Artificial Analysis Speech Arenaの最新ベンチマークにより、テキスト読み上げ(TTS)分野のトップモデルの評価が容易になりました。リーダーボードには、CartesiaのSonic 3.5のような超低レイテンシモデルから、ElevenLabs Eleven v3やGemini 3.1 Flash TTSのようにインラインタグでペース調整が可能な高度な制御システムまで、最適化された選択肢が並んでいます。オープンウェイトの代替案を求める開発者向けにはFish Audio S2 Proがランク上位ですが、商用展開にはライセンスが必要です。
- • 2026年5月30日時点で、Gemini 3.1 Flash TTS、Realtime TTS-2、Sonic 3.5、Realtime TTS 1.5 MaxがArtificial Analysis Speech Arenaのトップを占めています。
- • CartesiaのSonic 3.5は状態空間モデル(SSM)アーキテクチャを採用し、約82ミリ秒のエンドツーエンドレイテンシを実現しています。
- • Inworld AIのTTS-1.5 Miniは、P90の音声出力開始時間(TTFA)を130ミリ秒以下に抑え、リアルタイム用途をターゲットにしています。
- • ElevenLabs Eleven v3とGemini 3.1 Flash TTSは、スタイルやペースを制御するためのインライン音声フォーマットタグをサポートしています。
- • Fish Audio S2 Proはオープンウェイトモデルとして最高位ですが、研究目的以外での利用には商用ライセンスが必要です。
- • OpenAIのGPT-Realtime-2は、ライブの音声対話のためにGPT-5クラスの推論能力を備えた音声機能を導入しています。
アプリに音声を統合する開発者は、主要な商用モデルとオープンウェイトモデルの間で、実際のレイテンシ、推論能力、ライセンス条件を比較検討できます。
3. AgentTroveがエージェントSFTデータセット向けのストリーミングパイプラインを公開
AgentTroveの新しいPythonパイプラインにより、エージェントの行動からファインチューニング用データセットを作成する作業が簡素化されました。このオープンソースツールはトレースを直接ストリーミングするため、開発者はギガバイト単位の生ファイルを保存することなく、成功した結果のフィルタリングやツール使用状況の解析を行えます。抽出されたシーケンスは即座にShareGPT形式でエクスポートでき、AxolotlやLLaMA-Factoryといった一般的な学習ライブラリへ容易に投入可能です。
- • AgentTroveには、Pythonベースのストリーミングでアクセス可能な170万件のエージェント相互作用トレースが含まれています。
- • アシスタントのJSON出力からシェルコマンドを解析し、ツール使用状況を評価するコマンド抽出ユーティリティが含まれています。
- • 成功ベースのフィルターを採用し、解決済み、合格、または肯定的な評価を受けたトレースのみを抽出します。
- • フィルタリングされたトレースは、AxolotlやLLaMA-Factoryと互換性のあるクリーンなShareGPT形式のJSONLでエクスポートされます。
- • pandasとmatplotlibを使用して、タスクソース、教師モデル、ターン数などを要約・可視化します。
開発者は、巨大な生データをダウンロードすることなく、複雑なエージェントのやり取りから成功事例でフィルタリングされた高品質な教師ありファインチューニング(SFT)データセットを構築できます。