1. DeepSeekが次世代モデル「DeepSeek-V4」シリーズをプレビュー公開
DeepSeekは、最新モデルシリーズ「DeepSeek-V4」のプレビュー版を公開しました。1.6兆パラメータの「V4-Pro」と2840億パラメータの「V4-Flash」の2モデルが用意され、いずれも100万トークンのコンテキストウィンドウに対応しています。新しいハイブリッド・アテンション・アーキテクチャの採用により、長いコンテキストにおける推論計算量とKVキャッシュの要件を削減しました。MITライセンスでの公開に加え、API経由でも利用可能です。API価格はV4-Proが入力100万トークンあたり1.74ドル、V4-Flashが0.14ドルに設定されていますが、初期のベンチマークでは推論タスク時の出力トークン消費量が多くなる傾向が示されています。
2. Sakana AI、マルチエージェント・オーケストレーションAPI「Fugu」のベータ版を公開
Sakana AIは、複数の基盤モデルを連携させるマルチエージェント・オーケストレーションシステム「Sakana Fugu」のベータ版を発表しました。このシステムは、コーディングや科学的推論などのタスクに対し、固定のルールではなく動的に最適なエージェントの組み合わせと役割を選択します。OpenAI互換のAPIを通じて提供されるため、既存の開発ワークフローへの統合が容易です。低遅延向けの「Fugu Mini」と、複雑な推論タスク向けの「Fugu Ultra」の2つのバリエーションが用意されています。
3. LLMによるブラウザ自動化を支援するオープンソースライブラリ「Browser Harness」が登場
LLMがChrome DevTools Protocol(CDP)に直接アクセスしてブラウザ操作を行えるようにするオープンソースライブラリ「Browser Harness」が公開されました。従来のフレームワークとは異なり、LLM自身がクリック操作のヘルパー関数を記述したり、クロスオリジンのiframeなどの例外処理を動的に管理したりできるのが特徴です。システムは常駐型のCDP WebSocketデーモンと、モデルがその場で修正可能なPythonヘルパーで構成されています。モデルがDOMとツールの相互作用を完全に把握できるため、原因不明の自動化失敗(サイレント・フェイailure)を抑制できます。
4. AI2、地球観測モデル「OlmoEarth Studio」にカスタム埋め込みベクトルの書き出し機能を追加
アレン人工知能研究所(AI2)は、地球観測用の基盤モデル「OlmoEarth」からカスタムの埋め込みベクトルを計算・エクスポートできる新機能を「OlmoEarth Studio」に追加しました。ユーザーはUIやAPIを通じて、対象地域や期間、画像ソースなどのパラメータを設定できます。地球観測データは軽量なCloud-Optimized GeoTIFF(COG)としてダウンロード可能な数値表現に変換され、類似画像検索や変化検知、フューショット・マッピングなどの用途に最適化されています。