1. Zhipu AIが754Bのオープンソースモデル「GLM-5.1」を公開
Zhipu AIは、長期的なエージェントタスクに最適化された754億パラメータのモデル「GLM-5.1」をHugging Faceで公開しました。このモデルは、単一のタスクで最大8時間の自律実行が可能なように設計されています。SWE-Bench Proにおいて、Claude Opus 4.6やGPT-5.4などの商用モデルを上回る最高水準の性能を記録しています。開発者は商用利用のためにモデルをダウンロードしてカスタマイズできるほか、HuggingChat経由でもアクセス可能です。
2. Anthropic、サイバーセキュリティ専用モデル「Claude Mythos」を限定公開
Anthropicは、セキュリティ上の懸念から一般公開を見送る高性能モデル「Claude Mythos Preview」を発表しました。このモデルは「Project Glasswing」の一環として、AWS、Google、Microsoftを含む大手テック企業12社のコンソーシアムにのみ限定提供されます。Mythosは人間の指示なしに、主要なOSやブラウザから数千件の深刻なゼロデイ脆弱性を自律的に発見しました。これは、最先端モデルの防衛的サイバーセキュリティ運用における管理と展開の大きな転換点となります。
3. AWS、AIエージェント向けネイティブワークスペース「Amazon S3 Files」を提供開始
AWSは、S3オブジェクトストレージ上にAIエージェント用のネイティブなファイルシステムワークスペースを提供する「Amazon S3 Files」を発表しました。これにより、APIベースのオブジェクトストアとファイルパスに依存するエージェントを連携させるための、個別のファイルシステム層やデータ同期パイプラインを構築する必要がなくなります。エンジニアリングチームは、ローカルへのダウンロードによるセッション状態の喪失やコンテキストウィンドウの圧迫を避けて、Claude Codeなどのツールを直接S3データに接続できます。
4. OpenAI、次世代画像生成モデル「Image V2」をプレビュー公開
OpenAIは、ChatGPTおよびLM Arenaにおいて次世代画像生成モデル「Image V2」の3つのバリアントをテスト中です。初期テストでは、プロンプトへの忠実度、構図の理解、UIデザインのレンダリング性能が向上していることが示されています。この限定プレビューは、OpenAIの画像生成API機能の近日アップデートを示唆するものです。
5. Google、自律型コーディングエージェント「Jules V2」をプレビュー公開
Googleは、特定のタスク実行ではなく、高レベルの開発目標を自律的に管理するコーディングエージェント「Jules V2」を開発しています。現在、早期テストのためのウェイトリスト登録を開始しました。このKPI主導のアプローチは、大規模なコードベースの管理を支援することを目的としていますが、予測不可能なコード変更や検証といった新たな課題も伴います。
6. Google、エージェント・オーケストレーションのテスト環境「Scion」をオープンソース化
Googleは、エージェント・オーケストレーションのための実験的テスト環境「Scion」をオープンソースとして公開しました。このフレームワークは、マルチエージェント・ワークフローの構築、テスト、評価を行うための構造化された環境を開発者に提供します。Google Cloud上で複雑なエージェントシステムを設計するチームにとって、新たなリファレンス・アーキテクチャとなります。
7. Apple Siliconに最適化された「Gemma 4」マルチモーダル・ファインチューニングツールが登場
Apple Silicon向けに最適化された、Gemma 4のローカル・ファインチューニング・パイプラインを提供する新しいオープンソースプロジェクトが公開されました。このツールはGoogle Cloud Storageからトレーニングデータを直接ストリーミングできるため、大規模データセットにおけるローカルストレージの制約を回避できます。Macハードウェアでのマルチモーダルおよびオーディオの微調整に特化した最適化が含まれていますが、長いシーケンスではメモリ不足エラーを防ぐための監視が推奨されます。
8. オープンな音楽生成モデル「ACE-Step 1.5 XL」がリリース
40億パラメータの新しい音楽生成モデル「ACE-Step 1.5 XL」が、MITライセンスでHugging Faceに公開されました。このモデルはテキストからの音楽生成、カバー生成、リペインティング、オーディオ抽出などのタスクをサポートしています。法的コンプライアンスを遵守したデータセットでトレーニングされており、オーディオアプリケーションへの商用統合に適しています。
9. AutoAgent、自己改善型エージェント・ハーネスをオープンソース化
AutoAgentは、メタエージェントが自身の実行ハーネスを自律的に設計・最適化できる新しいMITライセンスのフレームワークです。山登り法を用いて、ツール利用やメモリ構造を夜間に反復改善します。TerminalBenchやSpreadsheetBenchでトップクラスの性能を記録しており、自己洗練型のエージェント・アーキテクチャを構築するための斬新なアプローチを開発者に提供します。
10. AIエージェントに深い文脈を提供するコードベース索引ツール「GitNexus」
GitNexusは、コードベース全体をナレッジグラフとして索引化し、CursorやClaude CodeなどのAIエージェントに深いコンテキストを提供する新しいツールです。依存関係やコールチェーンをマッピングすることで、エージェントがコード編集前にリポジトリ内の関係性を理解するのを助けます。エディタ統合用のCLIとWeb UIを備えており、コンテキストウィンドウの制限による破壊的変更のリスクを軽減します。
11. Webドキュメントをエージェント用仮想ファイルシステムとしてマウントする「Nia」
Niaは、オンラインのドキュメントサイトを仮想ファイルシステムとしてマウントし、AIエージェントがgrepやtreeなどの標準的なターミナルコマンドで探索できるようにする新しいツールです。このクライアントサイドのインメモリ・シェルは、Claude Code、Copilot、Geminiと連携し、最新のAPIへのリアルタイムアクセスを可能にします。Webをファイルシステムとして扱うことで、複雑なツールスキーマを構築することなく、古い学習データに起因するハルシネーションを抑制できます。