1. AnthropicがSpaceXと提携し、計算リソースを大幅に拡大
AnthropicはSpaceXと提携し、テネシー州メンフィスにあるスーパーコンピュータ「Colossus 1」を利用することになりました。この契約により、Anthropicは300メガワットを超える計算能力と、H100、H200、GB200モデルを含む22万基以上のNVIDIA GPUへのアクセス権を得ます。その結果、Anthropicは「Claude Code」の5時間あたりのレート制限を2倍に引き上げ、OpusモデルのAPI制限も緩和します。同社は今後、SpaceXと協力して軌道上でのAI計算能力の開発も検討しています。
- • Colossus 1を介した300メガワット以上の計算能力へのアクセス。
- • Claude Codeの5時間あたりのレート制限を2倍に拡大。
- • Claude OpusのAPIレート制限を拡大。
- • 軌道上でのAI計算能力に関する将来的な計画。
計算能力の向上は、Anthropicのモデルやエージェントツールを利用する開発者にとって、利用制限の緩和とパフォーマンスの向上に直結します。
2. 米政府、AIの安全性審査の義務化へ向けて始動
米AI安全研究所(US AI Safety Institute)は、AI標準・イノベーションセンター(CAISI)へと名称を変更し、Google DeepMind、Microsoft、xAIと、フロンティアAIモデルのリリース前安全性チェックを実施する合意を締結しました。政府は国家安全保障上の懸念から、公開前の政府審査を義務付ける大統領令を検討しています。この政策転換は、未公開モデルの潜在的なサイバーセキュリティリスクをめぐる最近の業界との対立を受けたものです。
- • CAISIがxAI、Microsoft、Google DeepMindとリリース前テストの合意を締結。
- • フロンティアモデルの政府審査を義務付ける大統領令の可能性。
- • 国家安全保障とサイバーセキュリティリスクへの注力。
フロンティアモデルを活用する開発者は、新たな規制のハードルやリリース前の審査要件に直面し、展開スケジュールに影響が出る可能性があります。
3. Subquadraticが1200万トークンのコンテキストウィンドウを発表
Subquadraticは、1200万トークンのコンテキストウィンドウを持つAIモデルを発表し、モデルが一度に処理できる情報量を大幅に拡大しました。同社は、このモデルが検索ベンチマークにおいてGPT-5.5を上回り、ロングコンテキストアテンションに通常伴う二次スケーリングの問題を解決したと主張しています。Subquadraticは将来的に5000万トークン版をリリースする予定です。
- • 1200万トークンのコンテキストウィンドウ。
- • 検索ベンチマークでGPT-5.5を上回ると主張。
- • 5000万トークンモデルの計画。
巨大なコンテキストウィンドウにより、開発者はコードベース全体や大規模なドキュメントリポジトリを単一のプロンプトで処理できるようになり、複雑なRAGアーキテクチャの必要性が低減します。
4. Anthropicがマネージドエージェント向けに「Dreaming」機能を導入
Anthropicは、Claude Managed Agents向けの「Dreaming」と呼ばれる研究プレビュー機能を導入しました。このプロセスにより、エージェントは最近のイベントやアクティビティログをレビューして重要な情報を特定・保存できるようになり、長期プロジェクトにおけるコンテキストウィンドウの制限を効果的に緩和します。セッション間で重要なデータを整理することで、複雑なマルチステップワークフローにおけるエージェントのパフォーマンスと記憶保持の向上を目指しています。
- • エージェントがログから重要な情報をレビュー・保存できる機能。
- • 長時間タスクにおけるコンテキストウィンドウの制限を緩和。
- • 現在、Managed Agents向けの研究プレビューとして利用可能。
この機能は、エージェントの長期記憶を管理するネイティブな方法を提供し、複雑なマルチステップ自動化ワークフローの開発を簡素化します。
5. CloudflareとStripeが自律型エージェントによるプロビジョニングを実現
CloudflareとStripeは提携し、コーディングエージェントがアカウントの作成、サブスクリプションの管理、ドメイン登録を自動的に行えるようにしました。この統合では、エージェントが本番環境のアプリケーションを直接デプロイできる新しいプロトコルを使用しています。不正な支出を防ぐため、システムにはエージェントに対して月額100ドルのデフォルト制限が設けられており、この機能は現在Stripe CLIを通じてオープンベータ版として利用可能です。
- • エージェントがCloudflareサービスのプロビジョニングとドメイン登録を実行可能に。
- • 安全な支払いトークン化のための新しいプロトコルを使用。
- • エージェントに対する月額100ドルのデフォルト支出制限。
この統合により、デプロイプロセスにおける手作業の摩擦が解消され、エージェントがインフラストラクチャのセットアップと請求を自律的に処理できるようになります。
6. CopilotKitが永続的なエージェントメモリのためのエンタープライズプラットフォームを立ち上げ
CopilotKitは、エージェントアプリケーション向けのマネージドインフラストラクチャ層を提供する「Enterprise Intelligence Platform」を立ち上げました。このプラットフォームは、コアプリミティブとして「Threads」を導入し、エージェントが異なるユーザー、デバイス、セッション間で永続的なコンテキストを維持できるようにします。生成UI、音声、マルチモーダル入力など、さまざまな対話タイプをサポートしており、SOC 2コンプライアンスやエアギャップ環境でのデプロイをサポートするエンタープライズ環境向けに設計されています。
- • 永続的なセッションメモリのための「Threads」を導入。
- • 生成UI、音声、マルチモーダル対話をサポート。
- • SOC 2コンプライアンスとエアギャップ対応を備えたエンタープライズ向け仕様。
永続的なメモリは本番グレードのエージェントにとって不可欠な要件であり、このプラットフォームはセッション間で状態を処理する標準化された方法を提供します。
7. HarveyとArtificial Analysisがリーガルエージェントベンチマークを公開
Artificial AnalysisはHarveyと提携し、複雑な法務タスクにおけるAIのパフォーマンスを測定するために設計された「Legal Agent Benchmark (LAB)」を立ち上げました。このベンチマークには、24の異なる法務分野をカバーする1,200のエージェントタスクが含まれており、2026年時点での法務セクターにおけるAIエージェントの能力を追跡・分析するための標準化された方法を提供します。
- • ベンチマークには1,200のエージェントタスクが含まれる。
- • 24の異なる法務分野をカバー。
- • 2026年時代のリーガルエージェントのパフォーマンスを追跡するように設計。
ドメイン特化型エージェントの標準化されたベンチマークは、開発者が高リスクな専門的ワークフローに対するモデルの適合性を評価するのに役立ちます。