1. Anthropicが企業導入数でOpenAIを追い抜く
2026年5月のRamp AI Indexのデータによると、企業AI支出に大きな変化が見られ、参加企業の34.4%がAnthropicのサービスに支払いを行っており、OpenAIの32.3%を上回った。OpenAIは依然として巨大な消費者基盤を維持しているが、Anthropicのビジネス導入数は過去1年間で4倍に増加しており、その主な要因はエージェント型コーディングツールの人気にある。この変化は、汎用的な消費者向けモデルよりも、専門的なエージェントワークフローに対する企業の選好が高まっていることを示している。
- • Anthropicのビジネス導入率は4月に34.4%に達し、OpenAIの32.3%を上回った。
- • Anthropicのビジネス導入数は過去1年間で4倍になった。
- • Claude Codeは、GitHubの全パブリックコミットの4%を作成していると推定される。
このマイルストーンは企業AI市場の転換点を示唆しており、Anthropicのエージェント型コーディングツールへの注力が、これまでOpenAIが独占していたビジネス予算をうまく獲得していることを示している。
2. AnthropicがAgent SDKクレジットを導入
Anthropicは、2026年4月に実施したClaudeサブスクリプションによるサードパーティ自律エージェントの利用禁止措置を撤回した。サブスクライバーは、プランに応じて20ドルから200ドルの固定月間クレジット(繰り越し不可)を受け取る。これらのクレジットはAPI料金で請求され、通常のチャット利用とは別枠となる。これは、エージェントがプロンプトキャッシュメカニズムをバイパスすることによって生じていた計算効率の低下に対処するためのもの。このポリシーは2026年6月15日までに完全に施行される。
- • Agent SDKクレジットは固定の月間割り当てであり、繰り越しはできない。
- • プログラムによる利用はAPI料金で請求され、対話型チャットの制限とは別枠となる。
- • このポリシー変更は、プロンプトキャッシュに関連する技術的な非効率性に対処するもの。
この変更により、開発者はサードパーティエージェントをClaudeと統合するための明確な道筋が得られると同時に、Anthropicは計算コストとインフラの安定性を管理できるようになる。
3. Fastino Labsがモデレーションモデル「GLiGuard」を公開
GLiGuardは、モデレーションを生成タスクではなくテキスト分類タスクとして扱うエンコーダーベースの安全性モデレーションモデルである。分類に焦点を当てることで、より大規模なデコーダー専用モデルよりも大幅に高いスループットと低いレイテンシを実現している。安全性分類、脱獄(ジェイルブレイク)検出、有害カテゴリ検出、拒否検出という4つの安全性次元を単一のフォワードパスで評価するため、本番環境グレードのAIガードレールに適している。
- • テキスト分類に最適化された300Mパラメータモデル。
- • 大規模なデコーダー専用モデルと比較して16.2倍高いスループットを実現。
- • 4つの安全性次元を単一のフォワードパスで評価。
AIアプリケーションを構築する開発者にとって、GLiGuardはリアルタイムの安全性モデレーションにおいて、より大規模なモデルに代わる軽量で効率的な選択肢を提供し、レイテンシと運用コストの両方を削減する。
4. ArdentがAIエージェント向けPostgresサンドボックスをローンチ
Ardentを使用すると、テラバイト規模のデータセットであっても、6秒以内にデータベースサンドボックスを立ち上げることができる。このプラットフォームは、レプリケーションストリームとコピーオンライト技術を使用して、本番データベースをミラーリングする分離環境を作成する。きめ細かなアクセス制御、認証情報の保護、自動PII(個人識別情報)マスキング機能が含まれており、AIエージェントが本番環境に近い状態でデータベース操作を安全にテストできる。
- • サンドボックスは6秒以内に起動。
- • ホストされているあらゆるPostgreSQLデータベースと互換性がある。
- • PIIマスキングとアクセス制御が組み込まれている。
AIエージェントを実際のデータベーススキーマに対してテストすることは、多くの場合遅くリスクを伴う。Ardentのアプローチにより、データベースアクセスを必要とするエージェントワークフローの反復をより迅速かつ安全に行うことが可能になる。
5. ModalがサーバーレスGPUスケーリングを最適化
ワークロードが大きく変動するAI推論において、サーバーレスコンピューティングはますます重要になっている。Modalはインフラを最適化し、新しいレプリカを迅速に立ち上げることで、推論容量をスケーリングするために必要な時間を数キロ秒からわずか数十秒に短縮した。この改善により、開発者はアイドル状態のGPU容量を維持することなく、予測不可能なトラフィックの急増により効果的に対応できるようになった。
- • スケーリング時間をキロ秒単位から数十秒単位に短縮。
- • 変動の激しい推論ワークロードに最適化。
- • GPU容量の過剰プロビジョニングの必要性を低減。
迅速なスケーリングは費用対効果の高いAI推論に不可欠であり、Modalのインフラ改善により、開発者は計算リソースの無駄を最小限に抑えながら、より応答性の高いアプリケーションを構築できる。
6. 26Mパラメータのオープンモデル「Cactus Needle」が登場
Cactus Needleは、Gemini 3.1から蒸留されたSimple Attention Network (SAN) である。わずか2600万パラメータで、MacやPCのハードウェア上でローカルに実行できるように設計されており、プリフィルで毎秒6,000トークン、デコードで毎秒1,200トークンの速度を実現する。モデルの重みは完全に公開されており、スマートフォンやウェアラブルなどのエッジデバイスにおけるAI機能を再定義することを目指している。
- • Gemini 3.1から蒸留された26Mパラメータモデル。
- • コンシューマーハードウェアでのローカルファインチューニングが可能。
- • プリフィルとデコードで高いトークンスループットを実現。
このモデルは、非常に効率的で小規模なモデルが特定のタスクをローカルで実行し、単純な対話のためにクラウドベースのAPI呼び出しを必要としない可能性を示している。
7. NotionがAIエージェント向け開発者プラットフォームをローンチ
Notionは、新しい開発者プラットフォームにより、生産性ソフトウェアをエージェント領域へと拡大している。このアップデートにより、チームは外部データソース、カスタムコード、AIエージェントをNotionワークスペースに直接接続できるようになった。この動きは、Notionがエージェントワークフローの中心的なハブとなる意図を示しており、ユーザーはアプリケーションを離れることなくタスクを自動化し、データと対話できるようになる。
- • 新プラットフォームは外部データとカスタムコードの統合をサポート。
- • チームがAIエージェントをNotionワークスペースに直接埋め込むことが可能。
- • エージェント型生産性ソフトウェアへの戦略的拡大。
ワークスペースをエージェントハブに変えることで、Notionは企業AIの主要なインターフェースとしての地位を確立し、開発者が仕事が行われる場所で直接動作するカスタムエージェントツールを構築できるようにしている。
8. 英国AI安全研究所がサイバー能力の急速な向上を報告
英国AI安全研究所(AISI)は、AIモデルが複雑なサイバータスクを完了する能力において急速に進歩していると報告している。Claude Mythos PreviewやGPT-5.5などのモデルでのテストでは、能力の倍増期間が約4.5か月であることが示されており、これは以前の推定よりも加速している。これらのモデルは現在、複雑なサイバーレンジ(演習環境)を解決する能力を備えており、パフォーマンスは本質的な能力よりもトークン使用量によって制限されているように見える。
- • サイバー能力の倍増期間は4.5か月と推定される。
- • 新しいモデルは複雑なサイバーレンジを解決することに成功している。
- • パフォーマンスは本質的な能力よりもトークン使用量によって制限されているように見える。
AIのサイバー能力の急速な進歩により、機密インフラと対話するエージェントシステムを構築する開発者にとって、新しいセキュリティフレームワークと監視戦略が必要となっている。