Anthropic、Claude 4.6向けに100万トークンのコンテキストウィンドウを一般公開

1. Anthropic、Claude 4.6向けに100万トークンのコンテキストウィンドウを一般公開

Anthropicは、Claude Opus 4.6およびSonnet 4.6の100万トークンのコンテキストウィンドウを、追加料金なしの標準価格で一般公開しました。また、メディア制限を最大600枚の画像やPDFページまで拡大し、大規模な文書分析やマルチモーダルな検索タスクを支援します。

2. Claude、インタラクティブなチャートや図を作成する生成UIを導入

Anthropicは、フローチャート、棒グラフ、クリック可能な周期表などのインタラクティブな視覚化をチャットインターフェース内で直接生成できるベータ機能を発表しました。このシステムはインクリメンタルパースを使用してHTMLウィジェットをストリーミングし、アクティブなエージェントタスクを中断せずにサイドパネルで問い合わせができる「/btw」コマンドで呼び出せます。

3. GPT-5.4のベンチマーク、実世界のコーディングタスクで優れた性能を実証

実際の開発者セッションを利用したCursorBenchによる評価で、GPT-5.4は16Kトークン未満の使用量で他のフロンティアモデルを上回る性能を示しました。複雑な推論において人間の専門家レベル以上のスコアを記録しており、自律的な技術能力が飛躍的に向上したことを示唆しています。

4. NanoClawとDockerが提携、AIエージェントの安全なサンドボックス環境を提供

オープンソースのAIエージェントプラットフォーム「NanoClaw」はDockerと提携し、Dockerサンドボックス内でエージェントを実行することで、自律的なコード実行のための安全な環境を提供します。この統合により、エージェントの動作をホストシステムから隔離しつつ、コードの構築、テスト、検証を可能にし、企業のセキュリティ懸念に対処します。

5. Axiom Math、AI駆動の形式検証に向けて2億ドルを調達

Axiom Mathは、Leanプログラミング言語で機械検証可能な推論を生成する「Verified AI」システムを開発するため、シリーズAで2億ドルを調達しました。同社は数学的証明の検証から決定論的なコード検証へと移行し、統計的確率ではなく形式手法を通じてソフトウェアの正確性を保証することを目指しています。

6. Perplexityが「パーソナルコンピュータ」エージェントとフルスタックAPIを公開

Perplexityは、Mac mini向けにローカルファイルやアプリケーションへの常時アクセスを維持し、自律的にタスクを実行する永続的なAIエージェントシステムを導入しました。ハードウェア統合に加え、マルチステップのオーケストレーションやWebスケールの検索を実現する検索、エージェント、埋め込みAPIを含むフルスタックAPIプラットフォームも公開しました。

7. Google DeepMind、自律研究用AIエージェント「Aletheia」を発表

Aletheiaは、膨大な文献を探索し、長期的な証明を構築することで、競技レベルの数学と専門的な研究のギャップを埋めるために設計された専門AIエージェントです。自然言語による生成、検証、修正の反復プロセスを通じて、新しい数学的知見を発見します。

8. NVIDIA、Nemotron 3 SuperハイブリッドMamba-Transformerモデルをリリース

NVIDIAの新しい「Nemotron 3 Super」は、120Bパラメータのハイブリッドモデルでありながら、12Bのアクティブパラメータのみを使用してマルチエージェントシステムの処理能力を5倍に向上させます。100万トークンのコンテキストウィンドウをネイティブで備え、ソフトウェア開発やサイバーセキュリティのトリアージといった高負荷なワークロードに最適化されています。

9. AWS、10年来のS3バケットスクワッティング脆弱性を解決

AWSは、攻撃者が削除されたバケット名を再取得してトラフィックやデータを傍受する「バケットスクワッティング（またはバケットスナイピング）」というセキュリティ問題に対する解決策を実装しました。新しいメカニズムによりバケット名の管理方法が変更され、S3ユーザーにとっての繰り返されるセキュリティリスクが解消されました。

10. AIエージェントがMcKinseyのチャットボット「Lilli」を2時間で突破

セキュリティスタートアップのCodeWallは、AIエージェントが22の認証されていないAPIエンドポイントを悪用し、McKinseyの内部データベース「Lilli」への完全な読み書き権限を取得できることを実証しました。この侵害により機密のチャットメッセージやクライアントファイルが平文で露呈し、エンタープライズグレードのエージェント導入における重大な脆弱性が浮き彫りになりました。

11. Meta、内部性能の不足により次世代モデル「Avocado」のリリースを延期

Metaは、OpenAI、Google、Anthropicの主要モデルの性能に及ばなかったとして、次世代AIモデル「Avocado」のリリースを少なくとも5月まで延期したと報じられています。以前の内部バージョンよりは向上しているものの、この延期はフロンティアレベルのベンチマークを満たすための競争が激化していることを反映しています。

12. Google、都市の洪水予測に向けたデータセット「Groundsource」を公開

Google AI Researchは、Geminiを使用して500万件の非構造化ニュースレポートから構造化された履歴データを抽出する手法「Groundsource」を発表しました。このプロジェクトは260万件の都市型鉄砲水イベントのオープンソースデータセットを作成し、最大24時間前の洪水予測を可能にします。

13. 「スウォームネイティブ」なコーディングエージェント「Slate V1」が登場

Random Labsは、統一されたコード環境内で膨大な数のサブエージェントをプログラム的にオーケストレーションするフロンティアエージェント「Slate V1」を立ち上げました。このフレームワークは、新しいコンテキストエンジニアリングとキャッシュの最大化を通じて、深いコンテキストと長期的なタスクを管理するという「システム問題」の解決に焦点を当てています。

14. Context Gateway、エージェント向けのバックグラウンドプロンプト圧縮を実現

Context Gatewayは、AIエージェントとLLM APIの間に配置され、バックグラウンドで会話履歴を圧縮する新しいユーティリティです。開発者は、手動での履歴圧縮を待ったりトークン制限に達したりすることなく、Claude CodeやCursorなどのツールで長期コンテキストセッションを維持できます。

15. Stanford、ローカルファーストのエージェントフレームワーク「OpenJarvis」を公開

OpenJarvisは、スタンフォード大学で開発された個人用オンデバイスAIフレームワークで、知能、推論、メモリのための5つの構成可能なプリミティブを利用します。CLI、ブラウザ、デスクトップのユースケースをサポートし、すべてのデータがローカルマシン内に留まることを保証しつつ、自己改善ループを用いてエージェントの性能を洗練させます。

16. Algoliaの管理者キーが39のオープンソースドキュメントサイトで露呈

セキュリティ研究者が、Vue.jsを含む主要なドキュメントサイトで39個のAlgolia管理者APIキーが公開されていることを発見しました。これにより、検索インデックスの追加、削除、変更が可能な完全な権限が第三者に与えられていました。この露呈は、オープンソースエコシステム全体でDocSearchの実装方法に広範な設定ミスがあることを浮き彫りにしました。

17. スウェーデンの電子政府プラットフォームのソースコードが流出

CGI Sverige ABのインフラストラクチャが侵害されたことを受け、スウェーデンの電子政府プラットフォームの全ソースコードが流出しました。ByteToBreachという脅威アクターによるものとされるこの流出には、スウェーデン政府が管理する重要なデジタルサービスのコードが含まれています。

18. カタールのヘリウム供給停止、世界の半導体サプライチェーンを脅かす

イランのドローン攻撃を受けたカタールのRas Laffanヘリウムコンプレックスの操業停止により、世界のヘリウム供給の30%が市場から失われました。再開の目処が立たない中、SK hynixなどの主要半導体メーカーは、生産停止を避けるためにサプライチェーンの多様化を余儀なくされています。

19. AI大手各社、データセンターの電力に関する「料金負担者保護誓約」に署名

Amazon、Google、Meta、Microsoft、OpenAI、Oracle、xAIは、データセンターの需要による電気料金の値上げから米国の消費者を守る誓約に署名しました。各社は、拡大するAIインフラを動かすために必要な新しい発電設備や送電網のアップグレードに資金を提供することを約束しました。

20. MacBook Neoのベンチマーク、Windows VMとの互換性を確認

Appleの599ドルのMacBook Neoの初期テストにより、Parallels Desktopを使用してA18 Pro搭載デバイス上でWindows 11を仮想マシンとして実行できることが確認されました。基本的な操作性は安定していますが、データベースや開発などの集中的なワークロードに対するハードウェアの適合性を判断するため、完全な性能検証が進行中です。

21. Microsoft、パーソナライズされた医療インサイトを提供する「Copilot Health」を発表

Microsoftは、50以上のウェアラブルデバイス、5万の病院のEHR記録、検査結果からのデータを統合する安全なAI環境「Copilot Health」を立ち上げました。このツールは、サイロ化された医療データを分析して一貫した「健康ストーリー」を提供し、ユーザーに直接パーソナライズされたインサイトを提供することを目指しています。

22. Spine Swarm、マルチエージェントコラボレーションのためのビジュアルキャンバスを公開

Spine Swarmは、財務モデリングやSEO監査などの複雑な非コーディングプロジェクトを実行するために、無限のビジュアルキャンバス上で動作する新しいマルチエージェントシステムです。ユーザーは複数のエージェントを同時にオーケストレーションし、構造化された計画と視覚化を必要とする長期的なタスクを処理できます。

23. TUI Studio、ターミナルアプリ向けのビジュアルデザイン環境を提供

TUI Studioは、ターミナルユーザーインターフェース（TUI）アプリケーション向けの新しいビジュアルエディタで、リアルタイムのANSIプレビューを備えたFigmaのようなドラッグ＆ドロップキャンバスを提供します。FlexboxやGridなどのレイアウトモードをサポートし、ワンクリックで6種類のTUIフレームワークにデザインをエクスポートできます。

24. xAI、Grokのコーディング製品開発に向けてCursorの製品リーダーを採用

イーロン・マスク氏率いるxAIは、Grokのコーディング機能を加速させるため、Cursorからシニア製品エンジニアのAndrew Milich氏とJason Ginsberg氏を採用しました。この動きは、現在50億ドル以上と推定される、支払い意欲の高い開発者市場への参入を意図していることを示しています。

25. Googleマップ、Geminiを統合し会話型検索と3Dナビゲーションを実現

Googleマップは、微妙な場所のクエリに対応する会話型インターフェース「Ask Maps」と、3Dビューやリアルタイムのストリートビュー分析を使用して車線案内を行う「Immersive Navigation」を展開しました。これらのアップデートはGeminiを活用し、3億件の場所やレビューのデータを統合してパーソナライズされた旅行計画を提供します。