Cursorが独自コーディングモデル「Composer 2」をリリース

1. Cursorが独自コーディングモデル「Composer 2」をリリース

AIコードエディタのCursorが、エージェント型AI環境に統合された新しい独自モデル「Composer 2」をリリースしました。内部ベンチマークではClaude Opus 4.6を上回る性能を示した一方、GPT-5.4には及ばなかったと報告されています。このリリースにより、IDE内での自動コード生成の速度と精度向上が期待されます。

2. Microsoft、AIエージェント専用のパッケージマネージャーを公開

Microsoftが、AIエージェント向けに設計されたオープンソースの依存関係マネージャーを導入しました。開発者はYMLファイルでエージェントの依存関係を定義でき、クローンしたリポジトリ間での環境構築を標準化・高速化できます。既存のパッケージマネージャーともシームレスに連携する設計となっています。

3. Google、Google Colab向けの公式MCPサーバーをリリース

Googleが、Google Colab用の公式Model Context Protocol (MCP) サーバーを公開しました。この統合により、ローカルのAIエージェントがColabランタイムと直接対話できるようになり、クラウドGPU上でのPythonコードの記述、修正、実行をプログラムから制御することが可能になります。

4. Stripe、AIモデル向けの決済プロトコル「Machine Payments Protocol」を発表

Stripeが、新しい「Machine Payments Protocol」を通じてプログラム可能なLLMへの対応を発表しました。企業はAIモデルを決済フローに直接統合できるようになり、言語モデルを活用したカスタマイズ済みの自動決済体験を構築することが可能になります。

5. オープンソースリポジトリを狙ったプロンプトインジェクション攻撃が急増

人気リポジトリ「awesome-mcp-servers」の管理者が、Contributing.mdファイルに隠されたプロンプトインジェクションによる自動プルリクエストの急増を報告しました。リポジトリのドキュメントに埋め込まれた悪意ある指示が、自動PRレビューボットやAIコーディングアシスタントを乗っ取るリスクを浮き彫りにしています。

6. Anthropic、APIヘッダーを削除したOpenCodeに対し法的措置を開始

Anthropicが、User-Agentヘッダーを無断で削除したとしてOpenCodeに対する法的措置を開始しました。GitHub上の指摘により、OpenCodeのコード修正において、Anthropicやその他のサードパーティプロバイダーへリクエストを転送する際に識別用ヘッダーを意図的に削除するロジックが含まれていたことが判明しました。

7. OpenAI、Ruffやuvを手掛けるAstralを買収へ

OpenAIが、Ruffやuvなどの人気オープンソースPython開発ツールを運営するAstralを買収することを発表しました。OpenAIはこの買収によりCodexの成長を加速させ、Astralの高性能なツール群を自社エコシステムに統合することで、次世代のPython開発を強力に支援するとしています。

8. OpenAI、ChatGPTとCodexを統合したデスクトップ向け「スーパーアプリ」を計画

OpenAIが、ChatGPT、Codexアプリ、およびブラウザ機能を一つのデスクトップアプリケーションに統合する計画を進めていることが報じられました。リソースの集約とユーザー体験の簡素化を目的としており、特にエンジニアリングやビジネス分野の顧客ニーズに応える狙いがあります。

9. Claude Codeを用いた自律型AI研究のスケーリング実験が成功

16基のGPUを搭載したKubernetesクラスター上で、Claude Codeを8時間自律稼働させる新しい技術実験が行われました。エージェントは910回以上の実験を遂行し、ハイパーパラメータのスケーリングを最適化したほか、検証用にH200、スクリーニング用にH100を割り当てる手法を自律的に学習しました。

10. AIコーディングエージェントを制御する「Cook CLI」がリリース

Claude Code、Codex、OpenCodeなどのモデルをオーケストレーションするための新しいオープンソースツール「Cook」がリリースされました。開発者はターミナルから直接、コーディングタスクの並列実行や、複数モデルの出力を競わせて最適な結果を選択する、自動レビューループの管理などを行えます。

11. 百度（Baidu）、企業向けビジョン言語モデル「Qianfan-VL」をリリース

百度が、企業アプリケーション向けに最適化されたビジョン言語モデル「Qianfan-VL」シリーズを立ち上げました。複雑なドキュメント解析、光学文字認識（OCR）、視覚的推論など、産業分野のタスクに特化した設計となっています。

12. Multiverse Computing、主要AIモデルの圧縮版APIを公開

Multiverse Computingが、主要なAIモデルを高度に圧縮したバージョンのAPIとデモアプリをリリースしました。OpenAI、Meta、DeepSeek、Mistral AIなどのモデルの圧縮に成功しており、より広範で効率的なデプロイを可能にします。

13. Kitten TTS、オンデバイス向けの超軽量音声合成モデルをリリース

オープンソースプロジェクトのKitten TTSが、80M、40M、14Mパラメータの3つの新しいテキスト読み上げ（TTS）モデルを公開しました。表現力豊かなオンデバイス利用を想定しており、最小のモデルは25MB以下のストレージ容量で動作します。

14. NanoGPT Slowrun、データ効率を10倍向上させる手法を実証

研究チームが「NanoGPT Slowrun」を公開し、モデルサイズに対して膨大な計算量を投入することで、データ効率を10倍向上させられることを示しました。わずか1億トークンで学習した500万パラメータのモデルで高い性能を達成し、既存のスケーリング則に新たな視点を提示しています。

15. 難解プログラミング言語でLLMの推論力を測る「EsoLang-Bench」が登場

LLMの真の推論能力を評価するための新しいベンチマーク「EsoLang-Bench」が公開されました。難解プログラミング言語（Esoteric Language）を用いることで、モデルが学習データに含まれる標準的な構文の暗記に頼らず、論理的に推論できているかを検証します。

16. Vercel、6人のエンジニアで数百万ユーザーを支えるAIインフラの構築事例を公開

Vercelが、わずか6人のエンジニアチームで数百万社規模のAIプラットフォームをスケールさせたケーススタディを公開しました。インフラを単一のコードベースとプラットフォームに集約し、運用を簡素化することで、急速な成長に対応した詳細が語られています。

17. ICML、査読にLLMを使用した論文の2%を即時却下

国際機械学習会議（ICML）は、査読（ピアレビュー）の生成にLLMを使用したことが判明した投稿論文の2%をデスクリジェクト（即時却下）しました。会議の議長は、科学的誠実性の欠如とLLM利用に関するポリシー違反を理由に挙げています。

18. Canary、コードベースを分析してテストを自動化するAI QAエージェントを公開

YC支援のスタートアップCanaryが、品質保証（QA）を自動化するAIエージェントをリリースしました。このエージェントはコードベースを読み込み、プルリクエストによる変更内容を分析した上で、影響を受けるユーザーワークフローのテストを自動的に生成・実行します。

19. MaxSATソルバーを最適化する自律型研究エージェントがリリース

MaxSATソルバーの性能を最適化するために設計された自律型AIエージェントが公開されました。229件の重み付きMaxSATインスタンスを対象に、エージェントが反復的に自己学習を行い、専門家のようにソルバーのパフォーマンスを向上させます。

20. 生成UIのプロトコルとしてMarkdownを活用する手法が提案される

生成UIとAIエージェントのコード実行を統合するプロトコルとして、Markdownを活用するプロトタイプが公開されました。テキスト、実行コード、データを単一のストリームで扱うアーキテクチャを採用しており、コードブロックを利用してUIコンポーネントを動的にレンダリングすることが可能です。