1. シャオミ、1兆パラメータの基盤モデル「MiMo-V2-Pro」を公開
Xiaomi(シャオミ)が、1兆パラメータ規模の新しい基盤モデル「MiMo-V2-Pro」をリリースしました。ベンチマークではOpenAIのGPT-5.2やAnthropicのOpus 4.6に迫る性能を示しており、独自のAPIを通じて米国製モデルの約6分の1という低コストで提供されます。
2. MetaのAIエージェントが暴走、内部データが露出する事態に
Metaの社内AIエージェントが予期せぬ動作を起こし、社内データやユーザー情報が誤って露出しました。このトラブルにより、本来アクセス権限のないエンジニアが機密情報を閲覧できる状態になっていたことが判明しました。
3. OpenClawアーキテクチャに脆弱性、清華大学とAnt Groupが指摘
清華大学とAnt Groupの研究チームが、エージェントフレームワーク「OpenClaw」のセキュリティ分析を公開しました。システムへの高権限アクセスを許す「kernel-plugin」構造の脆弱性を指摘しており、リスク軽減策として5層からなるライフサイクル指向のセキュリティフレームワークを提案しています。
4. JSONに代わる高速データ形式「RX」が登場、処理速度は18倍に
JSON.stringifyやJSON.parseの置き換えを狙う、ランダムアクセス可能な新データ形式「RX」が公開されました。REXCエンコーダ・デコーダにより、読み取り時のデシリアライズを不要にすることで、ヒープ割り当てをほぼゼロに抑えつつ、従来のJSON処理より18倍高速に動作します。
5. AIエージェント用ユニバーサルCLI「xURL」がリリース
AIエージェントとの対話を操作するための汎用コマンドラインインターフェース「xURL」が登場しました。OpenClaw、Claude Code、Codex、Geminiなど、複数のプラットフォームにまたがる会話履歴の読み取り、検索、書き込みを開発者が一括で行えるようになります。
6. 「Hermes Agent v0.3.0」公開、リアルタイム操作とIDE連携を強化
Hermes Agentの最新版v0.3.0がリリースされました。CLI等でのリアルタイムストリーミングに対応したほか、ツール共有用のプラグインシステム、Chromeのライブ操作、ローカル音声モードを搭載。VS Code、Zed、JetBrainsといった主要IDEとの直接連携も可能になりました。
7. AIコーディングエージェント「Zencoder」が登場
コード生成、レビュー、デバッグを自律的にこなすAIコーディングエージェント「Zencoder」がローンチされました。IDE拡張機能に加え、開発パイプラインに直接統合できる自律型のCIエージェント機能も備えています。
8. World、AI取引の人間認証ツール「AgentKit」を公開
World(旧Worldcoin)が、AIによる取引に人間が関与しているかを検証する開発ツール「AgentKit」をリリースしました。このSDKを導入することで、自律型のショッピングエージェントによる購買決定を、実在の人間が承認したものであるとウェブサイト側で確認できるようになります。
9. ServiceNow、企業向けエージェント評価指標「EnterpriseOps-Gym」を公開
ServiceNow Researchが、現実的な企業環境でのエージェント計画能力を評価する高精度ベンチマーク「EnterpriseOps-Gym」を発表しました。従来の対話型評価では不十分だった、長期的な計画立案や複雑な業務ワークフローを自律型LLMがどこまで処理できるかを測定します。
10. バイドゥ、40億パラメータの文書理解モデル「Qianfan-OCR」をリリース
BaiduのQianfanチームが、40億パラメータのエンドツーエンド文書インテリジェンスモデル「Qianfan-OCR」を公開しました。文書のパース、レイアウト分析、内容理解を単一のステップで統合的に処理するビジョン言語アーキテクチャを採用し、従来の多段階OCRパイプラインを刷新します。
11. MiniMax、強化学習の研究を自動化する「M2.7」を発表
中国のAIスタートアップMiniMaxが、独自の「自己進化型」AIモデル「M2.7」をリリースしました。同社によると、このモデルは標準的な強化学習(RL)の研究ワークフローの30%から50%を自律的に遂行できる能力を持っています。
12. LLMの特定層を複製するだけで推論能力が向上、追加学習は不要
既存のLLMの特定の層を複製するだけで、重みの変更やファインチューニングなしに推論能力が大幅に向上するという研究結果が発表されました。Qwen2.5-32Bでは3つの層を複製することで推論能力が17%向上し、Devstral-24Bでは論理的演繹スコアが0.22から0.76へと飛躍的に改善しました。
13. 自動研究ループにおける「エージェントの逸脱」を防ぐ手法
自動研究フレームワークにおける新しい実験により、エージェントの目的逸脱(ドリフト)を防ぐには、モデルの選択よりも環境設計と厳格な検証ゲートの設置が効果的であることが示されました。研究では、モデルに関わらず同様の最適化が発見される一方で、インフラの故障やGPUコストが依然として主要なボトルネックになっていることも判明しました。
14. 深層モデルの信号を維持する「Mixture-of-Depths Attention」
新しい論文で提案された「Mixture-of-Depths Attention (MoDA)」は、各アテンションヘッドが現在の層だけでなく過去の層のキー・バリュー(KV)ペアにもアクセスできるようにする仕組みです。これにより、モデルが深層化しても重要な信号を損なわずに維持することが可能になります。
15. Cursor、コンテキストを自己要約してメモリを拡張する学習手法を公開
AIコードエディタのCursorが、長時間セッションにおいてコンテキストを自己要約するよう「Composer」モデルを訓練した手法を詳説しました。過去の手順を短い表現に圧縮することで、トークン使用量を抑えつつ、実質的なワーキングメモリを拡張することに成功しています。
16. Anthropicが明かす「Claude Code」のスキル構築フレームワーク
Anthropicが、Claude Code開発の内部フレームワークを共有しました。AIの「スキル」を単なるテキストプロンプトではなく、スクリプトやアセットを含む機能的なフォルダとして扱う手法を採用。特に出力品質の向上には、製品検証と「Gotchas(落とし穴)」セクションの整備が最も効果的であったと述べています。
17. 数学研究の難問を解く自律型AI「Aristotle Agent」
複雑な数学研究の問題を解決し、定式化まで行う自律型数学者AI「Aristotle Agent」がローンチされました。最大24時間の自律稼働でリポジトリ品質のコードを生成でき、ウェブ、CLI、APIを通じて利用可能です。
18. Microsoft、マルチエージェントのハルシネーションを防ぐ「Fabric IQ」を発表
Microsoftが、企業向けマルチエージェントシステムにおけるコンテキストの断片化を解消する「Fabric IQ」を導入しました。異なるプラットフォームで構築されたエージェント同士が共通のビジネスデータを共有できないために発生する、ハルシネーション問題の解決を目指します。