1. NVIDIAがNemotron 3 Super 120Bハイブリッドモデルを発表
NVIDIAは、状態空間モデルとトランスフォーマーを組み合わせ、アクティブパラメータ数を12Bに抑えた120Bパラメータのハイブリッドモデル「Nemotron 3 Super」を発表しました。100万トークンのコンテキストウィンドウを備え、従来比5倍のスループットを実現し、大規模なマルチエージェントシステム向けに最適化されています。
2. GoogleがマルチモーダルなGemini Embedding 2をリリース
Googleは、テキスト、画像、動画、音声を単一の数値空間に統合するマルチモーダルモデル「Gemini Embedding 2」をリリースしました。出力次元をカスタマイズできるMatryoshka表現学習をサポートしており、本番環境のRAGパイプラインを最適化するように設計されています。
3. AmazonがPerplexityのショッピングエージェントに対する差し止め命令を獲得
米国の裁判所は、PerplexityのCometブラウザがユーザーに代わってAmazonで商品を購入することを禁止する仮差し止め命令を出しました。この判決により、PerplexityはAmazonのサイト制限を回避するエージェントの使用停止と、スクレイピングしたデータの破棄を求められています。
4. METRの分析により、SWE-benchのPRの半分がマージ不可であることが判明
METRの研究によると、SWE-bench Verifiedベンチマークを通過したPRの約半分は、現実のシナリオではメンテナーによってマージされないことが示されました。現在のベンチマークは、本番環境で必要な人間のような反復やフィードバックループを考慮しておらず、エージェントの準備状況を過大評価している可能性があると指摘しています。
5. Perplexityが「Personal Computer」AIオペレーティングシステムを発表
Perplexityは、Mac mini上でローカルに動作するAIネイティブなOSプロキシ「Personal Computer」を発表しました。このシステムは、ローカルファイルやアプリにアクセスできる常時稼働のエージェントを提供し、機密性の高い操作にはユーザーの承認を求めつつ、セッションをまたいで自律的に目標を実行します。
6. Microsoftが1ビットLLM推論用フレームワーク「bitnet.cpp」をリリース
Microsoftは、BitNet b1.58のような1ビットLLM向けの公式推論フレームワーク「bitnet.cpp」をリリースしました。標準的なCPUでのロスレス推論を可能にし、ARMアーキテクチャで最大5倍の高速化を実現することで、大規模モデルのローカル展開を容易にします。
7. Claude Codeがアップデート:自動メモリとアプリ間コンテキスト共有
AnthropicはClaude Codeをアップデートし、永続的なマークダウンファイルによる自動メモリ機能と、Microsoft ExcelやPowerPoint間でのコンテキスト共有機能を追加しました。また、自動プルリクエスト分析とバグ検出を行うマルチエージェント「Code Review」システムも導入されました。
8. Googleの研究:多様な対戦相手を通じてエージェントが協調を学習
Googleの研究者は、LLMエージェントが予測不可能な多様な対戦相手との訓練を通じて、マルチエージェントシステム内での協調を学習できることを発見しました。このアプローチはハードコードされた調整ルールを不要にし、企業向けエージェント展開においてよりスケーラブルで計算効率の高い設計図を提供します。
9. 産業用ロボットへの資金調達:Mind RoboticsとRhoda AI
RivianからスピンアウトしたMind Roboticsは産業用AIロボット開発のために5億ドルを調達し、Rhoda AIは公開インターネット動画で学習したモデルのために4億5000万ドルを調達しました。両社は、製造や物流環境で複雑な物理タスクを自動化する高度な自律システムの展開を目指しています。
10. ElevenLabsがマルチモーダルプラットフォーム「ElevenCreative」を立ち上げ
ElevenLabsは、音声と動画の生成およびローカライズを行うブラウザベースのプラットフォーム「ElevenCreative」を立ち上げました。音声クローン、テキスト読み上げ、AI動画生成を統合し、単一のインターフェースで70以上の言語をサポートしています。
11. Fish AudioのS2-Proが150ms未満のTTSレイテンシを達成
Fish Audioは、150ms未満のレイテンシで表現力豊かな音声合成が可能な大規模オーディオモデル(LAM)「S2-Pro」をリリースしました。ゼロショット音声クローンと詳細な感情タグ付けをサポートしており、統合されたオーディオアーキテクチャへの移行を示しています。
12. Claude Code向けのコンテキスト認識型権限ガードがリリース
Claude Code向けのコンテキスト認識型権限ガードとして「nah」ツールがリリースされました。単純な許可・拒否を超え、ファイル削除やgitチェックアウトなどの機密操作に対して開発者が詳細なルールを定義することで、自律エージェントによる壊滅的なシステム変更を防ぎます。
13. AIネットワークインフラ:Nexthop AIとEridu
Nexthop AIはハイパースケールデータセンターの消費電力とレイテンシを削減する専用スイッチのために5億ドルを調達しました。同時に、Eriduは大規模GPUクラスター向けの高性能AIネットワーク機器を構築するため、2億ドルを調達してステルス状態から脱却しました。
14. LLMfitユーティリティがハードウェア互換性に基づいてモデルをランク付け
LLMfitは、ローカルハードウェアをスキャンし、特定のCPU、RAM、GPU構成との互換性に基づいてLLMをランク付けする新しいユーティリティです。メモリと計算の制約を分析することで、開発者がデバイス上での実行に最も効率的なモデルを選択するのを支援します。
15. Difyがオープンソースのエージェントワークフロープラットフォームで3000万ドルを調達
Difyは、エージェントワークフローを構築・運用するためのオープンソースプラットフォームで3000万ドルを調達しました。このプラットフォームは、メモリ、ツール管理、セキュリティ制御を統合したAIアプリケーションを展開するための構造化された環境を提供します。
16. Expo Agentが自然言語からネイティブアプリをコンパイル
Expo Agentは、自然言語のプロンプトからネイティブのiOSおよびAndroidアプリケーションを生成・コンパイルする新しいツールです。React Native、SwiftUI、Jetpack Composeをサポートしており、ブラウザベースでのモバイルアプリ展開とテストを可能にします。
17. NotebookLM-pyがリサーチツール用のPython APIを提供
NotebookLM-pyは、GoogleのNotebookLM向けのPython APIとCLIを提供し、Webインターフェースでは利用できない機能へのプログラムによるアクセスを可能にします。これにより、研究者はNotebookLMの要約や検索機能を自動化されたデータ処理パイプラインに統合できます。
18. AnthropicがAI政策のための研究機関を設立
Anthropicの共同創業者であるJack Clarkは、AIが経済、法律、ガバナンスに与える影響を研究する新しい研究機関を率いています。この機関はフロンティアモデルのデータに直接アクセスし、AIの社会的役割に関する政策や規制の議論に情報を提供します。
19. WiFi-DensePoseがWiFi信号を通じて身体位置を再構築
研究者は、標準的なWiFi信号を使用してリアルタイムで全身の位置を再構築するシステム「WiFi-DensePose」を開発しました。この技術は、標準ハードウェアに存在するチャネル状態情報を分析することで、カメラやウェアラブルなしで壁越しに身体部位をマッピングします。
20. Temporal APIの実装によりJavaScriptの日付処理を修正
Bloombergのエンジニアは、Dateオブジェクトの長年の問題を修正するためにJavaScriptでTemporal APIを実装する9年間の取り組みについて詳細を報告しました。新しいAPIは、日付、時刻、タイムゾーンを処理するためのより堅牢で型安全な方法を提供し、グローバルなソフトウェアシステムの信頼性を向上させます。
21. MozillaがWebAssemblyをファーストクラス言語にするロードマップを概説
Mozillaは、WebAssemblyをWeb上のファーストクラス言語にする計画を概説し、高レベル言語向けの機能を拡張しています。最近のアップデートには、共有メモリ、SIMD、例外処理のサポートが含まれており、計算負荷の高い複雑なWebアプリケーションのパフォーマンスを向上させます。
22. ReplitがAIインフラブームの中で90億ドルの評価額に到達
Replitは4億ドルの資金調達ラウンドを経て90億ドルの評価額に達し、年末までに10億ドルのARR(年間経常収益)を目指しています。同社はAIを活用した開発環境を拡大し続け、共同作業やエージェントコーディングのための主要プラットフォームとしての地位を確立しています。
23. OracleがAI需要によりクラウド収益が44%増加したと報告
Oracleは、AIインフラへの需要によりクラウド収益が44%増の89億ドルに達したと報告しました。第3四半期の総収益は171億9000万ドルに達し、大規模なAIワークロードのホスティングやフロンティアモデルのトレーニングに必要な計算リソースの提供における同社の役割の拡大を反映しています。
24. Zendeskがエージェント型カスタマーサービスのForethoughtを買収
Zendeskは、AI主導のサポート機能を強化するために、エージェント型カスタマーサービススタートアップのForethoughtを買収しました。この買収により、Forethoughtの自律的な解決技術がZendeskのサービスプラットフォームに統合され、複雑な顧客対応が自動化されます。
25. WordPressがプライベートワークスペース「my.WordPress.net」を立ち上げ
WordPressは、ホスティングやサインアップなしでサイトを作成できるブラウザベースのプライベートワークスペース「my.WordPress.net」を立ち上げました。このサービスは、執筆、リサーチ、およびブラウザ内でのAIツール統合のための個人的な環境として設計されています。