Google、マルチモーダルモデル「Gemma 4」をApache 2.0ライセンスで公開

1. Google、マルチモーダルモデル「Gemma 4」をApache 2.0ライセンスで公開

Googleは、マルチモーダル対応のオープンウェイトモデル「Gemma 4」ファミリーをリリースしました。ラインナップは2B、4B、31B、および26BのMoEモデルで構成され、テキスト、画像、音声、動画の入力をサポートし、最大256kトークンのコンテキストウィンドウを備えています。特筆すべき点として、従来の独自利用制限を撤廃し、全モデルを標準的なApache 2.0ライセンスで公開しました。31Bおよび26Bモデルは単一のH100で動作可能で、Qwen3.5などの競合モデルに匹敵する高い推論性能を示しています。

2. Cursor 3が登場、マルチエージェント・ワークスペースとクラウド・ローカル間の引き継ぎ機能を搭載

AIコードエディタのCursorがバージョン3をリリースし、マルチエージェントによるソフトウェア開発に特化したインターフェースへと刷新されました。このアップデートでは、複数のリポジトリにまたがってローカルおよびクラウドのエージェントを並列実行できる統合ワークスペースが導入されています。また、エージェントのセッションをクラウド環境からローカルデスクトップへシームレスに引き継げる新機能により、テストや反復作業が容易になりました。さらに、ローカルサイトを確認しながらプロンプトを入力できる内蔵ブラウザや、MCPプラグイン用のマーケットプレイスも追加されています。

3. Arcee AI、推論特化型モデル「Trinity Large Thinking」を公開

Arcee AIは、複雑で長期的なタスクを実行するエージェントや、マルチターンのツール呼び出しに最適化されたオープンウェイトの推論モデル「Trinity Large Thinking」をリリースしました。このモデルは、出力の質を落とすことなく、複数回のやり取りにおける一貫性の維持や、ツール使用時の厳格な制約遵守に重点を置いて設計されています。現在はArceeのAPI経由で利用できるほか、Hugging FaceにてApache 2.0ライセンスで重みが公開されています。

4. 「LLM-as-a-Judge」ワークフローにおけるプロンプトインジェクションの脆弱性が判明

新しい調査報告により、履歴書や論文などの文書内にプロンプトインジェクションを仕込むことで、自動評価を行うLLM（LLM-as-a-Judge）を操作できることが明らかになりました。検証の結果、旧世代や小規模なモデルはこの攻撃に対して非常に脆弱である一方、最新のフロンティアモデルの多くは耐性を備えていることが分かりました。しかし、フロンティア級モデルの中で唯一、Gemini 3はこの特定のインジェクション攻撃に対して脆弱であることが指摘されています。LLMを自動評価に利用する開発者は、埋め込み型攻撃に対するモデルの耐性を確認する必要があります。

5. IBM、文書データ抽出に特化した「Granite 4.0 3B Vision」をリリース

IBMは、企業の文書データ抽出向けに設計されたビジョン言語モデル「Granite 4.0 3B Vision」をリリースしました。このモデルは、単一の巨大なマルチモーダル構造ではなく、軽量な言語モデル「Granite 4.0 Micro」をバックボーンとした専用アダプターとして機能するのが特徴です。この設計により、構造化データの抽出タスクにおいて、高精度な視覚的推論を実現しています。

6. 富士通、LLM量子化ライブラリ「One Compression」をオープンソースで公開

富士通は、大規模言語モデル（LLM）の学習後量子化（PTQ）を行うためのオープンソースPythonライブラリ「One Compression（OneComp）」を公開しました。このライブラリは、GPTQやDBFといった最新の量子化アルゴリズムを実装しています。TinyLlama、Llama-2、Llama-3、および最大32BパラメータまでのQwen3ファミリーなどのモデルで動作が公式に検証されています。