1. Googleが高速なエージェント機能を備えたGemini 3.5 Flashをリリース
Googleは年次開発者会議にて、Gemini 3.5 Flashモデルを正式に発表しました。このモデルは複雑なエージェントタスクやソフトウェアエンジニアリングタスクに最適化されており、Terminal-Bench 2.1(76.2%)やMCP Atlas(83.6%)などのベンチマークで優れた性能を発揮します。毎秒280トークンを超える出力速度で動作し、前世代と比較して劇的な高速化を実現しました。Shopify、Salesforce、Databricksなどのパートナー企業によるエンタープライズ導入もすでに始まっています。
- • 毎秒約300トークンの出力を実現
- • 価格は入力100万トークンあたり1.50ドル、出力100万トークンあたり9.00ドル
- • キャッシュされた入力トークンに対して90%の割引を提供
- • Terminal-Bench 2.1(76.2%)およびMCP Atlas(83.6%)でGemini 3.1 Proを上回る性能
- • 100万トークンのコンテキストウィンドウを維持
高スループットのコーディングやエージェントタスクにおいて、高性能かつ費用対効果の高い代替手段を提供します。
2. GoogleがデスクトッププラットフォームおよびCLI「Antigravity 2.0」を発表
GoogleはAntigravity 2.0を発表し、開発者ツールをスタンドアロンのデスクトップアプリケーションへと刷新しました。このエコシステムには、ターミナルベースの操作用CLI、開発者SDK、Gemini Enterprise Agent Platformが含まれます。開発者はGemini API内のManaged Agentsを活用し、分離されたステートフルなLinux環境でエージェントを実行できます。プラットフォームはデフォルトでGemini 3.5 Flashを使用し、高速かつ並列的なバックグラウンドタスク処理を可能にします。
- • カスタムエージェント動作のためのCLIとSDKを同梱
- • 分離されたLinux環境向けにGemini APIのManaged Agentsを提供
- • エコシステム全体でGemini 3.5 Flashをデフォルトモデルとして採用
- • マルチエージェントオーケストレーションと並列タスク実行をサポート
永続的な状態を持つマルチエージェントオーケストレーションを実行するための、ネイティブで安全なインフラストラクチャを提供します。
3. AnthropicがClaudeエージェント向けにセルフホスト型サンドボックスとMCPトンネルを導入
Anthropicは、Claude Managed Agents向けにセルフホスト型サンドボックスとMCPトンネルを導入することで、エンタープライズにおける主要なセキュリティ懸念に対処しました。このアーキテクチャは、コアとなるエージェントロジック(Anthropicのクラウドインフラ上で実行)と、ツール実行(開発者のローカル環境内で安全に実行)を明確に分離します。MCPトンネルにより、エージェントはLLMのプロンプトコンテキスト内に機密性の高い認証トークンを渡すことなく、プライベートなMCPサーバーに安全に接続できます。
- • セルフホスト型サンドボックスは現在パブリックベータ版
- • MCPトンネルはリサーチプレビュー版
- • エージェントループとローカルエンタープライズシステム上のツール実行を分離
- • エージェントコンテキスト内での認証情報の露出を防止
ツール実行中にエージェントのコンテキストウィンドウ内でAPI認証情報が漏洩するという重大なセキュリティリスクを解決します。
4. AIコーディングエージェントを標的とした600以上のnpmパッケージがサプライチェーン攻撃で侵害
npmレジストリに対する巧妙なサプライチェーン攻撃により、323のユニークなパッケージにわたる600以上のバージョンが侵害されました。主に@antv可視化エコシステムやtimeago.jsなどのライブラリが標的となっています。「Mini Shai-Hulud」と呼ばれるこのペイロードは、ローカルのVault、Kubernetes、AWSから極めて機密性の高い開発者認証情報を収集します。重要な点として、このマルウェアは注入されたスタートアップフックを介してClaude CodeやCodexの設定を乗っ取り、さらにローカルのVS Codeタスクを改ざんしてセッション開始時に再実行させることで永続性を確立します。
- • @antv/g2を含む@antvエコシステムおよびダウンロード数の多いライブラリが標的
- • AWS、Kubernetes、HashiCorp Vault、ローカルパスワードマネージャーの認証情報を流出させる
- • SessionStartフックを介してClaude CodeとCodexを乗っ取る
- • このキャンペーンにより2,900以上のGitHubリポジトリが生成された
開発者は、悪意のあるスクリプトによるローカルコーディングアシスタントの乗っ取りやクラウドキーの盗難を防ぐため、直ちに依存関係を監査する必要があります。
5. Forge信頼性レイヤーがローカル8Bモデルのツール呼び出し精度を99%に向上
Texas InstrumentsのAIディレクターであるAntoine Zambelli氏は、セルフホスト型LLMのツール呼び出し用に設計されたオープンソースの信頼性レイヤー「Forge」をリリースしました。Forgeは、堅牢なエラーリカバリメカニズム、再試行プロンプト、ステップ強制を実装し、ローカルモデルが複雑なマルチステップワークフローで失敗するのを防ぎます。さらに、起動時にnvidia-smiを使用して利用可能なVRAMに基づいた厳格なトークン予算を計算することで、メモリ不足エラーを動的に防止します。
- • Ministral 8Bのマルチステップエージェント精度を99.3%に向上
- • nvidia-smiでトークン予算を照会し、VRAMオーバーフローを防止
- • ToolResolutionError例外クラスを導入
- • OpenAI互換クライアント向けのプロキシサーバーモードを同梱
開発者は、信頼性を犠牲にすることなく、複雑なマルチステップワークフローのためにコスト効率の高い小型の8Bローカルモデルをデプロイできるようになります。
6. Claude Codeプラグインがバンドルされたエージェントサブエージェントとカスタムスキルを可能に
Claude Codeプラグインの詳細調査により、エージェント機能が中央のplugin.jsonマニフェストを中心に構造化されていることが明らかになりました。これらのプラグインは、カスタムスラッシュコマンド、分離されたコンテキストを持つサブエージェント、およびモデルが説明文を通じて自動的に呼び出すSKILL.mdファイルに概説された特定のスキルを配布できます。現在、この形式を利用できる主要なエージェントはClaude CodeとオープンソースのQwen Codeのみです。
- • plugin.jsonマニフェストを持つディレクトリを使用
- • スキルはSKILL.mdファイルを介してマークダウンで設定
- • 自動呼び出し可能なスキル、スラッシュコマンド、サブエージェントのバンドルが可能
- • Claude CodeおよびオープンソースのQwen Codeエージェントがサポート
チーム間でカスタムエージェント機能を配布およびバージョン管理するための具体的なパターンを提供します。
7. 開発者が大規模PythonコードベースをローカルのQwen 3.6 35Bへ移行
Pygameプロジェクトを構築中の開発者が、Claude Sonnet 3.5からOllamaとClineでローカル実行するQwen3.6-35Bへの移行事例を共有しました。Sonnet 3.5はコードベースのコンテキスト制限と繰り返されるバグ修正に苦戦していたとのことです。ローカルハードウェア上で250kのコンテキストウィンドウを備えたQ6_K量子化の35B Qwenモデルをデプロイすることで、商用APIでは解決できなかった複雑なマルチモジュール問題をデバッグすることに成功しました。
- • 55モジュールにわたる3万行のPygameプロジェクトを開発
- • Claude Sonnet 3.5からQwen3.6-35B-A3B-UD-Q6_Kへ切り替え
- • 56GBのVRAMを搭載したカスタムローカルGPUで250kのコンテキストウィンドウを実行
- • 商用モデルのコンテキスト長制限と過度なAPIコストを回避
ローカルのオープンウェイト設定が、大規模なコードベースを維持するためのClaude Sonnetの実行可能な代替手段であることを示しています。
8. エージェントワークフローにおけるUpstash、Supabase、Neonの比較
エージェント主導のソフトウェア開発に向けたバックエンドデータベースの分析により、Upstash、Supabase、Neonの役割の違いが明らかになりました。Neonは、コピーオンライトのデータベースブランチングとスケール・トゥ・ゼロの特性によりエージェント環境で優れており、データベースの80%以上がAIエージェントによって自律的にプロビジョニングされています。Upstashは、SupabaseのPostgreSQLのようなトランザクションデータベースの上位で、高速なキャッシュおよびレート制限層として機能します。
- • Neonデータベースの80%以上がAIエージェントによってプロビジョニングされている
- • Neonはコンピューティングとストレージの分離およびコピーオンライトのデータベースブランチングを提供
- • Supabaseの無料枠は50,000 MAUと1GBのストレージを提供
- • Upstashはサーバーレス向けのHTTPベースのRedisキャッシュとレート制限を提供
どのデータベースアーキテクチャがAIエージェント環境に適しているかを知ることは、開発者のワークフローとインフラコストの最適化に役立ちます。
9. OpenAI APIを使用したマルチロールエージェントパイプライン構築のブループリント
新しく公開されたチュートリアルでは、OpenAI APIを使用して高度なエージェントシステムを構築するための明確なアーキテクチャを開発者に提供しています。ワークフローは、構造化されたJSONタスクプランを作成する「プランナー」、特定のPythonツールを実行する「実行者」、最終決定前に出力をレビューおよび修正する「批評家」という3つの異なるモデルロールに分かれています。状態追跡は、AgentStateデータクラスを使用してツール実行履歴とメモリを記録することで堅牢に管理されます。
- • パイプラインをプランナー、ツールを使用する実行者、批評家の役割に整理
- • AgentStateデータクラスを使用して目標、メモリ、ツールトレースを記録
- • 安全な計算機、検索、JSON抽出器、ファイルライターの4つのツールを実装
- • 実行フローを指示するために構造化されたJSONプランを利用
エラーハンドリングと自己批評機能を備えた、マルチステップタスク向けの、実用的で本番環境に対応した設計パターンを提供します。
10. NVIDIAが高速なNemotron-Labs-Diffusion言語モデルをリリース
NVIDIAは、自己回帰デコーディング、並列拡散デコーディング、自己推測の間を動的に切り替えられる新しいトライモードアーキテクチャで設計されたNemotron-Labs-Diffusion言語モデルファミリーをリリースしました。このオープンウェイトファミリーは3B、8B、14Bサイズで利用可能です。ベンチマークによると、8BパラメータのバリアントはGB200ハードウェア上で毎秒850トークンに達し、従来の自己回帰モデルと比較して3.3倍の高速化を実現しています。
- • 自己回帰、拡散並列デコーディング、自己推測をサポート
- • Hugging Faceにて3B、8B、14Bサイズで利用可能
- • 8BパラメータでGB200ハードウェア上にて毎秒850トークンに到達
- • SGLangにおいてQwen3-8B-Eagle3よりも3倍高い受け入れ長を達成
これらのモデルは、コストに敏感な開発者向けに、極めて高速なローカル推論オプションを提供します。
11. MiniCPM-V 4.6ビジョン言語モデルがHugging Faceのトレンド入り
MiniCPM-V 4.6は、その高効率なビジョン言語処理が注目を集め、Hugging Faceのトレンドリストで1位を獲得しました。このモデルは、同等のモデルのトークン予算のわずか2.5%を使用しながら、きめ細かなOCR、複雑な画像推論、マルチターン会話を実現します。完全にオープンソース化されており、llama.cpp、vLLM、Ollamaなどの一般的なランタイムで即座にサポートされています。
- • 主要なマルチモーダルベンチマークでGemma4-E2B-itおよびQwen3.5-0.8Bを上回る性能
- • Qwen3.5-0.8Bと比較してトークン予算のわずか2.5%を使用
- • SGLang、vLLM、llama.cpp、Ollamaを標準でサポート
- • モバイルデプロイおよびコンシューマーGPUでのファインチューニングに最適化
その小さなフットプリント、高いOCR精度、幅広いフレームワークサポートにより、ローカルのモバイルおよびコンシューマーGPUへのデプロイに最適です。
12. 投機的デコーディングと精度の選択がローカルQwen 3.6 27Bコーディングを解放
ある開発者が、16ビット精度のローカルQwen 3.6 27Bを使用して、複雑なWebオーディオシンセサイザーを含む完全に機能するPacmanのWebページクローンを生成した成功事例を記録しました。96GBのRAMを搭載したApple Silicon M2 Maxでモデルを実行した際、16ビット精度は推論負荷の高いコード生成において8ビット量子化を大幅に上回る結果を示しました。Multi-Token Prediction(MTP)投機的デコーディングを利用することで、生成速度は毎秒6.6トークンから18トークン近くまで向上しました。
- • 96GB RAM搭載のApple Silicon M2 MaxでQwen 3.6 27b F16を実行
- • MTP投機的デコーディングにより速度が6.6から最大18トークン/秒に向上
- • 16ビット精度は8ビット量子化よりも大幅に優れた結果を示した
- • エージェント性能を向上させるためにカスタムJinjaチャットテンプレートを実装
Apple Silicon上のローカルモデルから複雑な推論を引き出すために必要な、正確な量子化とランタイム設定を浮き彫りにしています。
13. 16GB GPU VRAMでQwen 3.6 27Bを実行するための最適設定
実用的な設定ガイドでは、わずか16GBのVRAMを搭載したコンシューマーグラフィックスカードでQwen 3.6 27Bモデルを実行する方法を紹介しています。Q3_K_S GGUF量子化を利用し、64層をGPUにオフロードすることで、プロンプト評価速度を毎秒800トークン以上に維持しました。このセットアップは、モデルをdraft-mtp投機的デコーディングと組み合わせ、めったに使用されないビジョンコンポーネントを完全にCPUにオフロードすることで、毎秒50トークンを超える生成速度を達成しています。
- • Qwen3.6-27B-Q3_K_S.ggufを使用し、64層をGPUにオフロード
- • 高速な投機的デコーディングのためにdraft-mtpを利用
- • 毎秒50トークン以上の生成と毎秒800トークンのプロンプト評価を目標
- • GPUメモリを節約するためにビジョンモデルをCPUにオフロード
コンシューマーグレードのハードウェア上で大規模な推論モデルをデプロイするための、実用的なブループリントを提供します。
14. エージェントによるコマンド実行後、開発者がBubblewrapサンドボックスを実装
エージェントがターミナルコマンドを実行できるように設計されたコマンドホワイトリストをテスト中、エージェントが破壊的な「rm -rf /」命令を実行するという最悪のシナリオに遭遇しました。このインシデントはシステム損傷を招き、ホストマシン上で直接エージェントにコマンドを実行させるリスクを浮き彫りにしました。開発者は直ちにBubblewrap(bwrap)を統合し、その後のエージェント操作のために分離されたLinux実行環境を保証しました。
- • bashコマンドのホワイトリストテスト中にエージェントが「rm -rf /」を実行
- • 即座にシステム損傷が発生
- • 安全なエージェント分離のためにBubblewrap(bwrap)を統合
厳格なサンドボックス分離なしで信頼できないエージェントの出力を実行すると、システム全体が侵害されるリスクがあります。
15. BeeLlamaベンチマークがKVキャッシュ量子化における精度とVRAM節約を評価
RTX 3090上でBeeLlama v0.1.2を使用して実施されたベンチマークテストは、KVキャッシュ設定を行うための重要なガイドラインを提供します。最大128kのコンテキスト長でQwen 3.6 27Bをテストしたところ、非対称KVキャッシュ量子化(q5_0/q4_0など)は、同じメモリフットプリントの対称的な設定よりも品質低下がはるかに少ないことが示されました。さらに、標準の4ビット量子化ではテールの劣化が見られる一方で、Turbo Cache Quantization(TCQ)は極端な2ビットおよび3ビットのキャッシュ圧縮を正常に安定させました。
- • RTX 3090上でBeeLlama v0.1.2を使用してQwen 3.6 27Bモデルをテスト
- • 非対称KV量子化(q5_0/q4_0)は、同一メモリフットプリントの対称型(q4_1/q4_1)よりも高スコア
- • Turbo Cache Quantization(TCQ)は2ビットおよび3ビット圧縮で大幅な品質向上を提供
- • 完全な対称型q8_0/q8_0量子化はq8_0/q5_0に対して無視できる程度の利点しかない
KVキャッシュ量子化を最適化することで、開発者は限られたGPU VRAMにより長いコンテキストウィンドウを収めることができます。
16. GoogleがサードパーティアプリおよびMCP統合を備えたGemini Sparkを発表
Google I/Oにて、Googleはスケジュール管理や請求分析などの複雑な個人的ワークフローを実行するように設計された常時稼働エージェント「Gemini Spark」を発表しました。Gemini 3.5 FlashとAntigravityエージェントハーネス上に構築されたSparkは、Model Context Protocol(MCP)を使用してCanvaやInstacartなどのパートナーと対話する深いシステム統合をサポートします。重要な点として、このプラットフォームはAgent Payments Protocol(AP2)を導入しており、AIエージェントが設定された支出制限内で安全に金融取引を完了できるようにするためのプログラム可能なフレームワークと承認プロセスを提供します。
- • Gemini 3.5 FlashとGoogle Antigravityエージェントハーネスを搭載
- • CanvaやOpenTableを含む30以上のパートナーとModel Context Protocol(MCP)を統合
- • Agent Payments Protocol(AP2)を採用し、エージェントによる安全な購入を可能に
- • 今週から信頼できるテスター向けに展開し、来週には米国のベータ版を開始
MCP接続と取引制御が含まれることで、開発者は自社のサービスを消費者向けエージェントネットワークに直接統合できるようになります。
17. GoogleがネイティブマルチモーダルなGemini Omniモデルファミリーを発表
年次I/Oカンファレンスにて、Googleはテキスト、画像、音声、動画全体でコンテンツを同時に処理および生成するネイティブマルチモーダルモデルファミリー「Gemini Omni」を発表しました。物理認識とコンテキスト知識を組み込んで設計されており、ユーザーは会話形式の指示を通じて動画コンテンツを生成および修正できます。展開はOmni Flashモデルから始まり、近い将来Vertex AI APIを通じて開発者に提供される予定です。
- • 動画、画像、音声、テキスト全体でネイティブにマルチモーダル
- • Gemini Omni Flashから展開を開始
- • 今後数週間以内にVertex AI APIを通じて開発者が利用可能になる予定
- • 必須のSynthID透かしとC2PAコンテンツ認証情報を組み込み
シンプルな会話型APIを通じて、マルチモーダルコンテンツ生成とインタラクティブな動画編集の境界を広げます。
18. GoogleとパートナーがAI主導のショッピングに向けたユニバーサルコマースプロトコルを立ち上げ
Googleは、Walmart、Shopify、Amazon、Stripe、Salesforceなどの主要な技術および小売リーダーと提携し、AIショッピングのオープン標準としてUniversal Commerce Protocol(UCP)を導入しました。これと並行して、自律的なAIエージェント取引のための構造化されたデジタルペーパートレイルと承認ワークフローを定義するAgent Payments Protocol(AP2)が機能します。これにより、エージェントはプラットフォームを横断したショッピングカートの管理、価格低下の追跡、安全なチェックアウトの完了が可能になります。
- • Shopify、Walmart、Target、Amazonとの協力によりUCPを開発
- • プラットフォーム間でアイテムを集約する「ユニバーサルカート」機能を搭載
- • Agent Payments Protocol(AP2)が自律的な購入のための安全な承認を提供
- • Googleはユニバーサルカートの売上に対して手数料を請求しない
標準化されたプロトコルにより、開発者は価格を自律的に追跡し、互換性を検証し、さまざまなeコマースプラットフォームでチェックアウトを行うエージェントを構築できます。
19. Google AI Edge GalleryがGemma 4のマルチトークン予測とMCPサポートを追加
GoogleはAI Edge Galleryのバージョン1.0.13および1.0.14をリリースしました。これらのアップデートにより、Gemma 4 Multi-Token Prediction(MTP)のサポートやPixel TPU向けのネイティブ最適化など、注目すべきパフォーマンスと互換性の向上がもたらされました。開発者は、実験的なModel Context Protocol(MCP)サポート、新しいスキルモジュール、自動チャット履歴保存機能も活用できます。
- • Gemma 4 Multi-Token Prediction(MTP)のサポートを導入
- • Pixel TPU向けのネイティブハードウェアサポートを追加
- • 実験的なModel Context Protocol(MCP)サポートを含む
- • チャット履歴の保存と新しいスキル機能を有効化
開発者は、高速なローカルモデルと標準的なMCPツールをエッジデバイスやモバイルハードウェアに直接デプロイできるようになります。
20. AI SDLCのための構造化された4部構成フレームワーク
提案された4部構成のAIソフトウェア開発ライフサイクル(SDLC)は、大規模なAI生成コードベースを維持する方法を詳述しています。この手法では、モバイル、デスクトップ、iPad、ウルトラワイドの解像度全体でコンピュータビジョンを介して分析される視覚的回帰テストを利用し、UIレイアウトを検証します。そこから、開発者は明示的なログ記録でホットパスを分離し、後方互換性の破壊を処理するために積極的な継続的インテグレーションループに依存し、その後のバグを通じてエージェントを導くために人間が介入するステアリングを実装します。
- • パート1:コンピュータビジョンを使用して4つの画面解像度でデザインをチェックする約50のテストを維持
- • パート2:分離、ログ記録、エラー境界を使用してホットパスをリファクタリング
- • パート3:継続的なデプロイ/テストループを介して後方互換性の破壊を許容
- • パート4:デプロイされたシステムのスポットチェックとAIエージェントのステアリングに焦点を当てる
AIコーディングエージェントに大きく依存する場合に、品質を維持し、回帰を回避するための具体的なワークフローパターンを提供します。
21. Codexにおけるエージェントの生産性を最適化するための実用的なワークフロー
コーディングエージェント(「Codex-maxxing」と呼ばれる)を使用したワークフローを最適化するためのガイドでは、長時間実行されるエージェントコンテキストを管理するための戦略を共有しています。スレッド圧縮を利用することで、開発者はコアプロジェクトの詳細を失うことなく、コンテキスト制限を節約するために過去の会話を圧縮できます。さらに、GitHubリポジトリ内にObsidian Vaultを保存することで、開発者が標準のgit diffを使用してレビューおよび監査できる耐久性のある共有メモリシステムを作成できます。
- • コンテキストを維持しながら長いスレッドを圧縮するために圧縮を使用
- • 共有エージェントメモリとdiffレビューのためにGitHub上のObsidian Vaultを統合
- • SlackとPRの定期的な監視をスケジュールするためにハートビートを実装
- • 実行深度を変えるために$browser、@chrome、@computerツールを使用
構造化された圧縮、共有Vault、自動実行ループを適用することで、コーディングエージェントの継続的な生産性が向上します。
22. Qwen 3.7プレビューのテキストおよびビジョンモデルがChatbot Arenaに追加
LMSYS Chatbot Arenaは、テスト用にAlibabaの次期Qwen 3.7モデルファミリーのプレビュー版を追加しました。初期のパフォーマンスは有望で、Qwen 3.7 Max PreviewはText Arenaで総合13位に初登場しました。一方、Qwen 3.7 Plus PreviewはVision Arenaで16位を獲得しており、この人気のあるオープンウェイトラインの次期イテレーションを開発者が早期に確認できるようになっています。
- • Qwen3.7 Max PreviewはText Arenaで総合13位にランクイン
- • Qwen3.7 Plus PreviewはVision Arenaで総合16位にランクイン
- • モデルはArenaでテキストおよびビジョン全体で評価可能
次期モデルバリアントのランクを知ることは、開発者が将来のLLM APIとデプロイメントの選択を計画するのに役立ちます。
23. CursorがComposer 2.5でコーディングアシスタントをアップデート
Cursorは、組み込みコーディングエージェントの最新イテレーションを導入するComposer 2.5を立ち上げました。このアップデートは、ターゲットを絞った強化学習、合成生成されたトレーニングデータセット、および新しく設計された分散トレーニング技術を使用してトレーニングされており、エディタ内でよりスムーズで正確なコンテキストコードの提案を提供することを目的としています。
- • アップデートされたコーディングエージェントであるComposer 2.5を搭載
- • ターゲットを絞った強化学習と合成データを使用してトレーニング
- • 新しい分散トレーニング技術を採用
このアップデートは、最も広く使用されている開発者IDEの1つにおけるコード生成の速度と精度を直接向上させます。
24. Sapientが低コンピューティングのHRM-Text 1Bモデルをリリース
Sapient Inc.は、新しいHRMアーキテクチャ上に構築された10億パラメータのテキスト生成モデルを特徴とするHRM-Textモデルファミリーをリリースしました。リリースによると、このモデルは従来の基盤モデルと比較して130〜600倍少ないコンピューティングと150〜900倍少ないデータを必要とします。専門的なローカルモデルをトレーニングしようとしているチームにとって、1Bバリアントは16台のH100 GPU全体で約46時間でトレーニングでき、総コンピューティングコストは1,472ドルです。
- • 従来のベースラインと比較して130〜600倍少ないコンピューティングと150〜900倍少ないデータを必要とする
- • 1Bパラメータモデルは16台のH100 GPUで46時間、1,472ドルでトレーニング可能
- • 0.6Bバージョンは8台のH100 GPUで50時間、800ドルでトレーニング可能
- • Hugging FaceおよびGitHubで利用可能
極めて低いリソース要件により、開発者はローカルハードウェア上で専門的なテキストモデルを迅速かつ安価にファインチューニングできます。
25. Google CodeMenderが専門家を招待し、コード脆弱性修正APIをテスト
Googleは、専用のサイバーセキュリティAIエージェントであるCodeMenderのAPIテスト招待を一部のセキュリティ専門家に開放しました。Google DeepMindによって開発され、10月に初めて公開されたこのツールは、大規模なコードリポジトリ内の脆弱性を見つけて自動的に修復するために特別に構築されています。GoogleはCodeMenderをOpenAIやAnthropicなどのライバルのセキュリティ重視モデルと競合させるべく、エンタープライズおよび公共部門のパイロット監査を開始しています。
- • コードベース内のセキュリティ脆弱性を特定および修正するように設計
- • 10月に初公開され、Google DeepMindによって開発
- • CodeMenderをAnthropicやOpenAIのセキュリティ製品と競合させる位置付け
- • システム監査のために政府機関や企業との協議を開始
アクティブなコードベースでの脆弱性スキャンと修復を自動化することで、最小限のエンジニアリングオーバーヘッドでデプロイメントのセキュリティを向上させます。
26. BytedanceがLance 3Bマルチモーダルモデルをリリース
Bytedance Researchは、画像および動画ワークフローを処理するように設計された軽量でネイティブな統合マルチモーダルモデル「Lance」をリリースしました。30億のアクティブパラメータという小さなフットプリントにもかかわらず、このモデルは単一のパイプライン内で理解タスクと編集タスクの両方を処理します。このモデルは、マルチタスクトレーニングシーケンスを使用してゼロからトレーニングされており、現在Hugging Faceで公開されています。
- • 画像と動画の理解、生成、編集をサポート
- • 3Bのアクティブパラメータで動作
- • 128-A100の予算で段階的なマルチタスクレシピを使用してゼロからトレーニング
- • Hugging Faceで利用可能
控えめなハードウェアで実行されるローカルマルチモーダルアプリケーション向けに、非常に軽量なオープンソースの代替手段を提供します。