Audesso | Daily: AI

Google、自律型リサーチエージェント「Deep Research」と「Deep Research Max」を公開

00:00 / --:--

← ホームへ戻る

Google、自律型リサーチエージェント「Deep Research」と「Deep Research Max」を公開

1. Google、自律型リサーチエージェント「Deep Research」と「Deep Research Max」を公開

Googleは、Gemini APIを通じて「Deep Research」および「Deep Research Max」エージェントのパブリックプレビューを開始しました。Gemini 3.1 Proを搭載したこれらのエージェントは、Web検索と企業独自のデータを組み合わせた自律的なリサーチワークフローを可能にします。標準版は低遅延な対話型アプリ向けに最適化されており、Max版は推論時の計算量を増やすことで、より包括的な非同期タスクに対応します。また、Model Context Protocol(MCP)を利用して、任意のサードパーティ製データソースとの連携も可能です。

2. AIコーディングエージェントにおける機密情報の漏洩リスクが判明

セキュリティ研究者が、Anthropic、Google、GitHubのAIコーディングエージェントに影響を与えるプロンプトインジェクションの脆弱性を指摘しました。GitHubのプルリクエストのタイトルに悪意のある指示を含めることで、AnthropicのClaude Codeなどのエージェントに自身のAPIキーをコメント欄へ投稿させることが可能だといいます。この攻撃は外部インフラを必要とせず、多くのAI連携でリポジトリへのアクセス権限として利用される「pull_request_target」トリガーを標的にしています。CI/CDパイプラインでAIエージェントを利用している開発者は、設定の早急な確認が推奨されます。

3. OpenAI、「ChatGPT Images 2.0」をリリース

OpenAIは、最新の「GPT Image 2」モデルを搭載した「ChatGPT Images 2.0」を、すべてのChatGPTおよびCodexユーザー向けに公開しました。この新モデルは推論能力を備えており、Web検索やアップロードされたファイルの処理、1つのプロンプトから最大8枚の一貫性のある画像生成が可能です。最大2Kの解像度と3:1から1:3までのカスタムアスペクト比をサポートしています。また、日本語を含む多言語のテキスト描画能力が向上しており、詳細なインフォグラフィックやスライドの作成にも対応します。

4. Anthropic、Proプラン新規ユーザーへの「Claude Code」提供を終了

Anthropicは、月額20ドルの「Pro」サブスクリプションプランにおいて、新規ユーザー向けのCLIツール「Claude Code」へのアクセス権を削除しました。これまでProユーザーはAPIコストを個別に支払うことなく同ツールを利用できましたが、現在は上位の「Max」プラン限定の特典となっています。同社によると、これは新規登録者の一部を対象としたテスト運用であり、既存のサブスクリプションユーザーに影響はないとのことです。日常的にClaude Codeを利用している開発者は、従量課金制のAPI利用への移行か、プランのアップグレードを検討する必要があります。

5. Hugging Face、機械学習エンジニアリングを自動化する「ml-intern」を公開

Hugging Faceは、機械学習エンジニアリングのタスクを自動化するために設計されたオープンソースのAIエージェント「ml-intern」をリリースしました。このエージェントは、論文のリサーチや引用グラフの追跡、Hugging Face Hubからのデータセット整形、クラウド上での学習ジョブの実行などを自律的に行います。対話型のCLIまたはヘッドレスモードで動作し、人間の介入なしに学習状況の監視や失敗の診断、アブレーションスタディの実施が可能です。開発者はこのツールを活用することで、学習後のワークフローを効率化し、モデルのファインチューニングを迅速に繰り返すことができます。

6. Go言語製のオープンソースAIゲートウェイ「GoModel」が登場

アプリケーションとOpenAIやAnthropicなどのモデルプロバイダーとの間に配置する、Go言語製のオープンソースAIゲートウェイ「GoModel」が公開されました。このゲートウェイを導入することで、クライアントごとのAI利用量やコストの追跡、アプリケーションコードを変更しないモデルの切り替え、APIコスト削減のためのセマンティックキャッシュの実装などが可能になります。Dockerイメージは17MBと軽量で、環境変数を優先するシンプルな設定方式を採用しています。AIリクエストのフローを管理・デバッグしたいチームにとって、低オーバーヘッドな選択肢となります。

7. Anthropic、サードパーティ製CLIツール「OpenClaw」の利用を公式に容認

Anthropicはポリシーを更新し、CLIツール「OpenClaw」の使用およびAnthropic APIキーの再利用を公式にサポートすることを発表しました。OpenClawを使用することで、開発者は標準的なAPIアクセスやレガシートークンプロファイルを通じてAnthropicのモデルにリクエストを送信できます。また、プロンプトキャッシュ機能との連携や、特定のサービスティアを使用したAPIへの直接トラフィックの切り替えも可能です。今回の更新により、Anthropicのエコシステムにおいてサードパーティ製CLIツールを利用する際の認証や使用ルールが明確化されました。

8. Anthropic、リアルタイムで更新される「Live Artifacts」を導入

Anthropicは、Claude Coworkにおいてリアルタイムのダッシュボードやトラッカーを作成できる「Live Artifacts」機能を発表しました。従来の静的なArtifactsとは異なり、連携したアプリやファイルから最新データを取り込み、開くたびに自動で更新されます。Artifactsは専用のタブに保存され、完全なバージョン履歴も管理できるため、複数のセッションにわたってデータ駆動型のワークスペースを維持することが可能です。この機能は、Pro、Team、Enterpriseを含むすべての有料プランのユーザーが利用できます。

9. Cal.com、MITライセンスのコミュニティ版「Cal.diy」をリリース

日程調整プラットフォームのCal.comは、完全にオープンソース化されたMITライセンスのコミュニティ版「Cal.diy」を公開しました。このフォーク版からはSSO/SAMLや組織向けワークフローといったエンタープライズ専用コードが削除されており、ライセンスキーなしで動作します。商用依存を排除し、自身のインフラで日程調整システムをセルフホストしたい個人や開発者向けに設計されています。動作にはNode.jsとPostgreSQLが必要で、Unkeyによるレート制限のオプションもサポートしています。

10. テンセント、FLUXベースのスタイル転送フレームワーク「MegaStyle」を公開

テンセント(Tencent)は、FLUXをベースとした大規模なスタイル転送フレームワーク「MegaStyle」をオープンソースとして公開しました。今回のリリースには、Qwen-Imageで生成された17万件のスタイルプロンプトと40万件のコンテンツプロンプトを組み合わせた「MegaStyle-1.4M」データセットが含まれています。また、専用のスタイルエンコーダーとFLUXベースのスタイル転送モデル、さらに学習および推論用の全コードも提供されます。開発者はこれらのリソースを活用して、高度な画像スタイル転送アプリケーションの構築やファインチューニングを行うことができます。

11. Mozilla、Anthropicの次世代モデル「Mythos」を活用しFirefoxの脆弱性を特定

Mozillaは、Anthropicの未公開モデル「Mythos Preview」の早期アクセス版を利用し、Firefox 150において271件のセキュリティ脆弱性を特定したと発表しました。このAIモデルは未公開のソースコードを分析することで、通常であれば大規模な自動ファジングや専門家による手動レビューを必要とするバグを検出しました。前バージョンでの比較では、Anthropicの既存モデル「Opus 4.6」が検出した脆弱性は22件にとどまっており、Mythosの性能向上が際立っています。この成果は、開発やセキュリティチームにおけるAIを活用した自動脆弱性診断の大きな転換点となる可能性があります。

デイリーAIシグナルを受信箱へ

1日5分。無料、いつでも解除できます。