AIコーディングエージェントを標的とする「Shai-Hulud」ワーム

1. AIコーディングエージェントを標的とする「Shai-Hulud」ワーム

2026年5月11日から活動している「Mini Shai-Hulud」ワームは、170以上のnpmおよびPyPIパッケージに感染しています。このマルウェアは、ClaudeやKiro MCPサーバーの認証トークンを含むAIコーディングエージェントの設定を標的とし、外部サービスへのアクセス権を奪取します。一般的な設定ファイルを通じて永続性を確立し、認証情報が取り消された場合には破壊的なコマンドを実行する可能性があります。セキュリティ研究者は、影響を受けたマシンを隔離し、認証情報を取り消す前にイメージバックアップを取得してデータ損失を防ぐよう推奨しています。

• 172個のnpm/PyPIパッケージが侵害された
• AIエージェントの認証トークンを標的としている
• 設定ファイル内に永続性を確立する
• 認証情報が取り消されると破壊的なコマンドをトリガーする可能性がある

AIコーディングエージェントを利用する開発者は、汚染されたパッケージを通じて認証情報の窃取やシステム侵害のリスクにさらされています。

SOURCES

[1]

2. Perceptronが動画解析モデル「Mk1」を発表

Perceptron Inc.は、動画内の物理世界のダイナミクス、オブジェクトの同一性、時間的連続性を理解できる推論モデル「Mk1」を発表しました。このモデルは最大毎秒2フレームでネイティブ動画を処理し、現在の業界リーダーよりも大幅に低い価格設定となっています。クロッピング、高密度なシーンカウント、インコンテキスト学習のための特殊な機能を備えています。また、Perceptronは開発者向けに「Isaac」というオープンウェイトシリーズも提供しています。

• 毎秒2フレームで動画を処理
• 入力トークン100万あたり0.15ドルという価格設定
• クロッピングやカウントのための特殊な機能を搭載
• オープンウェイトのIsaacシリーズが利用可能

特殊な開発者向け機能を備え、動画推論タスクに対して費用対効果の高い代替手段を提供します。

SOURCES

[1]

3. Statewrightがステートマシンを用いてエージェントの信頼性を向上

Statewrightは、正式なステートマシンを使用してLLMのツール使用とソリューション空間を制限することで、エージェントによる問題解決の脆弱性に対処します。Rustベースのエンジンを通じて有効な遷移とツールアクセスを強制することで、モデルが手順をスキップしたり、誤ったツールを使用したりすることを防ぎます。このプラットフォームは、Model Context Protocolを介してClaude Codeなどのツールと統合されており、状態、遷移、ガードを含むワークフローを定義するためのビジュアルエディタを提供します。

• 正式なステートマシンを使用してLLMの挙動を制限
• Rustベースのエンジンを採用
• MCPを介してClaude Codeと統合
• ワークフロー定義のためのビジュアルエディタを提供

エージェントワークフローにおいて、ガードレールを強制し信頼性を高めるための構造化された方法を提供します。

SOURCES

[1]

4. DuckDBがクライアント・サーバープロトコル「Quack」を導入

DuckDBは、複数のDuckDBインスタンスが相互作用し、同時書き込みをサポートできるように設計されたクライアント・サーバー通信システム「Quack」プロトコルを立ち上げました。HTTP上に構築され、カスタムシリアル化形式を採用したこのプロトコルは、DuckDB v1.5.2で利用可能です。拡張可能な認証および認可メカニズムを備えており、小規模書き込みのベンチマークではPostgreSQLを上回る高いパフォーマンスを実証しています。

• 同時書き込みを可能にする
• HTTPベースで構築
• v1.5.2で利用可能
• 小規模書き込みのベンチマークで高いパフォーマンスを発揮

DuckDBへの同時アクセスを必要とするアプリケーションのデータインフラストラクチャ機能を向上させます。

SOURCES

[1]

5. Artificial Analysisが音声対音声モデルのベンチマークを公開

Artificial Analysisは、複数ターンのカスタマーサービス対話における音声対音声（S2S）モデルの性能を測定するために設計されたベンチマーク「𝜏-Voice」をリリースしました。このベンチマークは、背景ノイズやパケットロスといった現実世界の音声チャネルの複雑さをシミュレートし、278のシナリオにわたってモデルのツール呼び出しと指示追従能力を評価します。現在、xAIの「Grok Voice Think Fast 1.0」が52.1%の成功率でベンチマークをリードしています。

• 複数ターンの指示追従とツール使用を評価
• 音声チャネルのノイズとパケットロスをシミュレート
• 航空、小売、通信の各ドメインをカバー

複雑な現実環境における音声エージェントを評価するための標準化された方法を提供します。

SOURCES

[1]

6. AWS上のClaude Platformが一般提供開始

AWS上のClaude Platformが一般提供を開始しました。これにより、AWSの顧客はManaged Agents、Advisor戦略、コード実行を含むClaudeの全機能スイートにアクセスできるようになります。このプラットフォームは、認証にはAWS IAM、監査ログにはCloudTrail、課金にはAWSの請求システムと統合されています。AnthropicがAWS境界の外側でプラットフォームを運用し、Amazon Bedrockは引き続きAWS境界内で運用されます。

• AWS IAM、CloudTrail、課金システムと統合
• Claude Managed Agentsとコード実行をサポート
• ほとんどのAWS商用リージョンで利用可能

AWSのセキュリティおよび課金インフラストラクチャと直接統合することで、企業のClaude導入を簡素化します。

SOURCES

[1]

1. AIコーディングエージェントを標的とする「Shai-Hulud」ワーム

2. Perceptronが動画解析モデル「Mk1」を発表

3. Statewrightがステートマシンを用いてエージェントの信頼性を向上

4. DuckDBがクライアント・サーバープロトコル「Quack」を導入

5. Artificial Analysisが音声対音声モデルのベンチマークを公開

6. AWS上のClaude Platformが一般提供開始

デイリーAIシグナルを受信箱へ