1. AnthropicがClaude Fable 5とMythos 5をリリース
Anthropicは、同社のハイエンドモデルであるMythosクラスの初の一般公開版として「Claude Fable 5」を正式にリリースしました。高度なソフトウェアエンジニアリングや複雑なナレッジワーク向けに設計されたFable 5は、独自の安全アーキテクチャを導入しています。サイバーセキュリティや生物学などの高リスク領域に関連するクエリを分類器が検知すると、システムは自動的にリクエストをClaude Opus 4.8にルーティングします。また、特定のユースケース向けに、これらの安全対策を解除した「Claude Mythos 5」を、認定されたサイバーディフェンダーおよび研究者限定で提供します。
- • Claude Fable 5はClaude APIを通じて一般公開され、Claude Mythos 5はProject Glasswingの承認済みパートナーに限定されます。
- • 両モデルの価格は、入力トークン100万あたり10ドル、出力トークン100万あたり50ドルです。
- • Fable 5には、サイバーセキュリティ、生物学、化学、蒸留に関するクエリを自動的にClaude Opus 4.8へルーティングする安全分類器が含まれています。
- • 安全のためのフォールバックメカニズムは、平均してユーザーセッションの5%未満でトリガーされます。
- • これらのモデルはSWE-bench Proベンチマークで80.3%のスコアを達成し、OpenAIのGPT-5.5を上回りました。
- • Anthropicは、安全性と脱獄(ジェイルブレイク)を監視するため、Fable 5およびMythos 5の全トラフィックに対して30日間のデータ保持ポリシーを義務付けています。
開発者は、高リスクなクエリによるエラーを懸念することなく、複雑なコーディングやナレッジワークのためにAnthropicの最も強力なモデルクラスを使用してアプリケーションを構築できるようになります。
2. Appleがオンデバイス推論向けにAFM 3とCoreAIを発表
AppleはWWDC26において、第3世代基盤モデル(AFM 3)と、CoreMLに代わる新しいローカル推論エンジン「CoreAI」を発表しました。モバイルデバイスの厳しいメモリ制限を回避するため、200億パラメータの「AFM 3 Core Advanced」モデルは、重みセットをDRAMではなくNANDフラッシュメモリに保存します。このモデルは、プロンプトごとに専門家をルーティングする「Instruction-Following Pruning (IFP)」アーキテクチャを採用しており、メモリ帯域幅を使い果たすことなく、アクティブなパラメータを10億から40億の間で動的にスケーリングできます。
- • AFM 3ファミリーには5つのモデルが含まれ、オンデバイス展開用に設計された200億パラメータのAFM 3 Core Advancedが特徴です。
- • AFM 3 Core Advancedは、重みをDRAMではなくNANDフラッシュメモリに保存します。
- • モデルはタスクの複雑さに応じて、アクティブなパラメータを10億から40億の間で動的にスケーリングします。
- • プロンプトごとに専門家をルーティングするためにInstruction-Following Pruning (IFP)を使用します。
- • AppleはCoreMLの代替としてCoreAIを導入し、Swift APIを使用してAppleシリコン上で最適化されたローカル推論を提供します。
- • CoreAIを使用するには、Pythonスクリプトを使用してモデルの重みを変換する必要があります。
開発者は、システムメモリを使い果たすことなく、非常に高性能な200億パラメータのモデルをユーザーのデバイス上で直接展開できるようになります。
3. Cohereがオープンウェイトのコードモデル「North Mini Code」をリリース
Cohereは、エージェント型のコーディングパイプライン向けに特別に設計された300億パラメータの混合エキスパート(MoE)モデル「North Mini Code」をリリースしました。トークンあたりわずか30億のアクティブパラメータで動作するため非常に効率的で、単一のH100 GPUやMac Studio上でローカルに実行可能です。256kという広大なコンテキストウィンドウを備え、Apache 2.0ライセンスで提供されるため、自律的なソフトウェアエンジニアリングエージェントを構築する開発者にとって強力なオープンウェイトの選択肢となります。
- • North Mini Codeは300億パラメータの混合エキスパートモデルで、トークンあたり30億のアクティブパラメータを利用します。
- • モデルはApache 2.0ライセンスでリリースされ、重みはHugging Faceで標準およびfp8形式で入手可能です。
- • 256,000トークンのコンテキストウィンドウと、64,000トークンの最大生成長をサポートしています。
- • Artificial Analysis Coding Indexで33.4のスコアを達成しました。
- • vLLM経由での展開には、vLLMのメインブランチを使用し、cohere_melodyライブラリのバージョン0.9.0以上をインストールする必要があります。
開発者は、単一のH100 GPUやローカルのMac Studioで効率的に動作する、競争力の高いコーディングモデルをApache 2.0ライセンスの下でセルフホストできます。
4. GoogleがGemini 3.5 Live Translate APIのプレビューを開始
Googleは、リアルタイムの音声対音声翻訳モデル「Gemini 3.5 Live Translate」のパブリックプレビューを開始しました。Gemini Live APIおよびGoogle AI Studioからアクセス可能なこのモデルは、連続的な音声ストリームを処理し、わずか数秒の遅延で話された言語をその場で翻訳します。70以上の言語を自動検出し、元の話者のペース、ピッチ、イントネーションを維持しながら、SynthIDウォーターマークが埋め込まれた高品質な24kHz PCM音声を出力します。
- • Gemini 3.5 Live Translateは、70以上の言語を自動的に検出・翻訳する連続ストリーミング音声対音声モデルです。
- • Gemini Live APIおよびGoogle AI Studioを通じて、開発者向けにパブリックプレビューとして提供されています。
- • 連続ストリーム処理を使用して、わずか数秒の遅延で翻訳を行います。
- • パイプラインは16kHzのRAW 16ビットPCM音声を受け入れ、24kHzのRAW 16ビットPCM音声を出力します。
- • 生成されたすべての音声には、安全性と検出可能性のために不可視のSynthIDウォーターマークが含まれています。
開発者は、自動言語検出と自然な音声保持機能を備えた、リアルタイムかつ低遅延の音声翻訳機能をアプリに組み込むことができます。
5. npm v12、2026年7月にセキュリティのデフォルト設定を大幅変更へ
2026年7月に予定されているnpm v12の次期メジャーリリースでは、デフォルトのセキュリティ動作に重大な変更が導入されます。サプライチェーン攻撃を軽減するため、allowScripts設定がデフォルトでオフになり、依存関係によるpreinstall、install、postinstallスクリプトの実行が自動的にブロックされます。この変更により、明示的に承認されない限り、ネイティブのnode-gypビルドや、git、file、link依存関係からのprepareスクリプトがブロックされます。開発者は、npmバージョン11.16.0以降を使用して、これらの今後のデフォルト設定に関する警告を確認し、移行の準備を行うことができます。
- • npm v12は2026年7月にリリース予定で、セキュリティ関連のデフォルト設定に破壊的な変更が導入されます。
- • allowScripts設定がデフォルトでオフになり、preinstall、install、postinstallスクリプトの自動実行がブロックされます。
- • ネイティブのnode-gypビルドや、git、file、link依存関係からのprepareスクリプトはデフォルトでブロックされます。
- • 開発者はnpm approve-scriptsおよびnpm deny-scriptsを使用してスクリプト権限を管理し、許可リストをpackage.jsonに保存できます。
- • --allow-gitおよび--allow-remoteフラグはデフォルトでnoneとなり、GitおよびリモートURL依存関係を解決するには明示的な許可が必要になります。
- • 開発者はnpmバージョン11.16.0以降を使用して、これらの変更をテストし準備することができます。
開発者は、ネイティブのnode-gypビルドやgit依存関係のインストール失敗を防ぐため、今すぐビルドパイプラインとローカル環境を準備する必要があります。
6. 研究者がローカルでのハルシネーション抑制ツール「ntkMirror」を公開
研究者が、ローカルのオープンウェイトモデルにおける予測可能なハルシネーションを軽減するために設計された、トレーニング不要の回答/棄権ゲート「ntkMirror」をオープンソース化しました。ICML 2026で採択された研究に基づくこのツールは、証拠の提示順序によってモデルの出力確率が変化する「順列分散(permutation dispersion)」に対処します。順序周辺検証器(order-marginal verifier)と、順列フォワードパスを最大10倍高速化するカスタム融合カーネルを利用することで、このゲートは低信頼度の主張を慎重に棄権させることにより、監査済みデータセットにおけるハルシネーションを0.7%未満に抑えることに成功しました。
- • ntkMirrorの実装は、予測可能なハルシネーションと順列分散に関するICML 2026の論文に基づいています。
- • このツールは、順序周辺検証器を使用した、ローカルオープンウェイトモデル向けのトレーニング不要の回答/棄権ゲートです。
- • 監査において、このゲートは80.5%の精度を維持しつつ、約24%の棄権率で0.0〜0.7%のハルシネーションを達成しました。
- • ntkMirrorには、単純なループと比較して順列フォワードパスを2.6倍から10倍高速化する融合カーネルが含まれています。
- • 実装はGitHubで公開されており、Qwen2.5やGemmaなどのモデルをサポートしています。
ローカルでオープンウェイトモデルを実行している開発者は、トレーニング不要のゲートを統合することで、証拠に基づくタスクでのハルシネーションを劇的に低減できます。