1. Anthropic, Claude Fable 5 및 Mythos 5 출시
Anthropic이 자사의 고성능 Mythos급 모델을 처음으로 대중에 공개하며 Claude Fable 5를 공식 출시했습니다. 고급 소프트웨어 엔지니어링 및 복잡한 지식 업무를 위해 설계된 Fable 5는 독특한 안전 아키텍처를 도입했습니다. 사이버 보안이나 생물학 등 고위험 분야와 관련된 질문이 분류기에 감지되면 시스템이 자동으로 Claude Opus 4.8로 요청을 전달합니다. 또한 Anthropic은 이러한 안전 장치가 제거된 Claude Mythos 5를 승인된 사이버 방어자 및 연구원들에게만 독점적으로 제공합니다.
- • Claude Fable 5는 Claude API를 통해 대중에게 공개되며, Claude Mythos 5는 Project Glasswing의 승인된 파트너에게만 제한적으로 제공됩니다.
- • 두 모델 모두 입력 토큰 100만 개당 10달러, 출력 토큰 100만 개당 50달러로 책정되었습니다.
- • Fable 5에는 사이버 보안, 생물학, 화학, 증류 관련 질문을 Claude Opus 4.8로 자동 전달하는 안전 분류기가 포함되어 있습니다.
- • 안전 대체 메커니즘은 평균적으로 전체 사용자 세션의 5% 미만에서 작동합니다.
- • 이 모델들은 SWE-bench Pro 벤치마크에서 80.3%의 점수를 기록하며 OpenAI의 GPT-5.5를 능가했습니다.
- • Anthropic은 안전성 모니터링 및 탈옥 방지를 위해 모든 Fable 5 및 Mythos 5 트래픽에 대해 30일 데이터 보존 정책을 의무화하고 있습니다.
개발자들은 이제 고위험 질문으로 인해 오류가 발생할 걱정 없이, 복잡한 코딩 및 지식 업무를 위한 Anthropic의 가장 강력한 모델 클래스를 사용하여 애플리케이션을 구축할 수 있습니다.
2. Apple, 온디바이스 추론을 위한 AFM 3 및 CoreAI 공개
Apple은 WWDC26에서 3세대 파운데이션 모델(AFM 3)과 함께 CoreML을 대체하기 위해 설계된 새로운 로컬 추론 엔진인 CoreAI를 선보였습니다. 모바일 기기의 엄격한 메모리 제한을 우회하기 위해 200억 파라미터의 AFM 3 Core Advanced 모델은 가중치 세트를 DRAM이 아닌 NAND 플래시 메모리에 저장합니다. 이 모델은 프롬프트당 한 번 전문가를 라우팅하는 IFP(Instruction-Following Pruning) 아키텍처를 활용하여 메모리 대역폭을 소진하지 않고도 활성 파라미터를 10억 개에서 40억 개까지 동적으로 확장할 수 있습니다.
- • AFM 3 제품군은 5개의 모델로 구성되며, 온디바이스 배포를 위해 설계된 200억 파라미터의 AFM 3 Core Advanced가 포함됩니다.
- • AFM 3 Core Advanced는 가중치를 DRAM 대신 NAND 플래시 메모리에 저장합니다.
- • 모델은 작업 복잡도에 따라 활성 파라미터를 10억 개에서 40억 개로 동적으로 확장합니다.
- • 프롬프트당 한 번 전문가를 라우팅하기 위해 IFP(Instruction-Following Pruning)를 사용합니다.
- • Apple은 CoreML의 대체제로 CoreAI를 도입하여 Swift API를 통해 Apple Silicon에서 최적화된 로컬 추론을 제공합니다.
- • CoreAI를 사용하려면 Python 스크립트를 통해 모델 가중치를 변환해야 합니다.
개발자들은 시스템 메모리를 소진하지 않고도 고성능 200억 파라미터 모델을 사용자 기기에서 직접 배포할 수 있습니다.
3. Cohere, 오픈 웨이트 North Mini Code 모델 출시
Cohere는 에이전트 기반 코딩 파이프라인을 위해 특별히 설계된 300억 파라미터 규모의 MoE 모델인 North Mini Code를 출시했습니다. 토큰당 30억 개의 활성 파라미터만으로 작동하는 이 모델은 효율성이 뛰어나 단일 H100 GPU나 Mac Studio에서 로컬로 실행할 수 있습니다. 256k의 방대한 컨텍스트 윈도우를 지원하며 Apache 2.0 라이선스로 제공되어, 자율 소프트웨어 엔지니어링 에이전트를 구축하는 개발자들에게 강력한 오픈 웨이트 옵션이 될 것입니다.
- • North Mini Code는 300억 파라미터 규모의 MoE 모델로, 토큰당 30억 개의 활성 파라미터를 사용합니다.
- • 이 모델은 Apache 2.0 라이선스로 출시되었으며, Hugging Face에서 표준 및 fp8 형식으로 가중치를 이용할 수 있습니다.
- • 256,000 토큰의 컨텍스트 윈도우와 64,000 토큰의 최대 생성 길이를 지원합니다.
- • 이 모델은 Artificial Analysis Coding Index에서 33.4점을 기록했습니다.
- • vLLM을 통한 배포 시 vLLM 메인 브랜드를 사용하고 cohere_melody 라이브러리 0.9.0 버전 이상을 설치해야 합니다.
개발자들은 단일 H100 GPU나 로컬 Mac Studio에서 효율적으로 실행되는, Apache 2.0 라이선스 기반의 경쟁력 있는 코딩 모델을 직접 호스팅할 수 있습니다.
4. Google, Gemini 3.5 Live Translate API 프리뷰 출시
Google은 실시간 음성-음성 번역 모델인 Gemini 3.5 Live Translate를 공개 프리뷰로 선보였습니다. Gemini Live API와 Google AI Studio를 통해 액세스할 수 있는 이 모델은 연속적인 오디오 스트림을 처리하여 단 몇 초 만에 실시간으로 음성을 번역합니다. 70개 이상의 언어를 자동으로 감지하면서도 원래 화자의 속도, 음조, 억양을 유지하며, SynthID 워터마크가 포함된 고품질 24kHz PCM 오디오를 출력합니다.
- • Gemini 3.5 Live Translate는 70개 이상의 언어를 자동으로 감지하고 번역하는 연속 스트리밍 음성-음성 모델입니다.
- • 개발자들은 Gemini Live API와 Google AI Studio를 통해 공개 프리뷰로 이 모델을 사용할 수 있습니다.
- • 연속 스트림 처리를 사용하여 단 몇 초 만에 번역을 수행합니다.
- • 16kHz의 원시 16비트 PCM 오디오를 입력받아 24kHz의 원시 16비트 PCM 오디오를 출력합니다.
- • 생성된 모든 오디오에는 안전성과 탐지 가능성을 위해 감지할 수 없는 SynthID 워터마크가 포함되어 있습니다.
개발자들은 자동 언어 감지 및 자연스러운 음성 보존 기능을 갖춘 실시간 저지연 음성 번역 기능을 앱에 구축할 수 있습니다.
5. npm v12, 2026년 7월부터 보안 기본값 변경 예정
2026년 7월로 예정된 npm v12의 차기 메이저 릴리스에서는 보안 기본 동작에 중대한 변경 사항이 도입됩니다. 공급망 공격을 완화하기 위해 allowScripts 구성이 기본적으로 'off'로 설정되어, 의존성의 preinstall, install, postinstall 스크립트 실행이 자동으로 차단됩니다. 이 변경으로 인해 명시적으로 승인하지 않는 한 네이티브 node-gyp 빌드와 git, file, link 의존성의 prepare 스크립트가 차단됩니다. 개발자들은 npm 11.16.0 이상 버전을 사용하여 이러한 변경 사항에 대비하고 의존성을 감사할 수 있습니다.
- • npm v12는 2026년 7월 출시 예정이며 보안 관련 기본 설정에 중대한 변경 사항이 포함됩니다.
- • allowScripts 구성이 기본적으로 'off'로 설정되어 preinstall, install, postinstall 스크립트의 자동 실행이 차단됩니다.
- • 네이티브 node-gyp 빌드와 git, file, link 의존성의 prepare 스크립트가 기본적으로 차단됩니다.
- • 개발자는 npm approve-scripts 및 npm deny-scripts를 통해 스크립트 권한을 관리하고 package.json에 허용 목록을 저장할 수 있습니다.
- • --allow-git 및 --allow-remote 플래그는 기본적으로 'none'으로 설정되어 Git 및 원격 URL 의존성을 해결하려면 명시적 권한이 필요합니다.
- • 개발자는 npm 11.16.0 이상 버전을 사용하여 이러한 변경 사항을 테스트하고 준비할 수 있습니다.
개발자들은 네이티브 node-gyp 빌드 및 git 의존성의 설치 오류를 방지하기 위해 지금부터 빌드 파이프라인과 로컬 환경을 준비해야 합니다.
6. 연구진, 로컬 환각 현상 완화를 위한 ntkMirror 공개
연구진은 로컬 오픈 웨이트 모델에서 예측 가능한 환각을 완화하기 위해 설계된 답변/기권 게이트의 학습 불필요 구현체인 ntkMirror를 오픈 소스로 공개했습니다. ICML 2026에서 채택된 연구를 기반으로 하는 이 도구는 증거 제시 순서에 따라 모델 출력 확률이 달라지는 '순열 분산(permutation dispersion)' 문제를 해결합니다. 순서 한계 검증기(order-marginal verifier)와 순열 순방향 패스를 최대 10배까지 가속하는 맞춤형 융합 커널을 사용하여, 신뢰도가 낮은 주장에 대해 선택적으로 기권함으로써 감사 데이터셋에서 환각을 0.7% 미만으로 제한하는 데 성공했습니다.
- • ntkMirror 구현은 예측 가능한 환각 및 순열 분산에 관한 ICML 2026 논문을 기반으로 합니다.
- • 이 도구는 순서 한계 검증기를 사용하는 로컬 오픈 웨이트 모델용 학습 불필요 답변/기권 게이트입니다.
- • 감사 결과, 이 게이트는 약 24%의 기권율과 80.5%의 정확도로 0.0~0.7%의 환각률을 달성했습니다.
- • ntkMirror에는 순열 순방향 패스를 단순 루프 대비 2.6배에서 10배까지 가속하는 융합 커널이 포함되어 있습니다.
- • 이 구현체는 GitHub에서 이용 가능하며 Qwen2.5 및 Gemma와 같은 모델을 지원합니다.
로컬 오픈 웨이트 모델을 실행하는 개발자들은 학습이 필요 없는 게이트를 통합하여 증거 기반 작업에서 환각을 획기적으로 줄일 수 있습니다.