Anthropic, Claude 4.6용 1M 컨텍스트 윈도우 정식 출시

1. Anthropic, Claude 4.6용 1M 컨텍스트 윈도우 정식 출시

Anthropic이 Claude Opus 4.6 및 Sonnet 4.6의 1M 토큰 컨텍스트 윈도우를 정식 출시했습니다. 표준 가격이 적용되며 롱 컨텍스트 추가 비용은 없습니다. 이번 업데이트를 통해 미디어 제한도 최대 600개의 이미지 또는 PDF 페이지로 확장되어 대규모 문서 분석 및 멀티모달 검색 작업을 지원합니다.

2. Claude, 대화형 차트 및 다이어그램을 위한 Generative UI 도입

Anthropic은 채팅 인터페이스 내에서 플로우차트, 막대 그래프, 클릭 가능한 주기율표 등 대화형 시각화 자료를 생성할 수 있는 Claude 베타 기능을 출시했습니다. 이 시스템은 증분 파싱을 사용하여 HTML 위젯을 스트리밍하며, 새로운 /btw 명령어를 통해 활성 에이전트 작업을 방해하지 않고 사이드 패널에서 문의할 수 있습니다.

3. GPT-5.4 벤치마크, 실제 코딩 작업에서 우수한 성능 입증

실제 개발자 세션을 활용하는 CursorBench 평가 결과, GPT-5.4가 16K 미만의 토큰을 사용하면서도 다른 프런티어 모델들을 능가하는 성능을 보였습니다. 이 모델은 복잡한 추론에서 인간 전문가 수준 이상의 점수를 기록하며 자율적인 기술 역량의 비약적인 발전을 시사했습니다.

4. NanoClaw와 Docker, 보안 AI 에이전트 샌드박싱을 위해 협력

오픈 소스 AI 에이전트 플랫폼 NanoClaw가 Docker와 파트너십을 맺고 Docker Sandboxes 내에서 에이전트를 실행하여 자율 코드 실행을 위한 보안 환경을 제공합니다. 이 통합은 에이전트 작업을 호스트 시스템으로부터 격리하는 동시에 코드를 빌드, 테스트 및 검증할 수 있게 하여 기업의 보안 우려를 해결합니다.

5. Axiom Math, AI 기반 정형 검증을 위해 2억 달러 투자 유치

Axiom Math는 Lean 프로그래밍 언어로 기계가 확인 가능한 추론을 생성하는 'Verified AI' 시스템 개발을 위해 2억 달러 규모의 시리즈 A 투자를 유치했습니다. 이 스타트업은 수학적 증명 검증에서 결정론적 코드 검증으로 전환하여 통계적 확률이 아닌 정형 기법을 통해 소프트웨어의 정확성을 보장하는 것을 목표로 합니다.

6. Perplexity, 'Personal Computer' 에이전트 및 풀스택 API 출시

Perplexity는 로컬 파일 및 애플리케이션에 지속적으로 액세스하여 작업을 자율적으로 수행하는 Mac mini용 상주형 AI 에이전트 시스템을 도입했습니다. 하드웨어 통합과 더불어, 다단계 오케스트레이션 및 웹 규모 검색을 위한 Search, Agent, Embeddings API를 포함한 풀스택 API 플랫폼을 출시했습니다.

7. Google DeepMind, 자율 연구를 위한 Aletheia 공개

Aletheia는 방대한 문헌을 탐색하고 장기적인 증명을 구성함으로써 경진대회 수준의 수학과 전문 연구 사이의 간극을 메우도록 설계된 특화된 AI 에이전트입니다. 이 시스템은 자연어 생성, 검증 및 수정의 반복 과정을 활용하여 새로운 수학적 통찰력을 발견합니다.

8. NVIDIA, Nemotron 3 Super 하이브리드 Mamba-Transformer 모델 출시

NVIDIA의 새로운 Nemotron 3 Super는 120B 파라미터 하이브리드 모델로, 단 12B 활성 파라미터만을 사용하여 멀티 에이전트 시스템에서 5배 높은 처리량을 제공합니다. 기본 1M 토큰 컨텍스트 윈도우를 갖추고 있으며 소프트웨어 개발 및 사이버 보안 분류와 같은 대용량 워크로드에 최적화되어 있습니다.

9. AWS, 10년 된 S3 Bucketsquatting 취약점 해결

AWS는 공격자가 삭제된 버킷 이름을 점유하여 트래픽이나 데이터를 가로챌 수 있는 보안 문제인 'bucketsquatting' 또는 'bucketsniping'에 대한 해결책을 구현했습니다. 새로운 메커니즘은 버킷 명명 처리 방식을 변경하여 S3 사용자의 반복적인 보안 위험을 효과적으로 종식시켰습니다.

10. AI 에이전트, McKinsey의 'Lilli' 챗봇을 2시간 만에 침투

보안 스타트업 CodeWall은 AI 에이전트가 인증되지 않은 22개의 API 엔드포인트를 악용하여 McKinsey의 내부 'Lilli' 데이터베이스에 대한 전체 읽기/쓰기 권한을 획득할 수 있음을 입증했습니다. 이번 침투로 기밀 채팅 메시지와 고객 파일이 평문으로 노출되어 기업용 에이전트 배포의 심각한 취약점이 드러났습니다.

11. Meta, 내부 성능 격차로 인해 'Avocado' 모델 출시 연기

Meta는 차세대 AI 모델인 'Avocado'가 OpenAI, Google, Anthropic의 주요 모델 성능에 미치지 못함에 따라 출시를 최소 5월까지 연기한 것으로 알려졌습니다. 이전 내부 버전보다는 성능이 뛰어났지만, 이번 연기는 프런티어 수준의 벤치마크를 달성해야 한다는 압박이 거세지고 있음을 반영합니다.

12. Google, 도시 홍수 예측을 위한 Groundsource 데이터셋 출시

Google AI Research는 Gemini를 사용하여 500만 개의 비정형 뉴스 리포트에서 구조화된 과거 데이터를 추출하는 방법론인 Groundsource를 도입했습니다. 이 프로젝트를 통해 260만 건의 도시 돌발 홍수 이벤트에 대한 오픈 소스 데이터셋이 생성되었으며, 이를 통해 모델이 최대 24시간 전에 홍수를 예측할 수 있게 되었습니다.

13. Slate V1, 'Swarm-Native' 코딩 에이전트로 데뷔

Random Labs는 통합 코드 환경 내에서 방대한 수의 서브 에이전트를 프로그래밍 방식으로 오케스트레이션하도록 설계된 프런티어 에이전트 Slate V1을 출시했습니다. 이 프레임워크는 새로운 컨텍스트 엔지니어링과 극대화된 캐싱을 통해 깊은 컨텍스트와 장기적인 작업을 관리하는 '시스템 문제'를 해결하는 데 집중합니다.

14. Context Gateway, 에이전트를 위한 백그라운드 프롬프트 압축 지원

Context Gateway는 AI 에이전트와 LLM API 사이에서 대화 기록을 백그라운드에서 압축하는 새로운 유틸리티입니다. 이 도구를 통해 개발자는 Claude Code나 Cursor와 같은 도구에서 수동 기록 압축을 기다리거나 토큰 제한에 걸리지 않고 긴 컨텍스트 세션을 유지할 수 있습니다.

15. Stanford, OpenJarvis 로컬 우선 에이전트 프레임워크 출시

OpenJarvis는 Stanford에서 개발한 개인용 온디바이스 AI 프레임워크로, 지능, 추론 및 메모리를 위한 5개의 조합 가능한 프리미티브를 활용합니다. 이 시스템은 모든 데이터가 로컬 머신에 유지되도록 보장하면서 CLI, 브라우저 및 데스크톱 사용 사례를 지원하며, 자기 개선 루프를 사용하여 에이전트 성능을 정교화합니다.

16. 39개 오픈 소스 문서 사이트에서 Algolia 관리자 키 노출

한 보안 연구원이 Vue.js를 포함한 주요 문서 사이트에서 39개의 Algolia 관리자 API 키가 노출된 것을 발견했습니다. 이 키는 검색 인덱스를 추가, 삭제 또는 수정할 수 있는 전체 권한을 부여합니다. 이번 노출은 오픈 소스 생태계 전반에 걸쳐 DocSearch 구현이 배포되는 방식의 광범위한 설정 오류를 부각시킵니다.

17. 스웨덴 전자정부 플랫폼 소스 코드 유출

CGI Sverige AB의 인프라 침해 이후 스웨덴 전자정부 플랫폼의 전체 소스 코드가 유출되었습니다. 위협 행위자 ByteToBreach의 소행으로 추정되는 이번 유출에는 스웨덴 정부를 위해 관리되는 핵심 디지털 서비스 코드가 포함되어 있습니다.

18. 카타르 헬륨 생산 중단으로 글로벌 칩 공급망 위협

이란의 드론 공격 이후 카타르 Ras Laffan 헬륨 단지가 가동을 중단하면서 전 세계 헬륨 공급량의 30%가 시장에서 사라졌습니다. 재가동 시점이 불투명한 가운데, SK hynix와 같은 주요 반도체 제조업체들은 생산 중단을 피하기 위해 공급망 다변화를 강요받고 있습니다.

19. AI 거대 기업들, 데이터 센터 에너지를 위한 '요금 납부자 보호 서약' 서명

Amazon, Google, Meta, Microsoft, OpenAI, Oracle, xAI가 데이터 센터 수요로 인한 미국 소비자들의 전기 요금 인상을 방지하기 위한 서약에 동참했습니다. 이 합의에 따라 해당 기업들은 확장되는 AI 인프라에 전력을 공급하는 데 필요한 신규 발전 및 그리드 업그레이드 비용을 지원하기로 약속했습니다.

20. MacBook Neo 벤치마크, Windows VM 호환성 확인

Apple의 599달러 MacBook Neo에 대한 초기 테스트 결과, Parallels Desktop을 통해 A18 Pro 기반 기기에서 Windows 11을 가상 머신으로 성공적으로 실행할 수 있음이 확인되었습니다. 기본적인 사용성은 안정적이지만, 하드웨어가 집중적인 데이터베이스 및 개발 워크로드에 적합한지 판단하기 위한 전체 성능 검증이 진행 중입니다.

21. Microsoft, 개인화된 의료 통찰력을 위한 Copilot Health 선보여

Microsoft는 50개 이상의 웨어러블 데이터, 50,000개 병원의 EHR 기록 및 검사 결과를 종합하는 보안 AI 환경인 Copilot Health를 출시했습니다. 이 도구는 분산된 의료 데이터를 분석하여 사용자에게 직접 개인화된 통찰력을 제공함으로써 일관된 '건강 스토리'를 제공하는 것을 목표로 합니다.

22. Spine Swarm, 멀티 에이전트 협업을 위한 비주얼 캔버스 출시

Spine Swarm은 무한한 비주얼 캔버스에서 작동하여 재무 모델링 및 SEO 감사와 같은 복잡한 비코딩 프로젝트를 수행하는 새로운 멀티 에이전트 시스템입니다. 이 플랫폼을 통해 사용자는 구조화된 계획과 시각화가 필요한 장기적인 작업을 처리하기 위해 여러 에이전트를 동시에 오케스트레이션할 수 있습니다.

23. TUI Studio, 터미널 앱을 위한 시각적 디자인 환경 제공

TUI Studio는 터미널 사용자 인터페이스(TUI) 애플리케이션을 위한 새로운 시각적 편집기로, 실시간 ANSI 미리보기가 포함된 Figma 스타일의 드래그 앤 드롭 캔버스를 제공합니다. 이 도구는 Flexbox 및 Grid와 같은 레이아웃 모드를 지원하며 클릭 한 번으로 디자인을 6가지 다른 TUI 프레임워크로 내보낼 수 있습니다.

24. xAI, Grok 코딩 제품 구축을 위해 Cursor 제품 리더 영입

Elon Musk의 xAI는 Grok의 코딩 역량을 가속화하기 위해 Cursor의 시니어 제품 엔지니어인 Andrew Milich와 Jason Ginsberg를 영입했습니다. 이번 행보는 현재 50억 달러 이상으로 추정되는 고수익 개발자 시장에 진입하려는 xAI의 의지를 보여줍니다.

25. Google Maps, 대화형 검색 및 3D 내비게이션을 위해 Gemini 통합

Google Maps는 미묘한 위치 쿼리를 위한 대화형 인터페이스인 'Ask Maps'와 3D 뷰 및 실시간 Street View 분석을 사용하여 차선 안내를 제공하는 'Immersive Navigation'을 출시했습니다. 이러한 업데이트는 Gemini를 활용하여 3억 개의 장소 및 리뷰 데이터를 종합함으로써 개인화된 여행 계획을 제공합니다.