아마존, AI 지원 장애 발생 후 90일간 '코드 안전 리셋' 시행

1. 아마존, AI 지원 장애 발생 후 90일간 '코드 안전 리셋' 시행

아마존 리테일 부문은 AI 지원 코드 변경이 고영향 장애의 원인이 됨에 따라 90일간의 '코드 안전 리셋'을 도입하고 모든 배포에 대해 두 명의 시니어 엔지니어 승인을 의무화했습니다. 내부 보고서에 따르면 이러한 사고는 단 하루 만에 수백만 건의 주문 손실을 초래한 6시간의 가동 중단을 포함하여 '높은 폭발 반경(high blast radius)'을 기록했습니다.

2. Perplexity, Search, Agent 및 Sandbox API 출시

Perplexity가 자사의 "Personal Computer" 에이전트와 동일한 인프라를 기반으로 구축된 Search, Agent, Sandbox, Embeddings 등 4종의 새로운 API를 출시했습니다. 이 도구들을 통해 개발자들은 웹 규모의 검색, 에이전트 오케스트레이션 및 보안 코드 실행 환경을 외부 애플리케이션에 프로그래밍 방식으로 통합할 수 있습니다.

3. 메타, 2027년까지의 MTIA 칩 로드맵 공개

메타는 외부 실리콘 공급업체에 대한 의존도를 낮추고 추론 비용을 최적화하기 위해 설계된 4종의 자체 개발 칩 로드맵을 발표했습니다. MTIA 300은 현재 콘텐츠 랭킹용으로 생산 중이며, MTIA 400, 450, 500 세대는 2027년까지 대규모 배포가 예정되어 있습니다.

4. Claude Code 업데이트: 생성형 UI 및 앱 간 컨텍스트 공유

Anthropic은 대화 내에서 직접 맞춤형 차트와 시각화 자료를 생성하는 기능과 Microsoft Excel 및 PowerPoint 간의 공유 컨텍스트 확장 기능을 Claude에 업데이트했습니다. 또한 Claude Code CLI에는 활성 에이전트 작업을 방해하거나 기본 컨텍스트 창을 어지럽히지 않고 별도의 대화를 나눌 수 있는 /btw 명령어가 도입되었습니다.

5. NVIDIA Nemotron 3 Super, 로컬 실행 지원

NVIDIA의 1,200억 개 파라미터 하이브리드 MoE 모델인 Nemotron 3 Super를 이제 Ollama, LM Studio, Cloudflare Workers AI를 통해 로컬에서 실행할 수 있습니다. 이 모델은 100만 토큰의 컨텍스트 창과 멀티 에이전트 시스템의 처리량을 최적화하기 위한 네이티브 멀티 토큰 예측 기능을 갖추고 있습니다.

6. 스탠퍼드, 로컬 우선 에이전트 프레임워크 OpenJarvis 출시

스탠퍼드 대학교 Scaling Intelligence Lab 연구진이 기기에서 완전히 실행되는 개인용 AI 에이전트 구축을 위한 오픈 소스 프레임워크인 OpenJarvis를 출시했습니다. 이 프로젝트는 통합 도구 사용, 메모리 및 학습 기능을 포함하여 로컬 우선 AI 시스템에 필요한 전체 소프트웨어 스택을 제공합니다.

7. Axiom Math, AI 기반 정형 검증을 위해 2억 달러 투자 유치

Axiom Math가 Lean 언어를 활용해 코드와 수학적 증명을 정형 검증(formal verification)하는 AI 시스템 개발을 위해 2억 달러를 확보했습니다. 이 스타트업은 미션 크리티컬 시스템의 정확성을 보장하기 위해 이러한 검증 기술을 소프트웨어 엔지니어링에 적용하는 것을 목표로 합니다.

8. Databricks, 데이터 인프라 에이전트용 Genie Code 출시

Databricks가 데이터 엔지니어링 파이프라인 자동화, 시스템 장애 디버깅 및 프로덕션 대시보드 유지 관리를 위해 설계된 AI 에이전트 Genie Code를 선보였습니다. 내부 벤치마크에 따르면 이 에이전트는 77%의 성공률을 기록하며 데이터 관련 작업에서 범용 코딩 에이전트보다 월등한 성능을 보였습니다.

9. IonRouter, Grace Hopper를 위한 고처리량 추론 스택 공개

IonRouter가 밀리초 단위의 스왑 타임으로 단일 GPU에서 모델을 멀티플렉싱하도록 설계된 맞춤형 추론 스택과 함께 스텔스 상태에서 벗어났습니다. NVIDIA Grace Hopper 아키텍처에 최적화된 이 플랫폼은 고성능 로보틱스 인지 및 비디오 파이프라인을 위한 전용 GPU 스트림을 제공합니다.

10. OneCLI: AI 에이전트를 위한 오픈 소스 비밀 금고

OneCLI는 투명한 자격 증명 주입기 역할을 하여 AI 에이전트의 API 키를 보호하도록 설계된 Rust 기반 게이트웨이입니다. 개발자는 비밀 정보를 한 번만 저장하면 모델에 원본 키를 노출하지 않고 에이전트 워크플로우에 주입할 수 있어 자율 도구 사용 시의 보안 위험을 완화할 수 있습니다.

11. Axe: 유닉스 스타일 에이전트 오케스트레이션을 위한 12MB 바이너리

Axe는 에이전트를 조합 가능한 유닉스 스타일 프로그램으로 취급하여 무거운 AI 프레임워크를 대체하도록 설계된 미니멀리스트 CLI 도구입니다. TOML 기반 정의를 사용하여 특정 목적에 집중된 단일 에이전트 간에 데이터를 전달함으로써, 방대한 컨텍스트 오버헤드 없이 복잡한 체인을 쉽게 구축할 수 있게 해줍니다.

12. PycoClaw, ESP32 마이크로컨트롤러에서 에이전트 추론 구현

PycoClaw는 MicroPython 기반 엔진을 사용하여 ESP32 마이크로컨트롤러에 OpenClaw급 에이전트 추론 기능을 제공합니다. 이 시스템은 재귀적 도구 호출, 컨텍스트 압축, GPIO 및 CAN을 통한 직접 하드웨어 제어를 지원하여 5달러짜리 하드웨어에서도 자율형 에지 에이전트를 구동할 수 있게 합니다.

13. Understudy: 시연 기반 데스크톱 에이전트 학습

Understudy는 단 한 번의 인간 시연을 관찰함으로써 브라우저, 터미널, GUI 애플리케이션 전반에 걸쳐 작업을 수행하는 방법을 배우는 학습형 데스크톱 에이전트입니다. 호스트 시스템의 파일 시스템과 셸에서 직접 작동하여 서로 분리된 데스크톱 도구들 사이의 간극을 메워줍니다.

14. WolfIP: 동적 메모리 할당이 없는 경량 TCP/IP 스택

WolfIP는 동적 메모리 할당 없이 작동하는 리소스 제한적 임베디드 시스템용 경량 TCP/IP 스택입니다. BSD 스타일의 논블로킹 소켓 API를 제공하며, 사전 할당된 버퍼를 사용하여 고정된 수의 동시 소켓 연결을 지원합니다.

15. RAG 시스템, 문서 포이즈닝 공격에 취약

보안 연구에 따르면 RAG 시스템이 지식 베이스에 주입된 조작된 파일로 인해 LLM이 허위 데이터를 보고하게 만드는 '문서 포이즈닝(document poisoning)'에 매우 취약한 것으로 나타났습니다. 이 공격은 탈옥(jailbreaking)이 필요 없으며 표준 하드웨어에서 몇 분 만에 실행될 수 있어, 기업용 검색 파이프라인의 심각한 보안 허점을 드러냈습니다.

16. Gumloop, 노코드 에이전트 오케스트레이션을 위해 5,000만 달러 확보

Gumloop이 신뢰할 수 있는 AI 에이전트 구축을 위한 노코드 플랫폼 확장을 위해 Benchmark가 주도한 5,000만 달러 규모의 시리즈 B 투자를 유치했습니다. 이 플랫폼은 다단계 작업 오케스트레이션에 집중하여 비기술직 사용자도 복잡한 비즈니스 워크플로우를 처리하는 에이전트를 배포할 수 있도록 지원합니다.

17. 마이크로소프트, 오라클 철수 후 애빌린 데이터 센터 협상 중

마이크로소프트가 텍사스주 애빌린에 위치한 데이터 센터 부지에서 수백 메가와트의 용량을 임대하기 위해 심도 있는 협상을 진행 중인 것으로 알려졌습니다. 이번 행보는 자금 조달 분쟁으로 인해 오라클과 OpenAI가 해당 부지를 포기한 이후에 나온 것으로, 하이퍼스케일 인프라 확충 전략의 변화를 시사합니다.

18. Atlassian, AI 전환 자금 마련을 위해 인력 10% 감축

Atlassian이 AI 개발 및 기업 영업으로 자본을 재배치하기 위해 약 1,600명의 직원에 해당하는 인력 10% 감축을 발표했습니다. 이번 구조조정은 Block의 사례와 유사하며, 주요 소프트웨어 기업들이 AI 중심의 인프라 및 제품 전환을 위해 인력을 줄이는 추세를 반영합니다.

19. 구글, 'Ask Maps' 및 몰입형 내비게이션 출시

구글이 실제 장소에 대한 복잡한 자연어 질의를 처리하는 Gemini 기반 대화형 인터페이스인 'Ask Maps'를 출시했습니다. 이번 업데이트에는 3D 건물 데이터와 차선 안내를 활용해 더욱 상세한 시각적 경로를 제공하는 '몰입형 내비게이션(Immersive Navigation)'도 포함되었습니다.

20. 아마존 및 마이크로소프트, 전문 의료 AI 에이전트 출시

아마존과 마이크로소프트가 각각 의료 분야에 특화된 AI 에이전트를 출시했습니다. 아마존의 Health AI는 의료 기록 및 예약을 관리하며, 마이크로소프트의 Copilot Health는 웨어러블 기기의 생체 데이터를 통합합니다. 이 시스템들은 보안이 유지되는 HIPAA 준수 환경 내에서 개인화된 의학적 조언을 제공하고 임상 문서 작성을 자동화하도록 설계되었습니다.

21. Malus 서비스, AI를 활용한 클린룸 오픈 소스 재구현 지원

Malus는 독점 AI를 사용하여 오픈 소스 프로젝트를 독립적으로 처음부터 다시 제작함으로써 카피레프트(copyleft) 라이선스 의무를 우회하는 새로운 서비스입니다. 이 서비스는 법적으로 구별되는 코드와 기업 친화적인 라이선스를 생성하여 기업 사용자의 저작자 표시 요구 사항을 제거한다고 주장합니다.

22. MacBook Neo 벤치마크, DB 워크로드에서 강력한 성능 입증

DuckDB를 사용한 애플의 새로운 보급형 MacBook Neo 벤치마크 결과, ClickBench 및 TPC-DS와 같은 대규모 데이터베이스 워크로드에서 놀라운 성능을 보였습니다. 이는 최신 통합 메모리 아키텍처를 통해 저가형 하드웨어도 이전에는 하이엔드 워크스테이션에서만 가능했던 데이터 처리 작업을 수행할 수 있음을 시사합니다.

23. Grammarly, AI 학습 데이터 관련 집단 소송 직면

Grammarly가 동의 없이 저자의 데이터를 사용하여 'AI 에디터'를 학습시킴으로써 프라이버시 및 퍼블리시티권을 침해했다는 혐의로 집단 소송을 당했습니다. 이러한 반발에 대응하여 Superhuman은 실제 작가들로부터 영감을 받은 제안을 제공하던 Grammarly의 'Expert Review' 기능을 이미 비활성화했습니다.

24. AI 지원 라이브러리 재작성으로 카피레프트 약화 우려 확산

Python 라이브러리 chardet을 AI를 이용해 처음부터 다시 작성한 프로젝트가 AI 시대의 카피레프트 보호 약화에 대한 논쟁을 불러일으켰습니다. 해당 프로젝트는 재작성 후 라이선스를 LGPL에서 MIT로 전환했으며, 이는 LLM이 생성한 파생 저작물의 지위에 대한 기술적 및 법적 의문을 제기하고 있습니다.

25. 구글 리서치, Groundsource 홍수 이벤트 데이터셋 공개

구글 리서치가 Gemini를 사용하여 500만 건의 과거 뉴스 보도에서 추출한 260만 건의 홍수 이벤트 데이터셋인 Groundsource를 공개했습니다. 이 프로젝트는 환경 모델링의 데이터 부족 문제를 해결하기 위해 정성적인 역사 기록을 정량적인 시계열 데이터로 변환하는 방법론을 제시합니다.