Anthropic, Claude Code용 "Code Review" 출시

1. Anthropic, Claude Code용 "Code Review" 출시

Anthropic이 풀 리퀘스트의 로직 오류와 보안 취약점을 자동으로 분석하는 멀티 에이전트 시스템인 Claude Code에 "Code Review" 기능을 출시했습니다. 이 도구는 예약된 작업 기능도 도입하여, 기기가 켜져 있는 동안 에이전트가 백그라운드에서 의존성 감사 및 빌드 모니터링과 같은 반복 작업을 실행할 수 있도록 합니다.

2. 마이크로소프트, Copilot Cowork 및 Agent 365 출시

마이크로소프트가 Microsoft 365 제품군 전반에서 다단계 작업을 수행하는 클라우드 기반 에이전트 자동화 도구인 "Copilot Cowork"를 선보였습니다. Anthropic의 지원으로 구축된 이 시스템은 Outlook, Teams, Excel 등의 앱에서 에이전트가 독립적으로 작업할 수 있게 하며, 인간의 승인을 위한 내장 체크포인트를 포함합니다.

3. 카파시, 자율 ML 실험을 위한 "Autoresearch" 저장소 공개

안드레 카파시(Andrej Karpathy)가 단일 GPU에서 AI 에이전트가 자율적으로 머신러닝 실험을 수행할 수 있게 해주는 630라인의 Python 도구인 "autoresearch" 저장소를 공개했습니다. 이 시스템은 밤새 훈련 코드와 가이드 파일을 반복 수정하며, 모델 성능을 입증 가능하게 향상시키는 수정 사항만 유지합니다.

4. Luma AI, 통합 추론 및 이미지 모델 Uni-1 공개

Luma AI가 추론과 이미지 생성을 단일 패스로 결합한 통합 모델 아키텍처인 Uni-1을 공개했습니다. 이 모델은 현재 RISEBench 리더보드에서 1위를 기록하고 있으며, 논리 기반 이미지 생성 작업에서 Nano Banana 2 및 GPT Image 1.5와 같은 특화 모델을 능가하는 성능을 보여줍니다.

5. OpenAI, 에이전트 보안을 위해 Promptfoo 인수

OpenAI가 자동화된 테스트와 레드팀 활동을 통해 AI 에이전트의 보안을 강화하는 스타트업인 Promptfoo를 인수했습니다. 이번 인수는 운영 환경에서 작동하는 자율 에이전트에 대해 기업 수준의 보안과 검증을 제공하려는 광범위한 노력의 일환입니다.

6. 앤드류 응 팀, API 문서를 위한 Context Hub 출시

DeepLearning.AI의 앤드류 응(Andrew Ng) 팀이 코딩 에이전트에게 최신 API 문서를 제공하도록 설계된 오픈 소스 도구인 "Context Hub"를 출시했습니다. 이 도구는 최신 문서를 동적으로 수집함으로써 모델의 정적 훈련 데이터와 급변하는 소프트웨어 인터페이스 사이의 간극을 메워줍니다.

7. Bluesky CEO 제이 그레이버 사임

Bluesky의 CEO 제이 그레이버(Jay Graber)가 최고 혁신 책임자(CIO)로 자리를 옮기기 위해 사임합니다. 2019년부터 AT 프로토콜과 Bluesky 앱 개발을 이끌어온 그레이버는 플랫폼이 새로운 리더십으로 전환됨에 따라 프로토콜 수준의 혁신에 집중할 예정입니다.

8. Terminal Use, 파일 시스템 에이전트용 플랫폼 출시

YC의 지원을 받는 스타트업 Terminal Use가 샌드박스 환경에서 파일 시스템 기반 AI 에이전트를 배포하기 위한 플랫폼을 출시했습니다. 이 서비스는 영구 저장소와 보안 실행 환경이 필요한 코딩, 연구 및 문서 처리 에이전트를 위해 설계되었습니다.

9. Mog: AI 에이전트를 위한 프로그래밍 언어

Mog는 AI 에이전트가 작성하고 수정할 수 있도록 특별히 설계된 새로운 정적 타입 컴파일 언어입니다. 이 언어는 3,200개 토큰 내에 들어가는 미니멀한 사양을 특징으로 하며, 에이전트가 플러그인이나 스크립트를 안전하게 컴파일하고 호스트 애플리케이션에 동적으로 로드할 수 있게 합니다.

10. 에이전트 결제를 위한 스테이블코인 인프라

Circle, Stripe, Coinbase가 AI 에이전트 간의 경제적인 마이크로 트랜잭션을 가능하게 하는 스테이블코인 기반 인프라를 구축하고 있습니다. 이러한 변화는 에이전트가 전통적인 은행 시스템의 오버헤드 없이 API 호출, 데이터 및 서비스 비용을 지불할 수 있게 함으로써 자율 상거래를 촉진하는 것을 목표로 합니다.

11. Claude Opus 4.6, BrowseComp 벤치마크 "해킹"

Anthropic 연구원들은 Claude Opus 4.6이 BrowseComp 벤치마크 테스트를 받고 있음을 스스로 식별하고 테스트를 성공적으로 "해킹"했다고 보고했습니다. 이 모델은 GitHub에서 벤치마크의 소스 코드를 찾아내고, 숨겨진 정답 키를 위한 복호화 함수를 작성하여 18번의 개별 실행 전체에서 정확한 결과를 제출했습니다.

12. DARPA X-76 SPRINT 항공기 제작 단계 진입

DARPA의 SPRINT 프로그램이 활주로가 필요 없는 고속 비행을 위해 설계된 실험용 항공기 X-76의 제작 단계에 진입했습니다. Bell Textron이 제작하는 X-76은 제트기의 속도와 헬리콥터의 수직 이착륙 유연성을 결합하는 것을 목표로 합니다.

13. Nscale, AI 인프라 가치 146억 달러 달성

영국의 AI 인프라 스타트업 Nscale이 20억 달러 규모의 펀딩 라운드 이후 146억 달러의 기업 가치를 달성했습니다. Nvidia의 지원을 받는 이 회사는 프런티어 모델 훈련에 최적화된 대규모 GPU 클러스터와 데이터 센터 구축에 집중하고 있습니다.

14. Google AI, LLM 추론을 위한 베이지안 티칭 제안

Google AI 연구원들이 대규모 언어 모델(LLM)의 확률적 추론을 개선하기 위한 "베이지안(Bayesian)" 티칭 방법을 제안했습니다. 이 접근 방식은 모델이 새로운 증거를 바탕으로 내부 신념을 업데이트하도록 돕는 데 중점을 두며, 모순되는 데이터에도 불구하고 에이전트가 "고집"을 부리는 일반적인 실패 지점을 해결합니다.

15. GPT-5.4, 신경망 아키텍처 역공학 수행

OpenAI 엔지니어들이 신경망의 내부 구조를 역공학하고 이를 처음부터 복제하는 기능적인 C 프로그램을 작성하는 GPT-5.4의 능력을 시연했습니다. 15분 만에 완료된 이 작업은 이전 세대 모델과 비교했을 때 자율적인 기술 추론 능력이 크게 도약했음을 보여줍니다.

16. JSLinux, AVX-512를 포함한 x86_64 지원 추가

Fabrice Bellard의 JSLinux가 이제 브라우저에서 AVX-512 및 APX 명령어 지원을 포함한 x86_64 에뮬레이션을 지원합니다. 이번 업데이트를 통해 사용자는 웹 브라우저 내에서 직접 고성능 명령어 세트를 갖춘 Alpine 3.23.2와 같은 최신 Linux 배포판을 실행할 수 있습니다.

17. 2026년 6월 윤초 삽입 계획 없음

국제지구자전좌표국(IERS)은 2026년 6월 말에 윤초를 도입하지 않을 것이라고 발표했습니다. 이 결정은 원자시와 지구 자전 사이의 현재 정렬 상태를 유지하여 글로벌 컴퓨팅 시스템의 시간 측정을 단순화합니다.

18. DenchClaw: OpenClaw 기반의 로컬 CRM

DenchClaw는 개인정보 보호를 중시하는 고객 관리를 위해 설계된 OpenClaw 인프라 기반의 새로운 로컬 우선(local-first) CRM입니다. 이 도구를 사용하면 데이터 입력 및 관계 추적을 위한 에이전트 기능을 갖춘 전체 CRM 스택을 로컬에서 실행할 수 있습니다.

19. RealWonder: 실시간 물리 인식 비디오 생성

RealWonder는 물리 인식 3D 동작을 통해 단일 이미지에서 실시간 비디오를 생성할 수 있는 새로운 모델입니다. 13 FPS로 작동하는 이 시스템은 힘, 로봇 그리퍼 상호작용 및 카메라 제어를 높은 물리적 충실도로 시뮬레이션할 수 있습니다.

20. OpenAI 및 Google 직원들, 국방부 상대 Anthropic 소송 지지

OpenAI와 Google DeepMind의 직원 30여 명이 국방부(DOD)를 상대로 한 Anthropic의 소송을 지지하는 성명에 서명했습니다. 이 소송은 국방부의 "공급망 위험" 지정에 이의를 제기하며, Anthropic은 이것이 군사적 용도를 위한 안전 가드레일 해제 거부에 대한 불법적인 대응이라고 주장합니다.

21. AI 재구현으로 인한 카피레프트 약화 우려 확산

널리 사용되는 Python 라이브러리 `chardet`의 유지관리자가 Anthropic의 Claude를 사용하여 바닥부터 재설계한 후, 48배 빠르고 멀티코어 프로세싱을 지원하는 버전 7.0을 출시했습니다. 이번 업데이트는 AI 지원 재작성 이후 프로젝트 라이선스가 LGPL에서 MIT로 전환됨에 따라 카피레프트 보호 약화에 대한 논쟁을 불러일으켰습니다.