1. Sakana AI, 탠덤 음성 대 음성(S2S) 아키텍처 'KAME' 공개
Sakana AI가 대화형 AI에 실시간 LLM 지식을 주입하는 탠덤 음성 대 음성(S2S) 아키텍처 KAME를 발표했습니다. 이 시스템은 즉각적인 응답을 위한 저지연 S2S 모델과 정교한 지식 신호를 제공하는 비동기 백엔드 LLM을 결합하여, 에이전트가 '생각하면서 동시에 말하는' 것을 가능하게 합니다. 이를 통해 지연 시간 손실 없이 빠른 S2S 모델과 깊은 지식을 갖춘 계층형 시스템 간의 간극을 메웁니다.
2. Claude Code를 위한 DeepClaude 프록시 출시
한 개발자가 DeepSeek V4 Pro를 Anthropic의 Claude Code CLI와 통합하는 오픈 소스 프록시 DeepClaude를 출시했습니다. 이 도구는 터미널 UX, 파일 편집, bash 실행 및 자율적인 다단계 코딩 루프를 그대로 유지하면서 기반 모델만 교체합니다. 모델 API 호출을 DeepSeek 또는 OpenRouter로 라우팅함으로써, 개발자는 훨씬 낮은 토큰당 비용으로 에이전트 루프를 실행할 수 있습니다.
3. Flue, 자율형 AI 에이전트 구축을 위한 TypeScript 프레임워크 출시
Flue가 프로그래밍 가능한 자율형 AI 에이전트 구축을 위한 새로운 TypeScript 프레임워크를 출시했습니다. 이 프레임워크는 에이전트 하네스(harness)와 안전하게 격리된 컨테이너 작업 공간을 결합한 샌드박스 아키텍처를 사용합니다. 이를 통해 에이전트는 파일 편집, 코드 실행, 하위 에이전트 생성 및 터미널 명령을 안전하게 수행할 수 있습니다. 개발자는 CLI 또는 HTTP를 통해 프레임워크를 배포하여 범용 호스팅 시스템에 의존하지 않고 맞춤형 워크플로우를 구축할 수 있습니다.
4. Nexu, 오픈 소스 디자인 워크플로우 'Open Design' 출시
Nexu가 Anthropic의 Claude Design을 대체할 수 있는 오픈 소스 기반의 로컬 우선(local-first) 대안인 Open Design을 출시했습니다. 이 도구는 Claude Code, Codex, Cursor Agent와 같은 기존 로컬 코딩 에이전트를 기술 중심의 디자인 워크플로우에 연결합니다. 데몬을 사용하여 실제 디스크 프로젝트 폴더를 생성하고, 샌드박스 처리된 iframe에서 결과물을 렌더링하기 전 사전 점검과 자기 비판 과정을 거칩니다. 웹 레이어는 Vercel에 배포 가능하며, 개발자가 모든 레이어에 자신의 API 키를 사용할 수 있습니다.
5. 에이전트용 데스크톱 자동화 CLI 'Agent-desktop' 출시
AI 에이전트를 위한 네이티브 데스크톱 자동화 CLI인 Agent-desktop이 출시되었습니다. 이 도구는 토큰 소모가 많고 불안정한 스크린샷 스크레이핑 대신 macOS Accessibility, Windows UI Automation, Linux AT-SPI와 같은 OS 접근성 API를 활용합니다. 이를 통해 웹에서의 Playwright와 유사하게 에이전트에게 구조화된 UI 정보를 제공하며, 더욱 안정적이고 효율적인 데스크톱 자동화를 가능하게 합니다.
6. Apple의 SHARP 3D 모델 브라우저 이식 버전 공개
Apple의 단일 이미지 기반 3D Gaussian splatting 모델인 SHARP의 브라우저 구현 버전이 공개되었습니다. 이 프로젝트는 예측 모델을 ONNX로 내보내고 WebGPU 실행 프로바이더와 onnxruntime-web을 사용하여 클라이언트 측에서 완전히 실행됩니다. 사용자는 이미지를 업로드하여 서버로 데이터를 전송하지 않고도 로컬에서 .ply 파일을 생성할 수 있습니다. 초기 캐시 로드 용량이 크지만, 최신 하드웨어에서는 수 초 내에 추론이 완료됩니다.