Audesso | Daily: AI

NVIDIA, Nemotron 3 Super 120B 하이브리드 모델 출시

00:00 / --:--

← 메인으로

NVIDIA, Nemotron 3 Super 120B 하이브리드 모델 출시

1. NVIDIA, Nemotron 3 Super 120B 하이브리드 모델 출시

NVIDIA가 상태 공간 모델(state-space models)과 트랜스포머(transformers)를 결합한 1,200억 개의 파라미터 하이브리드 모델인 Nemotron 3 Super를 출시했습니다. 활성 파라미터는 120억 개에 불과하며, 100만 토큰 컨텍스트 윈도우를 갖추고 이전 버전보다 5배 높은 처리량을 제공하여 대규모 멀티 에이전트 시스템에 최적화되었습니다.

2. 구글, 멀티모달 Gemini Embedding 2 출시

구글이 텍스트, 이미지, 비디오, 오디오를 단일 수치 공간으로 통합하는 멀티모달 모델인 Gemini Embedding 2를 출시했습니다. 출력 차원 사용자 정의를 위한 Matryoshka Representation Learning을 지원하며, 프로덕션 수준의 검색을 위해 RAG 파이프라인을 최적화하도록 설계되었습니다.

3. 아마존, Perplexity 쇼핑 에이전트 대상 금지 가처분 승소

미국 법원이 Perplexity의 Comet 브라우저가 사용자를 대신해 아마존에서 구매하는 것을 금지하는 예비 명령을 내렸습니다. 판결에 따라 Perplexity는 에이전트를 이용한 아마존 사이트 제한 우회를 중단하고 스크래핑된 데이터 사본을 파기해야 하며, 법원은 고객 데이터 및 광고에 대한 위험을 근거로 들었습니다.

4. METR 분석, SWE-bench PR의 절반이 병합 불가능한 것으로 확인

METR의 연구에 따르면 SWE-bench Verified 벤치마크를 통과한 PR 중 약 절반이 실제 환경에서는 메인테이너에 의해 병합되지 않을 것으로 나타났습니다. 이는 현재의 벤치마크가 프로덕션에서 필요한 인간 수준의 반복 및 피드백 루프를 반영하지 못해 에이전트의 준비 상태를 과대평가할 수 있음을 시사합니다.

5. Perplexity, 'Personal Computer' AI 운영체제 공개

Perplexity가 Mac mini에서 로컬로 실행되는 AI 네이티브 운영체제 프록시인 'Personal Computer'를 선보였습니다. 이 시스템은 로컬 파일 및 앱에 액세스할 수 있는 상시 가동 에이전트를 제공하여 자율적으로 목표를 수행하며, 민감한 작업 시에는 사용자의 승인을 요구합니다.

6. 마이크로소프트, 1비트 LLM 추론을 위한 bitnet.cpp 출시

마이크로소프트가 BitNet b1.58과 같은 1비트 LLM을 위한 공식 추론 프레임워크인 bitnet.cpp를 출시했습니다. 이 프레임워크는 표준 CPU에서 무손실 추론을 가능하게 하며, ARM 아키텍처에서 최대 5배의 속도 향상을 달성하여 대규모 모델의 로컬 배포 접근성을 높였습니다.

7. Claude Code 업데이트: 자동 메모리 및 앱 간 컨텍스트 공유

Anthropic이 영구 마크다운 파일을 통한 자동 메모리 기능과 Microsoft Excel 및 PowerPoint 간의 확장된 컨텍스트 공유 기능을 Claude Code에 추가했습니다. 또한 자동화된 풀 리퀘스트 분석 및 버그 탐색을 위한 멀티 에이전트 'Code Review' 시스템도 도입되었습니다.

8. 구글 리서치: 에이전트가 다양한 상대를 통해 협력을 학습

구글 연구진은 LLM 에이전트가 예측 불가능한 다양한 상대와 훈련될 때 멀티 에이전트 시스템에서 협력하는 법을 배울 수 있다는 사실을 발견했습니다. 이 방식은 하드코딩된 조정 규칙 없이도 기업용 에이전트 배포를 위한 확장 가능하고 효율적인 청사진을 제공합니다.

9. 산업용 로보틱스 투자: Mind Robotics 및 Rhoda AI

Rivian에서 분사한 Mind Robotics가 산업용 AI 로봇 개발을 위해 5억 달러를 유치했으며, Rhoda AI는 인터넷 비디오로 훈련된 모델을 위해 4억 5천만 달러를 확보했습니다. 두 스타트업 모두 제조 및 물류 환경에서 복잡한 물리적 작업을 자동화하는 자율 시스템 배포를 목표로 합니다.

10. ElevenLabs, 멀티모달 플랫폼 ElevenCreative 출시

ElevenLabs가 오디오 및 비디오 생성 및 현지화를 위한 브라우저 기반 플랫폼 ElevenCreative를 출시했습니다. 이 시스템은 음성 클로닝, TTS, AI 비디오 생성을 통합하며 단일 인터페이스에서 70개 이상의 언어를 지원합니다.

11. Fish Audio S2-Pro, 150ms 미만의 TTS 지연 시간 달성

Fish Audio가 150ms 미만의 지연 시간으로 표현력 있는 음성 합성이 가능한 대규모 오디오 모델(LAM)인 S2-Pro를 출시했습니다. 제로샷 음성 클로닝과 세밀한 감정 태깅을 지원하며, 통합 오디오 아키텍처로의 전환을 보여줍니다.

12. Claude Code용 컨텍스트 인식 권한 가드 출시

단순한 허용/거부 수준을 넘어선 Claude Code용 컨텍스트 인식 권한 가드 툴 'nah'가 출시되었습니다. 개발자는 파일 삭제나 git 체크아웃 같은 민감한 작업에 대해 세밀한 규칙을 정의하여 자율 에이전트가 치명적인 시스템 변경을 일으키는 것을 방지할 수 있습니다.

13. AI 네트워킹 인프라: Nexthop AI 및 Eridu

Nexthop AI가 하이퍼스케일 데이터 센터의 전력 소비와 지연 시간을 줄이는 특수 스위치 개발을 위해 5억 달러를 유치했습니다. 동시에 Eridu는 대규모 GPU 클러스터용 고성능 AI 네트워킹 장비 구축을 위해 2억 달러를 확보하며 스텔스 상태에서 벗어났습니다.

14. LLMfit 유틸리티, 하드웨어 호환성별 모델 순위 제공

LLMfit은 로컬 하드웨어를 스캔하여 특정 CPU, RAM, GPU 구성과의 호환성을 바탕으로 LLM의 순위를 매기는 새로운 유틸리티입니다. 메모리 및 컴퓨팅 제약을 분석하여 개발자가 온디바이스 실행에 가장 효율적인 모델을 선택하도록 돕습니다.

15. Dify, 오픈 소스 에이전틱 워크플로우 플랫폼 위해 3,000만 달러 확보

Dify가 에이전틱 워크플로우 구축 및 운영을 위한 오픈 소스 플랫폼을 위해 3,000만 달러를 유치했습니다. 이 플랫폼은 통합 메모리, 도구 관리 및 보안 제어 기능을 갖춘 AI 애플리케이션 배포를 위한 구조화된 환경을 제공합니다.

16. Expo Agent, 자연어로 네이티브 앱 컴파일

Expo Agent는 자연어 프롬프트에서 네이티브 iOS 및 Android 애플리케이션을 생성하고 컴파일하는 새로운 도구입니다. React Native, SwiftUI, Jetpack Compose를 지원하여 브라우저 기반의 모바일 앱 배포 및 테스트를 가능하게 합니다.

17. NotebookLM-py, 연구 도구용 Python API 제공

NotebookLM-py는 구글 NotebookLM을 위한 Python API 및 CLI를 제공하여 웹 인터페이스에 없는 기능에 대한 프로그래밍 방식의 액세스를 가능하게 합니다. 이를 통해 연구자들은 NotebookLM의 요약 및 검색 기능을 자동화된 데이터 처리 파이프라인에 통합할 수 있습니다.

18. Anthropic, AI 정책 연구소 설립

Anthropic의 공동 창립자 잭 클라크(Jack Clark)가 경제, 법률 및 거버넌스에 미치는 AI의 영향을 연구하는 새로운 연구소를 이끕니다. 이 연구소는 AI의 사회적 역할에 관한 정책 및 규제 논의를 지원하기 위해 프런티어 모델 데이터에 직접 액세스할 수 있습니다.

19. WiFi-DensePose, WiFi 신호로 신체 위치 재구성

연구진이 표준 WiFi 신호를 사용하여 전신 위치를 실시간으로 재구성하는 시스템인 WiFi-DensePose를 개발했습니다. 이 기술은 표준 하드웨어의 채널 상태 정보를 분석하여 카메라나 웨어러블 기기 없이도 벽 너머의 신체 부위를 매핑합니다.

20. Temporal API 구현으로 JavaScript 날짜 처리 문제 해결

블룸버그 엔지니어들이 Date 객체의 고질적인 문제를 해결하기 위해 JavaScript에 Temporal API를 구현하려는 9년간의 노력을 상세히 설명했습니다. 새로운 API는 날짜, 시간 및 시간대를 처리하는 더 견고하고 타입 안전한 방식을 제공합니다.

21. 모질라, 웹어셈블리 일급 언어 로드맵 발표

모질라가 웹어셈블리(WebAssembly)를 웹의 일급 언어로 만들기 위한 계획을 발표하며 고수준 언어 지원 기능을 확장했습니다. 최근 업데이트에는 복잡한 웹 애플리케이션의 성능 개선을 위한 공유 메모리, SIMD 및 예외 처리 지원이 포함되었습니다.

22. Replit, AI 인프라 붐에 힘입어 기업 가치 90억 달러 달성

Replit이 4억 달러 규모의 투자 유치 후 90억 달러의 기업 가치를 기록했으며, 연말까지 ARR 10억 달러를 목표로 하고 있습니다. 이 회사는 AI 기반 개발 환경을 지속적으로 확장하며 협업 및 에이전틱 코딩의 주요 플랫폼으로 자리 잡고 있습니다.

23. 오라클, AI 수요로 클라우드 매출 44% 성장 보고

오라클이 AI 인프라 수요에 힘입어 클라우드 매출이 89억 달러로 44% 급증했다고 발표했습니다. 3분기 총 매출은 171억 9천만 달러를 기록했으며, 이는 대규모 AI 워크로드 호스팅 및 프런티어 모델 훈련용 컴퓨팅 제공 분야에서 오라클의 성장을 보여줍니다.

24. Zendesk, 에이전틱 고객 서비스를 위해 Forethought 인수

Zendesk가 AI 기반 지원 역량 강화를 위해 에이전틱 고객 서비스 스타트업 Forethought를 인수했습니다. 이번 인수를 통해 Forethought의 자율 해결 기술이 Zendesk 플랫폼에 통합되어 복잡한 고객 상호작용을 자동화할 예정입니다.

25. 워드프레스, my.WordPress.net 비공개 작업 공간 출시

워드프레스가 호스팅이나 가입 없이 사이트를 만들 수 있는 브라우저 기반 비공개 작업 공간인 my.WordPress.net을 출시했습니다. 이 서비스는 브라우저 내에서 직접 글쓰기, 연구 및 AI 도구 통합을 수행할 수 있는 개인용 환경으로 설계되었습니다.

데일리 AI 시그널을 인박스로

하루 5분. 무료, 언제든 해지할 수 있습니다.