Audesso | Daily: AI

OpenTelemetry Profiles, 퍼블릭 알파 버전 공개

00:00 / --:--

← 메인으로

OpenTelemetry Profiles, 퍼블릭 알파 버전 공개

1. OpenTelemetry Profiles, 퍼블릭 알파 버전 공개

OpenTelemetry Profiling SIG가 Profiles를 공식적으로 퍼블릭 알파 버전으로 출시했습니다. 이는 트레이스, 메트릭, 로그에 이어 지속적인 프로덕션 프로파일링을 위한 업계 표준을 확립합니다.

2. Google, Gemini 3.1 Flash 라이브 프리뷰 출시

Google이 사고 수준을 설정할 수 있는 Gemini 3.1 Flash 라이브 프리뷰를 선보였습니다. 높은 수준으로 설정 시 Big Bench Audio Speech to Speech 벤치마크에서 95.9%를 기록하며 두 번째로 높은 점수를 받은 음성 추론 모델이 되었습니다.

3. Mistral, 오픈소스 텍스트 음성 변환(TTS) 모델 공개

Mistral AI가 새로운 오픈소스 TTS 모델을 출시하고 가중치를 무료로 공개했습니다. 해당 모델은 음성 합성 능력 면에서 ElevenLabs를 능가한다고 회사 측은 밝혔습니다.

4. Cohere, Transcribe ASR 모델 출시

Cohere가 기업용 음성 지능을 위해 설계된 최첨단 자동 음성 인식(ASR) 모델인 Cohere Transcribe를 출시했습니다. 이 오픈소스 음성 모델은 비정형 오디오에서 실행 가능한 텍스트를 추출하는 과정을 간소화하는 것을 목표로 합니다.

5. Intercom, 맞춤형 Fin Apex 1.0 모델 공개

고객 서비스 플랫폼 Intercom이 자체 개발한 소형 맞춤형 AI 모델 Fin Apex 1.0을 발표했습니다. 고객 서비스 해결 지표에서 GPT-5.4 및 Claude Sonnet 4.6과 같은 프론티어 모델을 능가한다고 주장합니다.

6. Cursor, Composer를 위한 실시간 강화학습 상세 내용 공개

Cursor가 실시간 강화학습을 사용하여 Composer 기능을 개선하는 방법을 공유했습니다. 팀은 실제 사용자가 생성한 수조 개의 토큰 추론 볼륨에서 학습 신호를 추출하고 있습니다.

7. AI를 활용한 JSONata 재작성으로 연간 50만 달러 절감

한 엔지니어링 팀이 AI를 사용하여 단 하루 만에 JSONata API 인터페이스를 재작성했습니다. 이 재구현을 통해 연간 50만 달러의 운영 비용을 절감한 것으로 알려졌습니다.

8. Turbolite: 1초 미만 S3 쿼리를 위한 SQLite VFS

한 개발자가 Rust로 작성된 실험적 SQLite 가상 파일 시스템(VFS)인 Turbolite를 공개했습니다. 이 도구는 S3 객체 스토리지에서 콜드 JOIN 쿼리를 250ms 미만의 성능으로 처리하도록 설계되었습니다.

9. Stripe, Projects CLI 도입

Stripe가 새로운 명령줄 인터페이스(CLI) 도구인 Stripe Projects를 출시했습니다. 개발자는 이 CLI를 통해 터미널에서 직접 Stripe 서비스를 프로비저닝하고 관리할 수 있습니다.

10. Chroma, 에이전트형 검색 도구 오픈소스화

Chroma가 Hugging Face에 첫 번째 오픈 릴리스를 게시했습니다. 여기에는 기술 보고서와 에이전트형 검색 에이전트 학습에 대한 포괄적인 세부 정보가 포함되어 있습니다.

11. 컴퓨터 사용 에이전트를 위한 VideoCUA 데이터셋 공개

연구진이 인간 수준의 컴퓨터 사용 에이전트 발전을 위해 설계된 대규모 비디오 데이터셋 VideoCUA를 오픈소스로 공개했습니다. Hugging Face에 호스팅된 이 데이터셋은 87개 데스크톱 애플리케이션에 걸친 55시간의 영상, 600만 프레임, 1만 개의 인간 시연 작업을 포함합니다.

12. ATLAS 프레임워크, 14B 모델로 코딩 분야에서 Claude Sonnet 능가

A.T.L.A.S 프레임워크가 단일 소비자용 GPU에서 14B 모델을 사용하여 LiveCodeBench에서 74.6%의 pass@1을 달성했습니다. 이 시스템은 제약 조건 기반 생성과 자체 검증 반복 개선을 통해 Claude Sonnet과 같은 대형 모델을 능가합니다.

13. Tencent, 7B Covo-Audio 모델 오픈소스화

Tencent AI Lab이 70억 파라미터 규모의 엔드투엔드 대형 오디오 언어 모델인 Covo-Audio를 출시했습니다. 이 아키텍처는 음성 처리와 언어 지능을 통합하여 연속적인 오디오 입력을 직접 처리하고 실시간 대화를 위한 오디오 출력을 생성할 수 있습니다.

14. Voxtral-4B-TTS 모델, Hugging Face에 공개

새로운 텍스트 음성 변환 모델인 Voxtral-4B-TTS가 출시되었으며 Hugging Face에서 데모를 확인할 수 있습니다. 40억 파라미터 규모의 이 모델은 폐쇄형 음성 생성 API와 직접 경쟁하는 것을 목표로 합니다.

15. 기술 기업들, 사내 오픈 모델 도입으로 전환

Pinterest, Airbnb, Notion, Cursor, Intercom 등의 기업들이 사내에서 오픈 모델을 직접 학습하고 배포하는 사례가 늘고 있습니다. 엔지니어링 리더들은 많은 작업에서 오픈 모델을 직접 호스팅하고 미세 조정하는 것이 독점 API를 사용하는 것보다 더 효율적이고 저렴하며 빠르다고 보고합니다.

16. Swift 6.3 출시

Apple이 Swift 6.3을 출시하며 소프트웨어 스택 전반으로 언어의 영향력을 확대하고 있습니다. 이번 업데이트는 임베디드 펌웨어부터 인터넷 규모의 서비스에 이르기까지 강력한 안전 보장과 성능 제어에 중점을 둡니다.

데일리 AI 시그널을 인박스로

하루 5분. 무료, 언제든 해지할 수 있습니다.