GitHub Copilot, 학습 데이터 정책 업데이트

1. GitHub Copilot, 학습 데이터 정책 업데이트

GitHub은 4월 24일부터 사용자 상호작용 데이터를 AI 모델 학습에 활용한다고 발표했습니다. 여기에는 Copilot Free, Pro, Pro+ 사용자의 입력값, 출력값, 코드 스니펫 및 관련 컨텍스트가 포함됩니다. 자신의 코드가 모델 학습에 사용되는 것을 원치 않는 개발자는 직접 옵트아웃(opt-out) 설정을 해야 합니다.

2. Anthropic, Claude 4.6 출시

Anthropic이 100만 토큰 컨텍스트 윈도우와 Chat, Cowork, Code, Projects의 네 가지 모드를 갖춘 Claude 4.6을 출시했습니다. 이번 업데이트에는 Scheduled Tasks와 Connector를 통해 워크플로우를 자동화하는 Cowork 스위트가 포함되었습니다. Code 환경은 이제 CLAUDE.md 계층 구조, MCP 프로토콜, Agent Teams를 활용하여 자율적인 개발을 지원합니다.

3. 구글, 메모리 압축 알고리즘 TurboQuant 공개

Google Research가 대규모 언어 모델 및 벡터 검색을 위한 새로운 양자화 알고리즘 세트인 TurboQuant를 발표했습니다. 이 기술은 LLM의 key-value 캐시 메모리를 6배 절감하고 최대 8배의 속도 향상을 제공합니다. 구글은 이러한 대규모 압축 성과를 정확도 손실 없이 달성했다고 보고했습니다.

4. 배치 추론을 위한 Ray Data LLM 라이브러리 출시

대규모 배치 추론을 위한 새로운 라이브러리 Ray Data LLM이 출시되었습니다. 개별 요청 지연 시간보다 처리량(throughput)을 우선시하는 워크로드에 최적화되어 설계되었습니다. 확장 가능한 실행과 결함 허용(fault tolerance)을 제공하며, 프로덕션 규모에서 vLLM의 동기식 엔진보다 2배 높은 처리량을 구현하는 것으로 알려졌습니다.

5. Anthropic, 앱 개발을 위한 멀티 에이전트 아키텍처 상세 공개

Anthropic이 AI 기반 프론트엔드 디자인 및 풀스택 애플리케이션 코딩 성능을 개선하기 위한 멀티 에이전트 아키텍처를 공유했습니다. GAN(Generative Adversarial Networks)에서 영감을 받은 이 방식은 플래너, 제너레이터, 이밸류에이터 에이전트를 분리하여 사용합니다. 이러한 역할 분담은 장시간 소요되는 개발 작업에서 일관성 및 자기 평가 문제를 해결하는 데 도움을 줍니다.

6. 명세 기반 코드 생성을 위한 오픈소스 하네스 Ossature

명세 기반 코드 생성을 위한 새로운 오픈소스 하네스 Ossature가 소개되었습니다. 개발자가 소프트웨어 명세를 작성하면 Ossature가 LLM을 사용해 모호성을 검증하고 감사하며, 이후 편집 가능한 계획을 수립하고 각 작업에 필요한 컨텍스트만 제공하여 단계별로 코드를 생성합니다.

7. 컨텍스트 윈도우를 겨냥한 "Disregard That" 공격 주의보

보안 연구원들이 공유 컨텍스트 윈도우에서의 "Disregard That" 공격 위험성을 경고했습니다. 이 취약점은 공격자가 컨텍스트 윈도우에 이전 지침을 무시하라는 명령을 삽입할 때 발생합니다. 이는 신뢰할 수 없는 사용자나 외부 입력과 컨텍스트 윈도우를 공유할 때의 위험성을 시사합니다.

8. AI 에이전트 토큰 비용을 절감하는 xMemory 기술

King’s College London과 The Alan Turing Institute 연구진이 장기 운영 AI 에이전트의 컨텍스트 관리를 위한 xMemory 기술을 개발했습니다. 기존 RAG 파이프라인은 멀티 세션 배포 시 컨텍스트 비대화로 인해 실패하는 경우가 많으나, xMemory는 정보를 효율적으로 조직화하여 토큰 비용을 줄이고 장기 상호작용 성능을 유지합니다.

9. NVIDIA, PivotRL 프레임워크 발표

NVIDIA AI가 소프트웨어 엔지니어링 및 웹 브라우징과 같은 장기 에이전트 작업을 위한 LLM 사후 학습 프레임워크 PivotRL을 도입했습니다. 이 프레임워크는 연산 효율성과 모델 일반화 사이의 균형 문제를 해결하며, 4배 적은 롤아웃 턴으로도 높은 에이전트 정확도를 달성합니다.

10. Hugging Face, HF Papers CLI 출시

Hugging Face가 `hf papers` 명령줄 인터페이스를 출시했습니다. 이 도구는 AI 에이전트가 arXiv 논문을 의미론적으로 검색하고 마크다운 형식으로 추출할 수 있게 지원하며, 자동화된 연구 워크플로우를 위한 인프라 역할을 하도록 설계되었습니다.

11. DuckDB용 사전 필터링 HNSW 커뮤니티 확장 기능

DuckDB를 위한 새로운 커뮤니티 확장 기능이 ACORN-1을 사용한 사전 필터링 HNSW(Hierarchical Navigable Small World) 벡터 검색을 구현했습니다. DuckDB VSS 확장과 usearch를 수정하여 pgvector와 유사한 경험을 제공하며, 개발자가 실제 사전 필터링된 근사 근접 이웃 검색을 통해 효율적인 하이브리드 검색을 수행할 수 있게 합니다.

12. 오라클, 엔터프라이즈 에이전트를 위한 AI 데이터 스택 통합

오라클이 에이전트 기반 AI 배포 시 발생하는 데이터 동기화 문제를 해결하기 위해 데이터베이스 제품군을 업데이트했습니다. 통합된 스택은 벡터 스토어, 관계형 DB, 그래프 스토어, 레이크하우스를 아우르는 단일 진실 공급원(Single Version of Truth)을 제공하여, 프로덕션 부하에서 컨텍스트를 노후화시키는 복잡한 동기화 파이프라인의 필요성을 제거합니다.

13. 레딧, 봇 의심 계정에 대한 사람 인증 도입

레딧이 봇 기반 스팸 및 플랫폼 조작을 억제하기 위한 새로운 정책을 도입합니다. 자동화가 의심되는 계정은 이제 사람임을 인증해야 하며, 사용자에게 서비스를 제공하는 자동화 계정에는 명시적인 라벨이 부착될 예정입니다.

14. 구글, 양자 내성 암호 전환 기한 2029년으로 설정

구글이 양자 내성 암호로의 전환 준비 기한을 2029년으로 앞당겼습니다. 이는 현재의 암호 체계를 해독할 수 있는 양자 컴퓨터의 등장에 대비해 시스템 보안을 강화하기 위함입니다. 구글은 양자 컴퓨팅의 발전 속도가 예상보다 빠를 수 있다고 언급했습니다.

15. ARC Prize 재단, ARC-AGI-3 벤치마크 공개

ARC Prize 재단이 단순 암기력이 아닌 즉각적인 추론 능력을 측정하도록 설계된 새로운 AI 벤치마크 ARC-AGI-3를 발표했습니다. 비디오 게임과 유사한 시나리오를 사용하여 모델의 역량을 테스트하며, 프런티어 모델의 진정한 추론 한계를 더 정확히 평가하는 것을 목표로 합니다.

16. 구글, 음악 생성 모델 Lyria 3 Pro 출시

구글이 업그레이드된 AI 음악 생성 모델 Lyria 3 Pro를 출시했습니다. 새 버전은 최대 트랙 길이를 30초에서 3분으로 연장했으며, 생성된 오디오에 대해 사용자에게 더욱 강화된 창의적 제어 기능을 제공합니다.

17. 음성 에이전트 평가를 위한 EVA 프레임워크 출시

음성 에이전트 평가를 위한 새로운 프레임워크 EVA가 출시되었습니다. EVA는 완전한 멀티턴 음성 대화를 평가하며, 실제와 유사한 봇 간 대화(bot-to-bot) 아키텍처를 활용하여 음성 에이전트의 성능을 테스트하고 측정합니다.

18. Bland.ai, 음성 에이전트 구축 도구 Norm 출시

Bland.ai가 견고한 전화 상담 에이전트 제작을 간소화하는 새로운 도구 Norm을 도입했습니다. 개발자가 원하는 기능을 설명하기만 하면 Norm이 음성 AI의 복잡한 내부 과정을 자동화하여 에이전트를 구축할 수 있게 해줍니다.

19. Databricks, 보안 플랫폼 Lakewatch 출시

Databricks가 AI 에이전트를 활용해 위협을 탐지하는 AI 기반 보안 정보 및 이벤트 관리(SIEM) 플랫폼 Lakewatch를 발표했습니다. 이번 출시는 안전한 에이전트 배포를 지원하기 위해 진행된 Antimatter 및 SiftD.ai 인수의 연장선상에 있습니다.

20. RLVR을 통한 LLM 추론 성능 향상

검증 가능한 보상을 활용한 강화학습(RLVR)의 방향성 업데이트가 LLM의 추론 성능을 개선한다는 새로운 연구 결과가 나왔습니다. 이 기술은 처리 과정에서 추론에 결정적인 토큰을 더 잘 식별하며, 테스트 시점의 외삽과 학습 시점의 가중치 재설정을 가능하게 하여 전반적인 정확도를 높입니다.

21. LLM의 의미론적 보정(Semantic Calibration) 연구 결과

새로운 연구에 따르면 의미론적 보정은 대규모 언어 모델의 다음 토큰 예측 과정에서 자연스럽게 발생하는 부산물임이 밝혀졌습니다. 베이스 모델은 샘플링 기반의 의미론적 보정 개념을 사용할 때 매우 정교하게 보정된 상태를 보였으며, 이를 통해 별도의 학습 없이도 오픈 도메인 질의응답에서 자신의 답변 확신도를 유의미하게 평가할 수 있습니다.

22. 텍스트 음성 변환(TTS) 리더보드 업데이트

최신 TTS 리더보드에서 Inworld, ElevenLabs, MiniMax가 가장 선호되는 모델로 이름을 올렸습니다. 이들 연구소의 최신 체크포인트들은 TTS 품질의 한계를 넓혔으며, 상위 5개 모델 중 4개가 올해 출시되었습니다. 선두 모델들은 점점 더 실제와 유사한 오디오 생성 능력을 보여주고 있습니다.