1. Google, Apache 2.0 라이선스로 Gemma 4 출시
Google은 2B, 4B, 31B 및 26B MoE 변형을 포함하는 멀티모달 오픈 웨이트 모델 제품군인 Gemma 4를 출시했습니다. 이 모델들은 텍스트, 이미지, 오디오, 비디오 입력을 지원하며 최대 256k 토큰의 컨텍스트 윈도우를 제공합니다. 특히 기업용 개발자를 위해 기존의 맞춤형 사용 제한을 폐지하고 전체 제품군을 표준 Apache 2.0 라이선스로 공개했습니다. 31B 및 26B 모델은 단일 H100에서 실행 가능하며 Qwen3.5와 같은 동급 모델 대비 매우 경쟁력 있는 추론 성능을 보여줍니다.
2. Cursor 3, 멀티 에이전트 워크스페이스 및 클라우드-로컬 전환 기능 도입
Cursor는 멀티 에이전트 소프트웨어 개발에 초점을 맞춰 인터페이스를 완전히 재구축한 버전 3를 출시했습니다. 이번 업데이트는 개발자가 여러 로컬 및 클라우드 에이전트를 서로 다른 저장소에서 병렬로 실행할 수 있는 통합 워크스페이스를 제공합니다. 새로운 전환 기능을 통해 테스트 및 반복 작업을 위해 클라우드 환경과 로컬 데스크톱 간 에이전트 세션을 원활하게 이동할 수 있습니다. 또한 로컬 웹사이트 프롬프팅을 위한 통합 브라우저와 MCP 플러그인 마켓플레이스가 추가되었습니다.
3. Arcee AI, 추론 모델 Trinity Large Thinking 출시
Arcee AI는 복잡하고 장기적인 에이전트 작업 및 다중 턴 도구 호출을 위해 설계된 오픈 웨이트 추론 모델인 Trinity Large Thinking을 출시했습니다. 이 모델은 출력 품질 저하 없이 턴 간 일관성을 유지하고 도구 사용 시 엄격한 제약 조건을 준수하는 데 중점을 둡니다. Arcee API를 통해 이용 가능하며, Apache 2.0 라이선스 하에 Hugging Face에서 가중치를 다운로드할 수 있습니다.
4. LLM-as-a-Judge 워크플로우의 프롬프트 인젝션 취약점 연구 결과 발표
새로운 보고서에 따르면 지원자가 이력서나 논문과 같은 문서에 프롬프트 인젝션을 사용하여 자동 심사관 역할을 하는 LLM을 조작할 수 있음이 밝혀졌습니다. 테스트 결과 구형 및 소형 모델은 이러한 공격에 매우 취약하지만, 대부분의 최신 프론티어 모델은 이를 성공적으로 방어하는 것으로 나타났습니다. 다만 Gemini 3는 이러한 특정 유형의 인젝션에 취약한 유일한 프론티어급 모델로 확인되었습니다. 자동 평가를 위해 LLM을 사용하는 개발자는 내장된 프롬프트 공격에 대한 모델의 복원력을 검증해야 합니다.
5. IBM, 문서 추출을 위한 Granite 4.0 3B Vision 출시
IBM은 기업용 문서 데이터 추출을 위해 특별히 설계된 비전-언어 모델인 Granite 4.0 3B Vision을 출시했습니다. 이 모델은 단일 멀티모달 아키텍처를 사용하는 대신 Granite 4.0 Micro 언어 백본에 부착된 특수 어댑터로 작동합니다. 이러한 설계는 구조화된 데이터 추출 작업을 위한 고충실도 시각적 추론을 목표로 합니다.
6. Fujitsu, LLM 양자화를 위한 One Compression 라이브러리 오픈 소스 공개
Fujitsu는 대규모 언어 모델의 사후 학습 양자화를 위한 오픈 소스 Python 라이브러리인 One Compression(OneComp)을 출시했습니다. 이 라이브러리는 GPTQ 및 DBF를 포함한 최신 양자화 알고리즘을 구현합니다. TinyLlama, Llama-2, Llama-3 및 최대 32B 파라미터의 Qwen3 제품군과 같은 모델에서 작동함이 공식적으로 검증되었습니다.