Audesso | Daily: AI

구글, 나노 바나나 2 이미지 모델 출시

00:00 / --:--

← 메인으로

구글, 나노 바나나 2 이미지 모델 출시

1. 구글, 나노 바나나 2 이미지 모델 출시

구글이 이전 모델보다 훨씬 빠르고 저렴한 업그레이드 이미지 모델인 나노 바나나 2(Gemini 3.1 Flash Image)를 출시했습니다. 4K 해상도, 개선된 텍스트 렌더링, 최대 5명의 피사체에 대한 일관된 캐릭터 생성을 지원하며, 주요 텍스트-이미지 리더보드에서 1위를 차지했습니다.

2. 앤스로픽, 펜타곤의 무제한 모델 접근 요구 거부

앤스로픽의 CEO 다리오 아모데이는 대규모 국내 감시 및 살상용 자율 무기에 대한 우려를 이유로 클로드(Claude)에 대한 펜타곤의 무제한 접근 요청을 거부했습니다. 오픈AI와 xAI 등 경쟁사들은 유사한 조건을 수락한 것으로 알려졌으나, 앤스로픽은 이러한 사용 사례가 민주적 가치를 훼손한다고 주장합니다.

3. 클로드 코드 업데이트: 자동 메모리 및 계획 검토 기능 추가

앤스로픽이 클로드 코드(Claude Code)에 자동 메모리 기능을 도입하여, 에이전트가 MEMORY.md 및 CLAUDE.md 파일을 통해 세션 간 프로젝트 컨텍스트와 기본 설정을 유지할 수 있게 했습니다. 또한, /plan-exit-review와 같은 새로운 커뮤니티 주도 명령어를 통해 개발자가 코드를 작성하기 전 에이전트에게 구현 계획을 비판하도록 강제할 수 있습니다.

4. 오픈AI 리얼타임 API 정식 출시

오픈AI가 개선된 음성 대 음성(speech-to-speech) 기능을 제공하는 리얼타임(Realtime) API와 gpt-realtime 모델의 정식 출시(GA)를 발표했습니다. 이번 업데이트에는 향상된 지시어 이행 능력, 낮은 지연 시간, 음성 기반 시스템을 위한 새로운 프롬프팅 가이드가 포함되었습니다.

5. 커서 에이전트, 가상 머신 및 데스크톱 제어 기능 획득

커서(Cursor)가 클라우드 기반 에이전트에 전용 가상 머신과 데스크톱 제어 기능을 추가하여, 코드를 자율적으로 빌드, 테스트 및 검증할 수 있도록 업그레이드했습니다. 이 기능을 통해 에이전트는 풀 리퀘스트를 제출하기 전 샌드박스 내에서 자신의 작업을 직접 확인할 수 있습니다.

6. 오픈AI, 전 메타 및 애플 인프라 리드 루오밍 팡 영입

오픈AI가 메타와 애플에서 AI 인프라 리드를 역임한 루오밍 팡(Ruoming Pang)을 연구팀에 영입했습니다. 팡은 이전에 애플의 모델 그룹을 이끌었으며, 애플 인텔리전스(Apple Intelligence)와 메타의 초지능 연구소(Superintelligence Labs) 개발의 핵심 인물이었습니다.

7. 노우스 리서치, 헤르메스 에이전트 오픈 소스 공개

노우스 리서(Nous Research)가 텔레그램, 슬랙, 디스코드와 같은 메시징 플랫폼에서 작동하도록 설계된 개인용 AI 에이전트인 헤르메스 에이전트(Hermes Agent)를 오픈 소스로 공개했습니다. 이 에이전트는 40개 이상의 내장 도구를 갖추고 있으며, 시간이 지남에 따라 재사용 가능한 기술을 학습하고 구축하도록 설계되었습니다.

8. 구글 AI 엣지 갤러리, 펑션젬마와 함께 iOS로 확장

구글이 AI 엣지 갤러리(AI Edge Gallery)를 iOS로 확장하며, 2억 7천만 개의 파라미터만으로 온디바이스 함수 호출을 수행하는 펑션젬마(FunctionGemma) 모델을 선보였습니다. 이 앱에는 모바일 CPU 및 GPU 전반의 LiteRT 성능을 측정하는 벤치마킹 도구가 포함되어 있습니다.

9. xAI 공동 창업자, 스페이스X 합병 진행 중 퇴사

xAI의 공동 창업자 토비 폴렌(Toby Pohlen)이 회사를 떠나며, 설립 이후 일곱 번째로 퇴사한 공동 창업자가 되었습니다. 이번 행보는 대규모 기업공개(IPO)를 준비 중인 것으로 알려진 스페이스X와 xAI의 최근 합병에 따른 것입니다.

10. 퍼플렉시티, 주요 안드로이드 OEM에 API 공급

퍼플렉시티(Perplexity)가 온디바이스 AI 기능을 강화하기 위해 주요 안드로이드 기기 제조업체에 자사의 검색 및 리트리벌(retrieval) API를 공급합니다. 이번 파트너십은 심층 검색 및 요약 기능을 모바일 단말기 생태계에 직접 통합하는 것을 목표로 합니다.

11. 퀴버AI, Arrow 1.0 SVG 생성 모델 출시

퀴버AI(QuiverAI)가 스텔스 모드에서 벗어나 SVG 생성 전문 모델인 Arrow 1.0을 출시했습니다. 이 모델은 현재 디자인 아레나(Design Arena)의 SVG 리더보드에서 1위를 기록하고 있으며, 현재 공개 베타 버전으로 제공됩니다.

12. 클로드 무료 플랜, 150개 이상의 서드파티 커넥터 추가

앤스로픽이 클로드 무료 플랜에 슬랙, 피그마, 아사나 등 150개 이상의 서드파티 커넥터를 추가했습니다. 이번 업데이트를 통해 사용자들은 유료 구독 없이도 외부 데이터를 채팅 워크플로우에 직접 가져올 수 있게 되었습니다.

13. 하이퍼스케일러 AI 자본 지출, 2026년 7,700억 달러에 달할 전망

에포크 AI(Epoch AI)의 보고서에 따르면, GPT-4 출시 이후 하이퍼스케일러의 자본 지출이 4배 증가했으며, 2025년 총 AI 투자액은 5,000억 달러에 육박할 것으로 보입니다. 알파벳, 아마존, 메타, 마이크로소프트, 오라클은 2026년 인프라에 총 7,700억 달러를 지출할 것으로 예상됩니다.

14. 대규모 웹 스크래핑을 위한 Scrapling 프레임워크

Scrapling은 대규모 크롤링을 처리하고 웹사이트 변경에 자동 적응하도록 설계된 새로운 파이썬 기반 웹 스크래핑 프레임워크입니다. 일반적인 안티봇 시스템을 우회하고 최소한의 코드로 복잡한 요청 로직을 관리하는 기능을 포함하고 있습니다.

15. 에이전틱 엔지니어링 패턴을 위한 새로운 프레임워크

사이먼 윌리슨(Simon Willison)을 비롯한 업계 리더들은 복잡한 로직을 단순한 인터페이스 뒤에 숨기는 '심층 모듈(deep modules)' 사용과 같은 새로운 에이전틱 엔지니어링 패턴을 옹호하고 있습니다. 이러한 패턴은 코드 작성 비용이 거의 0에 수렴함에 따라 AI 에이전트가 코드베이스를 더 쉽게 탐색할 수 있도록 하는 것을 목표로 합니다.

데일리 AI 시그널을 인박스로

하루 5분. 무료, 언제든 해지할 수 있습니다.