Shai-Hulud 웜, AI 코딩 에이전트 공격

1. Shai-Hulud 웜, AI 코딩 에이전트 공격

2026년 5월 11일부터 활동 중인 'Mini Shai-Hulud' 웜이 170개 이상의 npm 및 PyPI 패키지를 감염시켰습니다. 이 멀웨어는 특히 Claude 및 Kiro MCP 서버 인증 토큰을 포함한 AI 코딩 에이전트 설정을 표적으로 삼아 외부 서비스에 대한 접근 권한을 획득합니다. 일반적인 설정 파일을 통해 지속성을 확보하며, 자격 증명이 취소될 경우 파괴적인 명령을 실행할 수 있습니다. 보안 연구원들은 데이터 손실을 방지하기 위해 자격 증명을 취소하기 전에 영향을 받은 기기를 격리하고 이미징할 것을 권장합니다.

• 172개의 npm/PyPI 패키지 감염
• AI 에이전트 인증 토큰 표적
• 설정 파일 내 지속성 확보
• 자격 증명 취소 시 파괴적인 명령 실행 가능

AI 코딩 에이전트를 사용하는 개발자들은 오염된 패키지를 통해 자격 증명 탈취 및 시스템 침해 위험에 노출되어 있습니다.

SOURCES

[1]

2. Perceptron, Mk1 비디오 분석 모델 출시

Perceptron Inc.는 비디오 내 물리적 세계의 역학, 객체 식별, 시간적 연속성을 이해할 수 있는 추론 모델인 Mk1을 선보였습니다. 이 모델은 초당 최대 2프레임의 네이티브 비디오를 처리하며, 현재 업계 선두 제품보다 훨씬 저렴한 가격으로 제공됩니다. 크로핑, 밀집 장면 카운팅, 인컨텍스트 학습을 위한 특수 기능을 포함하고 있습니다. Perceptron은 또한 개발자를 위해 Isaac이라는 오픈 웨이트 시리즈를 제공합니다.

• 초당 2프레임으로 비디오 처리
• 입력 토큰 100만 개당 0.15달러의 가격
• 크로핑 및 카운팅을 위한 특수 기능 포함
• 오픈 웨이트 Isaac 시리즈 제공

특수 개발자 기능을 갖춘 비디오 추론 작업을 위한 비용 효율적인 대안을 제공합니다.

SOURCES

[1]

3. Statewright, 상태 머신을 활용해 에이전트 신뢰성 향상

Statewright는 공식 상태 머신을 사용하여 LLM 도구 및 솔루션 공간을 제한함으로써 에이전트 기반 문제 해결의 취약성을 해결합니다. Rust 기반 엔진을 통해 유효한 전환과 도구 접근을 강제함으로써 모델이 단계를 건너뛰거나 잘못된 도구를 사용하는 것을 방지합니다. 이 플랫폼은 Model Context Protocol을 통해 Claude Code와 같은 도구와 통합되며, 상태, 전환, 가드를 포함한 워크플로우 정의를 위한 시각적 편집기를 제공합니다.

• 공식 상태 머신을 사용하여 LLM 동작 제한
• Rust 기반 엔진
• MCP를 통해 Claude Code와 통합
• 워크플로우 정의를 위한 시각적 편집기

에이전트 워크플로우에서 가드레일을 적용하고 신뢰성을 확보할 수 있는 구조화된 방법을 제공합니다.

SOURCES

[1]

4. DuckDB, Quack 클라이언트-서버 프로토콜 도입

DuckDB는 여러 DuckDB 인스턴스가 상호 작용하고 동시 쓰기를 지원하도록 설계된 클라이언트-서버 통신 시스템인 Quack 프로토콜을 출시했습니다. HTTP 기반의 사용자 지정 직렬화 형식을 사용하는 이 프로토콜은 DuckDB v1.5.2에서 사용할 수 있습니다. 확장 가능한 인증 및 권한 부여 메커니즘을 갖추고 있으며, 소규모 쓰기 벤치마크에서 PostgreSQL을 능가하는 높은 성능을 입증했습니다.

• 동시 쓰기 지원
• HTTP 기반 구축
• v1.5.2에서 사용 가능
• 소규모 쓰기 벤치마크에서 높은 성능

DuckDB에 대한 동시 접근이 필요한 애플리케이션의 데이터 인프라 기능을 향상시킵니다.

SOURCES

[1]

5. Artificial Analysis, 음성 대 음성 모델 벤치마크 발표

Artificial Analysis는 다중 턴 고객 서비스 상호 작용에서 음성 대 음성(S2S) 모델의 성능을 측정하기 위해 설계된 벤치마크인 𝜏-Voice를 발표했습니다. 이 벤치마크는 278개의 시나리오에 걸쳐 도구 호출 및 지시 이행 능력을 평가하며, 배경 소음 및 패킷 손실과 같은 실제 음성 채널의 복잡성을 시뮬레이션합니다. 현재 xAI의 Grok Voice Think Fast 1.0이 52.1%의 성공률로 벤치마크 선두를 달리고 있습니다.

• 다중 턴 지시 이행 및 도구 사용 평가
• 음성 채널 소음 및 패킷 손실 시뮬레이션
• 항공, 소매, 통신 도메인 포함

복잡한 실제 환경에서 음성 에이전트를 평가할 수 있는 표준화된 방법을 제공합니다.

SOURCES

[1]

6. AWS용 Claude 플랫폼 정식 출시

AWS용 Claude 플랫폼이 정식 출시되어 AWS 고객은 Managed Agents, Advisor 전략, 코드 실행을 포함한 전체 Claude 기능 제품군을 이용할 수 있게 되었습니다. 이 플랫폼은 인증을 위한 AWS IAM, 감사 로깅을 위한 CloudTrail, AWS 결제 시스템과 통합됩니다. Anthropic은 AWS 경계 외부에서 플랫폼을 운영하며, Amazon Bedrock은 계속해서 AWS 경계 내부에서 운영됩니다.

• AWS IAM, CloudTrail 및 결제 시스템과 통합
• Claude Managed Agents 및 코드 실행 지원
• 대부분의 AWS 상용 리전에서 사용 가능

AWS 보안 및 결제 인프라와 직접 통합되어 기업의 Claude 도입을 간소화합니다.

SOURCES

[1]

1. Shai-Hulud 웜, AI 코딩 에이전트 공격

2. Perceptron, Mk1 비디오 분석 모델 출시

3. Statewright, 상태 머신을 활용해 에이전트 신뢰성 향상

4. DuckDB, Quack 클라이언트-서버 프로토콜 도입

5. Artificial Analysis, 음성 대 음성 모델 벤치마크 발표

6. AWS용 Claude 플랫폼 정식 출시

데일리 AI 시그널을 인박스로