Project Glasswing

**프로젝트 글래스윙(Project Glasswing)**은 AI 안전 및 연구 기업인 Anthropic이 주도하는 사이버 보안 컨소시엄입니다. 2026년 4월 7일에 발표된 이 프로젝트는 주요 기술 및 금융 기업들을 결집하여, 미공개된 강력한 AI 모델인 Claude Mythos Preview를 방어적 사이버 보안 목적으로 활용합니다. 이 이니셔티브의 목표는 악의적인 행위자가 유사한 AI 기능을 사용하기 전에, 주요 오픈 소스 소프트웨어와 디지털 인프라의 보안 취약점을 선제적으로 발견하고 수정하는 것입니다. ^[1]

개요

프로젝트 글래스윙(Project Glasswing)은 Anthropic의 최첨단 AI 모델인 Claude Mythos Preview에서 관찰된 강력한 이중 용도(dual-use) 역량에 대한 직접적인 대응으로 설립되었습니다. 내부 테스트를 통해 해당 모델이 소프트웨어 결함을 자율적으로 찾아내고 악용할 수 있는 능력이 있음이 입증되자, Anthropic은 이 모델이 일반 대중에게 공개되기에는 너무 강력하다고 판단하여 공개 출시를 하지 않기로 결정했습니다. ^[2] ^[3]

이 컨소시엄의 핵심 임무는 통제된 환경에서 Claude Mythos Preview를 활용하여 디지털 방어력을 요새화하는 것입니다. 프로젝트 글래스윙은 파트너들에게 모델에 대한 비공개 조기 액세스 권한을 제공함으로써, 그들이 자체 시스템 및 널리 사용되는 오픈 소스 소프트웨어의 취약점을 발견하고 수정할 수 있도록 지원합니다. 이 프로젝트는 조정된 취약점 공개(coordinated vulnerability disclosure) 원칙에 따라 운영되며, 사이버 보안 전문가들에게 중요한 선점 기회를 제공하고 예상되는 AI 기반 사이버 위협의 확산에 맞서 "지속 가능한 우위"를 확보하는 것을 목표로 합니다. ^[3]

이 이니셔티브는 고급 사이버 공격 역량을 갖춘 AI 모델이 곧 널리 보급되어, 국가 및 비국가 행위자들이 더 빈번하고 정교한 공격을 수행할 수 있게 될 것이라는 우려를 다룹니다. 방어를 위해 동일한 기술을 활용함으로써, 이 프로젝트는 보안 환경의 균형을 재조정하고 AI로 가속화되는 위협 시대에 부합하는 취약점 관리의 새로운 모범 사례를 수립하고자 합니다. ^[1]

역사 및 배경

동기 및 근거

프로젝트 글래스윙(Project Glasswing)의 추진력은 Anthropic의 내부 개발 및 프런티어 AI 모델에 대한 레드팀 활동에서 비롯되었습니다. 회사는 자사의 최신 모델인 Claude Mythos Preview가 최소한의 인간 가이드만으로도 소프트웨어 취약점을 자율적으로 식별하고 기능적인 익스플로잇(exploit)을 생성하는 창발적 능력을 갖추고 있음을 발견했습니다. 이러한 발견은 이 강력한 기술을 방어적 애플리케이션에 우선적으로 적용하려는 회사의 이른바 "긴급한 시도"를 촉발했습니다. ^[1]

이 프로젝트의 근거는 고급 AI의 이중 용도(dual-use) 특성을 관리하는 데 뿌리를 두고 있습니다. 이 모델은 방어를 위한 강력한 도구인 동시에, 악의적인 사이버 공격을 위한 강력한 수단이 될 수도 있습니다. Anthropic의 경영진은 적대 세력이 "수년이 아닌 수개월" 내에 유사한 능력을 갖춘 AI를 개발할 것으로 예상한다고 밝혔으며, 이 프로젝트를 "인프라 보안을 위한 중대한 경주"로 규정했습니다. 이러한 긴박함은 Anthropic의 프런티어(Frontier) 레드팀 리더인 로건 그레이엄(Logan Graham)에 의해 다시 한번 강조되었습니다. 그는 "우리는 이러한 능력이 6개월, 12개월, 24개월 내에 널리 보급될 세상에 지금 대비해야 합니다. 현대 보안 패러다임의 기반이 된 많은 가정들이 무너질 수 있습니다"라고 언급했습니다. ^[3] ^[2]

출시 및 초기 공약

프로젝트 글래스윙은 2026년 4월 7일에 공식적으로 발표되었습니다. ^[3] 출시와 함께 앤스로픽(Anthropic)은 특정 조사 결과 및 수정된 취약점을 포함하여 프로젝트의 진행 상황을 90일 이내에 보고하겠다고 공개적으로 약속했습니다. 이 프로젝트는 단순한 기술적 이니셔티브를 넘어, 국가 안보 전략에 정보를 제공하고 업계 전반의 보안 관행을 발전시키기 위해 정부 및 보안 기관과 협력하는 공동 노력의 틀로 구성되었습니다. ^[1]

핵심 기술: Claude Mythos Preview

프로젝트 글래스윙(Project Glasswing)을 가능하게 하는 중심 기술은 Anthropic이 개발한 독점적인 프런티어 AI 모델인 Claude Mythos Preview입니다. 이 모델은 사이버 보안 분야에서 강력하고 잠재적으로 위험한 이중 용도(dual-use) 역량을 보유하고 있어 일반 공개는 예정되어 있지 않습니다. ^[1]

이 모델의 고급 사이버 보안 기술은 특정 사이버 작업을 위한 훈련의 결과라기보다, 일반적인 고급 코딩 및 추론 능력에서 나타난 창발적 특성입니다. Anthropic은 이 모델의 역량을 "시니어 보안 연구원"과 대등한 수준으로 평가했습니다. ^[2]

입증된 기능

컨소시엄 내의 내부 테스트 및 초기 사용을 통해 Claude Mythos Preview가 다음과 같은 다양한 고급 보안 작업을 수행할 수 있음이 입증되었습니다:

자율적 취약점 발견: 이 모델은 코드베이스에서 소프트웨어 취약점을 자율적으로 검색하고 식별할 수 있습니다.
익스플로잇 개발: 발견된 취약점에 대해 완전한 공격 체인 및 개념 증명(PoC)을 생성할 수 있습니다.
공격적 보안 시뮬레이션: 침투 테스트 및 엔드포인트 보안 평가에 사용할 수 있습니다.
바이너리 분석: 이 모델은 원래의 소스 코드에 대한 접근 권한이 없더라도 시스템 설정 오류를 찾아내고 소프트웨어 바이너리를 평가할 수 있습니다.

이러한 능력은 이전에 공개된 모델들에 비해 상당한 진보를 나타내며, 통제된 환경으로 접근을 제한하기로 한 결정을 뒷받침합니다. ^[2] ^[3]

주요 발견 사항

출시 전 및 초기 단계에서 이 모델은 주요 소프트웨어 프로젝트 전반에 걸쳐 이전에 알려지지 않았던 수천 개의 고위험 제로데이(zero-day) 취약점을 식별하는 데 사용되었습니다. ^[4] 주요 발견 사례는 다음과 같습니다:

원격 공격자가 대상 머신을 충돌시킬 수 있는 OpenBSD 운영 체제의 27년 된 취약점. ^[1] ^[3]
널리 사용되는 FFmpeg 멀티미디어 라이브러리의 16년 된 취약점. 이 결함은 해당 코드에 대해 약 500만 번 실행된 자동 스캔 도구들이 찾아내지 못했다는 점에서 특히 중요했습니다. ^[1] ^[4]
리눅스 커널의 여러 취약점을 결합하여 권한 상승을 달성하는 자율 생성 익스플로잇 체인. 이를 통해 공격자는 일반 사용자 계정에서 전체 시스템 제어권(루트 권한)을 획득할 수 있었습니다. ^[1]

초기 테스트 단계에서 식별된 모든 취약점은 프로젝트의 공식 발표 전에 해당 소프트웨어 유지 관리자와 협력하여 패치된 것으로 보고되었습니다. ^[4]

벤치마크 성능

Claude Mythos Preview는 출시 당시 Anthropic의 차상위 공개 모델인 Claude Opus 4.6과 비교했을 때 사이버 보안, 코딩 및 추론 벤치마크에서 주목할 만한 성능 향상을 보여줍니다. ^[1] ^[3]

벤치마크	Claude Mythos Preview	Claude Opus 4.6	설명
CyberGym	83.1%	66.6%	사이버 보안 작업에서의 성능을 측정합니다.
SWE-bench Pro	77.8%	53.4%	GitHub 리포지토리의 실제 버그를 수정하기 위한 고급 벤치마크입니다.
SWE-bench Verified	93.9%	80.8%	GitHub 리포지토리의 실제 버그를 수정하기 위한 벤치마크입니다.
Terminal-Bench 2.0	82.0%	65.4%	에이전트 기반의 터미널 작업 성능을 측정합니다.
GPQA Diamond	94.6%	91.3%	고급 추론 능력을 측정하는 벤치마크입니다.
OSWorld-Verified	79.6%	72.7%	운영 체제 환경 내에서의 에이전트 작업 성능을 측정합니다.

이러한 벤치마크 데이터는 Project Glasswing의 창설을 촉발한 성능의 향상을 잘 보여줍니다. ^[1] ^[3]

프로젝트 목표 및 방법론

주요 목표

프로젝트 글래스윙은 다음과 같은 몇 가지 핵심 목표를 가지고 운영됩니다:

취약점 보완: 핵심 활동은 파트너들이 자체 기초 소프트웨어 및 시스템에 대한 로컬 취약점 탐지, 블랙박스 테스트, 침투 테스트와 같은 보안 작업을 위해 Claude Mythos Preview를 사용하는 것을 포함합니다.
정보 공유: Anthropic은 프로젝트를 통해 얻은 학습 내용을 더 넓은 산업계와 공유할 수 있도록 조정합니다. 파트너는 집단 보안을 개선하기 위해 발견한 사항을 공유해야 할 계약적 의무가 있습니다.
공공 보고: 이 프로젝트는 투명성을 지향하며, 출시 후 90일 이내에 조사 결과와 진행 상황에 대한 공공 보고서를 발표할 예정입니다.
보안 관행의 진화: 컨소시엄은 보안 조직과 협력하여 AI 가속화 환경에 적합한 취약점 공개 프로세스, 소프트웨어 업데이트 메커니즘 및 설계 단계부터 보안을 고려하는(secure-by-design) 원칙에 대한 새로운 권고안을 생성하는 것을 목표로 합니다.
정부 협력: Anthropic은 국가 안보 전략 수립에 도움이 될 수 있도록 모델의 기능과 관련하여 미국 정부 관계자들과 지속적인 대화를 유지합니다.

이러한 목표들은 차세대 사이버 위협에 대비하여 더욱 탄력적인 디지털 생태계를 구축하는 것을 공동의 목표로 합니다. ^[1] ^[4]

취약점 공개 프로세스

Project Glasswing은 강력한 발견 사항들을 책임감 있게 관리하기 위해 다음과 같이 구조화된 다단계 취약점 공개 프로세스를 따릅니다.

내부 분류(Internal Triage): AI 모델에 의해 발견된 모든 잠재적 버그는 먼저 Anthropic 팀에 의해 내부적으로 분류됩니다.
인간 검증(Human Validation): 심각도가 높은 취약점은 전문 보안 전문가에게 전달되어 수동 검증을 거치며, 이를 통해 진위 여부를 확인하고 잠재적 영향을 평가합니다.
조율된 보고(Coordinated Reporting): 버그 보고서를 제출하기 전에, Anthropic은 관련 소프트웨어 유지관리자에게 연락하여 관리 가능한 보고 주기를 설정함으로써 대량의 보고서로 인해 업무가 마비되는 것을 방지합니다.
패치 지원(Patch Assistance): 오픈 소스 프로젝트의 경우, Anthropic은 취약점 보고서와 함께 후보 패치를 제공하기 위해 노력합니다. 이러한 패치는 'AI 생성' 또는 'AI 지원 및 인간 검토'로 명확하게 표시됩니다.
조율된 공개 일정(Coordinated Disclosure Timeline): 이 프로젝트는 표준 조율된 취약점 공개(CVD) 프레임워크를 준수하며, 일반적으로 패치가 제공된 후 기술적 세부 사항을 공개하기까지 45일을 기다립니다.

이 방법론은 발견된 결함이 악용될 위험을 최소화하는 동시에 AI 모델의 방어적 이점을 극대화하도록 설계되었습니다. ^[3]

파트너십 및 협력

프로젝트 글래스윙은 Anthropic이 주도하는 45개 이상의 조직으로 구성된 컨소시엄으로 시작되었습니다. ^[2]

창립 파트너

컨소시엄의 창립 멤버에는 기술, 금융 및 사이버 보안 분야의 주요 기업들이 포함됩니다:

아마존 웹 서비스 (AWS)
앤스로픽 (Anthropic)
애플 (Apple)
브로드컴 (Broadcom)
시스코 (Cisco)
크라우드스트라이크 (CrowdStrike)
구글 (Google)
JP모건 체이스 (JPMorganChase)
리눅스 재단 (The Linux Foundation)
마이크로소프트 (Microsoft)
엔비디아 (NVIDIA)
팔로알토 네트웍스 (Palo Alto Networks)

핵심 창립 그룹 외에도, 중요 소프트웨어 인프라 유지 관리를 담당하는 40개 이상의 기타 조직에 Claude Mythos Preview에 대한 접근 권한이 부여되었습니다. ^[1] ^[3] ^[4]

파트너 관점

파트너사의 대표들은 이 이니셔티브에 대해 공개적인 지지를 표명했습니다. 구글의 보안 엔지니어링 부문 부사장인 헤더 애드킨스(Heather Adkins)는 "구글은 이 범산업적 사이버 보안 이니셔티브가 결성된 것을 기쁘게 생각합니다. 우리는 AI가 사이버 방어에 있어 새로운 도전 과제를 제시하는 동시에 새로운 기회를 열어준다고 오랫동안 믿어 왔습니다"라고 밝혔습니다. 마찬가지로 마이크로소프트의 글로벌 정보보호최고책임자(CISO)인 이고르 치간스키(Igor Tsyganskiy)는 "클로드 미토스 프리뷰(Claude Mythos Preview)를 이용할 수 있는 프로젝트 글래스윙(Project Glasswing)에 참여함으로써, 위험을 조기에 식별 및 완화하고 보안 및 개발 솔루션을 강화하여 고객과 마이크로소프트를 더 잘 보호할 수 있게 되었습니다"라고 언급했습니다. ^[2]

자금 지원, 자원 및 접근 권한

재정적 약속

Anthropic은 프로젝트와 더 넓은 오픈 소스 보안 생태계를 지원하기 위해 상당한 자원을 투입하기로 약속했습니다:

모델 액세스 크레딧: Claude Mythos Preview를 위한 1억 달러 규모의 무료 사용 크레딧이 프로젝트 파트너 및 주요 인프라를 유지 관리하는 기타 조직에 배포되고 있습니다. ^[1]
직접 기부: Linux Foundation을 통한 Alpha-Omega 프로젝트 및 오픈 소스 보안 재단(OpenSSF)에 총 250만 달러, 그리고 Apache 소프트웨어 재단에 150만 달러를 기부했습니다. ^[1] ^[3]

액세스 및 가격 책정

초기 연구 프리뷰 단계 동안 참가자들은 Anthropic의 사용 크레딧 지원을 통해 대부분의 비용을 충당하며 모델을 사용할 수 있습니다. 이 단계가 종료된 후, 승인된 참가자들은 출력 토큰 100만 개당 125달러의 요율로 모델을 이용할 수 있습니다. 본 모델은 Claude API, Amazon Bedrock, Google Cloud의 Vertex AI, 그리고 Microsoft Foundry를 포함한 다양한 플랫폼을 통해 참가자들에게 제공됩니다. ^[3]

대중의 관심 및 출시 전 이벤트

2026년 4월 7일 프로젝트 글래스윙의 공식 발표에 앞서, 2026년 3월 말 앤스로픽(Anthropic)에서 대중의 관심을 끌었던 두 건의 무관한 보안 사고가 발생했습니다.

CMS 데이터 유출: 2026년 3월 말, 공개 검색이 가능한 콘텐츠 관리 시스템(CMS)의 설정 오류로 인해 프로젝트 글래스윙을 상세히 다룬 블로그 게시물 초안을 포함한 회사 내부 자산이 의도치 않게 노출되었습니다.
NPM 패키지 유출: 2026년 3월 31일, "Claude Code"라는 이름의 내부 개발 도구 전체 소스 코드가 실수로 공개 npm 패키지 저장소에 게시되었습니다. 해당 코드는 삭제되기 전까지 약 3시간 동안 접근 가능한 상태로 유지되었습니다.

앤스로픽은 이러한 사건들에 대해 공식적으로 대응하며, 이를 "보안 아키텍처의 침해 사례가 아닌, 게시 도구 사용상의 휴먼 에러"라고 규정했습니다. 회사는 향후 이러한 오류를 방지하기 위해 개선된 프로세스를 구현했다고 밝혔습니다. ^[3]

어원

이 프로젝트의 이름은 글래스윙 나비(glasswing butterfly, 학명: Greta oto)의 이름을 따서 명명되었습니다. 이 이름은 프로젝트의 사명을 나타내는 이중적인 비유로 사용됩니다.

숨겨진 취약점: 나비의 투명한 날개는 주변 환경과 동화될 수 있게 해주는데, 이는 프로젝트가 발견하고자 하는 미묘하고 탐지하기 어려운 소프트웨어 취약점을 상징합니다.
안전을 위한 투명성: 나비의 투명성은 일종의 방어 기제이기도 합니다. 이는 모두를 위한 사이버 보안을 개선하기 위해 투명하고 협력적인 정보 공유 방식을 사용하려는 프로젝트의 목표를 반영합니다.

이 이름은 숨겨진 결함을 찾는 도전 과제와 해결책의 협력적 특성을 모두 반영하기 위해 선택되었습니다. ^[1]

Project Glasswing

개요

역사 및 배경

동기 및 근거

출시 및 초기 공약

핵심 기술: Claude Mythos Preview

입증된 기능

주요 발견 사항

벤치마크 성능

프로젝트 목표 및 방법론

주요 목표

취약점 공개 프로세스

파트너십 및 협력

창립 파트너

파트너 관점

자금 지원, 자원 및 접근 권한

재정적 약속

액세스 및 가격 책정

대중의 관심 및 출시 전 이벤트

어원

평균 평점

경험은 어땠나요?

참고 문헌 (4 출처)

Project Glasswing

Project Glasswing

개요

역사 및 배경

동기 및 근거

출시 및 초기 공약

핵심 기술: Claude Mythos Preview

입증된 기능

주요 발견 사항

벤치마크 성능

프로젝트 목표 및 방법론

주요 목표

취약점 공개 프로세스

파트너십 및 협력

창립 파트너

파트너 관점

자금 지원, 자원 및 접근 권한

재정적 약속

액세스 및 가격 책정

대중의 관심 및 출시 전 이벤트

어원

Wiki Details

프로필 요약

피드백

평균 평점

경험은 어땠나요?

커밋 정보

관련 기사

Related Articles

참고 문헌 (4 출처)

관련 기사