**프로젝트 글래스윙(Project Glasswing)**은 AI 안전 및 연구 기업인 Anthropic이 주도하는 사이버 보안 컨소시엄입니다. 2026년 4월 7일에 발표된 이 프로젝트는 주요 기술 및 금융 기업들을 결집하여, 미공개된 강력한 AI 모델인 Claude Mythos Preview를 방어적 사이버 보안 목적으로 활용합니다. 이 이니셔티브의 목표는 악의적인 행위자가 유사한 AI 기능을 사용하기 전에, 주요 오픈 소스 소프트웨어와 디지털 인프라의 보안 취약점을 선제적으로 발견하고 수정하는 것입니다. [1]
프로젝트 글래스윙(Project Glasswing)은 Anthropic의 최첨단 AI 모델인 Claude Mythos Preview에서 관찰된 강력한 이중 용도(dual-use) 역량에 대한 직접적인 대응으로 설립되었습니다. 내부 테스트를 통해 해당 모델이 소프트웨어 결함을 자율적으로 찾아내고 악용할 수 있는 능력이 있음이 입증되자, Anthropic은 이 모델이 일반 대중에게 공개되기에는 너무 강력하다고 판단하여 공개 출시를 하지 않기로 결정했습니다. [2] [3]
이 컨소시엄의 핵심 임무는 통제된 환경에서 Claude Mythos Preview를 활용하여 디지털 방어력을 요새화하는 것입니다. 프로젝트 글래스윙은 파트너들에게 모델에 대한 비공개 조기 액세스 권한을 제공함으로써, 그들이 자체 시스템 및 널리 사용되는 오픈 소스 소프트웨어의 취약점을 발견하고 수정할 수 있도록 지원합니다. 이 프로젝트는 조정된 취약점 공개(coordinated vulnerability disclosure) 원칙에 따라 운영되며, 사이버 보안 전문가들에게 중요한 선점 기회를 제공하고 예상되는 AI 기반 사이버 위협의 확산에 맞서 "지속 가능한 우위"를 확보하는 것을 목표로 합니다. [3]
이 이니셔티브는 고급 사이버 공격 역량을 갖춘 AI 모델이 곧 널리 보급되어, 국가 및 비국가 행위자들이 더 빈번하고 정교한 공격을 수행할 수 있게 될 것이라는 우려를 다룹니다. 방어를 위해 동일한 기술을 활용함으로써, 이 프로젝트는 보안 환경의 균형을 재조정하고 AI로 가속화되는 위협 시대에 부합하는 취약점 관리의 새로운 모범 사례를 수립하고자 합니다. [1]
프로젝트 글래스윙(Project Glasswing)의 추진력은 Anthropic의 내부 개발 및 프런티어 AI 모델에 대한 레드팀 활동에서 비롯되었습니다. 회사는 자사의 최신 모델인 Claude Mythos Preview가 최소한의 인간 가이드만으로도 소프트웨어 취약점을 자율적으로 식별하고 기능적인 익스플로잇(exploit)을 생성하는 창발적 능력을 갖추고 있음을 발견했습니다. 이러한 발견은 이 강력한 기술을 방어적 애플리케이션에 우선적으로 적용하려는 회사의 이른바 "긴급한 시도"를 촉발했습니다. [1]
이 프로젝트의 근거는 고급 AI의 이중 용도(dual-use) 특성을 관리하는 데 뿌리를 두고 있습니다. 이 모델은 방어를 위한 강력한 도구인 동시에, 악의적인 사이버 공격을 위한 강력한 수단이 될 수도 있습니다. Anthropic의 경영진은 적대 세력이 "수년이 아닌 수개월" 내에 유사한 능력을 갖춘 AI를 개발할 것으로 예상한다고 밝혔으며, 이 프로젝트를 "인프라 보안을 위한 중대한 경주"로 규정했습니다. 이러한 긴박함은 Anthropic의 프런티어(Frontier) 레드팀 리더인 로건 그레이엄(Logan Graham)에 의해 다시 한번 강조되었습니다. 그는 "우리는 이러한 능력이 6개월, 12개월, 24개월 내에 널리 보급될 세상에 지금 대비해야 합니다. 현대 보안 패러다임의 기반이 된 많은 가정들이 무너질 수 있습니다"라고 언급했습니다. [3] [2]
프로젝트 글래스윙은 2026년 4월 7일에 공식적으로 발표되었습니다. [3] 출시와 함께 앤스로픽(Anthropic)은 특정 조사 결과 및 수정된 취약점을 포함하여 프로젝트의 진행 상황을 90일 이내에 보고하겠다고 공개적으로 약속했습니다. 이 프로젝트는 단순한 기술적 이니셔티브를 넘어, 국가 안보 전략에 정보를 제공하고 업계 전반의 보안 관행을 발전시키기 위해 정부 및 보안 기관과 협력하는 공동 노력의 틀로 구성되었습니다. [1]
프로젝트 글래스윙(Project Glasswing)을 가능하게 하는 중심 기술은 Anthropic이 개발한 독점적인 프런티어 AI 모델인 Claude Mythos Preview입니다. 이 모델은 사이버 보안 분야에서 강력하고 잠재적으로 위험한 이중 용도(dual-use) 역량을 보유하고 있어 일반 공개는 예정되어 있지 않습니다. [1]
이 모델의 고급 사이버 보안 기술은 특정 사이버 작업을 위한 훈련의 결과라기보다, 일반적인 고급 코딩 및 추론 능력에서 나타난 창발적 특성입니다. Anthropic은 이 모델의 역량을 "시니어 보안 연구원"과 대등한 수준으로 평가했습니다. [2]
컨소시엄 내의 내부 테스트 및 초기 사용을 통해 Claude Mythos Preview가 다음과 같은 다양한 고급 보안 작업을 수행할 수 있음이 입증되었습니다:
이러한 능력은 이전에 공개된 모델들에 비해 상당한 진보를 나타내며, 통제된 환경으로 접근을 제한하기로 한 결정을 뒷받침합니다. [2] [3]
출시 전 및 초기 단계에서 이 모델은 주요 소프트웨어 프로젝트 전반에 걸쳐 이전에 알려지지 않았던 수천 개의 고위험 제로데이(zero-day) 취약점을 식별하는 데 사용되었습니다. [4] 주요 발견 사례는 다음과 같습니다:
초기 테스트 단계에서 식별된 모든 취약점은 프로젝트의 공식 발표 전에 해당 소프트웨어 유지 관리자와 협력하여 패치된 것으로 보고되었습니다. [4]
Claude Mythos Preview는 출시 당시 Anthropic의 차상위 공개 모델인 Claude Opus 4.6과 비교했을 때 사이버 보안, 코딩 및 추론 벤치마크에서 주목할 만한 성능 향상을 보여줍니다. [1] [3]
| 벤치마크 | Claude Mythos Preview | Claude Opus 4.6 | 설명 |
|---|---|---|---|
| CyberGym | 83.1% | 66.6% | 사이버 보안 작업에서의 성능을 측정합니다. |
| SWE-bench Pro | 77.8% | 53.4% | GitHub 리포지토리의 실제 버그를 수정하기 위한 고급 벤치마크입니다. |
| SWE-bench Verified | 93.9% | 80.8% | GitHub 리포지토리의 실제 버그를 수정하기 위한 벤치마크입니다. |
| Terminal-Bench 2.0 | 82.0% | 65.4% | 에이전트 기반의 터미널 작업 성능을 측정합니다. |
| GPQA Diamond | 94.6% | 91.3% | 고급 추론 능력을 측정하는 벤치마크입니다. |
| OSWorld-Verified | 79.6% | 72.7% | 운영 체제 환경 내에서의 에이전트 작업 성능을 측정합니다. |
이러한 벤치마크 데이터는 Project Glasswing의 창설을 촉발한 성능의 향상을 잘 보여줍니다. [1] [3]
프로젝트 글래스윙은 다음과 같은 몇 가지 핵심 목표를 가지고 운영됩니다:
이러한 목표들은 차세대 사이버 위협에 대비하여 더욱 탄력적인 디지털 생태계를 구축하는 것을 공동의 목표로 합니다. [1] [4]
Project Glasswing은 강력한 발견 사항들을 책임감 있게 관리하기 위해 다음과 같이 구조화된 다단계 취약점 공개 프로세스를 따릅니다.
이 방법론은 발견된 결함이 악용될 위험을 최소화하는 동시에 AI 모델의 방어적 이점을 극대화하도록 설계되었습니다. [3]
프로젝트 글래스윙은 Anthropic이 주도하는 45개 이상의 조직으로 구성된 컨소시엄으로 시작되었습니다. [2]
컨소시엄의 창립 멤버에는 기술, 금융 및 사이버 보안 분야의 주요 기업들이 포함됩니다:
핵심 창립 그룹 외에도, 중요 소프트웨어 인프라 유지 관리를 담당하는 40개 이상의 기타 조직에 Claude Mythos Preview에 대한 접근 권한이 부여되었습니다. [1] [3] [4]
파트너사의 대표들은 이 이니셔티브에 대해 공개적인 지지를 표명했습니다. 구글의 보안 엔지니어링 부문 부사장인 헤더 애드킨스(Heather Adkins)는 "구글은 이 범산업적 사이버 보안 이니셔티브가 결성된 것을 기쁘게 생각합니다. 우리는 AI가 사이버 방어에 있어 새로운 도전 과제를 제시하는 동시에 새로운 기회를 열어준다고 오랫동안 믿어 왔습니다"라고 밝혔습니다. 마찬가지로 마이크로소프트의 글로벌 정보보호최고책임자(CISO)인 이고르 치간스키(Igor Tsyganskiy)는 "클로드 미토스 프리뷰(Claude Mythos Preview)를 이용할 수 있는 프로젝트 글래스윙(Project Glasswing)에 참여함으로써, 위험을 조기에 식별 및 완화하고 보안 및 개발 솔루션을 강화하여 고객과 마이크로소프트를 더 잘 보호할 수 있게 되었습니다"라고 언급했습니다. [2]
Anthropic은 프로젝트와 더 넓은 오픈 소스 보안 생태계를 지원하기 위해 상당한 자원을 투입하기로 약속했습니다:
초기 연구 프리뷰 단계 동안 참가자들은 Anthropic의 사용 크레딧 지원을 통해 대부분의 비용을 충당하며 모델을 사용할 수 있습니다. 이 단계가 종료된 후, 승인된 참가자들은 출력 토큰 100만 개당 125달러의 요율로 모델을 이용할 수 있습니다. 본 모델은 Claude API, Amazon Bedrock, Google Cloud의 Vertex AI, 그리고 Microsoft Foundry를 포함한 다양한 플랫폼을 통해 참가자들에게 제공됩니다. [3]
2026년 4월 7일 프로젝트 글래스윙의 공식 발표에 앞서, 2026년 3월 말 앤스로픽(Anthropic)에서 대중의 관심을 끌었던 두 건의 무관한 보안 사고가 발생했습니다.
앤스로픽은 이러한 사건들에 대해 공식적으로 대응하며, 이를 "보안 아키텍처의 침해 사례가 아닌, 게시 도구 사용상의 휴먼 에러"라고 규정했습니다. 회사는 향후 이러한 오류를 방지하기 위해 개선된 프로세스를 구현했다고 밝혔습니다. [3]
이 프로젝트의 이름은 글래스윙 나비(glasswing butterfly, 학명: Greta oto)의 이름을 따서 명명되었습니다. 이 이름은 프로젝트의 사명을 나타내는 이중적인 비유로 사용됩니다.
이 이름은 숨겨진 결함을 찾는 도전 과제와 해결책의 협력적 특성을 모두 반영하기 위해 선택되었습니다. [1]