Summer Yue는 AI 안전, 정렬 및 대규모 머신 러닝 시스템을 전문으로 하는 인공 지능 연구원입니다. 그녀는 Meta의 Superintelligence Labs의 이사이며 이전에는 Scale AI에서 연구 부사장 겸 안전 및 표준 이사로 재직했습니다. [1] [2]
Yue는 펜실베이니아 대학교에 다녔으며 Jerome Fisher 경영 및 기술 프로그램에 등록했습니다. 그녀는 이학사 학위를 받았으며 공학 및 응용 과학 대학에서 컴퓨터 과학과 Wharton School에서 경제학을 복수 전공했습니다. [3] [2] [6]
Yue는 Oliden Technology, LLC의 웹 프로그래머, China Petroleum의 소프트웨어 엔지니어링 인턴, Microsoft Office의 백엔드 엔지니어, Square의 규정 준수 엔지니어링 소프트웨어 엔지니어링 인턴 등 여러 인턴십으로 경력을 시작했습니다. 그런 다음 Google에 합류하여 처음에는 YouTube의 신뢰 및 안전 부서에서 소프트웨어 엔지니어로 근무하면서 허위 정보, 스팸 및 혐오 발언과 같은 문제에 집중했습니다. 이후 Google의 AI 연구 부서로 전환하여 Google Brain에서 선임 연구 엔지니어로, 이후 합병 후 Google DeepMind에서 스태프 연구 엔지니어로 근무했습니다. 2018년부터 2023년까지 Google에서 근무하는 동안 Gemini, LaMDA 및 AlphaChip을 포함한 프로젝트를 위한 대규모 딥 러닝 모델 및 인프라 연구에 기여했습니다.
2023년 11월 Yue는 Scale AI에 연구 부사장 겸 안전 및 표준 이사로 합류했습니다. 이 직책에서 그녀는 또한 설립자 겸 CEO인 Alexandr Wang의 AI 최고 책임자로 근무했습니다. 그녀는 회사의 안전, 평가 및 분석 연구소(SEAL)를 설립하고 이끌기 위해 고용되었으며, 이 연구소는 AI 모델 평가, 레드 팀 구성 및 확장 가능한 감독에 대한 연구에 집중했습니다. 그녀의 업무에는 자동 평가, 합성 데이터 및 사후 훈련 데이터 연구에 전념하는 여러 생성 AI 머신 러닝 팀을 관리하는 것이 포함되었습니다.
2025년 7월 Yue는 Scale AI를 떠나 Meta의 새로 구성된 Superintelligence Labs에 이사로 합류한다고 발표했습니다. Meta에서의 그녀의 업무는 AI 안전 및 정렬에 중점을 두고 신뢰할 수 있고 안정적인 AI 시스템 구축에 대한 연구를 계속합니다. [1] [2] [3] [4] [5] [6]
Scale AI에서 근무하는 동안 Yue의 업무는 대규모 언어 모델(LLM)의 안전성을 평가하고 보장하기 위한 강력한 방법을 확립하는 데 중점을 두었습니다. 그녀의 주요 관심사는 강화 학습, 해석 가능성, 가치 학습, 적대적 예제 및 대규모 머신 러닝 시스템의 공정성을 포함합니다. [3]
Scale AI의 SEAL 책임자로서 Yue는 AI 안전의 연구 과제를 해결하기 위한 이니셔티브를 주도했습니다. 그녀의 리더십 하에 있는 주요 프로젝트는 LLM용 순위 시스템인 SEAL 리더보드를 만드는 것이었습니다. 리더보드는 공개 벤치마크에서 훈련하는 모델 개발자가 쉽게 "조작"할 수 없는 비공개 전문가 검증 데이터 세트를 사용하도록 설계되었습니다. 이 리더보드는 지침 준수 및 특정 프롬프트에 대한 유해한 응답을 생성하는 경향과 같은 기준에 따라 모델을 평가했습니다. 연구소는 또한 AI 에이전트의 취약성에 대한 연구를 수행하여 LLM의 안전 메커니즘이 다운스트림 브라우저 에이전트에 효과적으로 일반화되지 않는다는 사실을 발견했습니다. [5] [1]
Yue는 Scale AI와 AI 안전 센터(CAIS) 간의 파트너십을 주도하여 대량 살상 무기 프록시(WMDP) 안전 벤치마크를 개발했습니다. 이 벤치마크는 고급 AI 기능과 관련된 잠재적 위험을 평가하고 완화하기 위한 표준화된 방법을 제공하여 악의적인 목적으로 오용될 수 있는 프런티어 AI 모델의 위험을 평가하기 위해 만들어졌습니다. [5] [4]
Yue는 AI 안전, 평가 및 코드 생성에 대한 수많은 연구 논문을 공동 저술했습니다. 그녀의 출판물은 ICLR 및 NeurIPS와 같은 컨퍼런스에서 소개되었습니다. 주목할 만한 작품은 다음과 같습니다.
이 목록은 그녀의 출판된 연구의 일부를 나타냅니다. [4]
Yue는 SXSW 2025 컨퍼런스에서 "과장 광고를 넘어: 신뢰할 수 있고 신뢰할 수 있는 AI 구축"이라는 제목으로 강연할 예정입니다. [5]