**즈칭 선(Zhiqing Sun)**은 대규모 언어 모델(LLM) 및 자율 AI 에이전트를 전문으로 하는 인공지능 연구원입니다. 현재 메타 초지능 연구소의 연구원으로 재직 중이며, 이전에는 OpenAI 연구팀의 일원으로 고급 에이전트 시스템 및 기반 모델 개발에 기여했습니다. [1]
선은 카네기 멜론 대학교 언어 기술 연구소에서 컴퓨터 과학 박사 학위를 받았습니다. 2월 28일, "진실 추구, 복잡한 추론 및 인간 가치에 대한 대규모 언어 모델의 확장 가능한 정렬"이라는 제목의 박사 학위 논문을 성공적으로 변호했습니다. 그의 박사 연구는 대규모 AI 시스템이 진실되고 복잡한 논리적 단계를 수행할 수 있으며 인간이 정의한 원칙에 부합하는 방식으로 작동하도록 보장하는 방법을 개발하는 데 중점을 두었습니다. 그의 논문에 제시된 연구는 AI 정렬 연구의 여러 핵심 영역을 다루었습니다. 여기에는 모델 출력의 사실 정확도를 향상시키기 위해 인간 피드백에서 강화 학습을 사용하는 기술인 Fact-RLHF, AI 추론 프로세스의 효율성을 향상시키는 방법인 Lean-STaR, AI 모델이 더 간단한 작업에서 훈련되어 더 복잡하고 보이지 않는 문제를 해결할 수 있는 능력을 개발하는 방법을 조사하는 쉬운-어려운 일반화에 대한 연구가 포함됩니다. 그의 연구는 또한 최소한의 인간 감독으로 모델이 원하는 가치에 맞춰 스스로 정렬하는 방법을 배우는 자체 정렬 기술과 인간 운영자가 더 쉽게 안내하고 수정할 수 있도록 설계된 지시 가능한 보상 모델의 생성도 탐구했습니다. [1]
선의 전문 경력은 주요 기술 회사의 응용 AI 연구의 최전선에 위치해 있습니다. 그는 OpenAI의 연구원으로, 다양한 정교한 작업을 수행하도록 대규모 언어 모델을 훈련하는 데 참여했습니다. 재직 기간 동안 그는 고도로 자율적인 AI 에이전트를 만드는 데 중점을 둔 프로젝트의 핵심 기여자였습니다. 이러한 시스템은 복잡하고 다단계 작업을 실행하고 인간 입력으로부터 상당한 독립성을 가지고 새로운 정보를 발견하도록 설계되었습니다. 그의 기여는 조직에서 AI가 실제 시나리오에서 달성할 수 있는 한계를 넓히기 위한 광범위한 노력의 일부였습니다. [1]
2025년 중반, 선은 메타 초지능 연구소(MSL)에 합류했습니다. 그의 메타로의 이직은 최고의 AI 인재를 확보하기 위한 치열한 경쟁 기간 동안 발생했으며, 종종 "AI 군비 경쟁"이라고 불리며, 주요 기술 회사들은 인공 일반 지능(AGI)에 대한 연구를 발전시키기 위해 숙련된 연구원을 적극적으로 영입했습니다. 특히 메타는 초지능 연구 부서를 구축하기 위해 상당한 채용 이니셔티브를 수행하여 OpenAI를 포함한 경쟁사에서 수많은 전문가를 성공적으로 영입했습니다. 이러한 전략적 노력은 고급 AI 분야에서 입증된 협업 및 혁신 실적을 가진 팀을 구성하는 것을 목표로 했습니다. [2] [3]
OpenAI에서 선은 AI 에이전트 및 기반 모델의 기능을 발전시키는 것을 목표로 하는 여러 주요 프로젝트에 기여했습니다.
선은 2025년 7월에 발표된 시스템인 ChatGPT 에이전트를 개발한 팀의 일원이었습니다. 그는 이 프로젝트를 여러 AI 기술을 결합하여 더욱 유능하고 자율적인 도우미를 만드는 통합 에이전트 시스템으로 특징지었습니다. 이 에이전트는 웹사이트를 탐색하고 상호 작용할 수 있는 액션 수행 원격 브라우저, 인터넷에서 정보를 수집하고 통합할 수 있는 "심층 연구" 프로젝트의 웹 합성 기능, ChatGPT의 확립된 대화 강점을 통합합니다. 이 시스템의 주요 목표는 AI가 컴퓨터를 직접 작동하여 사용자를 대신하여 복잡한 작업을 수행할 수 있도록 지원하는 것입니다. 이는 텍스트 기반 상호 작용을 넘어 약속 예약, 상세한 시장 조사 수행 또는 온라인 계정 관리와 같은 작업을 에이전트가 실행할 수 있도록 하는 중요한 단계입니다. [1]
선은 OpenAI의 "심층 연구" 프로젝트의 핵심 기여자이기도 했습니다. 이 이니셔티브는 장기 작업(수많은 단계, 계획 및 장기간에 걸친 적응이 필요한 복잡한 문제)을 해결하도록 설계된 고도로 자율적인 에이전트를 구축하는 데 중점을 두었습니다. 이 프로젝트의 목표는 추론 모델에 포괄적인 연구를 수행하고 지속적인 인간 지침 없이 새로운 통찰력이나 지식을 발견할 수 있는 데 필요한 도구와 자율성을 제공하는 것이었습니다. 에이전트에게 어려운 문제를 제시함으로써 시스템은 독립적으로 계획을 수립하고 정보를 수집하며 인간 연구자의 프로세스를 모방하여 솔루션을 향해 노력하도록 의도되었습니다. [1]
웹 브라우징 AI 에이전트의 성능을 체계적으로 측정하고 개선하기 위해 선은 BrowseComp("브라우징 경쟁") 생성에 참여했습니다. 4월에 출시된 이 오픈 소스 벤치마크는 AI 에이전트가 인터넷을 탐색하여 특정하고 종종 찾기 어려운 정보를 찾는 능력을 엄격하게 테스트하도록 설계되었습니다. 선은 이 벤치마크를 코딩 또는 수학과 같은 분야의 학술 또는 전문 경쟁에 비유했는데, 이는 지능과 기술에 대한 표준화된 테스트 역할을 합니다. 이러한 벤치마크가 실제 복잡성을 완벽하게 복제하지는 않지만, 보다 유능하고 신뢰할 수 있는 브라우징 에이전트 개발에서 진행 상황을 평가하고 약점을 식별하며 혁신을 주도하기 위한 중요한 프레임워크를 제공합니다. [1]
OpenAI에서 선의 작업에는 ARC(Abstraction and Reasoning Corpus) 벤치마크에서 최첨단 결과를 달성한 시스템인 o3 모델에 대한 기여도 포함되었습니다. 2024년 12월, o3 모델이 ARC-AGI 준-비공개 평가에서 75.7%를 득점했으며, 모델의 더 많은 계산 집약적인 버전이 87.5%에 도달했다고 발표되었습니다. ARC 벤치마크는 AI 커뮤니티에서 시스템의 추상적 추론 능력에 대한 어려운 테스트로 널리 존경받고 있으며, 이는 인공 일반 지능의 기본으로 간주됩니다. 이 테스트에서는 AI가 이전에 본 적이 없는 새로운 논리 퍼즐을 풀어야 하며, 광대한 데이터 세트에서 패턴 인식을 사용하는 대신 몇 가지 예에서 일반화하는 능력을 측정합니다. ARC에서 높은 점수를 받는 것은 AI가 인간과 유사한 문제 해결 기술을 향해 나아가는 중요한 지표로 간주됩니다. [1]