**손지칭(Sun Zhiqing)**은 대규모 언어 모델(LLM) 및 자율 AI 에이전트를 전문으로 하는 인공지능 연구원입니다. 현재 메타 초지능 연구소(Meta Superintelligence Labs) 연구원이며, 이전에는 OpenAI 연구팀에서 고급 에이전트 시스템 및 기초 모델 개발에 기여했습니다. [1]
손 박사는 카네기멜론대학교 언어기술연구소(Language Technologies Institute)에서 컴퓨터 과학 박사 학위를 받았습니다. 2월 28일에 "진실 추구, 복잡한 추론 및 인간 가치를 향한 대규모 언어 모델의 확장 가능한 정렬(Scalable Alignment of Large Language Models Towards Truth-Seeking, Complex Reasoning, and Human Values)"이라는 제목의 박사 논문을 성공적으로 발표했습니다. 그의 박사 연구는 대규모 AI 시스템이 진실되고 복잡한 논리적 단계를 수행하며 인간이 정의한 원칙에 부합하는 방식으로 작동하도록 하는 방법 개발에 중점을 두었습니다. 그의 논문에서 제시된 연구는 AI 정렬 연구의 몇 가지 주요 영역을 다루었습니다. 여기에는 모델 출력의 사실적 정확도를 향상시키는 데 인간 피드백으로부터 강화 학습을 사용하는 기술인 Fact-RLHF, AI 추론 프로세스의 효율성을 높이는 방법인 Lean-STaR, 그리고 더 간단한 작업에 대해 훈련된 AI 모델이 더 복잡하고 보이지 않는 문제를 해결하는 능력을 개발하는 방법을 조사하는 easy-to-hard 일반화에 대한 연구가 포함됩니다. 그의 연구는 또한 최소한의 인간 감독으로 모델이 원하는 가치에 스스로 정렬하도록 학습하는 자기 정렬 기술과 인간 운영자가 더 쉽게 안내하고 수정할 수 있도록 설계된 지시 가능한 보상 모델 생성을 탐구했습니다. [1]
손 박사의 전문 경력은 주요 기술 회사 내 응용 AI 연구의 최전선에 위치해 있습니다. 그는 OpenAI에서 연구원으로 일하면서 다양한 정교한 작업을 수행하도록 대규모 언어 모델을 훈련하는 작업에 참여했습니다. 재직 기간 동안 그는 고도로 자율적인 AI 에이전트를 만드는 프로젝트에 중요한 기여를 했습니다. 이러한 시스템은 복잡하고 다단계 작업을 실행하고 인간의 입력으로부터 상당한 독립성을 가지고 새로운 정보를 발견하도록 설계되었습니다. 그의 기여는 AI가 실제 시나리오에서 달성할 수 있는 범위를 넓히려는 조직의 광범위한 노력의 일부였습니다. [1]
2025년 중반, 손 박사는 메타 초지능 연구소(Meta Superintelligence Labs) (MSL)에 합류했습니다. 메타로의 이직은 최고 수준의 AI 인재를 위한 치열한 경쟁, 즉 주요 기술 회사들이 인공 일반 지능(AGI)에 대한 연구를 발전시키기 위해 경험이 풍부한 연구원들을 적극적으로 영입하는 "AI 군비 경쟁"이라고 불리는 시기에 이루어졌습니다. 특히 메타는 초지능 연구 부서를 구축하기 위해 상당한 채용 계획을 수행하여 OpenAI를 포함한 경쟁사의 수많은 전문가를 성공적으로 영입했습니다. 이러한 전략적 노력은 고급 AI 분야에서 협업과 혁신의 입증된 실적을 가진 팀을 구성하는 것을 목표로 했습니다. [2] [3]
OpenAI에서 손 박사는 AI 에이전트와 기초 모델의 기능을 향상시키는 것을 목표로 하는 여러 주목할 만한 프로젝트에 기여했습니다.
손 박사는 2025년 7월에 발표된 시스템인 ChatGPT 에이전트를 개발한 팀의 일원이었습니다. 그는 이 프로젝트를 여러 AI 기술을 결합하여 더욱 유능하고 자율적인 어시스턴트를 만드는 통합 에이전트 시스템으로 묘사했습니다. 이 에이전트는 웹사이트를 탐색하고 상호 작용할 수 있는 행동 수행 원격 브라우저, 인터넷에서 정보를 수집하고 통합할 수 있는 "심층 연구" 프로젝트의 웹 합성 기능, 그리고 확립된 ChatGPT의 대화 기능을 통합합니다. 이 시스템의 주요 목표는 AI가 컴퓨터를 직접 작동하여 사용자를 대신하여 복잡한 작업을 수행할 수 있도록 하는 것입니다. 이는 텍스트 기반 상호 작용을 넘어선 중요한 단계로, 에이전트가 약속 예약, 상세한 시장 조사 수행 또는 온라인 계정 관리와 같은 작업을 실행할 수 있도록 합니다. [1]
손 박사는 OpenAI의 "심층 연구" 프로젝트에도 중요한 기여를 했습니다. 이 계획은 장기간의 작업, 즉 여러 단계, 계획 및 장기간에 걸친 적응이 필요한 복잡한 문제를 해결하도록 설계된 고도로 자율적인 에이전트를 구축하는 데 중점을 두었습니다. 이 프로젝트의 목표는 추론 모델에 지속적인 인간의 안내 없이 포괄적인 연구를 수행하고 새로운 통찰력이나 지식을 발견할 수 있는 필요한 도구와 자율성을 제공하는 것이었습니다. 에이전트에 어려운 문제를 제공함으로써, 시스템은 독립적으로 계획을 수립하고, 정보를 수집하고, 해결책을 향해 노력하여 인간 연구자의 과정을 모방하도록 의도되었습니다. [1]
웹 브라우징 AI 에이전트의 성능을 체계적으로 측정하고 개선하기 위해 손 박사는 BrowseComp("브라우징 경쟁") 생성에 참여했습니다. 4월에 출시된 이 오픈 소스 벤치마크는 AI 에이전트가 종종 찾기 어려운 특정 정보를 찾기 위해 인터넷을 탐색하는 능력을 엄격하게 테스트하도록 설계되었습니다. 손 박사는 이 벤치마크를 코딩이나 수학과 같은 분야의 학문적 또는 전문적인 경쟁과 비교했는데, 이는 지능과 기술의 표준화된 테스트 역할을 합니다. 이러한 벤치마크가 실제 세계의 복잡성을 완벽하게 복제하지는 않을 수 있지만, 진행 상황을 평가하고, 약점을 파악하고, 더 유능하고 신뢰할 수 있는 브라우징 에이전트 개발을 위한 혁신을 주도하는 데 중요한 프레임워크를 제공합니다. [1]
OpenAI에서 손 박사의 작업에는 추상 및 추론 코퍼스(ARC) 벤치마크에서 최첨단 결과를 달성한 o3 모델에 대한 기여도 포함되었습니다. 2024년 12월, o3 모델이 ARC-AGI 준비밀 평가에서 75.7%를 기록했으며, 더 많은 컴퓨팅 집약적인 버전의 모델은 87.5%에 도달했다고 발표되었습니다. ARC 벤치마크는 AI 커뮤니티에서 시스템의 추상적 추론 능력에 대한 어려운 테스트로 널리 인정받고 있으며, 이는 인공 일반 지능의 기본으로 간주됩니다. 이 테스트는 AI가 이전에 본 적이 없는 새로운 논리 퍼즐을 풀도록 요구하여 방대한 데이터 세트에서 패턴 인식에 의존하기보다는 몇 가지 예에서 일반화하는 능력을 측정합니다. ARC에서 높은 점수는 AI가 더 인간과 같은 문제 해결 기술을 향해 나아가는 중요한 지표로 간주됩니다. [1]