孙志清 是一位人工智能研究员,专门研究大型语言模型 (LLM) 和自主 AI 代理。他目前是 Meta 超智能实验室 的研究员,此前曾在 OpenAI 的研究团队工作,在那里他为高级代理系统和基础模型的开发做出了贡献。[1]
孙获得了卡内基梅隆大学语言技术研究所的计算机科学博士学位。他于 2 月 28 日成功完成了博士论文答辩,论文题目为“大型语言模型在寻求真理、复杂推理和人类价值观方面的可扩展对齐”。他的博士研究侧重于开发方法,以确保大规模人工智能系统以真实、能够进行复杂逻辑步骤并符合人类定义原则的方式运行。他的论文中提出的工作涵盖了人工智能对齐研究的几个关键领域。这些包括 Fact-RLHF,这是一种利用人类反馈的强化学习来提高模型输出的事实准确性的技术;Lean-STaR,一种提高 AI 推理过程效率的方法;以及关于从易到难泛化的研究,该研究调查了在更简单的任务上训练的 AI 模型如何发展解决更复杂、未见问题能力。他的研究还探索了自我对齐技术,模型在人类监督最少的情况下学习将自己与期望的价值观对齐,以及可指导奖励模型的创建,这些模型旨在更容易地受到人类操作员的指导和纠正。[1]
孙的职业生涯一直处于主要科技公司应用人工智能研究的最前沿。他曾是 OpenAI 的一名研究员,他的工作包括训练大型语言模型来执行一系列复杂的任务。在他的任期内,他是专注于创建高度自主 AI 代理的项目的关键贡献者。这些系统旨在执行复杂的多步骤操作,并以很大程度上独立于人类输入的方式发现新信息。他的贡献是该组织更广泛努力的一部分,旨在突破 AI 在实际、现实场景中可以完成的任务的界限。[1]
2025 年年中,孙加入了 Meta 超智能实验室 (MSL)。他转到 Meta 的时期正值顶级 AI 人才竞争激烈的时期,通常被称为“AI 军备竞赛”,领先的科技公司积极招募经验丰富的研究人员来推进他们在通用人工智能 (AGI) 方面的工作。特别是 Meta 参与了一项重要的招聘计划,以建立其超智能研究部门,成功地从包括 OpenAI 在内的竞争对手那里招募了众多专家。这项战略努力旨在组建在高级 AI 领域拥有良好合作和创新记录的团队。[2] [3]
在 OpenAI,孙为多个旨在提高 AI 代理和基础模型能力的高调项目做出了贡献。
孙是开发 ChatGPT 代理的团队成员,该系统于 2025 年 7 月宣布。他将该项目描述为一个统一的代理系统,它结合了多种 AI 技术来创建一个更强大和自主的助手。该代理集成了一个执行操作的远程浏览器,允许它导航和与网站交互;来自“深度研究”项目的网络合成功能,使其能够从互联网收集和整合信息;以及 ChatGPT 已建立的对话优势。该系统的主要目标是让 AI 通过直接操作计算机来代表用户执行复杂的工作。这代表了超越基于文本的交互的重要一步,允许代理执行诸如预订约会、进行详细的市场调查或管理在线帐户等任务。[1]
孙也是 OpenAI“深度研究”项目的关键贡献者。该计划的重点是构建一个高度自主的代理,旨在解决长期任务——需要在较长时间内进行多个步骤、计划和适应的复杂问题。该项目的目标是为推理模型提供必要的工具和自主性,以进行全面的研究,并可能在没有持续的人工指导的情况下发现新的见解或知识。通过向代理提供一个具有挑战性的问题,该系统旨在独立制定计划、收集信息并努力寻找解决方案,从而模仿人类研究人员的过程。[1]
为了系统地衡量和提高网络浏览 AI 代理的性能,孙参与了 BrowseComp(“浏览竞赛”)的创建。这个于 4 月发布的开源基准旨在严格测试 AI 代理导航互联网以查找特定、通常难以找到的信息的能力。孙将该基准比作编码或数学等领域的学术或专业竞赛,这些竞赛是智力和技能的标准化测试。虽然此类基准可能无法完美地复制现实世界的复杂性,但它们为评估进展、识别弱点和推动更强大和可靠的浏览代理的开发创新提供了一个关键框架。[1]
孙在 OpenAI 的工作还包括为 o3 模型做出贡献,该系统在抽象和推理语料库 (ARC) 基准上取得了最先进的结果。2024 年 12 月,宣布 o3 模型在 ARC-AGI 半私有评估中获得了 75.7% 的分数,该模型的计算密集型版本达到了 87.5%。ARC 基准在 AI 社区中被广泛认为是系统抽象推理能力的难题,这被认为是通用人工智能的基础。该测试要求 AI 解决它以前从未见过的新的逻辑难题,衡量它从几个例子中进行概括的能力,而不是依赖于来自庞大数据集的模式识别。ARC 的高分被认为是 AI 在朝着更像人类的解决问题技能方向发展的重要指标。[1]