Jason Wei

Jason Wei 是一位美国人工智能研究员，以其对大型语言模型的贡献而闻名，包括思维链提示的开发。他目前是 Meta 超智能实验室的研究员，此前曾在 OpenAI 和 Google Brain 工作。 ^[1] ^[2]

职业生涯

Wei 的职业生涯始于 Google Brain 的一名研究科学家，他的工作重点是提高大型语言模型 (LLM) 的能力。在 Google 工作期间，他在研究中发挥了重要作用，推广了该领域的几项关键技术。他对思维链提示的研究表明，LLM 可以通过生成中间步骤（模仿类似人类的思维过程）更有效地执行复杂的推理任务。他还为指令调整的开发做出了贡献，这是一种微调语言模型以更好地遵循用户指令的方法，并对 LLM 的涌现能力进行了研究，这些能力是随着模型规模的增加而出现的意外能力。 ^[1] ^[3]

2023 年 2 月，Wei 宣布他已离开 Google 加入 OpenAI 的 ChatGPT 团队。 ^[4] 在 OpenAI，他继续从事高级 AI 模型的研究，并且是 OpenAI o1 模型的共同创建者，该模型是一系列旨在花费更多时间“思考”然后再提供答案以处理更复杂问题的模型。他还从事一个名为“深度研究”的项目。 ^[1] ^[2] 在 OpenAI 工作期间，Wei 成为强化学习 (RL) 的坚定支持者，这是一种使用反馈来改进模型性能的训练方法。他称自己为“RL 死忠”，并指出其核心概念如何影响了他的个人哲学，他说“击败老师需要走自己的路，并从环境中获取风险和回报。” ^[3] ^[5]

2025 年 7 月，据报道，Wei 与他的亲密同事 Hyung Won Chung 一起离开 OpenAI 加入 Meta 新成立的超智能实验室。Wei 在推理和强化学习方面的专业知识被视为 Meta 实现目标的关键资产。 ^[1] ^[2] ^[6]

主要作品

Wei 为人工智能领域的几个有影响力的研究领域和模型做出了贡献。他的工作主要集中在增强大型语言模型的推理和泛化能力。

思维链提示

在 Google 工作期间，Wei 是导致思维链 (CoT) 提示的研究中的关键人物。该技术提示语言模型将多步骤问题分解为中间推理步骤，然后再给出最终答案。通过外化其“思维过程”，该模型可以为算术、常识和符号推理等领域的复杂任务得出更准确和可靠的解决方案。这项工作发表在 2022 年题为“思维链提示引发语言模型中的推理”的论文中，有助于推广该方法，并显着影响了 LLM 推理的后续研究。 ^[1] ^[3]

指令调整和涌现能力

Wei 还为指令调整的研究做出了贡献，尤其是在 Google 的 FLAN（微调语言网络）模型方面。指令调整涉及在格式化为指令的数据集集合上微调预训练的语言模型。此过程提高了模型在零样本设置中执行各种未见任务的能力，使其更通用并与用户意图保持一致。他的工作在“微调语言模型是零样本学习器”（2021 年）和“缩放指令微调语言模型”（2022 年）等论文中进行了详细介绍。同时，他与人合着了论文“大型语言模型的涌现能力”（2022 年），该论文描述了 LLM 的某些能力如何在特定的模型大小和训练数据规模下不可预测地出现，而不是平稳地改进。 ^[1]

OpenAI o1 模型

在 OpenAI，Wei 是 o1 模型的共同创建者，该模型于 2024 年 9 月在预览版中推出。o1 系列模型旨在通过在生成响应之前投入更多的计算工作或“思考时间”来改进先前模型的推理限制。这种方法允许模型以更高的准确性推理科学、数学和编码等领域的复杂任务。Wei 解释说，该模型是对 AI 领域的一项重大更新，超越了简单的思维链提示，转向了更复杂的推理过程。 ^[7] ^[2]

订阅 wiki

Share wiki

Bookmark

Wiki Details

个人简介