Mark Chen 是一位人工智能研究员,担任 OpenAI 的首席研究官。他也是代表美国参加国际信息学奥林匹克竞赛 (IOI) 队的教练。 [1] [2]
Chen 获得了加州理工学院 (Caltech) 的数学和计算机科学学士学位,后来获得了纽约大学 (NYU) 的计算机科学博士学位。 [3]
Chen 在 2018 年加入 OpenAI,此前他在 Jane Street Capital 担任量化交易员,在那里他开发了用于期货交易的机器学习模型。在 OpenAI,他是该公司几个旗舰项目开发的关键人物。他率先创建了 DALL-E,该公司的生成图像模型,后来致力于将图像识别功能集成到 GPT-4 中。Chen 还领导了 Codex 的开发,Codex 是为 GitHub Copilot 提供支持的生成编码模型。 [2]
作为首席研究官,Chen 与首席科学家 Jakub Pachocki 共同领导 OpenAI 的研究部门。他的职责包括塑造和管理研究团队。他的公开交流通常涉及宣布或展示重要的 OpenAI 项目和里程碑。例如,在 2022 年 4 月,他分享了由 DALL-E 2 模型生成的图像,在 2025 年 3 月,他发布了关于在 GPT-4o 中启动原生图像生成功能的消息。在 2025 年 2 月,Chen 宣布一项名为“深度研究”的功能正在向 ChatGPT 的所有专业级用户推出。此功能旨在使 AI 能够查找、分析和综合来自数百个在线资源的信息,以生成综合报告。 [1] [2]
除了他的公司职务外,Chen 还积极参与竞技编程,担任美国国际信息学奥林匹克竞赛 (IOI) 队的教练。他将这项教练工作与他的职业动机联系起来,表示他的长期目标是创建能够达到最优秀的参赛者水平的 AI 模型。在 2024 年 9 月,他宣布 OpenAI 的模型已经达到了相当于当年 IOI 竞赛问题金牌的水平。 [1] [2]
在他的领导岗位上,Chen 负责驾驭人工智能研究的竞争格局,包括人才保留。在 2025 年 6 月,在 Meta 招募了四名 OpenAI 高级研究员之后,Chen 在一份内部备忘录中向公司发表了讲话。他表达了一种“发自内心的感觉……好像有人闯入我们的家并偷走了东西”,并向员工保证领导层正在积极努力留住员工。他表示 OpenAI 正在“重新调整薪酬”,并探索“创造性的方式来认可和奖励顶尖人才”。在承诺为他的员工而战的同时,Chen 还强调了他“高度的个人公平标准”,并指出他不会“以对他人不公平为代价”来留住人才。在同一份备忘录中,他告诫不要“过于沉迷于定期产品发布的节奏以及与竞争对手的短期比较”,敦促大家专注于推进通用人工智能 (AGI) 的“主要任务”。OpenAI 首席执行官 Sam Altman 公开赞扬了 Chen 在此期间的领导能力。 [3]
Chen 公开评论人工智能行业的发展趋势。在 2025 年 1 月,他承认了竞争对手 DeepSeek 在生产“o1 级推理模型”方面的工作,并指出他们的研究独立地得出了一些与 OpenAI 发现的相同的核心概念。在同一次讨论中,他谈到了围绕开发高级 AI 的高成本的公众说法。Chen 表示,这种反应“有些夸大”,他解释说,通过将开发过程分为两种模式——预训练和推理——可以优化两个轴上的能力,而不是一个轴,这可以降低运营成本。他肯定了 OpenAI 专注于提高模型效率,并致力于执行其研究路线图,以在全年发布更高级的模型。 [1]
Chen 明确表示,他个人在竞技编程方面的背景影响了他的研究目标。他表示希望“创建加速我们自己的模型”,认为这是快速进步的途径。他和他的同事认为,精通数学和编码是“一种更普遍的智能形式的基石”,能够解决新问题。 [2]
关于通往 AGI 的道路,Chen 强调了“自主时间”的概念,将其作为一个关键指标。他将其定义为“模型在没有陷入僵局的情况下,在解决难题上取得有效进展所能花费的时间”。他还对扩展定律表示了持续的信心,该定律认为模型会随着计算能力的提高而改进,并表示“我认为没有任何证据表明扩展定律在任何意义上已经失效”。他认为,研究突破将继续克服数据或模型架构中的瓶颈。 [2]
当被问及 2024 年 OpenAI 超级对齐团队关键成员离职时,Chen 将这种情况描述为“高度个人化的决定”的结果。他认为,在一个“非常动态的领域”,一家公司的发展可能与特定研究人员的预期不符,从而导致他们离开。他指出,“有时这个领域的发展方式与你进行研究的方式不太一致。” [2]