任弘宇 是一位以其在大型语言模型方面的工作而闻名的研究科学家,尤其是在 OpenAI 的 o 系列模型和 GPT-4o,以及他后来转到 Meta 的 Superintelligence Labs。
任弘宇获得了北京大学计算机科学荣誉学士学位。 后来,他在斯坦福大学继续深造,并获得了计算机科学博士学位。 [1] [2] [5]
任弘宇是一位计算机科学家,在学术界和工业界的机器学习研究方面拥有丰富的经验。自 2023 年 7 月以来,他一直在 OpenAI 担任研究科学家,为多个语言模型的开发做出了贡献。他的工作包括参与 OpenAI 的 o1、o1-mini、o3-mini 和 GPT-4o 模型的设计和实施。他还领导了模型开发的后期训练阶段的工作。
在加入 OpenAI 之前,任弘宇曾在多家科技公司担任研究职位。2021 年,他在 Apple 完成了两次实习,在那里他从事与语音助手系统中问题解答相关的自然语言处理任务。从 2020 年到 2021 年,他与 Google 合作,担任学生研究员和研究实习生,专注于基于 Transformer 的模型的优化。
2019 年,他曾在 NVIDIA 担任研究实习生,他的工作重点是元强化学习。在他职业生涯的早期,2018 年,他曾在北京微软研究院担任研究助理,为人工智能项目做出了贡献。
2025 年,任弘宇加入了 Meta 的 Superintelligence Labs,这是一个旨在研究通用人工智能的研究计划。他转到该实验室正值一项更广泛的扩张计划,该计划涉及从整个行业招募人工智能研究人员。 [3] [5]
在 OpenAI 工作期间,任弘宇参与了多个著名人工智能模型的共同创建和开发:
任弘宇获得了多个奖学金:
在斯坦福大学期间,任弘宇曾担任计算机科学课程的助教。