任弘宇 是一位以其在大型语言模型方面的工作而闻名的研究科学家,尤其是在 OpenAI 的 o 系列模型和 GPT-4o,以及他后来转到 Meta 的超智能实验室。
任弘宇获得了北京大学计算机科学专业的荣誉理学学士学位。 后来,他在斯坦福大学攻读研究生,并在那里完成了计算机科学博士学位。 [1] [2] [5]
任弘宇是一位计算机科学家,在学术界和工业界的机器学习研究方面拥有丰富的经验。 自 2023 年 7 月以来,他一直在 OpenAI 担任研究科学家,为多种语言模型的开发做出了贡献。 他的工作包括参与 OpenAI 的 o1、o1-mini、o3-mini 和 GPT-4o 模型的设计和实施。 他还领导了模型开发的后期训练阶段的工作。
在加入 OpenAI 之前,任弘宇曾在多家科技公司担任研究职位。 2021 年,他在 Apple 完成了两次实习,在那里他从事与语音助手系统中问题解答相关的自然语言处理任务。 从 2020 年到 2021 年,他与 Google 合作,担任学生研究员和研究实习生,专注于基于 Transformer 的模型的优化。
2019 年,他曾在 NVIDIA 担任研究实习生,他的工作重点是元强化学习。 早在他职业生涯的 2018 年,他曾在北京微软研究院担任研究助理,为人工智能项目做出了贡献。
2025 年,任弘宇加入了 Meta 的超智能实验室,这是一个为研究通用人工智能而设立的研究机构。 他转到该实验室是在一项更广泛的扩张努力中发生的,该努力涉及从整个行业招募人工智能研究人员。 [3] [5]
在 OpenAI 工作期间,任弘宇参与了多个著名人工智能模型的共同创建和开发:
任弘宇获得了多个奖学金:
在斯坦福大学期间,任弘宇曾担任计算机科学课程的助教。