陈曦 是一位专注于人工智能、计算机视觉和深度学习的研究科学家。他是 Meta 超级智能实验室 的成员,此前曾在 Google DeepMind 工作,是 Gemini 多模态模型系列的核心贡献者。 [1] [2]
刘完成了他在清华大学的本科学习,在那里他获得了自动化专业的学士学位。他继续在美国深造,获得了加州大学洛杉矶分校 (UCLA) 的统计学硕士学位。然后,刘在约翰·霍普金斯大学攻读博士学位,师从彭博杰出教授 Alan Yuille。他获得了计算机科学博士 (PhD) 学位,他的研究重点是计算机视觉和深度学习。 [3] [4] [7]
完成博士学位后,刘开始了他在自动驾驶技术公司 Waymo 的职业生涯,担任高级研究员。后来,他加入 Google DeepMind 担任研究科学家。在 DeepMind,他是负责 Gemini 系列大型语言模型后训练的团队成员,并被列为 Gemini、Gemini 1.5 和 Gemini 2.5 技术报告的核心贡献者。
2025 年,刘加入 Meta,担任该公司新成立的 超级智能实验室 的研究科学家。他的加入是 Meta 更广泛的计划的一部分,该计划旨在组建一个由来自 OpenAI 和 DeepMind 等组织的杰出研究人员组成的团队,专注于通用人工智能 (AGI) 的开发。 [6] [2] [1] [5] [7]
刘的研究兴趣包括计算机视觉、深度学习、神经架构搜索 (NAS) 和视觉语言模型。他曾在主要的 AI 会议上发表过大量论文,例如计算机视觉和模式识别会议 (CVPR)、欧洲计算机视觉会议 (ECCV) 和国际学习表征会议 (ICLR)。
他在 Google DeepMind 的工作涉及对 Gemini 项目的重大贡献,Gemini 项目是一系列功能强大的多模态模型。在他从事大型语言模型工作之前,刘的研究重点是自动发现高效的神经网络架构。他在“渐进式神经架构搜索”(PNAS) 方面的工作引入了一种学习卷积网络结构的方法,该方法比以前的方法更有效。另一项值得注意的工作“Auto-DeepLab”提出了一种用于语义图像分割的分层神经架构搜索算法。 [1] [8]
以下是他的一些主要作品:
2019 年,刘被评为 Google AI 研究员,该奖项旨在表彰和支持在计算机科学及相关领域进行杰出研究的优秀研究生。他是入选该奖学金的 54 名学生之一,该奖学金提供两年的付费学费和杂费。在获奖时,刘表示他的研究目标是“让机器自发高效地发现最有利于各种视觉智能任务的架构”。 [4]