陈曦·刘是一位专注于人工智能、计算机视觉和深度学习的研究科学家。他是Meta Superintelligence Labs的成员,此前曾在Google DeepMind工作,是Gemini系列多模态模型的核心贡献者。[1] [2]
刘在清华大学完成了本科学习,获得了自动化专业的学士学位。他继续在美国深造,获得了加州大学洛杉矶分校(UCLA)的统计学硕士学位。之后,刘在约翰·霍普金斯大学攻读博士学位,师从彭博杰出教授Alan Yuille。他获得了计算机科学博士学位(PhD),其研究方向为计算机视觉和深度学习。[3] [4] [7]
完成博士学位后,刘开始了他在Waymo(一家自动驾驶技术公司)的职业生涯,担任高级研究员。之后,他加入Google DeepMind,担任研究科学家。在DeepMind,他是负责Gemini系列大型语言模型后训练的团队成员,并被列为Gemini、Gemini 1.5和Gemini 2.5技术报告的核心贡献者。
2025年,刘加入Meta,担任该公司新成立的Superintelligence Labs的研究科学家。他的加入是Meta更广泛计划的一部分,旨在组建一个由来自OpenAI和DeepMind等机构的杰出研究人员组成的团队,专注于通用人工智能(AGI)的开发。[6] [2] [1] [5] [7]
刘的研究兴趣包括计算机视觉、深度学习、神经架构搜索(NAS)和视觉语言模型。他曾在主要的AI会议上发表过大量论文,如计算机视觉与模式识别会议(CVPR)、欧洲计算机视觉会议(ECCV)和国际学习表征会议(ICLR)。
他在Google DeepMind的工作涉及对Gemini项目(一系列功能强大的多模态模型)的重大贡献。在从事大型语言模型研究之前,刘的研究重点是自动发现高效的神经网络架构。他在“渐进式神经架构搜索”(PNAS)方面的工作引入了一种学习卷积网络结构的方法,该方法比以前的方法更有效。另一项值得注意的工作“Auto-DeepLab”提出了一种用于语义图像分割的分层神经架构搜索算法。[1] [8]
以下是他的一些主要作品:
2019年,刘被评为Google AI Fellow,该奖项旨在表彰和支持在计算机科学及相关领域进行杰出研究的优秀研究生。他是入选该奖学金的54名学生之一,该奖学金提供两年的学费和杂费。在获奖时,刘表示他的研究目标是“让机器自发高效地发现最有利于各种视觉智能任务的架构”。[4]