Summer Yue 是一位人工智能研究员,专门研究人工智能安全、对齐和大规模机器学习系统。她是 Meta 超智能实验室 的主管,此前曾担任 Scale AI 的研究副总裁以及安全和标准主管。[1] [2]
Yue 曾就读于宾夕法尼亚大学,参加了 Jerome Fisher 管理与技术项目。她获得了理学学士学位,同时获得了工程与应用科学学院的计算机科学和沃顿商学院的经济学双学位。[3] [2] [6]
Yue 的职业生涯始于多次实习,包括在 Oliden Technology, LLC 担任 Web 程序员、在中国石油担任软件工程实习生、在 Microsoft Office 担任后端工程师以及在 Square 担任合规工程软件工程实习生。之后,她加入了 Google,最初在 YouTube 的信任与安全部门担任软件工程师,专注于错误信息、垃圾邮件和仇恨言论等问题。后来,她转到 Google 的人工智能研究部门,在 Google Brain 担任高级研究工程师,随后在 Google DeepMind 合并后担任 Google DeepMind 的高级研究工程师。在 2018 年至 2023 年期间,她在 Google 工作,为 Gemini、LaMDA 和 AlphaChip 等项目的大规模深度学习模型和基础设施研究做出了贡献。
2023 年 11 月,Yue 加入 Scale AI,担任研究副总裁以及安全和标准主管。在此职位上,她还担任创始人兼首席执行官 Alexandr Wang 的人工智能幕僚长。她受聘建立并领导公司的安全、评估和分析实验室 (SEAL),该实验室专注于人工智能模型评估、红队演练和可扩展监督的研究。她的工作包括管理多个致力于自动评估、合成数据和后训练数据研究的生成式人工智能机器学习团队。
2025 年 7 月,Yue 宣布离开 Scale AI,加入 Meta 新成立的 超智能 实验室,担任主管。她在 Meta 的工作重点是人工智能安全和对齐,继续她在构建可信赖和可靠的人工智能系统方面的研究。[1] [2] [3] [4] [5] [6]
在 Scale AI 工作期间,Yue 的工作重点是建立强大的方法来评估和确保大型语言模型 (LLM) 的安全。她的主要兴趣包括强化学习、可解释性、价值学习、对抗性示例以及大规模机器学习系统中的公平性。[3]
作为 Scale AI 的 SEAL 负责人,Yue 领导了解决人工智能安全研究挑战的倡议。在她领导下的一个关键项目是创建 SEAL 排行榜,这是一个 LLM 排名系统。该排行榜旨在利用私有的、经过专家审查的数据集,这些数据集不容易被在公共基准上训练的模型开发者“玩弄”。它评估了模型在指令遵循以及对特定提示产生有害响应的倾向等标准。该实验室还对 人工智能代理 的漏洞进行了研究,发现 LLM 中的安全机制无法有效地推广到下游浏览器代理。[5] [1]
Yue 推动了 Scale AI 与人工智能安全中心 (CAIS) 之间的合作,以开发大规模杀伤性武器代理 (WMDP) 安全基准。创建此基准是为了评估前沿人工智能模型被滥用于恶意目的的风险,从而提供一种标准化方法来评估和减轻与高级人工智能能力相关的潜在危险。[5] [4]
Yue 共同撰写了大量关于人工智能安全、评估和代码生成的论文。她的出版物曾在 ICLR 和 NeurIPS 等会议上发表。值得注意的著作包括:
此列表代表了她发表的研究成果的精选。[4]
Yue 计划在 SXSW 2025 大会上发表演讲,她的演讲题目是“超越炒作:构建可靠和值得信赖的人工智能”。[5]