Summer Yue 是一位人工智能研究员,专门研究人工智能安全、对齐和大规模机器学习系统。她是 Meta 超智能实验室 的主管,此前曾担任 Scale AI 的研究副总裁以及安全和标准主管。[1] [2]
Yue 曾就读于宾夕法尼亚大学,参加了杰罗姆·费舍尔管理与技术项目。她获得了理学学士学位,在工程与应用科学学院获得了计算机科学和沃顿商学院的经济学双学位。[3] [2] [6]
Yue 的职业生涯始于多次实习,包括在 Oliden Technology, LLC 担任 Web 程序员、在中国石油担任软件工程实习生、为 Microsoft Office 担任后端工程师,以及在 Square 担任合规工程软件工程实习生。之后,她加入了 Google,最初在 YouTube 的信任与安全部门担任软件工程师,专注于错误信息、垃圾邮件和仇恨言论等问题。后来,她转到 Google 的人工智能研究部门,在 Google Brain 担任高级研究工程师,随后在 Google DeepMind 合并后担任 Google DeepMind 的高级研究工程师。在 2018 年至 2023 年期间,她在 Google 工作,为 Gemini、LaMDA 和 AlphaChip 等项目的大规模深度学习模型和基础设施研究做出了贡献。
2023 年 11 月,Yue 加入 Scale AI,担任研究副总裁以及安全和标准主管。在此职位上,她还担任创始人兼首席执行官 Alexandr Wang 的人工智能幕僚长。她受聘成立并领导公司的安全、评估和分析实验室 (SEAL),该实验室专注于人工智能模型评估、红队演练和可扩展监督的研究。她的工作包括管理多个致力于自动评估、合成数据和后训练数据研究的生成式人工智能机器学习团队。
2025 年 7 月,Yue 宣布离开 Scale AI,加入 Meta 新成立的 超智能 实验室,担任主管。她在 Meta 的工作重点是人工智能安全和对齐,继续她在构建可信赖和可靠的人工智能系统方面的研究。[1] [2] [3] [4] [5] [6]
Yue 在 Scale AI 工作期间,主要致力于建立评估和确保大型语言模型 (LLM) 安全性的可靠方法。她的主要兴趣包括强化学习、可解释性、价值学习、对抗性示例以及大规模机器学习系统中的公平性。[3]
作为 Scale AI 的 SEAL 负责人,Yue 领导了解决人工智能安全研究挑战的倡议。在她领导下的一个关键项目是创建 SEAL Leaderboard,这是一个 LLM 排名系统。该排行榜旨在利用私有的、经过专家审查的数据集,这些数据集不容易被在公共基准上训练的模型开发者“玩弄”。它评估了模型在指令遵循以及对特定提示产生有害响应的倾向等标准。该实验室还对 人工智能代理 的漏洞进行了研究,发现 LLM 中的安全机制无法有效地推广到下游浏览器代理。[5] [1]
Yue 推动了 Scale AI 与人工智能安全中心 (CAIS) 之间的合作,以开发大规模杀伤性武器代理 (WMDP) 安全基准。创建此基准是为了评估前沿人工智能模型被滥用于恶意目的的风险,从而提供一种标准化方法来评估和减轻与高级人工智能能力相关的潜在危险。[5] [4]
Yue 共同撰写了大量关于人工智能安全、评估和代码生成的论文。她的出版物曾在 ICLR 和 NeurIPS 等会议上发表。值得注意的著作包括:
此列表代表了她已发表研究的精选。[4]
Yue 是 SXSW 2025 大会的预定演讲者,她将在会上发表题为“超越炒作:构建可靠和值得信赖的人工智能”的演讲。[5]