毕书超 是一位以其在多模态系统、强化学习和大规模模型训练方面的工作而闻名的人工智能研究员。他目前是 Meta 超智能实验室 (MSL) 的一位人工智能研究员,在那里他为基础人工智能系统的开发做出贡献。[1]
毕书超毕业于浙江大学数学系,获得学士学位。然后,他获得了加州大学伯克利分校的统计学硕士学位和数学博士学位。[2]
毕书超的职业生涯始于 2007 年至 2012 年在加州大学伯克利分校担任研究生助教,在那里他教授本科数学课程。在此期间,他还于 2011 年在 Bloomberg LP 和 2012 年在 Credit Suisse 担任实习职位,从事涉及衍生品定价模型和统计套利的量化金融问题。
从 2013 年到 2019 年,毕书超在 Google 担任技术主管经理,在那里他开发了深度学习模型来优化 Google Ads 的效果。然后,他于 2019 年加入 YouTube,担任工程总监和 YouTube Shorts Discovery 的负责人,直到 2024 年。在该职位上,他共同领导了 YouTube 短视频产品的开发,并负责内容发现系统的工程设计,包括排名、推荐和视频理解。
2024 年 5 月,毕书超加入 OpenAI,担任多模态模型后期训练负责人。他领导一个研究组织,专注于诸如从人类反馈中进行强化学习 (RLHF)、跨图像、视频和音频的多模态推理、模型评估和奖励建模、用于具身人工智能的视觉-语言-动作模型以及跨模态智能等领域。[3]
超智能实验室 (MSL) 是 Meta 内部的一个部门,于 2024 年 6 月启动,旨在统一和加速公司的人工智能计划,特别是在追求通用人工智能 (AGI) 方面。MSL 由 Alexandr Wang 和 Nat Friedman 领导,汇集了来自 FAIR 的基础模型、应用人工智能产品和核心研究团队。该部门是在一项重大的人才收购活动中成立的,从 OpenAI、Anthropic 和 DeepMind 聘请了研究人员,并遵循 Meta 对 Scale AI 的 143 亿美元投资。MSL 负责 Meta 的 Llama 模型系列和下一代人工智能系统的开发,重点是长期进步以及在 Meta 的消费者平台上的集成。[4] [5]
在哥伦比亚大学关于人工智能进展的演讲中,毕书超讨论了机器学习的演变,详细介绍了其起源于 1948 年左右以及随后的重大发展。他强调了自监督学习和强化学习的出现,强调了诸如超越人类工程算法的深度学习模型、Adam 等优化方法的引入以及包括残差网络和 Transformer 在内的神经网络架构的创新等突破。讨论涉及生成式人工智能和缩放定律的现状,指出计算能力和大型数据集推动了性能的提高。
尽管他承认人工智能在推理能力和人类智能的复杂性方面存在局限性,但毕书超对人工智能的未来发展表示乐观,包括探索新功能以及将人类学习过程整合到开发更高效的算法中。确定了开放性问题,重点是提高数据效率以及扩展和生成高质量数据的挑战,最终设想了一个人工智能可以显着增强科学发现和个人学习的未来。[6]