Devendra Singh Chaplot 是一位印度裔人工智能研究科学家,以其在机器人技术、具身智能(Embodied AI)、深度强化学习和大型语言模型(LLMs)领域的工作而闻名。作为印度理工学院孟买分校和卡内基梅隆大学的校友,Chaplot 曾在 Meta AI、Mistral AI 以及 SpaceX/xAI 等主要科技公司和人工智能实验室担任关键职位。2026 年 3 月,他加入埃隆·马斯克(Elon Musk)开发通用人工智能的计划,引起了媒体的广泛关注。[1] [2]
Chaplot 在印度理工学院孟买分校(IIT Bombay)完成了本科阶段的学习,并于 2014 年 8 月获得计算机科学与工程学士学位(B.Tech),辅修应用统计学。[3] [4]
随后,他前往美国卡内基梅隆大学(CMU)计算机科学学院深造。他于 2016 年 8 月开始攻读博士学位,并获得了机器学习硕士(M.S.)和博士学位。他的博士论文于 2021 年 3 月完成答辩,题目为《构建智能自主导航代理》(Building Intelligent Autonomous Navigation Agents)。他的博士导师是 Ruslan Salakhutdinov 教授和 Abhinav Gupta 教授。[3]
Chaplot 的职业生涯涵盖了多家主要科技和人工智能公司的实习及全职研究职位。在本科和研究生期间,他曾担任多个角色,包括 2014 年 9 月至 2015 年 8 月在韩国水原三星电子物联网智能实验室担任研究员。在攻读博士学位期间,他于 2017 年 6 月至 12 月在苹果人工智能研究院(Apple AI Research)担任研究员,并于 2018 年 5 月至 2020 年 12 月在 Facebook 人工智能研究院(FAIR)担任研究实习生。[1] [3]
Chaplot 以研究科学家的身份加入了 Facebook 人工智能研究院(FAIR,后更名为 Meta AI)。他于 2020 年 12 月至 2023 年 8 月在加利福尼亚州门洛帕克任职。在 FAIR 期间,他的研究重点是计算机视觉与机器人技术的交叉领域,延续了他在研究生实习和博士研究期间开始的工作。[1] [3]
2023 年 4 月,Chaplot 成为 Mistral AI 的创始团队成员。这家总部位于巴黎的初创公司在大型语言模型领域迅速崛起。在截至 2024 年 7 月的任职期间,他为公司的基础模型做出了重大贡献。他参与了 Mistral 7B、Mixtral 8x7B 和 Mistral Large 等模型的训练。Chaplot 还领导了多模态研究团队,开发了 Pixtral 12B 和 Pixtral Large 模型。此外,他还负责建立并领导了 Mistral AI 位于加利福尼亚州帕洛阿尔托的美国办公室。[1] [3]
根据其职业档案,Chaplot 在 2025 年 2 月至 2026 年 3 月期间是 Thinking Machines Lab 的创始团队成员。在担任研究和产品职位期间,他参与开发了“Tinker”,这是一个旨在让用户训练自己的大型语言模型的 API。[3]
2026 年 3 月,Chaplot 通过 X(原 Twitter)发布消息宣布加入 SpaceX 和 xAI。此举吸引了印度和国际科技媒体的大量报道。他表示自己的目标是“与 Elon Musk 及其团队合作构建超级智能,以造福人类”。[1] [2]
Chaplot 的研究主要集中在创建能够感知、导航并与复杂的 3D 环境(包括模拟和物理环境)互动的智能代理。他的工作通常将深度强化学习与计算机视觉及经典机器人技术相结合。[1] [3]
Chaplot 著名的项目之一是主动神经 SLAM。该工作将深度强化学习与经典的即时定位与地图构建(SLAM)方法相结合,以创建自主探索代理。该系统能够学习在陌生环境中高效导航。该项目被评为 CVPR 2019 AI Habitat 导航挑战赛的冠军。[3]
Chaplot 还研究了物体目标导航("ObjectNav"),这是具身智能中的一项基础任务,要求代理在以前未见过的环境中定位特定物体(例如“找到一把椅子”)。他的框架使代理能够以极高的成功率完成此任务,该研究获得了 TechCrunch 和 Gizmodo 等科技媒体的关注。他在该领域的工作赢得了 CVPR 2020 Habitat ObjectNav 挑战赛。[3]
2017 年,Chaplot 开发了 "Arnold",这是一个旨在玩经典第一人称射击游戏《毁灭战士》(Doom)的自主 AI 代理。该代理展示了先进的能力,能够仅通过视觉输入学习导航复杂的动态 3D 关卡并与敌人作战。"Arnold" 代理在 2017 年 Visual Doom AI 竞赛的 Full Deathmatch 赛道中获得第一名,并获得了 AAAI-17 会议的最佳演示奖。[3]
在 Facebook 人工智能研究院期间,Chaplot 参与了 PyRobot 项目,这是一个旨在使人工智能和机器人研究民主化的开源机器人框架。PyRobot 在机器人的底层控制器之上提供了一个轻量级的高级接口,使研究人员能够更轻松地在不同硬件平台上运行实验和基准测试性能。该项目于 2019 年 10 月获得了 Facebook 研究奖。[3]
在学术和职业生涯中,Devendra Chaplot 因其研究贡献获得了多项奖项和奖学金。