Matt Deitke

Wiki Powered byIconIQ
Matt Deitke

我们刚刚发布了 IQ AI.

查看详情

Matt Deitke

Matt Deitke 是一位美国人工智能 (AI) 研究员,就职于 (MSL)。他以在多模态人工智能、具身人工智能和大规模 3D 数据集方面的工作而闻名,曾领导过 Molmo、Objaverse 和 ProcTHOR 等著名项目的开发。[1] [2]

教育背景

Deitke 曾就读于华盛顿大学,并在 Paul G. Allen 计算机科学与工程学院完成了本科学习。随后,他进入该大学的博士项目,继续与 Allen 人工智能研究所 (AI2) 合作进行研究。2024 年 12 月,Deitke 宣布他将在完成博士项目之前离开,共同创办一家新公司。[1] [2] [4]

职业生涯

Deitke 在 18 岁时开始了他在西雅图 Allen 人工智能研究所 (AI2) 的研究生涯,当时他是一名研究科学家,同时也在攻读大学教育。他在 AI2 的工作重点是创建强大的多模态人工智能系统。在他的任期内,他领导了几个重要的研究项目,这些项目产生了广泛使用的开放数据集和模型。

2024 年 11 月,Deitke 共同创立了 Vercept,这是一家致力于构建自主 的初创公司,旨在运行基于互联网的软件。该公司成功从包括前谷歌首席执行官埃里克·施密特在内的投资者那里筹集了 1650 万美元的资金。

2025 年 7 月,Deitke 宣布他已加入 (MSL),该部门专注于提升人工智能能力。他的招聘是 Meta 为组建一支领先的人工智能研究团队而进行的一项更广泛、备受瞩目的人才收购工作的一部分。

Meta 招聘和薪酬

Deitke 于 2025 年加入 Meta 的转型引起了媒体的广泛关注,主要是因为据报道他的薪酬方案的价值。据报道,Meta 最初向 Deitke 提供了一份为期四年、价值约 1.25 亿美元的“低球”方案,但他拒绝了。在与 Meta 首席执行官马克·扎克伯格的私人会面后,据报道,该报价翻了一番,达到约 2.5 亿美元,第一年可能支付 1 亿美元。这被认为是近期企业历史上最大的雇佣方案之一,反映了对精英人工智能人才的激烈竞争。

该报价的规模引发了对顶级人工智能研究人员估值的评论。麻省理工学院经济学家 David Autor 评论说:“当计算机科学家的薪酬像职业运动员一样时,我们就达到了‘书呆子的复仇’的高潮!”在与投资者的财报电话会议上,扎克伯格解释了公司的战略:“我们正在建立一支精英、人才密集的团队……因此,努力竞争并尽一切努力获得那 50 或 70 位顶级研究人员来组建你的团队,这确实是有意义的。”他补充说:“对于最优秀和最有才华的人来说,绝对存在溢价。”[3] [6] [7]

Deitke 领导或一直是人工智能领域几个有影响力的项目的关键贡献者,尤其是在视觉语言模型、3D 数据和具身人工智能领域。

  • Molmo 和 PixMo:一个从头开始开发的开源视觉语言模型系列。该项目还发布了 PixMo,这是一个具有详细图像标题、问答对和 2D 指向数据的新型数据集。拥有 720 亿个参数的 Molmo 模型在学术基准测试中表现出与几个专有模型相当或超过的性能。
  • Objaverse:一个大规模的开放 3D 对象数据集。最初的版本包含超过 800,000 个带注释的 3D 模型。它旨在推进生成模型、2D 实例分割和开放词汇对象导航方面的研究。
  • Objaverse-XL:Objaverse 数据集的扩展版本,包含超过 1000 万个 3D 对象。该数据集用于训练 Zero123-XL,这是一个用于 3D 生成任务(如图像到 3D 和文本到 3D)的基础模型。
  • ProcTHOR:一个使用程序生成来创建大规模、多样化和交互式模拟 3D 环境的平台。通过扩大训练数据的多样性,ProcTHOR 被证明可以显着提高具身人工智能代理在各种任务中的泛化和性能。
  • Phone2Proc:一个系统,可以从用智能手机拍摄的真实空间短视频扫描中生成语义匹配的模拟训练环境。在这种自定义生成的场景中训练对象导航代理被证明可以将 sim-to-real 传输性能从 35% 提高到 71%。
  • RoboTHOR:一个开放的模拟到真实具身人工智能平台。该项目涉及创建真实公寓布局的计算建模数字孪生,使研究人员能够研究纯粹在模拟中训练的代理如何将其技能转移到物理机器人。
  • AI2-THOR:Deitke 是这个用于视觉人工智能研究的交互式 3D 模拟框架的贡献者。该平台提供近乎逼真的室内场景,代理可以在其中导航并与对象交互,从而实现视觉导航和任务完成等领域的研究。

这些项目已在主要人工智能会议上发表,并因其对开放科学和人工智能研究进步的贡献而得到广泛认可。

Deitke 因其研究贡献而获得了多个奖项。

  • CVPR 2025 最佳论文荣誉提名:因论文“Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models”而获奖。
  • NeurIPS 2022 杰出论文奖:因论文“ProcTHOR: Large-Scale Embodied AI Using Procedural Generation”而获奖。这是人工智能研究界的一项重大荣誉,仅授予提交给会议的 10,000 多篇论文中的一小部分。
  • CVPR 2023 杰出审稿人奖:因其对计算机视觉和模式识别会议的同行评审过程的贡献而获得认可。

除了这些奖项外,Deitke 还是 Richard Szeliski 的教科书 Computer Vision: Algorithms and Applications 第二版(2022 年出版)的贡献者。[1] [2] [4] [5]

参考文献

首页分类排名事件词汇表