Kai Zou
邹凯是 Netmind.AI 的首席执行官和创始人,Netmind.AI 是一个用于共享计算资源的分布式平台,允许用户在大型网络上协作、训练深度学习模型和开发 AI 应用程序。[1]
教育
邹凯获得清华大学数学与物理学士学位,并于 2010 年担任研究助理。后来,他获得了乔治城大学数学与统计学硕士学位,并于 2013 年担任助教。[1][2]
职业生涯
从乔治城大学毕业后,邹凯在大学研究办公室高级副总裁处担任量化研究专家,直到 2014 年 3 月。之后,他成为决策信息资源公司 (DIR) 的高级项目分析师和顾问,DIR 是一家研究和数据收集公司,他在那里工作到 2021 年 11 月。在此期间,他创立了 ProtagoLabs,该公司专注于研究自然语言处理 (NLP)、逻辑推理和 AGI。2021 年 9 月,邹凯创立了 Netmind.AI,并在 2023 年创立了 AGI Odyssey,这是一个致力于推进人工智能 (AI)、机器学习和大型语言模型 (LLM) 的动态非营利组织。[1][2][3][4]
访谈
背景和 Netmind
2024 年 5 月 6 日,CryptoKoryo 采访了邹凯关于 Netmind.AI 及其在 加密货币 和 区块链 领域的计划。在采访开始时,他分享了他在人工智能和机器学习方面的背景:[5]
“我的意思是,我和我的大部分团队实际上来自 AI Web Two,而不是 Web 3。我在中国清华大学学习数学和物理,之后我去了乔治城大学攻读数学和统计学硕士学位。自 2013 年从乔治城大学毕业后,我一直担任数据科学家和机器学习研究员。我开始构建更多的统计和回归模型,当时使用随机森林和神经网络来解决分类和预测问题。那实际上是我最早的研究工作,那时我使用的神经网络只有三层,而不是深度神经网络。”
“但是,是的,从 2016 年开始,我开始更多地了解深度学习和深度神经网络。我被 CNN 在图像检测方面的结果所吸引;准确率超过 99%,这令人印象深刻。我意识到 NLP 问题还有很大的改进潜力。因此,我在 2016 年创立了我的 AI 公司 Proto Labs。当时它更像是一个 AI 研究工作室,灵感来自 DeepMind 和 OpenAI。我对 AGI 充满热情,所以我成立了一个 AI 研究小组。我们实际上每年都在顶级会议上发表很多论文,并且通过我们的内部研究工作,我们开始提供 AI 咨询服务,为美国公司提供定制的 AI 模型。”
“从 2021 年开始,我们决定成为一家更以产品为导向的公司。N Power 平台的想法很简单,因为我们当时正在训练我们的语言模型。那时,我意识到,哦,GPU 太贵了。为什么不使用我们自己的显卡,比如我可以用我的游戏设置在我的桌面上运行一个 AI 模型?然后我们想到了这个想法:为什么不将更多低级或低 GPU RAM 显卡组合在一起,以训练一个大型 AI 模型?因此,我们开始了对异步训练结构的研究,试图将网络中的小型显卡组合在一起。然后我们开始设计这个 N Power 产品,以鼓励更多人贡献他们的闲置机器,这样我们就可以拥有一个潜在的大型分布式计算机网络。所以,是的,我在 2021 年搬到了伦敦,并成立了 Netmind。”
当被问及他对 区块链 和 AI 的交叉点的看法时,邹凯回答说:[5]
“这是一个好问题。所以,一件事是去中心化的计算能力,我猜另一件事是 AI 的完全去中心化。对于大型公司来说,语言模型就像每个人的黑匣子。对于研究人员、每个人或依赖其 API 的初创公司来说,他们无法控制。一次更新后,性能可能会很差,我们不知道发生了什么。因此,需要一个更透明和去中心化的模型,每个人都可以访问,每个人都知道它是如何工作的,甚至每个人都可以投票决定下一个版本会是什么样子。我认为这可能是 Web 3 和 AI 的未来。此外,在未来,一旦我们拥有 AI 代理社会并且 AGI 出现,我觉得代理、人类和 AI 之间需要一种加密货币来进行交易,以促进经济发展。”
他还解释了 Netmind Token (NMT) 代币经济学的改造:[5]
“人们可以看到我不是来自 Web 3。最初,我将代币 NMT 设计为 100 年,这就是为什么我真正相信我们的项目将持续 100 多年。通过这种设计,我旨在从长远来看实现一切去中心化,使整个平台开源并可供所有人访问,并建立一个完整的生态系统社区,以便开发人员可以一起构建该平台。但是,在我们两三个月前推出后,我们突然成为一家 Web 3 公司,并开始学习所有 Web 3 术语和 共识机制。那实际上是我第一次听说 FV,我意识到它可能没有持续 100 年的意义。当然,我想让矿工更具可持续性,但对于社区基金、团队或质押来说,可能不需要 100 年。因此,我将新的经济模型从 100 年调整为 10 年。10 年后,矿工仍然可以从所有付款或社区基金中 挖掘 代币,因此它仍然是可持续的,而其他比例不需要 100 年。”
在采访结束时,邹凯分享了他对 Web3 AI 和学术界的看法:[5]
“我认为对于模型训练部分或大型语言模型部分,我看到更多的团队或教授希望构建去中心化的大型语言模型。我实际上看到有团队站出来说,哦,我们想构建这个由每个人拥有并可供所有人访问的语言模型,每个人都可以向其中贡献数据。我们实际上也在做同样的事情。异步训练结构是我们用来构建大型语言模型的基本算法。我对这个的想法是创建一个具有自学习功能的自动增长模型。因此,一旦有 50 个 GPU,该模型将在 50 个 GPU 上运行。当我们获得更多 GPU 时,它会将一些任务分配给新的 GPU 并训练模型。之后,它可以合并在一起,并且该模型将随着计算网络的增长而增长。这是我们的研究项目之一,我们认为它非常适合 N Power 结构。从长远来看,我们希望它可以成长为一个真正的大型语言模型,与 GPT-4 一样好,并且可以供所有人访问。”