曾毅钦是 MyShell 的联合创始人兼人工智能研究主管,MyShell 是一个去中心化平台,利用 区块链 技术来实现人工智能原生应用。他还是清华大学计算机科学博士候选人,他的研究重点是多模态机器学习和生成式人工智能。[1] [4] [6]
曾毅钦于 2018 年在北京航空航天大学获得自动化科学与电气工程学士学位。之后,他加入清华大学计算机科学与技术系,成为彭宇新教授指导下的博士生。在攻读博士学位期间,他曾是麻省理工学院 (MIT) 的访问学生,与 Antonio Torralba 教授和 Phillip Isola 教授合作研究计算机视觉和表征学习。他还曾在微软亚洲研究院视觉计算组实习,在郭百宁博士的指导下为大规模视觉语言模型做出贡献。[1] [4]
曾毅钦的职业生涯始于在地平线机器人实习期间专注于嵌入式系统和实时感知。这段早期的经验为他后来在去中心化系统和 区块链 技术方面的工作奠定了基础。
之后,他加入微软亚洲研究院视觉计算组担任研究实习生,在那里他从事视觉语言预训练技术的研究。他在此职位上的贡献推动了多模态人工智能系统的发展,该系统集成了文本、图像和其他数据类型。这项研究为他后来探索去中心化技术(包括区块链)奠定了基础,作为确保人工智能开发中透明度和社区驱动创新的手段。
2023 年,秦共同创立了 MyShell,这是一个去中心化平台,结合了人工智能和 区块链 技术,使创作者能够构建人工智能原生应用程序。在 MyShell,他负责监督开源基础模型和工具的开发,旨在增强用户能力,同时促进去中心化治理。他在 MyShell 的工作反映了他致力于创建可访问和透明的人工智能生态系统的承诺。
秦的学术研究重点是将多模态数据统一到有凝聚力的人工智能框架中。他的出版物在 CVPR、NeurIPS 和 ICCV 等会议上发表,涉及跨模态检索、生成模型效率和人类对齐的人工智能训练等主题。他为 LLaVA(大型语言和视觉助手)和 MiniGPT-4 等开源项目做出了贡献,这些项目集成了视觉和语言模型,用于原型设计人工智能应用程序。
曾毅钦倡导开源人工智能和去中心化平台,强调透明度和社区参与在人工智能开发中的重要性。他表示支持优先考虑人工智能技术部署中的伦理考量和用户赋权的倡议。
根据 Google Scholar 的数据,秦的研究已被引用 1,000 多次。他担任多个 AI 会议和期刊的审稿人,为多模态系统研究的进步做出了贡献。他在 GitHub 上的开源项目已被全球开发人员使用。[1] [2] [3] [4] [5] [6]
在 2024 年 9 月在 YouTube 频道 Naveen K 上的一次采访中,曾毅钦详细阐述了他对开源人工智能、去中心化系统以及人工智能在社会中不断变化的角色。作为人工智能未来系列的一部分,秦将开源模型定义为协作进步的关键驱动力,使研究人员和开发人员能够在共享进步的基础上进行构建,而不是重新发明基础工作。他引用了 Stable Diffusion 用于图像生成和 MyShell 的 Open Voice 用于音频合成等项目,作为开源技术实现商业可行性的例子,同时强调了它们在普及高级工具访问方面的作用。
秦还谈到了通用人工智能 (AGI) 的概念,将其描述为自动化复杂、重复性任务并提高各行业生产力的长期愿望。然而,他承认目前的局限性,指出大多数人工智能系统仍然是专门化的,需要与特定领域的专业知识相结合才能最大限度地发挥其效用。在讨论人工智能开发挑战时,他强调了高质量数据高于计算规模或架构复杂性的首要地位,主张进行细致的数据管理以减轻偏差和低效率。
在为新兴研究人员提供建议时,秦鼓励他们专注于跨学科应用,例如人工智能在教育或环境科学中的应用,而不是直接与大型公司竞争基础模型开发。他认为,特定领域内的利基创新可以产生变革性影响,同时避免资源差异。
在整个对话中,秦重申了他对去中心化框架的支持,特别是 MyShell 集成 区块链 技术,以确保人工智能生态系统中的透明度和社区治理。他将此类平台定位为对集中控制的制衡,通过优先考虑开放协作和用户代理来促进道德创新。
这次采访强化了秦对开源原则的认同,不仅将其定义为技术战略,而且将其定义为普及人工智能社会效益的机制。他的讲话突出了务实的乐观主义,在学术严谨性与对可访问、公平的技术进步的承诺之间取得了平衡。[7]