Sean Ren
任翔 (Sean Xiang Ren) 是去中心化人工智能区块链平台 Sahara AI 的联合创始人兼首席执行官。 他同时担任南加州大学 (USC) 计算机科学副教授以及 Andrew 和 Erna Viterbi 早期职业主席,并在该校领导智能与知识发现 (INK) 研究实验室。 [1]
教育
Sean Ren 毕业于浙江大学计算机科学专业,获得工程学士学位。之后,他在伊利诺伊大学厄巴纳-香槟分校(UIUC)攻读博士学位,并获得了计算机科学博士学位。在攻读博士学位期间,他还曾在斯坦福大学的自然语言处理(NLP)小组和SNAP小组工作过。 [2] [16]
职业生涯
任于2017年12月加入南加州大学(USC)计算机科学系,开始了其学术生涯。2022年9月,他被任命为南加州大学副教授以及Andrew and Erna Viterbi早期职业主席。他还担任南加州大学信息科学研究所(ISI)的研究团队负责人,并领导着智能与知识发现(INK)研究实验室,该实验室专注于推进自然语言处理和机器学习。
除了学术职务外,任还在工业界担任过职务,包括担任Snap Inc.的数据科学顾问,以及2022年4月至2024年3月在艾伦人工智能研究所(AI2)担任访问研究科学家。2023年5月,他与他人共同创立了Sahara AI,这是一个去中心化的AI区块链平台,他担任首席执行官。该公司旨在促进新型AI的开发,以实现公平、透明和普遍获取全球知识资本,专注于AI知识产权溯源和用户拥有的便携式代理等领域。Sahara AI已参与链上共同所有权和数据贡献者收入分享的合作,其代币$SAHARA已在交易所上市。
任还积极参与更广泛的学术界,自2018年9月起担任ACM SIGKDD和年度KDD会议的信息主管。他曾在多个重要会议上组织了多次研讨会,包括常识表示与推理研讨会(CSRR)、自然语言处理联邦学习(FL4NLP)和低资源自然语言处理深度学习(DeepLo)。 [1] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [2]
研究
任的研究主要集中于构建能够处理各种语言任务和情境的通用自然语言处理(NLP)系统,重点是扩大模型通用性的范围。他的工作包括开发新的算法和数据集,以降低构建和维护NLP模型的成本,使AI模型具备常识,并增强模型的透明度和可靠性,以建立用户信任。
INK研究实验室由任领导,专注于以下几个关键领域:
- 创建评估方法和数据集,以评估各种人类推理场景中最新的NLP系统。
- 构建新颖的学习算法和模型架构,以利用常识和事实知识来增强NLP系统。
- 开发用于关系推理的图神经网络方法。
- 验证和增强NLP模型的鲁棒性。
他的研究还探讨了从自然语言数据中提取机器可操作的知识,为智能应用执行神经符号知识推理,以及从人类解释和指令中学习。他的关于标签高效NLP的博士工作总结在《挖掘文本中的事实知识结构:一种轻量级方法》一书中。
任的研究已获得多个组织机构的资助,包括美国国家科学基金会(NSF CAREER奖)、DARPA(MCS、KMASS、INCAS、SCORE、GAILA、SAIL-ON)、IARPA(HIATUS、BETTER)以及谷歌、亚马逊、Meta、摩根大通、Adobe、索尼和Snapchat等行业合作伙伴。 [2] [7]
奖项与荣誉
Sean Ren 在其职业生涯中获得了众多奖项和荣誉:
- 2024: ACM WSDM 时间考验奖。
- 2023: 三星年度 AI 研究员。
- 2023: 麻省理工科技评论 35 岁以下创新者(亚太地区)。
- 2023: 大川研究资助金。
- 2023: ACL 杰出论文奖,论文题目为 "SCOTT: Self-Consistent Chain-of-Thought Distillation"。
- 2022: NAACL 杰出论文奖,论文题目为 "NewsEdits"。
- 2022: 谷歌研究学者。
- 2021: NSF CAREER 奖。
- 2021: 亚马逊安全可信 ML 资助金。
- 2021: TrustNLP @NAACL 最佳论文奖。
- 2020: 索尼教师创新奖。
- 2020: The Web Conference 最佳论文奖亚军,论文题目为 "NERO: A Neural Rule Grounding Framework for Label Efficient Relation Extraction"。
- 2019: 福布斯亚洲 30 位 30 岁以下精英(医疗保健与科学领域)。
- 2019: 摩根大通 AI 研究奖。
- 2019: 亚马逊教师研究奖。
- 2018: 谷歌教师研究奖。
- 2018: ACM SIGKDD 博士论文奖。
- 2017: David J. Kuck 杰出论文奖。
- 2016: 谷歌博士奖学金。 [2] [8] [9] [10] [11] [12] [13] [14]
教学
任教职于南加州大学期间,任教授了多门课程,主要集中在深度学习、自然语言处理和知识抽取领域。这些课程包括:
- 深度学习及其应用 (CSCI 566)
- 自然语言处理的表征学习
- 自然语言处理表征学习高级主题 (CSCI 699)
- 知识抽取与推理的机器学习 (CSCI 699)
- 信息抽取导论
任积极参与学术服务,担任 ACL、EMNLP、NeurIPS、ICML、AAAI 和 ICLR 等主要人工智能和自然语言处理会议的领域主席或高级项目委员会成员。他还为 K-12 推广活动做出了贡献,通过客座讲座和参与项目小组讨论,向高中生解释人工智能的应用,包括打击网络仇恨言论。 [2] [15]
面试
Sean Ren 谈 AI 和区块链 #01
在《技术乐观主义者》播客的一集中,Sahara AI 的联合创始人兼首席执行官 Sean Ren 概述了该项目的框架及其在人工智能和 区块链 技术交叉领域中的预期作用。根据 Ren 的说法,Sahara AI 旨在开发一种去中心化基础设施,使用户能够在旨在支持透明度和隐私的条件下管理、保留和交易与 AI 相关的数据。
Ren 将该平台的技术结构描述为由三个主要层组成。基础是一个定制的 Layer 1 区块链,用于记录与 AI 工作流程相关的数据集、模型和应用程序的所有权和出处。在此基础上构建的是一个去中心化执行层,该层使用低秩适配器 (LoRA) 等机制来促进 AI 模型的训练和部署,旨在维护数据隐私。第三层包括用于数据标记、代理配置和模型访问管理等任务的工具和市场。
在采访中,Ren 表示 Sahara AI 最近发布了其测试网,该测试网已与其应用程序市场集成。他还提到计划在今年年底前推出主网并引入其他工具。该公司披露了一轮总计 4300 万美元的融资,Binance Labs、Pantera Capital 和 Polychain Capital 等投资实体参与了融资。根据 Ren 的说法,这些资源将用于扩大员工队伍、生态系统开发和推广活动。
讨论的主题包括数据和模型可追溯性在 AI 系统中的相关性,以及使用 区块链 来注册和管理此类出处。Ren 强调,实施这些机制可以支持对去中心化环境中 AI 组件进行更结构化的监督。他还指出,去中心化 LoRA 是一种用户可以在本地微调模型,同时最大限度地减少敏感数据暴露的方法。
Ren 谈到了 区块链 和 AI 社区之间缺乏集成的问题,并指出 Sahara AI 正在努力促进这两个领域之间的知识交流和合作开发。他还介绍了他的学术和专业背景,包括自然语言处理方面的研究以及构建 AI 系统的先前经验。根据 Ren 的说法,这种专业知识的结合有助于该项目在技术实施和数据治理方面的结构性方法。 [18]
Sean Ren 谈去中心化人工智能基础设施 #02
2025年2月18日,Sahara AI 的首席执行官兼联合创始人肖恩·任(Sean Ren)出现在 Cryptonews Spotlight 播客上,讨论了去中心化人工智能系统的发展以及 区块链 技术在人工智能工作流程中的应用。对话涉及开源人工智能模型的出现及其对现有中心化基础设施的潜在影响。
任概述了像 DeepSeek 这样的公开可用模型如何为专有系统提供替代方案,允许独立开发人员在特定资源条件下修改和部署模型。他描述了 Sahara AI 在通过基于 区块链 的跟踪机制促进数据、计算和模型贡献的透明归属方面的作用。
采访还介绍了知识代理(KA)的概念,这是一种使用用户特定或组织特定数据来自动化任务的人工智能系统。根据任的说法,这些代理旨在通过整合个人数据在定义的上下文中运行,从而可能提高各个领域的运营效率。
此外,任还解释了 Sahara AI 市场的结构,该市场支持数据集、模型和计算服务的分配和货币化。该平台应用可编程合约来根据使用情况和性能分配补偿,旨在协调贡献者之间的激励。
讨论包括提及涉及主要技术公司的机构合作,并强调旨在提高开发人员和最终用户参与度的举措。这些努力包括发布新工具和生态系统范围内的参与计划。
任将 Sahara AI 的方法描述为一种应用去中心化基础设施来解决人工智能开发中数据所有权、知识产权管理和贡献者补偿方面挑战的方法。 [17]