NOVA 是一个用于早期药物研发的去中心化人工智能网络,作为 Bittensor 生态系统中的第 68 号子网运行,由 Metanova Labs 开发。该项目协调分布式参与者,利用确定性机器学习预言机,针对生物靶点生成并评估可合成的化学化合物,并将结果记录在链上,以确保透明度和可重复性。[1] [2]
NOVA 是一个为药物研发而构建的去中心化 AI 网络,作为 Bittensor 生态系统中的第 68 号子网运行,由 Metanova Labs 开发。它作为一个分布式平台,用于筛选和优化潜在的药物化合物,将早期制药研究重新定义为一个大规模的计算问题。该系统协调全球参与者贡献模型和算力,以探索广阔的化学空间,寻找可能与特定生物靶点有效相互作用的分子。这一过程被结构化为一个竞争性的迭代工作流:部分参与者生成候选分子,而其他参与者评估其特性,从而实现对大型化合物库的并行探索。
NOVA 的核心构建是一个去中心化的筛选和优化引擎。它使用机器学习模型来预测分子将如何与靶点蛋白结合,并避免与非靶点产生不良相互作用。这些预测通过重复的评估周期不断完善,使网络能够识别出具有更强结合亲和力和更低副作用风险的候选药物。该平台整合了早期药物研发的多个阶段,包括虚拟筛选、模型微调和验证工作流。通过将这些任务分布在网络中并将激励措施与性能挂钩,NOVA 旨在加速可行候选药物的识别,同时降低传统制药研究通常所需的时间和成本。[1] [2]
NOVA 允许开放参与药物研发,任何人都可以作为矿工或验证者做出贡献,不存在机构壁垒。这创建了一个全球分布式的早期制药研究网络,计算、模型开发和评估均通过众包完成。所有结果,包括分子评分和顶级候选药物,都透明地记录在链上,产生了一个开放且不断扩大的已评估化合物数据集。[2]
NOVA 中的药物研发被结构化为一个竞争性的优化过程,参与者竞相识别具有最高预测生物活性的分子。系统以快速迭代周期运行,频繁的反馈允许矿工不断完善并重新提交改进后的候选分子。这使分子筛选转变为一个实时的竞争环境,对化学空间的探索会直接获得奖励,并激励多样化的策略。[2]
评估通过名为 PSICHIC 的确定性机器学习模型进行标准化,该模型用于预测蛋白质-配体结合亲和力。所有验证者都使用相同的模型对分子进行评分,确保结果在整个网络中是一致的、可重复的且具有客观可比性。这消除了主观的人为判断,并建立了一个所有参与者必须最大化的单一共享优化函数。[2]
该系统在极大规模的分子数据集上运行,包括 SAVI-2020,其中包含约 17.5 亿种可合成化合物。与纯生成式化学系统不同,这些分子被限制在可以使用已知化学合成路径生产的结构内。这确保了高分候选药物不仅是计算预测,而且在物理上是可实现的,使输出结果与现实世界的药物开发直接相关。[2]
NOVA 是作为去中心化科学框架的一部分构建的,该框架整合了开放数据集、开源模型和 区块链 协调。从数据和模型评估到结果的完整流程都是透明且可重复使用的,允许外部研究人员检查并在该系统基础上进行构建。这使药物研发从封闭的制药流程转向开放、协作的基础设施。[2]
NOVA 的架构被设计为一个竞争性的、预言机驱动的优化网络,参与者在其中探索化学空间,以识别具有高预测生物活性的分子。从高层来看,该系统结合了蛋白质-配体结合预测模型、针对可合成化合物库的大规模化学搜索,以及一个在所有参与者中标准化评估的确定性评分预言机 (PSICHIC)。其目标是将药物研发转化为跨越海量分子搜索空间的实时、高通量优化过程。该架构由三个核心组件组成:
在 Compound 模式下,矿工针对指定靶点在每个 epoch 提交一组分子。验证者使用名为 Boltz-2 的复合程序对每个分子重新评分,该程序将预测的靶点亲和力与基于熵或新颖性的奖励相结合,以鼓励化学多样性。重复检测会使同一靶点周内先前提交过的分子后续出现时失效,且提交内部的重复或未达到属性要求(如最小重原子数或可旋转键阈值)的分子可能会导致提交被取消资格。排名通常是每个挑战赛的胜者全得制,平局则由最早的有效提交打破。这种模式在可重复的约束下实现了广泛搜索,同时遏制了平庸的重复,并促进了对化学空间采样不足区域的时间敏感性探索。确切的数值权重、熵公式和属性阈值因挑战而异,且未在公开摘要中全面列出,反映了可能随时间变化的协议级参数化。[1]
Blueprint 模式评估的是通用的搜索策略,而非一次性的分子列表。矿工提交在标准化沙箱内运行的代码,运行时间预算固定——据报告在 NVIDIA RTX 4090 GPU 上约为 30 分钟。代码必须输出 100 个分子,然后使用确定性 PSICHIC 预言机针对一组随机的靶点和非靶点蛋白进行重新评分。排名基于对靶点和非靶点组的预测亲和力之间的平均差异,提交内部重复或属性要求失败将取消结果资格。化学空间、反应模板以及靶点/非靶点集在提交窗口期间是随机且不公开的,这强化了对算法鲁棒性和通用性的要求,而非针对特定已知靶点的过拟合。此模式还应用了多样性阈值和新颖性强制执行,以减少退化解并鼓励更广泛的探索。[1]
评估通过确定性预言机进行标准化,以便所有验证者对相同的输入产生相同的评分。PSICHIC 作为主要的蛋白质-配体亲和力模型,接收蛋白质序列或结构信息以及 SMILES 等分子表示,以输出数值评分。在 Compound 模式下,名为 Boltz-2 的额外复合重评分过程结合了新颖性/熵,以奖励化学多样性并遏制狭隘的开发;在 Blueprint 模式下,排名使用一组 100 个分子在靶点和非靶点预测之间的平均差异。网络执行多种公平和反滥用机制,包括:
评分和排名按区块节奏进行,描述为每个评估周期约 12 秒,产生快速更新的排行榜和按区块的奖励分配。轮次通常跨越数百个区块,允许矿工迭代完善并重新提交改进后的候选分子。某些描述指出在特定模式下每个矿工有单一活跃分子的约束,而 Compound 模式允许每个 epoch 进行批量提交;这种差异被指出是协议演变或文档不一致,应在最新的技术规范中予以澄清。[2] [1]