OpenVision 是一个去中心化的研究集体,致力于通过使用真实世界的视频数据和社区提供的计算资源来推进机器感知。它作为一个自筹资金的团队运作,专注于人工智能、边缘基础设施和视觉智能。[1]
OpenVision 是一个去中心化的基础设施协议,旨在通过无需许可的网络开发、训练和部署视觉语言模型 (VLM)。它结合了分布式计算、真实世界的数据流和一个定制的 Layer 1 区块链,以支持机器人技术、自主系统、物联网和边缘设备等领域的视觉 AI 应用。
其核心模型 Parallax 在全球贡献者的视频数据上进行训练,并通过去中心化计算节点进行更新。网络参与者贡献 GPU 资源、数据和验证,并获得 $VISION 代币作为回报。OpenVision 集成了 Ethereum 用于治理和透明度,一个私有的 VisionX L1 链用于以视觉为中心的智能合约,以及一个模块化计算协议 (MCP) 用于分配训练工作负载。[2]
Parallax 是一个模块化的视觉语言模型 (VLM),通过众包训练和去中心化微调开发,结合了来自 Vision Transformers (ViT)、CLIP 和 SAM 类似注意力机制的元素,以实现实时空间推理和上下文理解。它集成了图像、文本和地理空间元数据等多模态输入,以支持各种应用,包括自动驾驶车辆中的车道检测和物体识别、机器人技术中的深度估计和环境映射、监控中的异常检测和人群分析,以及 AR/VR 和物联网系统中的实时图像解析。[3]
VisionNode 是一个基于桌面和浏览器的应用程序,使配备摄像头的用户设备能够充当网络中的训练或推理节点。它上传来自行车记录仪或闭路电视等来源的视频流,对 GPU、RAM 和正常运行时间等系统资源进行基准测试,并相应地分配任务。根据设备的规格,VisionNode 支持模型推理和微调工作负载。[4]
VisionSync 是一个分布式训练协议,将大型模型训练过程划分为更小的微任务。它根据硬件容量、贡献者声誉和所涉及的数据类型等因素分配这些任务。该系统包括具有冗余的内置验证机制,并支持 零知识机器学习 (zkML) 以进行额外验证。[5]
VisionX 是一个模块化的 Layer 1 区块链,专为视觉相关 AI 工作负载的高吞吐量协调而设计。它具有针对视觉应用量身定制的任务拍卖和执行引擎,以及管理奖励、模型检查点和 验证者 治理的 智能合约。该链支持亚秒级最终性,并针对处理频繁的 AI 任务进行了优化,包括任务定价和 零知识 机器学习证明,与通用 L1 链相比,提供了更高的效率。[6]
模块化计算协议 (MCP) 通过基于系统能力在 VisionNode 上分配微任务来实现去中心化 AI 训练。它利用一个声誉系统,该系统根据任务完成情况、正常运行时间和延迟对贡献者进行评分,而任务结果通过仲裁共识或回退 零知识机器学习 (zkML) 证明进行验证。MCP 包括一个调度机制来平衡工作负载并防止节点过载,并对不正确或恶意行为强制执行惩罚,例如代币削减和声誉降低。[7]
$VISION 代币作为 OpenVision 生态系统中的核心 实用 资产发挥作用,支持协议运营、治理和贡献者激励。VISION 的总供应量为 10 亿个代币。它用于计算支付、访问高级培训模块、治理参与以及优先访问任务。API 和培训工作收入的一部分会自动用于购买和销毁 $VISION,从而引入与协议使用直接相关的通货紧缩机制。选择以 USDC 支付的企业将面临额外费用,除非持有最低 $VISION 余额,从而加强代币需求。代币销毁 率和进一步的减少可以通过基于网络性能和代币供应条件的 DAO 提案进行管理。[8]
质押 机制通过激励长期代币锁定,进一步将 $VISION 嵌入到协议运营中,从而获得更高的奖励、治理影响力和对计算任务的高级访问权限。贡献者可以将代币质押 1 到 36 个月,奖励等级由质押金额、锁定时间和历史表现决定。验证者 节点 因低质量输出或不当行为而面临削减惩罚,从而在将可靠性与质押资本联系起来的同时,保持系统完整性。这些系统共同将 $VISION 与 OpenVision 基础设施的增长、可靠性和去中心化联系起来。[9]
OpenVision 的治理通过 去中心化自治组织 (DAO) 运作,该组织管理协议开发和生态系统监督。代币持有者可以使用链上工具,通过加权投票来提议和投票决定升级、奖励结构和国库分配等变更。社区成员可以使用标准化提案模板提交建议,投票权可以委托给专家进行精选的决策。DAO 还管理用于研究资助、社区项目和储备金的国库资金,并通过多重签名和链上机制强制执行控制。治理旨在根据预定义的里程碑,从核心团队逐步过渡到社区。[10]