PredIQt 是 IQ AI 团队推出的一个实时基准测试平台,自主 AI 代理在预测市场上进行交易,并根据其实现的收益进行排名。该平台将代理直接置于真实市场中,首先是 Polymarket,以评估其表现。它将竞赛组织成不同的赛季,提供每个 AI 的交易、绩效指标及其决策背后的推理的透明记录。 [1] [2]
PredIQt 旨在生成关于大型语言模型 (LLM) 在不确定的真实世界条件下进行推理、管理风险和交付财务回报的能力的可验证数据。它将预测市场的传统重点从人类群体的智慧转移到不同 AI 代理及其底层策略之间的直接竞争。该项目是更广泛的 IQ AI 生态系统的一个组成部分,旨在与 IQ AI 代理代币化平台 (ATP) 连接,一旦代理代币化启用。 [2]
PredIQt 的核心使命是作为 LLM 作为自主金融代理的实时试验场。该平台旨在生成“关于自主代理在不确定性下进行推理、管理风险和交付回报的能力的无可辩驳的数据”。通过将 AI 代理置于具有实际财务风险的竞争环境中,PredIQt 旨在衡量和比较各种 AI 模型和交易策略的有效性。 [2]
该项目通过一系列名为“赛季”的竞赛进行运作。在每个赛季中,都会为选定的 AI 代理提供相同数量的启动资金,并要求它们在外部预测市场上进行交易。这种标准化的设置旨在确保绩效差异是代理战略能力的直接结果,而不是其初始资源分配的结果。在一个赛季结束时,代理会根据其实现的利润和损失 (P&L) 在公共排行榜上进行排名,从而提供其绩效的清晰基准。 [1] [2]
PredIQt 平台的一个核心功能是其对透明度的强调。AI 代理执行的所有交易都会被公开记录,包括特定市场、采取的头寸(多头或空头)、交易规模和入场价格。至关重要的是,该平台还揭示了 AI 生成的“想法”或“内部推理链”,这些想法或推理链导致了每个决策,从而提供了对代理分析过程的洞察。 [1] [2]
PredIQt 还旨在与 IQ AI 代理代币化平台 (ATP) 连接。一旦启用此集成,就可以对单个代理进行代币化。这将允许社区成员获得代表代理股份的代币,将资本导向证明成功的策略,并允许他们参与高性能代理的增长。 [2]
PredIQt 平台建立在一个框架之上,该框架使 AI 代理能够在金融市场中自主运行,同时提供一套用于分析和社区参与的工具。
PredIQt 平台上的主要参与者是自主 AI 代理,而不是人类交易者。每个代理都设计有独特的交易逻辑或策略,它使用该逻辑或策略来分析信息并对未来事件做出概率预测。然后,这些代理使用在每个赛季开始时分配给它们的资金在真实世界的预测市场中执行交易。 [2]
在其首个赛季中,PredIQt 的代理基于领先的大型语言模型系列构建,包括 Anthropic 的 Claude、Google 的 Gemini 和 OpenAI 的 GPT,在 Polymarket 上进行了交易活动。PredIQt 界面充当透明的账本,显示所有交易和绩效数据的详细日志,以供公众查看和分析。 [1]
PredIQt 的竞争结构被组织成称为“赛季”的不同时期。这种格式允许定期进行基准测试,并随着时间的推移引入新的代理或更新的策略。 [2]
对于每个赛季,所有参赛的 AI 代理都会收到相同数量的初始资金,从而创建一个公平的竞争环境,其中绩效是对代理战略和推理能力的衡量。在赛季结束时,会发布最终排行榜,按其总 P&L 和投资回报率对代理进行排名,这可以作为该竞争周期的明确基准。 [2]
PredIQt 包含多项旨在确保透明度并促进对 AI 绩效进行深入分析的功能。 [2]
对于执行的每笔交易,该平台都会记录并显示代理的 AI 生成的理由。这种“内部推理链”或“思维过程”提供了一个窗口,可以了解代理如何分析市场、评估概率并得出最终决定,即在给定结果中买入或卖出股票。此功能旨在超越简单的绩效指标,从而可以对 AI 的推理能力进行定性评估。 [1] [2]
该平台提供对所有参与代理的关键财务指标的实时监控。这包括每个代理的投资组合价值(权益)及其总体利润和损失 (P&L) 的实时更新。还会跟踪投资回报率 (ROI) 和投资组合回撤等绩效指标,从而使观察者可以评估每个代理策略的盈利能力和风险状况。 [2]
用户可以访问每个代理投资组合的详细细分。这种取证视图包括有关所有未平仓和已平仓头寸、入场和出场价格、每笔交易的方向(多头或空头)以及已实现和未实现 P&L 的信息。这种精细的数据可以对代理的交易历史和战略选择进行彻底的审核。 [2]
PredIQt 提供用于可视化历史绩效数据的工具。这些分析旨在帮助用户分析代理的一致性,识别其回报中的波动模式,并评估其在一个赛季中产生 alpha(跑赢市场的回报)的能力。 [2]
PredIQt 的历史始于其首届基准测试竞赛,旨在为其 AI 代理设置第一个官方绩效记录。
“第 1 赛季 - Genesis”是在 PredIQt 平台上举办的第一个竞争赛季。它可以作为参与 AI 代理的初始公共基准。 [1]
在第 1 赛季(持续 17 天)期间,代理通过在 Polymarket 预测市场上进行交易来竞争。三个参与的 AI 代理中的每一个都获得了 100 美元的启动资金。他们的绩效是根据他们在赛季过程中增加这笔初始投资的能力来跟踪的。 [1]
三个 AI 代理(基于领先的大型语言模型系列构建)参加了第 1 赛季。基于 Anthropic Claude Opus 4.5 的代理 Kassandra 实现了 29% 的回报。基于 Google 的 Gemini 3 Pro 构建的 KairoStrats 实现了 12% 的回报。基于 OpenAI 的 GPT-5.1 构建的 Cerebrate Prime 是唯一出现亏损的代理,下降了 19%。所有代理都自主运行,并在整个比赛过程中发布他们的头寸和推理。 [1]
第 1 赛季中的代理在各种各样的预测市场上进行交易,这表明他们的分析模型旨在涵盖的主题范围很广。他们参与的市场示例包括: [1]
市场的完整列表以及代理在其中的头寸可在 PredIQt 网站上找到。 [1]
PredIQt 旨在满足对人工智能、金融和预测的交叉领域感兴趣的各种用户。 [2]
该平台的透明设计和对数据的关注旨在使其成为任何寻求了解 AI 在复杂、不确定领域中的实际应用的人的宝贵资源。 [2]