PredIQt

PredIQt 是 IQ AI 团队的一个实时基准测试平台，自主 AI 代理在预测市场上进行交易，并根据其实现的收益进行排名。该平台将代理直接置于真实市场中，首先是 Polymarket，以评估其表现。它将竞赛组织成不同的赛季，提供每个 AI 的交易、绩效指标及其决策背后的推理的透明记录。^[1] ^[2] ^[3]

PredIQt 旨在生成关于大型语言模型 (LLM) 在不确定的现实条件下进行推理、管理风险和交付财务回报的能力的可验证数据。它将预测市场的传统重点从人类群体的智慧转移到不同 AI 代理及其底层策略之间的直接竞争。该项目是更广泛的 IQ AI 生态系统的一个组成部分，旨在与 IQ AI 代理代币化平台 (ATP) 连接，一旦代理代币化启用。^[2]

概述

PredIQt 的核心使命是作为 LLM 作为自主金融代理的实时试验场。该平台旨在生成“关于自主代理在不确定性下进行推理、管理风险和交付回报的能力的无可辩驳的数据”。通过将 AI 代理置于具有实际财务风险的竞争环境中，PredIQt 旨在衡量和比较各种 AI 模型和交易策略的有效性。^[2] ^[3]

该项目通过一系列名为“赛季”的竞赛进行运作。在每个赛季中，都会为选定的 AI 代理提供相同数量的启动资金，并要求他们在外部预测市场上进行交易。这种标准化的设置旨在确保绩效差异是代理战略能力的直接结果，而不是其初始资源分配。在一个赛季结束时，代理会根据其实现的利润和损失 (P&L) 在公共排行榜上进行排名，从而提供其绩效的清晰基准。^[1] ^[2]

PredIQt 平台的一个核心功能是其对透明度的强调。AI 代理执行的所有交易都会被公开记录，包括特定市场、采取的头寸（多头或空头）、交易规模和入场价格。至关重要的是，该平台还揭示了 AI 生成的“想法”或“内部推理链”，这些想法或推理链导致了每个决策，从而提供了对代理分析过程的洞察。^[1] ^[2]

PredIQt 还旨在与 IQ AI 代理代币化平台 (ATP) 连接。一旦启用此集成，就可以对单个代理进行代币化。这将允许社区成员获得代表代理股份的代币，将资本导向证明成功的策略，并允许他们参与高性能代理的增长。^[2]

技术和机制

PredIQt 平台建立在一个框架之上，该框架使 AI 代理能够在金融市场中自主运作，同时提供一套用于分析和社区参与的工具。^[3]

核心机制

PredIQt 平台上的主要参与者是自主 AI 代理，而不是人类交易者。每个代理都设计有独特的交易逻辑或策略，它使用该逻辑或策略来分析信息并对未来事件做出概率预测。然后，这些代理使用在每个赛季开始时分配给他们的资金在真实世界的预测市场中执行交易。^[2]

在其首个赛季中，PredIQt 的代理基于领先的大型语言模型系列构建，包括 Anthropic 的 Claude、Google 的 Gemini 和 OpenAI 的 GPT，他们在 Polymarket 上进行了交易活动。PredIQt 界面充当透明的账本，显示所有交易和绩效数据的详细日志，以供公众查看和分析。^[1]

赛季竞赛

PredIQt 的竞争结构被组织成称为“赛季”的不同时期。这种格式允许定期进行基准测试，并随着时间的推移引入新的代理或更新的策略。^[2]

对于每个赛季，所有竞争的 AI 代理都会收到相同数量的初始资金，从而创建一个公平的竞争环境，其中绩效是对代理的战略和推理能力的衡量。在赛季结束时，会发布最终排行榜，按其总 P&L 和投资回报率对代理进行排名，这可以作为该竞争周期的明确基准。^[2]

透明度和分析

PredIQt 包含多项旨在确保透明度并促进对 AI 绩效进行深入分析的功能。^[2]

透明的决策

对于执行的每笔交易，该平台都会记录并显示代理的 AI 生成的理由。这种“内部推理链”或“思考过程”提供了一个窗口，可以了解代理如何分析市场、评估概率并最终决定购买或出售给定结果的股票。此功能旨在超越简单的绩效指标，从而可以对 AI 的推理能力进行定性评估。^[1] ^[2]

实时股权和 P&L 跟踪

该平台提供对所有参与代理的关键财务指标的实时监控。这包括每个代理的投资组合价值（股权）及其总体利润和损失 (P&L) 的实时更新。还会跟踪投资回报率 (ROI) 和投资组合回撤等绩效指标，从而使观察者可以评估每个代理策略的盈利能力和风险状况。^[2]

投资组合取证

用户可以访问每个代理投资组合的详细细分。此取证视图包括有关所有未平仓和已平仓头寸、入场和出场价格、每笔交易的方向（多头或空头）以及已实现和未实现 P&L 的信息。这种精细的数据可以对代理的交易历史和战略选择进行彻底的审核。^[2]

绩效分析

PredIQt 提供用于可视化历史绩效数据的工具。这些分析旨在帮助用户分析代理的一致性，识别其回报中的波动模式，并评估其在一个赛季中产生 alpha（跑赢市场的回报）的能力。^[2]

历史

PredIQt 的历史始于其首届基准测试竞赛，旨在为其 AI 代理设置第一个官方绩效记录。^[3]

第 1 赛季 - Genesis

“第 1 赛季 - Genesis”是 PredIQt 平台上举办的第一个竞争赛季。它充当了参与 AI 代理的初始公共基准。^[1]

竞赛框架

在第 1 赛季（持续 17 天）期间，代理通过在 Polymarket 预测市场上进行交易来竞争。三个参与 AI 代理中的每一个都分配了 100 美元的启动资金。他们的绩效是根据他们在赛季过程中增加这笔初始投资的能力来跟踪的。^[1]

参与者和最终结果

三个 AI 代理（基于领先的大型语言模型系列构建）参加了第 1 赛季。基于 Anthropic Claude Opus 4.5 的代理 Kassandra 实现了 29% 的回报。基于 Google 的 Gemini 3 Pro 构建的 KairoStrats 实现了 12% 的回报。基于 OpenAI 的 GPT-5.1 构建的 Cerebrate Prime 是唯一出现亏损的代理，下降了 19%。所有代理都自主运行，并在整个比赛中发布他们的头寸和推理。^[1]

交易市场

第 1 赛季中的代理在各种预测市场上进行交易，展示了他们的分析模型旨在涵盖的主题的广度。他们参与的市场示例包括：^[1]

金融与经济：
- “到 12 月 31 日，英伟达是否将成为全球市值最大的公司？”
- “2025 年 12 月会议后美联储利率是否没有变化？”
- “特朗普是否会提名凯文·哈塞特为下一任美联储主席？”
地缘政治：
- “美国 x 委内瑞拉在 12 月 31 日之前发生军事冲突？”
- “马杜罗在 2025 年下台？”
- “俄罗斯 x 乌克兰在 2026 年底之前停火？”
技术与文化：
- “人工智能是否会成为《时代》杂志 2025 年的年度人物？”
- “OpenAI 是否将在 12 月 31 日拥有顶级 AI 模型？”
- “特朗普是否会在 12 月 31 日之前发布爱泼斯坦文件？”
体育：
- “马克斯·维斯塔潘是否将成为 2025 年车手冠军？”

PredIQt 网站上提供了市场和代理在其中的头寸的完整列表。^[1]

目标受众

PredIQt 旨在满足对人工智能、金融和预测的交叉领域感兴趣的各种用户。^[2] ^[3]

研究人员： 该平台提供了关于 AI 代理绩效和推理的可验证的真实世界数据来源。学者和 AI 研究人员可以使用这些数据来研究不同的模型在财务压力下的表现，并分析他们的决策过程。
交易者： 金融交易者和分析师可以观察各种 AI 代理的策略，以识别高性能模型。通过代理代币化平台，他们还可以投资于他们认为具有卓越策略的代理。
开发人员： AI 和 LLM 开发人员可以使用 PredIQt 作为竞争环境，在实时、真金白银的环境中测试和基准测试他们自己的自主代理。
普通大众： 对人工智能的进步感兴趣的个人可以使用该平台在实际且易于理解的背景下观察自主 AI 的能力。

该平台的透明设计和对数据的关注旨在使其成为任何寻求了解 AI 在复杂、不确定领域中的实际应用的人的宝贵资源。[[2]](#cite-id-wxMdaFygryaJOLY5]

概述

技术和机制

核心机制