Promptfoo
Promptfoo 是一个 AI 安全和测试平台,提供用于评估、测试和保护大语言模型 (LLM) 应用程序的开源工具。该公司由 Ian Webster 和 Michael D'Angelo 于 2024 年创立,使命是为开发可靠的 AI 应用程序提供系统性框架。2026 年 3 月 9 日,OpenAI 宣布收购 Promptfoo,将其安全和评估技术整合到 OpenAI 的平台中。[1] [2]
历史
Promptfoo 由担任首席执行官 (CEO) 的 Ian Webster 和担任首席技术官 (CTO) 的 Michael D'Angelo 于 2024 年共同创立。公司的最初使命是为开发人员创建一个易于使用的平台,以便系统地测试其 AI 应用程序。创始人很快发现,针对安全性和防护性的对抗性测试是企业采用 AI 的主要挑战,这促使公司进行了战略转型,专注于这一领域。公司的官方使命变为“交付智能体,而非漏洞”。[2] [3]
2025 年 7 月,Promptfoo 完成了 A 轮融资,筹集了 1840 万美元。该轮融资由 Insight Partners 领投,Andreessen Horowitz (a16z) 参投。参与投资的关键合伙人包括来自 Insight Partners 的 Ganesh Bell 和来自 a16z 的 Zane Lackey。根据 Pitchbook 的数据,此轮融资使 Promptfoo 的总融资额达到 2268 万美元,投后估值为 8550 万美元。该公司还获得了一些未公开的天使投资者的支持。[4] [2]
在被收购时,Promptfoo 的工具已在市场上获得了显著的关注。该平台已被超过 350,000 名开发人员使用,月活跃用户达 130,000 名。其开源工具已被超过 25% 的财富 500 强公司的团队采用。[2] [5]
被 OpenAI 收购
2026 年 3 月 9 日,OpenAI 宣布已达成收购 Promptfoo 的协议,该协议取决于惯例成交条件。交易的财务条款未公开披露。在宣布收购时,Promptfoo 拥有一支 23 人的团队,所有成员都将加入 OpenAI。[5] [4] [2]
此次收购是 OpenAI 的一项战略举措,旨在增强其 AI 智能体技术的安全性,特别是针对企业客户。Promptfoo 首席执行官 Ian Webster 表示,加入 OpenAI 的目标是为构建现实世界 AI 系统的团队带来“更强大的安全、防护和治理能力”。整合 Promptfoo 的技术旨在为先进的 AI 系统提供系统性的风险检测和合规性。[4] [5]
Promptfoo 的技术和团队计划整合到 “OpenAI Frontier” 中,这是该公司用于开发和部署 AI 智能体(有时被称为“AI 同事”)的企业平台。整合计划使自动化安全测试、防护评估和红队测试成为 OpenAI Frontier 平台的原生功能。这旨在将安全评估深度嵌入到开发人员的工作流程中,从而实现风险的早期识别和修复。合并后的工具还将提供报告和可追溯性功能,帮助组织记录 AI 测试并满足治理、风险和合规 (GRC) 标准。[1] [5]
在收购公告中,OpenAI 和 Promptfoo 团队确认了他们继续开发和维护 Promptfoo 开源产品的承诺。Promptfoo 还表示,它将继续为现有用户和企业客户提供服务,并维持对 OpenAI 以外的各种 AI 提供商和模型的生态系统支持。[2] [4]
技术与产品
Promptfoo 的设计围绕“测试驱动的 LLM 开发”理念,为构建 AI 应用程序中常用的试错方法提供了一种结构化且数据驱动的替代方案。其技术核心是一个开源命令行界面 (CLI) 和库,使用 TypeScript 编写并根据 MIT 许可证分发。该工具以开发人员为中心,在本地运行,以确保专有的提示词、测试数据和 API 密钥保留在用户的机器上。它使用声明式 YAML 配置文件 (promptfoo.yaml) 来定义提示词、模型和测试用例,这使得测试套件可以进行版本控制并集成到开发工作流中。[6] [7]
产品套件
Promptfoo 提供了一套旨在将安全性整合到 AI 开发生命周期全过程的产品。[3]
- 评估 (Evaluations):一个开源组件,用于测试和评估提示词、模型和检索增强生成 (RAG) 系统的性能、质量和准确性。它允许用户构建自定义基准并并排比较结果。[7]
- 红队测试 (Red Teaming):一种主动安全工具,通过模拟对抗性用户行为,在部署前识别并修复特定于应用程序的漏洞。它会自动生成自定义攻击,以测试提示词注入(直接和间接)、越狱、数据泄露、个人身份信息 (PII) 暴露和业务逻辑违规等风险。[3] [1]
- 护栏 (Guardrails):一种为生产环境中的 AI 应用程序提供实时保护的功能。它旨在防御运行时的越狱、提示词注入和其他对抗性攻击。[2]
- 模型安全 (Model Security):一项用于 AI 模型全面安全测试和持续监控的服务。它有助于确保模型随着时间的推移能够抵御各种威胁。[3]
- 代码扫描 (Code Scanning):一种集成工具,可直接在开发人员的集成开发环境 (IDE) 中以及作为持续集成/持续部署 (CI/CD) 流水线的一部分查找与 LLM 相关的安全漏洞。[3]
- MCP 代理 (MCP Proxy):一种专门的安全代理,旨在保护使用模型上下文协议 (MCP) 的通信。[3]
核心功能
- 比较评估:核心功能是能够同时针对多个模型(例如 GPT-4、Claude、Gemini)、不同的提示词或不同的系统设置运行提示词。结果显示在并排矩阵视图中,以便直接比较。[6]
- 断言与评分:用户可以定义特定标准或断言,以自动为 LLM 响应的质量和安全性评分。这可以包括检查有效的 JSON 格式、标记特定关键词,或使用另一个 LLM 作为“裁判”来评估主观质量。[1]
- CI/CD 集成:该工具旨在 CI/CD 流水线中运行,以便在将更改部署到由 LLM 驱动的功能之前,自动执行质量门禁和安全检查。[6]
- 供应商无关性:该平台与供应商无关,支持来自广泛供应商的模型,包括 OpenAI、Anthropic、Google、Azure、Amazon Bedrock 和 HuggingFace。它还可以与通过 Ollama 或 Llama 本地托管的开源模型一起使用,并支持专有模型的自定义 API 端点。[7]
- 隐私优先架构:默认情况下,所有评估都在用户的本地机器上处理。该工具直接与模型提供商的 API 通信,这防止了提示词和模型输出等敏感数据暴露给第三方。[6]
采用与用例
据报道,在被收购之前,Promptfoo 的工具已在为超过 1000 万用户提供服务的生产应用程序中使用。该平台被 127 家财富 500 强公司使用,包括全球顶级零售商、美国主要无线运营商和著名的医疗保健组织。Anthropic 等其他 AI 实验室的团队也使用该平台,其开源项目已收到来自 Google、Microsoft 和 Amazon 开发人员的贡献。[6] [3]
行业特定解决方案
Promptfoo 为多个受监管行业提供量身定制的安全和合规解决方案:[3]
- 医疗保健:旨在符合医疗 AI 的《健康保险流通与责任法案》(HIPAA) 的安全解决方案。
- 金融服务:符合金融业监管局 (FINRA) 法规的安全测试。
- 保险:用于保护受保护健康信息 (PHI) 并确保合规性的工具。
- 电信:语音和文本 AI 智能体的安全性。
- 房地产:合规性测试,以帮助遵守公平住房法规。