AI代理公司Patronus获5000万美元融资，用数字世界测试智能体稳定性｜AI指令集

Zevo

AI代理公司Patronus获5000万美元融资，用数字世界测试智能体稳定性

Zevo 更新时间 2026-06-28 10:05 14 0

AI摘要

Patronus AI是一家初创公司，专注于为AI智能体构建高仿真的“数字世界”以进行压力测试。公司由Meta前AI研究人员创立，旨在通过模拟复杂情况，确保AI智能体在现实世界中的稳定运行。与依赖基准测试的传统方法不同，Patronus AI利用虚拟环境进行强化学习，奖励成功完成任务并惩罚错误行为，从而提升AI智能体的实际工作能力。公司近日完成5000万美元B轮融资，总融资额

从对话助手到行动派 AI面临安全新挑战

随着人工智能代理, 从单纯的问答交互, 进化成能自主执行复杂多步骤任务的行动派, 确保这些智能体, 在现实世界中稳定运行, 成为行业关注的焦点。这些AI智能体, 不再仅仅是聊天机器人, 而是开始接手, 软件工程、金融分析等关键领域的工作。

可是, 现实世界所具备的复杂性以及不可预测性, 给AI提出了超级巨大的考验。模型开发商依靠各类基准测试去展现性能, 然而这些分数没办法完全体现AI操控实际复杂工作的能力。智能体在执行任务之际, 常常会尝试去寻觅捷径, 而不是真正地解决问题, 这极有可能引致严重的后果。

虚拟数字世界成为AI质检新阵地

近日, 有一家名为AI的初创公司宣称完成了5000万美元的B轮融资, 而且其总融资额已然达到了7000万美元。这家公司是在2023年由Meta前AI研究人员Anand以及Qian创立的, 它的核心业务乃是为AI智能体创建高仿真的数字世界。

这种机制跟Waymo为自动驾驶汽车研发虚拟训练场景相类似, 借助模拟的各种稀有的、复杂的极端情形, 针对AI智能体开展全方位的压力测试, AI凭借构建这些虚拟数字环境, 在模型完成基础训练之后对模型实施强化学习测试。

强化学习迭代优化惩罚作弊行为

身处AI构建的虚拟环境里, 系统会对成功完成的任务予以奖励迭代, 同时惩处任何作弊行径或错误行为。这样的机制保障模型在直面不确定的真实世界情形时, 始终能够维持稳健状态，不会妄图走捷径或者采用不当方式去完成任务。

采用这般反反复复的测试以及优化过程, AI智能体得以在仿若真实世界的场景里积攒下巨量经验。其中这种训练形式相较于单单凭借静态基准测试, 更能够体现出AI于复杂环境当中的实际表现本领。

营收增长15倍市场需求供不应求

当前, AI的服务现已经覆盖软件工程以及金融分析等范畴, 其客户群体差不多包含了所有前沿AI实验室还有新兴AI初创公司, 在过去的一年之中营收增长了足足15倍, 市场对于这种高仿真测试环境的需求已然达到了供不应求的状况。

指出的是投资方GLENN的董事总经理, 当前市场对于AI质检服务的需求是极其旺盛的, 随着越来越多的企业把AI智能体部署到实际业务里, 保证这些智能体的可靠性以及安全性已然成为优先事项。

长远目标是打造长周期持续作业环境

虽然当下AI着重于可验证的任务情形, 不过公司创始人宣称这仅仅只是个开端, 他们的目的是塑造更繁杂的环境, 使得智能体可以开展长周期的持续作业, 不管是10小时、10天亦或是更长久的时间, 都能够保证其行为的合规与准确。

这表明, 往后的AI智能体, 会具备在无人实施监督的状况下, 长时间稳定开展运行的能力。这对于那些有着24小时不间断进行运作需求的金融交易领域而言, 是格外重要的。这对于网络安全监控这类领域来说，同样是极为重要的。

资本市场看好AI质检赛道前景

此次融资, 是由那GLENN带领投资, 其他众多家知名的投资机构跟着进行投资, 这显示出了资本市场对于那一个AI质检赛道有着深度的认可。那5000万美元的B轮融资, 将会被用来扩大团队, 加速产品的研发以及市场的拓展。

基于AI应用场景从实验室迈向真实世界这一情况，保证AI智能体可以安全可靠地运行已然成为整个行业所面临的共同挑战, AI的虚拟测试环境方案抑或会成为AI产业发展不可缺少的基础设施。

你认为在AI正式步入工作岗位之前, 它有没有必要被强制经由这般的“压力测试”呢? 欢迎于评论区去分享你个人的观点, 点赞并且进行转发, 以便让更多的人参与到讨论当中！

登录后参与评论

评论仅开放给已登录并完成邮箱绑定的用户。

评论 0

暂无评论。

作者 Zevo

120 14 5 3

分类与标签

新闻资讯 AI代理 Patronus 数字世界智能体测试融资

从对话助手到行动派 AI面临安全新挑战

虚拟数字世界成为AI质检新阵地

强化学习迭代优化 惩罚作弊行为

营收增长15倍 市场需求供不应求

长远目标是打造长周期持续作业环境

资本市场看好AI质检赛道前景

相关文章

AI算力借记卡来了！一张卡搞定多模型充值，省去切换烦恼

Kimi大模型B端定价真相：缓存命中率决定你的实际成本

DeepSeek V4七月上线，高峰时段API价格翻倍

登录后参与评论

评论 0

强化学习迭代优化惩罚作弊行为

营收增长15倍市场需求供不应求