“减少幻觉”这句话已经被说烂了,但真正能让客户掏钱的,是把它变成工程工具。
TechCrunch 6 月 16 日报道,Probably 完成 900 万美元 seed round,由 Andreessen Horowitz 领投。The SaaS News 的融资条目也确认了金额、轮次和日期,并把公司定位为提高 AI 准确性的工具。
Probably 的方向不是再训一个更大的模型,而是做一套更严谨的验证层。CryptoBriefing 的报道提到,它希望通过 deterministic validators 和较小模型来检查输出,目标是接近 99.99% 准确率。这个目标很大胆,先别全信,但产品切口是对的。
AI 可靠性市场会越来越大。因为企业不只关心模型会不会答对,还关心答错之前能不能被拦下来、错在哪里、能不能复盘。尤其是金融、医疗、法务、数据分析这种场景,幻觉不是体验问题,是风险问题。
种子轮也意味着它还很早。验证器能覆盖多少任务、会不会引入新误报、成本能否低于直接多模型交叉检查,都要看实测。
但我愿意继续跟。前沿模型越强,越需要外部验收层;否则大家只是在用更贵的方式制造更自信的错误。
主要来源: