C
ChaoBro

SAP十亿欧元收购TabPFN母公司PriorLabs:表格数据基础模型的时代来了

SAP十亿欧元收购TabPFN母公司PriorLabs:表格数据基础模型的时代来了

15个月,从900万到10亿

PriorLabs的故事堪称2026年AI领域最戏剧性的资本故事之一。

2025年初,这家德国AI初创公司仅以 €900万欧元的种子轮融资 起步。15个月后的今天,SAP宣布以 €10亿欧元投资承诺 收购PriorLabs——估值增长超过100倍。

驱动这次巨额收购的核心资产,是GitHub Trending上正在热传的开源项目 TabPFN(Prior Labs Tabular Foundation Model)。

TabPFN解决了什么痛点

如果你做过机器学习,大概率经历过这个折磨:

  1. 拿到一份几百行的表格数据
  2. 尝试XGBoost、随机森林、LightGBM
  3. 花几天时间调参、做特征工程
  4. 结果在小数据集上严重过拟合

TabPFN的解决思路是:把表格数据当成一种”语言”,用基础模型的方式来处理

它不是传统ML模型的替代品,而是一种范式转换:

维度传统ML流程TabPFN
训练方式每个任务从头训练预训练模型,零样本推理
小数据表现容易过拟合天然适配,表现稳定
调参成本高(网格搜索/贝叶斯优化)几乎为零
特征工程必须手动处理自动编码
推理速度取决于模型复杂度极快

为什么SAP愿意花10亿

SAP的核心业务是企业软件——ERP、CRM、供应链管理,而这些系统的底层,几乎全是表格数据

TabPFN对SAP的战略价值在于:

  1. 智能分析内置化:企业用户无需配置ML Pipeline,直接获得智能数据洞察
  2. 降低AI使用门槛:业务人员可以直接用自然语言+表格数据获得分析结果
  3. 竞争壁垒:在其他AI厂商还在卷文本和图像时,SAP拿下了”表格数据AI”这个垂直赛道
  4. 开源生态:TabPFN的开源属性意味着SAP可以吸引开发者生态,形成护城河

基础模型的下一个 frontier:不是文本,不是图像,是表格

2023-2024年,基础模型的战场在文本(GPT-4、Claude)和图像(Midjourney、DALL-E)。2025年,视频和音频成为新战场。

但表格数据一直是被忽视的蓝海:

  • 全球 80%以上的企业数据 仍以表格形式存储
  • 表格数据的AI处理市场规模预计2027年超过 500亿美元
  • 传统ML工具的使用门槛极高,只有不到5%的企业数据团队 能有效利用

TabPFN的开源项目已经在GitHub上获得 6,486颗Star,今日增长218颗,在Trending榜单排名第三。

格局判断

这次收购释放了几个信号:

  • 企业级AI的价值正在被重新定义:不是聊天机器人,而是对核心业务数据的智能处理
  • 基础模型正在”专业化”:从通用大模型到垂直领域基础模型(代码、表格、生物、金融)
  • 开源+商业化的路径正在验证:TabPFN是开源项目,但SAP看到了将其整合到企业产品线的商业价值

行动建议

  • 数据科学从业者:立即试用TabPFN,它在小型数据集上的零样本表现可能替代你一半的调参工作
  • 企业IT决策者:关注SAP如何将TabPFN整合到现有产品线,这可能改变企业数据分析的成本结构
  • AI创业者:TabPFN证明了”垂直领域基础模型”这条路走得通,代码、法律、医疗等领域都有类似机会

基础模型的竞争正在进入深水区。下一个被十亿级收购的,可能就是你正在用的那个开源项目。