funding rounddata licensingai infrastructuredata governance2026年6月24日

Scale AI 融资 10 亿美元用于扩展其前沿模型数据引擎

Accel 领投巨额融资,数据标注巨头估值达 138 亿美元,高质量 AI 训练集需求达到顶峰。

Scale AI 已完成 10 亿美元的 F 轮融资,公司估值飙升至公开披露的 138 亿美元(https://techcrunch.com/2024/05/21/scale-ai-raises-1-billion-at-a-13-8-billion-valuation/),全球对高保真 AI 训练数据的争夺达到了白热化程度。本轮融资由 Accel 领投,Nvidia、Amazon 和 Meta 参投,这标志着机构对“数据引擎”作为前沿模型开发主要瓶颈的巨额投资。Scale AI 的扩张正值一个关键时刻,高质量的公共互联网数据供应已接近枯竭,迫使 AI 实验室转向定制化、人工参与的数据生成和复杂的合成数据管道。

转向高端数据许可

Scale AI 的融资是更广泛市场转变的一个缩影,数据不再被视为商品,而是高价值的战略资产。这一趋势进一步体现在 新闻集团与 OpenAI 的里程碑式多年合作 中,该协议估计在五年内价值超过 2.5 亿美元(https://www.reuters.com/technology/news-corp-strikes-content-licensing-deal-with-openai-2024-05-22/)。根据协议,OpenAI 可以访问《华尔街日报》和《泰晤士报》等主要出版物的当前和存档内容,提供只有专业编辑数据才能提供的强大推理能力。此举表明,“免费抓取”时代已基本结束,取而代之的是一个结构化的许可知识产权市场。

基础设施和治理资本

随着管理中的专有数据量激增,支持它的基础设施吸引了创纪录的资本。 CoreWeave 最近获得了公开披露的 75 亿美元债务融资(https://www.reuters.com/technology/coreweave-raises-75-bln-debt-led-by-blackstone-magnetar-2024-05-17/),以扩大其数据中心规模,确保有足够的计算能力来处理这些海量新数据集。与此同时,数据治理正成为一项独立的投资主题。Atlan 获得了公开披露的 1.05 亿美元 C 轮融资(https://atlan.com/news/series-c-funding/),以帮助企业管理其“数据资产”,确保输入 AI 模型的数据是合规、干净且可追溯的——这是任何企业级 AI 部署的先决条件。

专业数据资产的兴起

除了通用 LLM,垂直 AI 的专业数据也看到了显著的估值溢价。语言翻译专家 DeepL 获得了公开披露的 3 亿美元投资,估值达到 20 亿美元(https://www.forbes.com/sites/iainmartin/2024/05/22/deepl-the-german-ai-translation-startup-hits-2-billion-valuation-with-300-million-investment/),以加倍投入其专有语言数据集。这凸显了“专家级”数据不断增长的二级市场,其能力超越了通用网络爬取信息。与此同时,自动驾驶仍然是数据密集度最高的垂直领域,Wayve 公开披露的 10.5 亿美元 C 轮融资(https://wayve.ai/news/series-c/)由软银领投,旨在通过大规模传感器数据处理实现“具身智能”的商业化。

这对数据所有者意味着什么

对于数据所有者而言,Scale AI 和新闻集团的交易证实了我们已经进入了 AI 经济的“收获阶段”。高质量、人工验证的数据现在是 AI 供应链中最稀缺的资源。专有档案、专业技术文档或真实世界传感器数据的拥有者不再仅仅是“存储”信息;他们掌握着下一代主权和企业 AI 的原材料。货币化策略正从一次性销售转向经常性许可模式,数据的价值与它训练的模型性能和收入挂钩。

d-nvest 将这些交易背后的数据资产转化为有评分、可操作的机会。

探索管道 →
Scale AI 融资 10 亿美元用于扩展其前沿模型数据引擎 | d-nvest