fundingdata licensingscale aiai infrastructure2026年6月22日

Scale AI 融资 10 亿美元,估值达 138 亿美元

由 Accel 领投的此轮融资将 Scale AI 定位为前沿人工智能模型开发的首选“数据铸造厂”。

Scale AI 已完成 10 亿美元的 F 轮融资(https://scale.com/blog/series-f),其投后估值达到披露的 138 亿美元(https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation)。本轮融资由 Accel 领投,Nvidia、Amazon 和 Meta 显著参与,标志着资本大规模转向当前大型语言模型(LLM)开发商面临的“数据瓶颈”。随着行业超越“抓取公开网络”的时代,Scale AI 构建“数据铸造厂”的使命代表了迄今为止在创建专家标注的高密度主权和企业级人工智能数据资产方面最重要的投资。

人工智能数据的工业化

这 10 亿美元的注资(https://scale.com/blog/series-f)不仅仅是一轮增长融资;它是一项基础设施投资。Scale AI 将自己定位为 21 世纪原材料的关键精炼厂。此次融资将用于扩展其“数据引擎”,该引擎提供必要的人类反馈强化学习(RLHF),以推动模型突破当前的推理瓶颈。随着思科投资、英特尔资本和 AMD 风险投资等投资者(https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation)加入股东行列,这笔交易凸显了跨行业的共识:下一代人工智能的性能将通过数据质量而非仅仅计算量来赢得。

授权交易达到白热化阶段

Scale AI 的融资恰逢模型构建商与优质内容所有者之间前所未有的直接数据收购交易浪潮。最值得注意的是,新闻集团与 OpenAI 签署了一项多年协议(https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d),估计五年价值 2.5 亿美元(https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d)。这项合作使 OpenAI 能够访问《华尔街日报》、《巴伦周刊》和《泰晤士报》的档案和当前内容,标志着向授权的高权威数据集的明确转变。同样,OpenAI 与 Reddit 的合作(https://openai.com/index/openai-and-reddit-partnership/)提供了对 Reddit 数据 API 的实时访问,从而能够将以人为本的对话数据集成到 ChatGPT 和其他产品中。

利用具身和专业化数据

除了基于文本的大型语言模型,专业化数据资产市场也看到了巨额资本流入。Wayve 最近在软银领投的 C 轮融资中获得了 10.5 亿美元(https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/),用于开发自动驾驶的“具身人工智能”。这笔交易凸显了对“边缘数据”的重视——即无法仅通过合成生成来复制的真实世界感官信息。为了支持这个数据密集型生态系统,CoreWeave 筹集了 11 亿美元(https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/),以扩展其专门的云基础设施,该基础设施专门设计用于处理数据密集型人工智能训练工作负载所需的巨大吞吐量。

监管和权利的反弹

随着数据资产价值飙升,权利所有者正积极采取行动保护其知识产权。索尼音乐集团向 700 多家人工智能公司发出了正式警告(https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/),明确声明“退出”未经授权用于人工智能训练的数据抓取。此前,已有包括 OpenAI 与 Vox Media(https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt)和《大西洋月刊》(https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/)在内的一系列授权协议,这表明用于训练数据的“合理使用”时代正迅速被一个结构化的、价值数十亿美元的内容版权市场所取代。

这对数据所有者意味着什么

对于机构数据所有者而言,Scale AI 的估值和新闻集团的交易证实了专有数据集不再是次要资产——它们是人工智能经济中的主要筹码。从 2.5 亿美元的授权交易转向 10 亿美元的数据精炼厂融资,表明“干净、专家标注的数据”现在是一个独立的资产类别。拥有独特、高流通性或历史悠久数据的拥有者应优先考虑数据治理和“人工智能就绪性”,以捕捉当前市场最大参与者设定的溢价估值。

d-nvest 将这些交易背后的数据资产转化为有评分、可操作的机会。

探索管道 →
Scale AI 融资 10 亿美元,估值达 138 亿美元 | d-nvest