ai fundingdata licensingphysical aidata labelingregulation2026年7月4日

Scale AI 融资 10 亿美元,估值 138 亿美元,用于数据供应链建设

Accel 领投巨额融资,以扩展数据标注和合成数据生成能力,服务前沿 AI 模型。

Scale AI 已完成披露的 10 亿美元 Series F 融资(https://scale.com/blog/series-f),使这家数据基础设施领导者的估值达到披露的 138 亿美元(https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-from-accel-nvidia-at-13-8-billion-value)。本轮融资由风险投资公司 Accel 领投,标志着 AI 市场的一个决定性转变:随着计算能力日益商品化,主要的竞争壁垒已迁移至数据供应链。此次投资包括英伟达(Nvidia)、亚马逊(Amazon)、Meta 和英特尔资本(Intel Capital)等战略巨头的参与(https://scale.com/blog/series-f),凸显了行业普遍认同的观点,即高质量、人工标注的数据是下一代前沿模型必不可少的燃料。

数据标注的工业化

此次注资将用于扩展 Scale AI 的“数据铸造厂”,这是一个复杂的运营体系,结合了自动化系统和全球专业人才队伍,将原始数据精炼成结构化的训练数据集。与早期 AI 时代仅需简单的图像标注不同,当前的需求侧重于复杂的推理、编码和多模态理解。Scale AI 正将自己定位为原始数字信息与大型语言模型(LLM)开发者所需精炼智能之间的关键中间商。此次估值从 2021 年的 73 亿美元(税后估值)(https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-from-accel-nvidia-at-13-8-billion-value)大幅跃升至 138 亿美元,反映了驱动自主 AI 系统所需数据量和复杂性的指数级增长。

物理 AI 与自主数据前沿

对 Scale AI 的投资恰逢“物理 AI”领域融资的广泛增长,这类系统通过传感器和执行器与现实世界进行交互。一个典型例子是 Wayve(https://wayve.ai/news/series-c-funding/)近期完成的由软银集团(SoftBank Group)领投的 10.5 亿美元 Series C 融资。Wayve 正在为自动驾驶领域开创“具身智能”(Embodied AI),该领域需要 Scale AI 越来越有能力处理的专业化、高保真物理世界数据。Scale 的 10 亿美元和 Wayve 的 10.5 亿美元这两笔交易的汇合,凸显了市场正转向能够同时解决物理和数字领域“数据瓶颈”的初创公司。

从抓取到结构化许可的转变

随着监管机构收紧对未经授权数据采集的管控,许可数据资产的市场正在爆炸式增长。本周,行业注意到《新闻集团》(News Corp)与 OpenAI(https://www.reuters.com/technology/news-corp-strikes-multi-year-content-partnership-with-openai-2024-05-22/)达成了约 2.5 亿美元的多年协议,允许 OpenAI 访问《华尔街日报》和《泰晤士报》等出版物的内容。此前,Reddit 也同意将其数据授权给 OpenAI(https://www.reuters.com/technology/reddit-shares-jump-partnership-with-openai-2024-05-16/),使这家 AI 公司能够利用实时对话数据进行训练。这些交易标志着“许可数据”新时代的到来,高价值数据集不再被随意抓取,而是被视为具有经常性许可费用的优质资产,Scale AI 的基础设施正是为大规模促进这一趋势而设计。

监管与全球数据标准

这些巨额资本流动的背景是欧盟《人工智能法案》(https://www.consilium.europa.eu/en/press/press-releases/2024/05/21/artificial-intelligence-ai-act-council-gives-final-green-light-to-the-first-worldwide-rules-on-ai/)的正式通过,这是全球首个全面的人工智能监管框架。《法案》要求对用于训练通用人工智能模型的透明度。对于像 Scale AI 这样的数据所有者和基础设施提供商而言,这项法规是增长的催化剂;它迫使 AI 开发者放弃不透明的数据源,转向可追溯、高质量且合规的数据集。这种监管的顺风正推动对数据治理平台(如 Atlan)的进一步投资,Atlan 最近获得了披露的 1.05 亿美元 Series C 融资(https://atlan.com/news/atlan-raises-105m-series-c-led-by-gic-and-meritech-capital/),以帮助企业管理其面向 AI 的数据资产。

对数据所有者的意义

对于数据所有者而言,Scale AI 的融资以及《新闻集团》的合作证明,数据不再是业务的副产品——它已成为主要产品。一家主要从事数据标注和结构化业务的公司获得了 138 亿美元的估值,这表明“炼油厂”的价值与“原油”本身一样高。无论是在媒体、医疗保健还是物理物流领域拥有专有数据集的所有者,现在都有了一条清晰的途径,可以通过结构化许可和合作伙伴模式实现货币化。随着行业向物理 AI 和受监管的透明度发展,对干净、合法且高保真的数据的需求将持续上升,使数据资产成为现代投资领域中最具利润的类别之一。

d-nvest 将这些交易背后的数据资产转化为有评分、可操作的机会。

探索管道 →
Scale AI 融资 10 亿美元,估值 138 亿美元,用于数据供应链建设 | d-nvest