biological aiphysical aifunding rounddata licensing2026年7月4日

EvolutionaryScale 获 1.42 亿美元融资,用于生物数据 AI

前 Meta 研究人员推出 ESM3,一款基于 27 亿个蛋白质序列训练的前沿模型,用于编程生物学。

EvolutionaryScale 已完成一轮披露的 1.42 亿美元种子轮融资(https://www.evolutionaryscale.ai/blog/esm3-release),由 Nat Friedman、Daniel Gross 和 Lux Capital 领投,旨在将前沿 AI 模型商业化用于生物数据。这笔资金注入是生物技术 AI 领域历史上最大规模的种子轮融资之一,表明市场对能够理解和操纵物理世界基本构件的“物理 AI”系统有着强劲的需求。此次交易的核心是 ESM3 的发布,这是一个在专有和公共数据集(涵盖 27 亿个蛋白质序列)(https://www.evolutionaryscale.ai/blog/esm3-release)上训练的生成模型,它使研究人员能够通过模拟数字环境中数十亿年的进化来有效地“编程”生物学。

生物数据资产的多模态优势

与前几代蛋白质语言模型不同,ESM3 是一个多模态前沿模型。它不仅仅预测结构;它同时在序列、结构和功能之间进行推理。通过处理包含 27 亿个序列及其对应的 3D 结构的数据集(https://www.evolutionaryscale.ai/blog/esm3-release),该模型可以生成自然界中不存在的全新蛋白质。这一能力将生物数据从被动的进化记录转变为药物发现、碳捕获和材料科学的活跃资产。该公司由 Meta 的 ESM 项目团队创立,正将自己定位为“生物学的 OpenAI”,向科学界提供该模型的一个版本,同时保留高容量版本用于商业合作。

物理 AI 与数据货币化的转变

EvolutionaryScale 的交易凸显了一个更广泛的趋势,即最有价值的数据资产正从人类生成文本转向物理世界观察。虽然文本的 LLM 面临收益递减和版权方面的法律障碍,但生物数据提供了一个广阔、未开发的领域。ESM3 模型使用了约 1.0 x 10^24 FLOPS 的计算能力(https://www.evolutionaryscale.ai/blog/esm3-release)进行训练,这一规模以前仅限于顶级通用模型。这项投资强调了在专业、高保真物理数据上训练模型的成本高昂——以及潜在回报丰厚。随着物理 AI 的成熟,结构化生物、化学和机器人数据集的许可价值预计将超过通用网络爬取数据。

竞争格局:生命科学中的数据护城河

EvolutionaryScale 进入的市场目前由 DeepMind 的 AlphaFold 3 主导,但其重点是生成式设计而非仅仅结构预测。该领域的竞争护城河正从模型架构转向训练语料库的规模和质量。通过开源 ESM3 的 14 亿参数版本的权重,该公司正试图为生物数据表示设定行业标准。与此同时,生态系统中的其他参与者正在确保自己的数据管道;例如,据彭博社报道,Poolside 正在就筹集约 5 亿美元进行谈判,以将类似的基金模型原理应用于软件工程数据,这进一步说明了在特定垂直数据领域占据主导地位的竞争。

监管与数据获取的合法性

随着这些模型的规模不断扩大,数据获取的法律框架仍然是投资者关注的关键焦点。在一项对数据行业具有重要意义的裁决中,美国一家法院最近在与 Meta 的长期法律纠纷中(https://brightdata.com/blog/court-rules-in-favor-of-bright-data)支持了 Bright Data,确认抓取公共数据不违反《计算机欺诈和滥用法案》(CFAA) 或构成违约,前提是数据不在登录保护之下。这项裁决为像 EvolutionaryScale 这样依赖大规模抓取公共科学数据库来增强其专有训练集的 AI 公司提供了重要的法律保护。然而,其他方面的监管压力正在增加;欧盟委员会最近通知苹果公司,其初步认为苹果的应用商店规则违反了《数字市场法案》(https://ec.europa.eu/commission/presscorner/detail/en/ip_24_3433),这提醒我们数据看门人正面临着关于如何控制生态系统数据访问的日益严格的审查。

基础设施与许可创新

处理这些生物数据集所需的基础设施也在不断发展。Etched 最近宣布完成了一轮披露的 1.2 亿美元 A 轮融资(https://www.etched.com/announcing-etched),旨在构建用于 Transformer 模型的专用芯片,以提供下一代数据密集型物理 AI 所需的计算效率。在许可方面,Perplexity AI 推出了新的“出版商计划”(https://www.perplexity.ai/hub/blog/perplexity-publishers-program),以与包括《时代》杂志和《明镜周刊》在内的数据所有者建立收入共享模式。这一举措代表着数据-AI 市场正在走向成熟,从未经授权的抓取转向结构化的多年许可协议,为 AI 公司提供稳定、高质量的数据管道,同时补偿原始创作者。

对数据所有者的意义

对于数据所有者而言,EvolutionaryScale 的交易证明了高度专业化、非文本数据集(如基因组序列或蛋白质结构)现在是 AI 经济中最有价值的资产之一。随着基础模型向物理科学领域发展,提供清洁、结构化且合乎道德的数据以支持“物理 AI”的能力将带来高额许可费用。数据所有者应专注于审计其专有数据集的生成潜力,因为市场正迅速从简单的数据存储转向用于模型训练和微调的资产的积极许可。

d-nvest 将这些交易背后的数据资产转化为有评分、可操作的机会。

探索管道 →
EvolutionaryScale 获 1.42 亿美元融资,用于生物数据 AI | d-nvest