licensingopenaidata acquisitionmedia deals2026年6月27日

OpenAI 与 Time 达成多年数据许可协议

OpenAI 获得 101 年 Time 杂志档案数据访问权,用于优化 ChatGPT 和训练下一代模型。

OpenAI 已正式与《时代》杂志达成一项多年版权许可协议,使这家人工智能巨头能够访问超过 101 年的存档报道,以优化其生成模型并增强 ChatGPT 的实时响应能力。尽管具体的财务条款尚未披露,但行业基准表明,该协议的估值轨迹与 OpenAI 此前与新闻集团(News Corp)达成的 2.5 亿美元(https://www.cnbc.com/2024/05/22/news-corp-strikes-multiyear-deal-with-openai.html)多年合作协议类似。此次对优质编辑数据的最新收购,允许 OpenAI 在适当引用和链接的情况下展示《时代》杂志的新闻报道,同时利用其长达一个世纪的数据库进行后端模型训练。

战略性转向许可编辑资产

与《时代》杂志的合作并非孤例,而是 OpenAI 规避法律风险并确保高保真数据来源的核心支柱。通过许可可追溯至 1923 年的档案数据,OpenAI 实际上是在购买一份精心策划的 20 世纪和 21 世纪历史记录。此举紧随其后的是一系列类似的高风险收购,包括与 Vox Media 和《大西洋月刊》的交易,以及与 Axel Springer 和《世界报》等国际出版商的合作。随着人工智能开发者面临着摆脱导致大规模版权诉讼的未经授权的网络抓取实践的巨大压力,经过验证、由人类撰写的数据市场已达到白热化程度。

对《时代》杂志而言,这项协议是其历史资产的关键货币化途径。该出版物将获得 OpenAI 技术的使用权,以开发新的读者工具,这标志着传统媒体与人工智能基础设施之间更深层次的融合。这种趋势在市场其他地方也有体现;例如,软银最近向 Tempus AI 投资了 2 亿美元(https://www.bloomberg.com/news/articles/2024-06-24/softbank-invests-200-million-in-ai-medical-firm-tempus-ai),这是一家专注于利用海量临床数据驱动精准医疗的公司。无论是在新闻业还是医疗保健领域,底层数据集的价值现在是资本配置的主要驱动力。

法律压力与免费抓取时代的终结

OpenAI 此次大规模许可行动的紧迫性,体现在日益严峻的法律环境。就在本周,包括索尼音乐和环球音乐集团在内的全球最大唱片公司,对人工智能音乐初创公司 Suno 和 Udio 提起了重大诉讼,指控它们未经授权使用受版权保护的录音来训练其系统。这些唱片公司正在为每项侵权作品寻求高达 150,000 美元(https://www.reuters.com/legal/major-record-labels-sue-ai-firms-suno-udio-over-copyright-infringement-2024-06-24/)的赔偿。这场诉讼凸显了那些依赖“合理使用”原则进行大规模数据摄取而无需付费的人工智能公司所面临的生存威胁。

与此同时,基础设施提供商正在进行大规模融资,以支持这些许可数据集的处理。Etched,一家专业芯片制造商,已完成 1.2 亿美元(https://techcrunch.com/2024/06/25/etched-raises-120m-to-build-a-chip-that-only-runs-transformer-models/)的 A 轮融资,用于构建专门用于更高效运行 Transformer 模型的硬件。随着行业的成熟,焦点正从通用计算能力转向能够从 OpenAI-Time 协议等交易解锁的特定、高质量数据孤岛中提取最大价值的专用系统。

全球监管壁垒收紧

监管环境也正在推动一种更透明的数据获取方式。欧盟的《人工智能法案》正朝着全面实施迈进,要求通用人工智能模型的开发者提供用于训练的数据的详细摘要。这一透明度要求使得公司越来越难以隐藏使用抓取或盗版内容的行为。在此背景下,直接许可协议不仅是一种内容策略,更是一种合规必需。

市场正在出现“干净”模型(使用许可数据训练)和继续依赖有争议的抓取数据的“高风险”模型之间的分化。投资者显然更青睐前者,正如《华尔街日报》报道的苹果和 Meta 之间关于将 Meta 的 Llama 模型集成到 Apple Intelligence 中的潜在合作讨论所证明的那样——这项交易很可能需要严格的数据来源保证,以满足苹果的隐私和法律标准。

这对数据所有者意味着什么

OpenAI 与《时代》杂志的交易证实,“数据即资产”的时代已从理论走向了数百万美元的现实。对于专有数据集的所有者——无论是历史档案、临床记录还是技术文档——当前市场都提供了一个独特的窗口来将其沉睡的资产货币化。随着人工智能开发者耗尽高质量的公共网络数据供应,独家、经过人类验证且法律清晰的数据集的溢价将持续上涨。数据所有者应将他们的档案视为不仅是过去的记录,更是下一代工业和消费者智能的必备燃料。

d-nvest 将这些交易背后的数据资产转化为有评分、可操作的机会。

探索管道 →
OpenAI 与 Time 达成多年数据许可协议 | d-nvest