licensingai traininglitigationdata acquisition26 червня 2026 р.

OpenAI та Time уклали багаторічну угоду про ліцензування даних

Партнерство забезпечує доступ до 101 року архівних даних для навчання ШІ, зміцнюючи ринок 'плати за навчання'.

OpenAI уклала багаторічну угоду про ліцензування з журналом Time для інтеграції 101 року архівного контенту у свої генеративні моделі ШІ (https://openai.com/index/time-and-openai-partnership/). Це партнерство надає лабораторії ШІ доступ до мільйонів статей з багатої історії Time, дозволяючи її продуктам, включаючи ChatGPT, цитувати та посилатися на оригінальні матеріали, одночасно використовуючи дані для підвищення точності моделей та фактичної обґрунтованості. Хоча фінансові умови залишаються нерозголошеними, галузеві показники свідчать про те, що угода відповідає траєкторії оцінки попередньої угоди OpenAI з News Corp на суму 250 мільйонів доларів (за оцінками) (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-81014532).

Стратегічний поворот до ліцензованих архівів

Угода з Time є критично важливим елементом стратегії OpenAI щодо захисту своїх навчальних конвеєрів від юридичної та регуляторної волатильності, пов'язаної з веб-скрейпінгом. Забезпечуючи століття високоякісних, перевірених людиною даних, OpenAI фактично створює 'рів' ліцензованої інтелектуальної власності. Цей крок стосується не лише доступу до контенту; він стосується структурної цілісності активу даних. Архіви Time надають хронологічний набір даних про глобальні події, що є неоціненним для навчання моделей розуміти історичний контекст та довгострокові зміни наративів. Це відповідає ширшій тенденції, коли видавці більше не розглядають свої архіви як статичну історію, а як динамічні навчальні активи для епохи генерації.

Альтернатива судовим процесам: попередження на 1,6 мільярда доларів

Нагальність формального ліцензування підкреслюється масовим юридичним тиском, що зростає проти використання неліцензованих даних. Цього тижня Асоціація звукозаписної індустрії Америки (RIAA), що представляє таких гігантів, як Sony Music та Universal Music Group, подала знакову позовну заяву про порушення авторських прав на суму 1,6 мільярда доларів (за оцінками) проти стартапів у сфері музики ШІ Suno та Udio (https://www.reuters.com/legal/major-record-labels-sue-ai-firms-suno-udio-copyright-infringement-2024-06-24/). Позивачі вимагають відшкодування збитків у розмірі до 150 000 доларів (розголошено) за кожний порушений твір (https://www.theverge.com/2024/6/24/24184792/riaa-suno-udio-ai-music-copyright-lawsuit). Цей агресивний судовий процес слугує ринковим сигналом: ера 'скрейпінгу та вибачень' закінчується, і вартість неліцензованих даних тепер оцінюється за преміальною ціною судами.

Консолідація інфраструктури даних

Окрім ліцензування, ринок інфраструктури, орієнтованої на дані, переживає швидку консолідацію. OpenAI нещодавно придбала Rockset, компанію з розробки баз даних для пошуку та аналітики в реальному часі, за нерозголошену суму, яка оцінюється в сотні мільйонів (https://openai.com/index/openai-acquires-rockset/). Це придбання є прямою спробою покращити 'генерацію з доповненим пошуком' (RAG), дозволяючи корпоративним користувачам ефективніше індексувати власні пропрієтарні активи даних. Водночас інвестиційний ландшафт для ШІ, що інтенсивно використовує дані, залишається міцним; Etched нещодавно закрила раунд Серії А на суму 120 мільйонів доларів (розголошено) для розробки спеціалізованих чіпів, які оптимізують обробку архітектур даних на основі трансформерів (https://techcrunch.com/2024/06/25/etched-raises-120m-to-build-an-ai-chip-that-only-runs-transformers/).

Глобальне регулювання та стиснення даних

Регуляторні органи ще більше ускладнюють ландшафт придбання даних. Європейська комісія нещодавно звинуватила Apple у порушенні Закону про цифрові ринки (DMA), зокрема, націлившись на правила 'керування' технологічного гіганта, які обмежують, як розробники можуть керувати власними даними клієнтів та відносинами з ними (https://ec.europa.eu/commission/presscorner/detail/en/ip_24_3433). Оскільки регулятори посилюють контроль над портативністю даних та замкненістю екосистем, цінність 'первинних' ліцензованих даних, таких як архіви Time, лише зростає. Компанії, які володіють своїми конвеєрами даних та мають чіткі юридичні права на свої навчальні набори, опиняються в значній конкурентній перевазі в поточних капітальних умовах.

Чому це важливо для власників даних

Для інституційних власників даних угода OpenAI-Time та паралельні судові процеси RIAA підтверджують, що високоякісні, структуровані набори даних є найціннішим товаром у ланцюжку постачання ШІ. Ми рухаємося до біфуркованого ринку: високоцінного 'білого ринку' для ліцензованих, чистих даних та високоризикованого 'сірого ринку' для зібраного контенту. Власники даних повинні надавати пріоритет курації та юридичному аудиту своїх архівів, оскільки модель ліцензування 'єдиним платежем', започаткована YouTube та OpenAI, стає стандартним виходом для пропрієтарних контентних активів. Оцінка ваших даних більше не прив'язана до кількості переглядів, а до їх корисності як фундаментальної навчальної ваги.

d-nvest перетворює активи даних, що стоять за цими угодами, на оцінені, дієві можливості.

Дослідити конвеєр →