Scale AI залучила $1 млрд у раунді серії F з оцінкою $13,8 млрд
Раунд під керівництвом Accel позиціонує Scale AI як основну 'фабрику даних' для розробки передових моделей ШІ.
Scale AI завершила раунд фінансування серії F на суму $1 мільярд (https://scale.com/blog/series-f), що підвищило її оцінку після залучення коштів до заявлених $13,8 мільярда (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation). Раунд, очолюваний Accel за значної участі Nvidia, Amazon та Meta, сигналізує про масовий перехід капіталу до 'вузького місця даних', з яким наразі стикаються найбільші розробники великих мовних моделей (LLM). Оскільки галузь виходить за межі ери 'парсингу відкритих веб-даних', місія Scale AI зі створення 'фабрики даних' представляє собою найзначнішу інвестицію на сьогоднішній день у створення експертно маркованих, високощільних даних для суверенного та корпоративного ШІ.
Індустріалізація даних для ШІ
Ін'єкція $1 мільярда (https://scale.com/blog/series-f) — це не просто раунд зростання; це інвестиція в інфраструктуру. Scale AI позиціонує себе як необхідний переробний завод для сировини 21-го століття. Фінансування буде використано для масштабування їхнього 'рушія даних', який забезпечує навчання з підкріпленням на основі зворотного зв'язку від людини (RLHF), необхідне для подолання поточних плато продуктивності моделей. З такими інвесторами, як Cisco Investments, Intel Capital та AMD Ventures (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation), що приєдналися до списку акціонерів, угода підкреслює консенсус між галузями: наступне покоління продуктивності ШІ буде виграно за рахунок якості даних, а не лише обсягу обчислень.
Ліцензійні угоди досягають піку
Раунд Scale AI збігається з безпрецедентною хвилею прямих угод з придбання даних між розробниками моделей та власниками преміум-контенту. Найбільш помітно, що News Corp підписала багаторічну угоду з OpenAI (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d) на суму приблизно $250 мільйонів протягом п'яти років (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d). Це партнерство надає OpenAI доступ до архівів та поточного контенту The Wall Street Journal, Barron’s та The Times, що знаменує чіткий зсув у бік ліцензованих, високоавторитетних наборів даних. Аналогічно, партнерство OpenAI з Reddit (https://openai.com/index/openai-and-reddit-partnership/) надає доступ у реальному часі до Reddit Data API, дозволяючи інтегрувати дані людських розмов у ChatGPT та інші продукти.
Використання втілених та спеціалізованих даних
Окрім текстових LLM, ринок спеціалізованих наборів даних спостерігає масові припливи капіталу. Wayve нещодавно залучила $1,05 мільярда (https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/) у раунді серії C під керівництвом SoftBank для розробки 'втіленого ШІ' для автономного водіння. Ця угода підкреслює премію, що надається 'периферійним даним' — сенсорній інформації з реального світу, яку неможливо відтворити лише синтетичною генерацією. Підтримуючи цю екосистему, багату на дані, CoreWeave залучила $1,1 мільярда (https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/) для розширення своєї спеціалізованої хмарної інфраструктури, розробленої спеціально для обробки величезної пропускної здатності, необхідної для інтенсивних тренувальних навантажень ШІ.
Регуляторний та правовий відгук
Оскільки вартість наборів даних стрімко зростає, правовласники активно захищають свою інтелектуальну власність. Sony Music Group видала офіційне попередження понад 700 компаніям ШІ (https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/), оголосивши про явний 'відмову' від несанкціонованого парсингу даних для навчання ШІ. Це слідує за низкою ліцензійних угод, таких як угода OpenAI з Vox Media (https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt) та The Atlantic (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/), що свідчить про те, що ера 'добросовісного використання' для навчальних даних швидко замінюється структурованим багатомільярдним ринком прав на контент.
Чому це важливо для власників даних
Для інституційних власників даних оцінка Scale AI та угода News Corp підтверджують, що пропрієтарні набори даних більше не є другорядними активами — вони є основним важелем у економіці ШІ. Перехід від ліцензійних угод на $250 мільйонів до раундів фінансування на $1 мільярд для переробних заводів даних вказує на те, що 'чисті, експертно марковані дані' тепер є окремим класом активів. Власникам унікальних, високошвидкісних або історично глибоких даних слід надавати пріоритет управлінню даними та 'готовності до ШІ', щоб отримати преміальні оцінки, які зараз встановлюються найбільшими гравцями ринку.
d-nvest перетворює активи даних, що стоять за цими угодами, на оцінені, дієві можливості.
Дослідити конвеєр →