Scale AI залучила $1 млрд у рамках раунду Серії F для масштабування свого Data Engine для передових моделей
Accel очолив масштабний раунд, оцінивши гіганта з маркування даних у $13,8 млрд, оскільки попит на високоякісні набори даних для навчання ШІ досягає піку.
Scale AI закрила раунд фінансування Серії F на суму $1 мільярд, підвищивши свою оцінку до заявлених $13,8 мільярда (https://techcrunch.com/2024/05/21/scale-ai-raises-1-billion-at-a-13-8-billion-valuation/) на тлі глобальної гонки за високоякісними даними для навчання ШІ, яка досягла апогею. Раунд, очолюваний Accel за участю Nvidia, Amazon та Meta, свідчить про масивну інституційну ставку на «data engine» як основний вузький прохід для розробки передових моделей. Розширення Scale AI відбувається в критичний момент, коли пропозиція високоякісних даних з відкритого інтернету наближається до вичерпання, змушуючи ШІ-лабораторії переходити до індивідуального створення даних за участю людини та складних конвеєрів синтетичних даних.
Перехід до ліцензування преміум-даних
Фінансування Scale AI є симптомом ширшого ринкового зсуву, де дані більше не розглядаються як товар, а як високоцінний стратегічний актив. Ця тенденція додатково підтверджується істотною багаторічною партнерською угодою News Corp з OpenAI, вартість якої оцінюється більш ніж у $250 мільйонів (https://www.reuters.com/technology/news-corp-strikes-content-licensing-deal-with-openai-2024-05-22/) протягом п'яти років. Згідно з угодою, OpenAI отримує доступ до поточного та архівного контенту від провідних видань, таких як The Wall Street Journal та The Times, забезпечуючи високі можливості для аналізу, які можуть надати лише професійні редакційні дані. Цей крок свідчить про те, що ера «безкоштовного скрейпінгу» фактично закінчилася, поступившись місцем структурованому ринку ліцензованої інтелектуальної власності.
Інфраструктура та капітал для управління даними
Зі зростанням обсягів пропрієтарних даних під управлінням, інфраструктура для їх підтримки приваблює рекордні обсяги капіталу. CoreWeave нещодавно залучила заявлені $7,5 мільярда боргового фінансування (https://www.reuters.com/technology/coreweave-raises-75-bln-debt-led-by-blackstone-magnetar-2024-05-17/) для розширення своєї мережі центрів обробки даних, забезпечуючи обчислювальні потужності для обробки цих величезних нових наборів даних. Водночас управління даними стає самостійною інвестиційною тезою. Atlan залучив заявлені $105 мільйонів у рамках Серії C (https://atlan.com/news/series-c-funding/) для допомоги підприємствам у керуванні їхніми «даними», забезпечуючи відповідність, чистоту та відстежуваність даних, що подаються в моделі ШІ — передумова для будь-якого розгортання ШІ корпоративного рівня.
Зростання спеціалізованих даних
Окрім загальних LLM, спеціалізовані дані для вертикального ШІ бачать значні премії в оцінці. DeepL, спеціаліст з перекладу мов, залучив заявлені $300 мільйонів інвестицій при оцінці в $2 мільярди (https://www.forbes.com/sites/iainmartin/2024/05/22/deepl-the-german-ai-translation-startup-hits-2-billion-valuation-with-300-million-investment/) для подвоєння своїх пропрієтарних лінгвістичних наборів даних. Це підкреслює зростаючий вторинний ринок «експертних» даних, які перевищують можливості загальних даних, зібраних з Інтернету. Тим часом, автономне водіння залишається найбільш ресурсомістким вертикальним напрямком, що ілюструється заявленими $1,05 мільярда Серії C від Wayve (https://wayve.ai/news/series-c/) під керівництвом SoftBank, яка має на меті комерціалізувати «Embodied AI» шляхом обробки даних з датчиків у величезних масштабах.
Чому це важливо для власників даних
Для власників даних угоди Scale AI та News Corp підтверджують, що ми вступили у «Фазу збору врожаю» економіки ШІ. Високоякісні, перевірені людьми дані є найдефіцитнішим ресурсом у ланцюжку постачання ШІ. Власники пропрієтарних архівів, спеціалізованої технічної документації або даних з датчиків реального світу більше не просто «зберігають» інформацію; вони володіють сировиною для наступного покоління суверенного та корпоративного ШІ. Стратегії монетизації зміщуються від одноразових продажів до моделей повторного ліцензування, де вартість даних індексується до продуктивності та доходу моделей, які вони навчають.
d-nvest перетворює активи даних, що стоять за цими угодами, на оцінені, дієві можливості.
Дослідити конвеєр →