EvolutionaryScale залучила $142 млн для моделей ШІ на біологічних даних
Колишні дослідники Meta очолили посівний раунд для ліцензування та масштабування моделей дизайну білків ESM-3 для розробки ліків.
EvolutionaryScale залучила $142 мільйони (https://www.reuters.com/technology/ai-startup-evolutionaryscale-raises-142-million-with-backing-amazon-nvidia-2024-06-17/) у рамках оголошеного раунду початкового фінансування для прискорення розробки генеративних ШІ-моделей для біології, що знаменує ключовий момент для монетизації спеціалізованих наукових даних. Стартап, очолюваний колишніми дослідниками Meta AI, запускає ESM-3, передову мовну модель, навчену на пропрієтарному наборі даних, що містить 2,78 мільярда білків (https://techcrunch.com/2024/06/17/evolutionaryscale-seed-biological-ai/). У раунді взяли участь такі титани індустрії, як NVentures (Nvidia) та Amazon Web Services (AWS), що свідчить про стратегічний зсув у бік високоточних, доменно-специфічних даних як наступного основного драйвера оцінки ШІ.
Фронтир біологічних даних: ESM-3 та $142 млн початкового фінансування
Основна ціннісна пропозиція EvolutionaryScale полягає в його здатності симулювати мільярди років біологічної еволюції за допомогою даних. Оголошені інвестиції в розмірі $142 мільйонів (https://www.bloomberg.com/news/articles/2024-06-17/ex-meta-scientists-raise-142-million-for-biological-ai-startup) оцінюють компанію приблизно в $1 мільярд (https://www.reuters.com/technology/ai-startup-evolutionaryscale-raises-142-million-with-backing-amazon-nvidia-2024-06-17/), що відображає високу премію, яку отримує модель ESM-3 з її 98 мільярдами параметрів. На відміну від загальних LLM, ESM-3 навчена на структурованих біологічних послідовностях, що дозволяє їй генерувати абсолютно нові білки, які не існують у природі. Ця можливість «програмованої біології» побудована на придбанні та обробці величезних геномних та протеомних наборів даних, які компанія має намір ліцензувати фармацевтичним гігантам для розробки ліків та екологічної інженерії.
Інфраструктура як носій: гра KKR на $50 млрд
У той час як EvolutionaryScale зосереджується на рівні інтелекту даних, фізична інфраструктура, необхідна для обробки таких активів, бачить безпрецедентні припливи капіталу. KKR та Energy Capital Partners (ECP) оголосили про стратегічне партнерство на $50 мільярдів (https://www.reuters.com/business/energy/kkr-energy-capital-partners-form-50-bln-strategic-partnership-ai-2024-06-17/) для прискорення розвитку центрів обробки даних та енергетичної інфраструктури. Це оголошене багаторічне зобов'язання вирішує «вузьке місце» економіки даних: величезні енергетичні потреби кластерів для навчання ШІ. Для власників даних ця інфраструктурна хвиля гарантує, що ліквідність та обчислювальні потужності для великомасштабних наборів даних залишатимуться стабільними, навіть коли складність моделей експоненційно зростає.
Європейський суверенітет та «рів даних» Mistral
Глобальний ринок даних також формується регіональними чемпіонами, які прагнуть до «суверенітету даних». Паризька Mistral AI нещодавно закрила раунд Серії B на суму 600 мільйонів євро (640 мільйонів доларів США) (https://techcrunch.com/2024/06/11/mistral-ai-raises-600-million-at-a-5-8-billion-valuation/) з оголошеною оцінкою в 5,8 мільярда євро (https://www.ft.com/content/88d68994-633b-419b-9c71-f76e736a617c). Стратегія Mistral значною мірою спирається на куровані, багатомовні набори даних, які пропонують конкурентну альтернативу моделям, орієнтованим на США. Забезпечивши масивне фінансування від таких інвесторів, як General Catalyst та Lightspeed, Mistral позиціонує себе як лідера на європейському ринку ліцензування корпоративних даних, де місцеве регулювання та конфіденційність даних мають першочергове значення.
Регуляторні перешкоди: європейська даних імпас Meta
Однак придбання даних для навчання ШІ стикається з посиленим регуляторним контролем. Meta Platforms була змушена призупинити свої плани щодо використання даних європейських користувачів Facebook та Instagram для навчання своїх ШІ-моделей після запиту від Ірландської комісії із захисту даних. Цей крок, спричинений скаргами правозахисної групи NOYB, підкреслює зростаючий розрив у доступності даних. У той час як американські та азійські компанії можуть продовжувати збирати величезні загальнодоступні набори даних, європейські компанії повинні орієнтуватися в ландшафті «згода перш за все», що потенційно може підвищити ринкову ціну на юридично сумісні, ліцензовані набори даних.
Чому це важливо для власників даних
Угоди EvolutionaryScale та KKR підкреслюють фундаментальний зсув у ланцюжку створення вартості ШІ: перехід від алгоритмічної переваги до переваги даних та енергії. Для власників пропрієтарних наборів даних — чи то в біології, фінансах, чи праві — запуск ESM-3 доводить, що спеціалізовані дані можуть мати оцінку в мільярди доларів незалежно від загальних LLM. Оскільки обчислювальна інфраструктура розширюється завдяки угодам на 50 мільярдів доларів, а в Європі зростають регуляторні бар'єри, дефіцит високоякісних, «чистих» даних, ймовірно, стимулюватиме нову хвилю високоцінних ліцензійних угод. Дані більше не є просто вхідним ресурсом; це основний капітальний актив економіки інтелекту 2026 року.
d-nvest перетворює активи даних, що стоять за цими угодами, на оцінені, дієві можливості.
Дослідити конвеєр →