biological aidata licensingfunding roundworld models1 липня 2026 р.

EvolutionaryScale залучила $142 млн на "світові моделі" для біології

Nvidia та Amazon підтримали посівний раунд на $142 млн для тренування моделі ESM3 на датасеті з 278 мільйонів білків.

EvolutionaryScale закрила оголошений посівний раунд фінансування на суму $142 мільйони (https://www.forbes.com/sites/alexkonrad/2024/06/25/evolutionaryscale-raises-142-million-for-biological-ai-model/) для прискорення розробки "світових моделей" на базі ШІ, здатних симулювати та інженерно створювати біологічні системи. Раунд, очолюваний Lux Capital, Nat Friedman та Daniel Gross, за участю Nvidia та Amazon, ставить стартап на передову "гонки озброєнь" у сфері даних для біології. Капітал призначений для вдосконалення ESM3, передової мовної моделі для біології, яка має 98 мільярдів параметрів (https://www.evolutionaryscale.ai/blog/esm3-release) і була навчена на масивному датасеті з 278 мільйонів білків (https://www.evolutionaryscale.ai/blog/esm3-release).

Зростання біологічних "світових моделей"

На відміну від традиційного генеративного ШІ, який зосереджується на тексті чи пікселях, EvolutionaryScale створює те, що дослідники називають "світовою моделлю" для наук про життя. Розглядаючи генетичний код як мову, модель ESM3 продемонструвала здатність генерувати абсолютно нові флуоресцентні білки, які суттєво відрізняються від природних — ефективно симулюючи 500 мільйонів років еволюції (https://www.evolutionaryscale.ai/blog/esm3-release) у цифровому середовищі. Ця можливість сигналізує про зміну на ринку даних, де найціннішими датасетами стають не просто зібрані з вебу тексти, а високоспеціалізовані, структуровані біологічні послідовності, які можна використовувати для "програмування" матерії.

Перехід до ліцензування даних: від добросовісного використання до платних активів

Раунд EvolutionaryScale збігається з ширшим ринковим зсувом у бік ліцензування даних високої цілісності. Поки біологічні дані токенізуються для відкриття ліків, медіагіганти забезпечують власні архіви. OpenAI нещодавно підписала багаторічну угоду про ліцензування контенту (https://time.com/6992661/time-openai-partnership/) з Time Magazine, надавши ШІ-лабораторії доступ до понад 100 років журналістських архівів. Хоча фінансові умови залишаються нерозголошеними (https://www.reuters.com/technology/openai-time-strike-multi-year-content-licensing-deal-2024-06-27/), угода слідує за оголошеним орієнтиром у $250 мільйонів (https://www.reuters.com/technology/news-corp-signs-multi-year-ai-content-deal-with-openai-2024-05-22/), встановленим угодою News Corp. Аналогічно, YouTube веде переговори (https://www.ft.com/content/22759e6f-479e-41a4-9e7b-f947702f23b2) з великими музичними лейблами, включаючи Sony та Universal, щоб запропонувати оціночні одноразові виплати в розмірі кількох мільйонів доларів (https://www.ft.com/content/22759e6f-479e-41a4-9e7b-f947702f23b2) за легальний доступ до музичних каталогів для тренування ШІ.

Регуляторні перешкоди та походження даних

Зі стрімким зростанням вартості тренувальних даних регулятори та творці виступають проти несанкціонованого використання. Figma нещодавно вимкнула свою функцію ШІ "Make Design" (https://www.theverge.com/2024/7/1/24189917/figma-disables-ai-design-tool-apple-weather-app-copying) після звинувачень у тому, що вона була навчена на існуючих дизайнах додатків, що підкреслює юридичні ризики непрозорих конвеєрів даних. Крім того, інвестиції SoftBank у розмірі від $10 до $20 мільйонів (https://www.bloomberg.com/news/articles/2024-06-27/softbank-to-invest-in-search-startup-perplexity-ai/) у Perplexity AI відбуваються на тлі шквалу повідомлень про порушення авторських прав від видавців, що свідчить про те, що навіть швидкозростаючі ШІ-стартапи тепер повинні значно виділяти кошти на відповідність даних та врегулювання. Ця тенденція додатково підтверджується оціночним раундом фінансування Harvey у розмірі $100 мільйонів (https://techcrunch.com/2024/06/26/legal-ai-startup-harvey-is-raising-100m-at-a-1-5b-valuation/), який оцінює спеціаліста з юридичних даних у приблизно $1,5 мільярда (https://techcrunch.com/2024/06/26/legal-ai-startup-harvey-is-raising-100m-at-a-1-5b-valuation/) — премія, зумовлена його доступом до пропрієтарних, високоризикових юридичних датасетів.

Чому це важливо для власників даних

Угода EvolutionaryScale доводить, що найприбутковішим напрямком для монетизації даних є перехід від загального веб-контенту до "доменно-специфічних світових моделей". Для власників даних у галузях біології, права та музики ринок вийшов за межі простого ліцензування до моделі стратегічного партнерства, де дані є основним каталізатором наукових та творчих проривів. Оскільки ШІ-лабораторії, такі як OpenAI та Anthropic, вичерпують загальнодоступні веб-дані, премія за чисті, пропрієтарні та юридично затверджені датасети продовжуватиме зростати, перетворюючи пасивні архіви на високоприбуткові фінансові активи.

d-nvest перетворює активи даних, що стоять за цими угодами, на оцінені, дієві можливості.

Дослідити конвеєр →