EvolutionaryScale haalt $142 miljoen op voor biologische "wereldmodellen"
Nvidia en Amazon steunen een seed-ronde van $142 miljoen voor het trainen van het ESM3-model op een dataset van 278 miljoen eiwitten.
EvolutionaryScale heeft een bekendgemaakte seed-financieringsronde van $142 miljoen afgesloten (https://www.forbes.com/sites/alexkonrad/2024/06/25/evolutionaryscale-raises-142-million-for-biological-ai-model/) om de ontwikkeling van AI "wereldmodellen" te versnellen die biologische systemen kunnen simuleren en engineeren. De ronde, geleid door Lux Capital, Nat Friedman en Daniel Gross, met deelname van Nvidia en Amazon, positioneert de startup aan de frontlinie van de "data-voor-biologie" wapenwedloop. Het kapitaal is bestemd voor de verfijning van ESM3, een geavanceerd taalmodel voor biologie dat 98 miljard parameters (https://www.evolutionaryscale.ai/blog/esm3-release) telt en getraind is op een enorme dataset van 278 miljoen eiwitten (https://www.evolutionaryscale.ai/blog/esm3-release).
De opkomst van biologische wereldmodellen
In tegenstelling tot traditionele generatieve AI die zich richt op tekst of pixels, bouwt EvolutionaryScale wat onderzoekers een "wereldmodel" voor de levenswetenschappen noemen. Door de genetische code als een taal te behandelen, heeft het ESM3-model de mogelijkheid aangetoond om volledig nieuwe fluorescerende eiwitten te genereren die significant afwijken van die in de natuur gevonden – effectief 500 miljoen jaar evolutie (https://www.evolutionaryscale.ai/blog/esm3-release) simulerend in een digitale omgeving. Deze capaciteit signaleert een verschuiving in de markt voor data-activa, waar de meest waardevolle datasets niet langer alleen web-gescrapte tekst zijn, maar zeer gespecialiseerde, gestructureerde biologische sequenties die gebruikt kunnen worden om materie te "programmeren".
De datalicentie-pivot: van eerlijk gebruik naar betaalde activa
De EvolutionaryScale-ronde valt samen met een bredere markttrend richting licenties voor data van hoge integriteit. Terwijl biologische data wordt getokeniseerd voor medicijnontdekking, beveiligen mediagiganten hun eigen archieven. OpenAI heeft onlangs een meerjarige contentlicentieovereenkomst (https://time.com/6992661/time-openai-partnership/) gesloten met Time Magazine, waardoor het AI-lab toegang krijgt tot meer dan 100 jaar aan journalistieke archieven. Hoewel de financiële voorwaarden niet bekend zijn gemaakt (https://www.reuters.com/technology/openai-time-strike-multi-year-content-licensing-deal-2024-06-27/), volgt de deal de bekendgemaakte benchmark van $250 miljoen (https://www.reuters.com/technology/news-corp-signs-multi-year-ai-content-deal-with-openai-2024-05-22/) die is gezet door de overeenkomst met News Corp. Op vergelijkbare wijze onderhandelt YouTube naar verluidt (https://www.ft.com/content/22759e6f-479e-41a4-9e7b-f947702f23b2) met grote platenlabels, waaronder Sony en Universal, om naar schatting multi-miljoen dollar lump sums (https://www.ft.com/content/22759e6f-479e-41a4-9e7b-f947702f23b2) aan te bieden voor legale toegang tot muziekcatalogi voor AI-training.
Regelgevende tegenwind en dataherkomst
Nu de waarde van trainingsdata explodeert, zetten regelgevers en makers zich af tegen ongeautoriseerd gebruik. Figma heeft onlangs zijn "Make Design" AI-functie (https://www.theverge.com/2024/7/1/24189917/figma-disables-ai-design-tool-apple-weather-app-copying) uitgeschakeld na beschuldigingen dat deze getraind was op bestaande app-ontwerpen, wat de juridische risico's van ondoorzichtige datapijplijnen benadrukt. Bovendien komt de gerapporteerde investering van SoftBank van $10 miljoen tot $20 miljoen (https://www.bloomberg.com/news/articles/2024-06-27/softbank-to-invest-in-search-startup-perplexity-ai/) in Perplexity AI te midden van een golf van auteursrechtinbreukmeldingen van uitgevers, wat suggereert dat zelfs snelgroeiende AI-startups nu zwaar moeten budgetteren voor dataprofessionaliteit en schikkingen. Deze trend wordt verder geïllustreerd door Harvey's geschatte financieringsronde van $100 miljoen (https://techcrunch.com/2024/06/26/legal-ai-startup-harvey-is-raising-100m-at-a-1-5b-valuation/), die de specialist in juridische data waardeert op naar schatting $1,5 miljard (https://techcrunch.com/2024/06/26/legal-ai-startup-harvey-is-raising-100m-at-a-1-5b-valuation/) – een premie gedreven door de toegang tot propriëtaire, risicovolle juridische datasets.
Waarom het ertoe doet voor data-eigenaren
De EvolutionaryScale-deal bewijst dat de meest lucratieve grens voor datamonetisatie verschuift van algemene webcontent naar "domeinspecifieke wereldmodellen". Voor data-eigenaren in biologie, recht en muziek is de markt verder gegaan dan simpele licenties naar een strategisch partnerschapsmodel waarbij de data de primaire katalysator is voor wetenschappelijke en creatieve doorbraken. Nu AI-labs zoals OpenAI en Anthropic publieke webdata uitputten, zal de premie op schone, propriëtaire en juridisch goedgekeurde datasets blijven stijgen, waardoor passieve archieven worden getransformeerd tot financiële activa met een hoog rendement.
d-nvest zet de data-activa achter deze deals om in gescoorde, bruikbare kansen.
Verken de pijplijn →