biological aiphysical aifunding rounddata licensing4 juli 2026

EvolutionaryScale haalt $142 miljoen op voor AI voor biologische data

Voormalige Meta-onderzoekers lanceren ESM3, een grensmodel getraind op 2,7 miljard eiwitsequenties om biologie te programmeren.

EvolutionaryScale heeft een bekendgemaakte seed-financieringsronde van $142 miljoen (https://www.evolutionaryscale.ai/blog/esm3-release) afgesloten, geleid door Nat Friedman, Daniel Gross en Lux Capital, om grensmodellen voor AI voor biologische data te commercialiseren. De kapitaalinjectie markeert een van de grootste seed-rondes in de geschiedenis van AI gericht op biotechnologie, wat duidt op een agressieve marktinteresse in "Physical AI" – systemen die in staat zijn de bouwstenen van de fysieke wereld te begrijpen en te manipuleren. De kern van de deal is de release van ESM3, een generatief model getraind op een eigen en publieke dataset van 2,7 miljard eiwitsequenties (https://www.evolutionaryscale.ai/blog/esm3-release), waarmee onderzoekers biologie effectief kunnen "programmeren" door miljarden jaren evolutie in een digitale omgeving te simuleren.

De Multi-Modale Voorsprong in Biologische Data-Assets

In tegenstelling tot eerdere versies van eiwit-taalmodellen, is ESM3 een multi-modaal grensmodel. Het voorspelt niet alleen de structuur; het redeneert gelijktijdig over sequentie, structuur en functie. Door een dataset van 2,7 miljard sequenties en hun bijbehorende 3D-structuren (https://www.evolutionaryscale.ai/blog/esm3-release) te verwerken, kan het model volledig nieuwe eiwitten genereren die niet in de natuur voorkomen. Deze mogelijkheid transformeert biologische data van een passief verslag van evolutie naar een actief bezit voor medicijnontdekking, koolstofafvang en materiaalkunde. Het bedrijf, opgericht door het team achter Meta's ESM-project, positioneert zich als de "OpenAI van de biologie", en biedt een versie van het model aan de wetenschappelijke gemeenschap aan, terwijl het high-capacity versies behoudt voor commerciële partnerschappen.

Physical AI en de Verschuiving in Data Monetisatie

De EvolutionaryScale-deal benadrukt een bredere trend waarbij de meest waardevolle data-assets verschuiven van door mensen gegenereerde tekst naar observaties van de fysieke wereld. Terwijl LLM's voor tekst te maken hebben met afnemende meeropbrengsten en juridische hindernissen met betrekking tot auteursrecht, biedt biologische data een enorm, onontgonnen terrein. Het ESM3-model is getraind met ongeveer 1,0 x 10^24 FLOPS aan rekenkracht (https://www.evolutionaryscale.ai/blog/esm3-release), een schaal die voorheen was voorbehouden aan top-tier algemene modellen. Deze investering onderstreept de hoge kosten – en het hoge potentiële rendement – van het trainen van modellen op gespecialiseerde, hoogwaardige fysieke data. Naarmate fysieke AI volwassener wordt, wordt verwacht dat de licentieverlening van gestructureerde biologische, chemische en robotische datasets de algemene web-gecrawlde data zal overtreffen wat betreft waarde per token.

Het Competitieve Landschap: Data Moats in Life Sciences

EvolutionaryScale betreedt een markt die momenteel wordt gedomineerd door DeepMind's AlphaFold 3, maar met een duidelijke focus op generatief ontwerp in plaats van alleen structurele voorspelling. De competitieve moat in deze sector verschuift van modelarchitectuur naar de schaal en kwaliteit van het trainingscorpus. Door de gewichten voor een versie van ESM3 met 1,4 miljard parameters open-source te maken, probeert het bedrijf de industriestandaard voor biologische data-representatie te zetten. Ondertussen beveiligen andere spelers in het ecosysteem hun eigen data-pipelines; bijvoorbeeld, Poolside zou volgens Bloomberg in gesprek zijn om naar schatting $500 miljoen op te halen om vergelijkbare fundamentele modelprincipes toe te passen op software-engineering data, wat verder de rush illustreert om specifieke verticale data-domeinen te domineren.

Regulering en de Legaliteit van Data Acquisitie

Naarmate deze modellen schalen, blijft het juridische kader voor hoe data wordt verkregen een cruciaal keerpunt voor investeerders. In een belangrijke uitspraak voor de data-industrie heeft een Amerikaanse rechtbank onlangs in het voordeel van Bright Data beslist in haar langdurige juridische strijd met Meta (https://brightdata.com/blog/court-rules-in-favor-of-bright-data), waarbij werd bevestigd dat het scrapen van publieke data niet in strijd is met de Computer Fraud and Abuse Act (CFAA) of contracten schendt wanneer de data niet achter een login zit. Deze uitspraak biedt een vitaal juridisch schild voor AI-bedrijven zoals EvolutionaryScale die afhankelijk zijn van grootschalige oogst van publieke wetenschappelijke databases om hun eigen trainingssets aan te vullen. Echter, de regelgevingsdruk neemt elders toe; de Europese Commissie heeft Apple onlangs geïnformeerd over haar voorlopige standpunt dat de regels van de App Store de Digital Markets Act (https://ec.europa.eu/commission/presscorner/detail/en/ip_24_3433) schenden, een herinnering dat data-poortwachters steeds meer onder de loep worden genomen wat betreft hoe zij de toegang tot ecosysteemdata controleren.

Infrastructuur en Licentie Innovaties

De infrastructuur die nodig is om deze biologische datasets te verwerken, evolueert ook. Etched heeft onlangs een bekendgemaakte Series A van $120 miljoen aangekondigd (https://www.etched.com/announcing-etched) om gespecialiseerde chips voor transformer-modellen te bouwen, met als doel de rekenkracht-efficiëntie te bieden die nodig is voor de volgende generatie data-intensieve fysieke AI. Op het gebied van licenties heeft Perplexity AI een nieuw "Publishers Program" gelanceerd (https://www.perplexity.ai/hub/blog/perplexity-publishers-program) om een model van inkomsten delen met data-eigenaren, waaronder Time en Der Spiegel, te creëren. Deze stap vertegenwoordigt een volwassenwording van de data-voor-AI-markt, weg van ongeautoriseerd scrapen naar gestructureerde, meerjarige licentieovereenkomsten die AI-bedrijven voorzien van stabiele, hoogwaardige data-pipelines, terwijl de oorspronkelijke makers worden gecompenseerd.

Waarom het ertoe doet voor data-eigenaren

Voor data-eigenaren bewijst de EvolutionaryScale-deal dat zeer gespecialiseerde, niet-tekstuele datasets – zoals genomische sequenties of eiwitstructuren – nu tot de meest waardevolle activa in de AI-economie behoren. Nu fundamentele modellen zich begeven naar de fysieke wetenschappen, zal het vermogen om schone, gestructureerde en ethisch verkregen data te leveren voor "Physical AI" premium licentiekosten opleveren. Data-eigenaren moeten zich richten op het auditen van hun eigen datasets op hun generatieve potentieel, aangezien de markt snel verschuift van eenvoudige data-opslag naar de actieve licentieverlening van activa voor modeltraining en fine-tuning.

d-nvest zet de data-activa achter deze deals om in gescoorde, bruikbare kansen.

Verken de pijplijn →
EvolutionaryScale haalt $142 miljoen op voor AI voor biologische data | d-nvest