EvolutionaryScale raccoglie 142 milioni di dollari per scalare modelli di dati biologici per l'IA
Il round seed, guidato da Nat Friedman e Daniel Gross, mira alla monetizzazione di massicci set di dati biologici.
EvolutionaryScale ha finalizzato un round di finanziamento seed da 142 milioni di dollari (https://www.bloomberg.com/news/articles/2024-06-18/ai-startup-evolutionaryscale-raises-142-million-to-design-proteins) per commercializzare il suo modello ESM3, un'IA basata su transformer addestrata su un set di dati proprietario di 278 milioni di sequenze proteiche. Il round, guidato da Nat Friedman, Daniel Gross e Lux Capital (https://techcrunch.com/2024/06/18/evolutionaryscale-raises-142m-from-nat-friedman-daniel-gross-and-lux-capital-to-pioneer-generative-ai-for-biology/), posiziona la startup come un attore principale nella corsa all'applicazione di architetture di large language model (LLM) ad asset di dati biologici, un settore precedentemente dominato da AlphaFold di DeepMind.
La posta in gioco degli asset di dati biologici
Il valore fondamentale di EvolutionaryScale risiede nel suo modello ESM3, addestrato utilizzando circa 1 trilione di teraflops di potenza di calcolo, un investimento massiccio nell'elaborazione di dati di sequenze biologiche (https://www.evolutionaryscale.ai/blog/esm3-release). A differenza degli LLM generici addestrati su testo raccolto dal web, gli asset di EvolutionaryScale sono costruiti su dati genomici e proteomici ad alta fedeltà. Questa mossa segnala una tendenza di mercato più ampia in cui le valutazioni più elevate si stanno spostando verso aziende che possiedono o curano set di dati specializzati e non pubblici. Trattando il codice genetico come un linguaggio, EvolutionaryScale sta effettivamente creando un nuovo mercato per la progettazione di proteine sintetiche, dove i "dati" sono il set di istruzioni per la vita stessa.
Sovranità dei dati aziendali: il patto HPE-Nvidia
Mentre EvolutionaryScale si concentra sui dati biologici, il mercato aziendale più ampio sta virando verso il controllo dei dati localizzato. Hewlett Packard Enterprise (HPE) e Nvidia hanno recentemente lanciato "NVIDIA AI Computing by HPE" (https://www.hpe.com/us/en/newsroom/press-release/2024/06/hpe-and-nvidia-announce-nvidia-ai-computing-by-hpe-to-accelerate-the-generative-ai-industrial-revolution.html), una soluzione co-sviluppata progettata per consentire alle aziende di addestrare modelli di IA sui propri data silo privati. Questa partnership risponde alla crescente domanda di "Private AI", dove gli asset di dati non lasciano mai il firewall aziendale. Mentre la capitalizzazione di mercato di Nvidia ha raggiunto i 3,34 trilioni di dollari (https://www.reuters.com/technology/nvidia-set-overtake-microsoft-worlds-most-valuable-company-2024-06-18/) questa settimana, l'attenzione si è spostata dalla semplice vendita di hardware all'infrastruttura dati sottostante che alimenta questi modelli su scala industriale.
Precedenti legali nello scraping e nella licenza dei dati
La valutazione degli asset di dati è anche plasmata da nuovi confini legali. In una sentenza storica, un giudice statunitense si è recentemente schierato con Bright Data nella sua battaglia legale contro Meta (https://www.reuters.com/legal/meta-loses-bid-block-bright-data-scraping-its-sites-2024-06-18/), concludendo che lo scraping di dati pubblicamente accessibili non viola i termini di servizio di Meta. Questa decisione è una vittoria fondamentale per i marketplace e gli aggregatori di dati, rafforzando la legalità della raccolta di dati pubblici per l'addestramento dell'IA. Contemporaneamente, il Medio Oriente sta emergendo come hub per gli investimenti in dati sovrani, come dimostra l'accordo tra Etisalat (e&) e AWS per un investimento di 2 miliardi di dollari (https://www.reuters.com/technology/etisalat-aws-invest-2-bln-uae-cloud-expansion-2024-06-17/) per espandere le capacità cloud e dati IA negli Emirati Arabi Uniti nel prossimo decennio.
Acquisizioni strategiche nell'intelligenza dei dati cloud
Il consolidamento nel settore dei dati continua mentre i principali attori si muovono per acquisire strati di intelligenza specializzati. Nvidia starebbe acquisendo Shoreline.io per circa 100 milioni di dollari (https://www.bloomberg.com/news/articles/2024-06-17/nvidia-is-said-to-acquire-software-startup-shoreline). La tecnologia di Shoreline si concentra sull'automazione della risposta agli incidenti negli ambienti cloud, fornendo a Nvidia un ricco flusso di dati operativi per ottimizzare la gestione dei data center guidata dall'IA. Questo segue uno schema di "acqui-hiring" e acquisizioni di asset di dati intese a rafforzare l'affidabilità dei massicci cluster richiesti per l'addestramento di modelli di prossima generazione.
Perché è importante per i proprietari di dati
Per i proprietari di dati, il round di EvolutionaryScale e la sentenza di Bright Data sottolineano due percorsi divergenti ma redditizi: la monetizzazione di set di dati proprietari iper-specializzati e la continua vitalità dell'aggregazione di dati pubblici. Con la crescente domanda aziendale di "Private AI" tramite l'alleanza HPE-Nvidia, il premio per asset di dati puliti, etichettati e conformi alla legge non è mai stato così alto. I proprietari di set di dati unici in biologia, finanza e operazioni industriali sono ora posizionati come i decisori finali in un'economia IA che ha superato l'era del "compute-first" per entrare in una realtà "data-first".
d-nvest trasforma gli asset di dati dietro queste operazioni in opportunità valutate e attuabili.
Esplora la pipeline →