Scale AI Assicura 1 Miliardo di Dollari di Serie F per Scalare il Data Engine per i Modelli Frontier
Accel guida un round massiccio che valuta il gigante dell'etichettatura dati a 13,8 miliardi di dollari mentre la domanda di set di addestramento AI di alta qualità raggiunge il picco.
Scale AI ha chiuso un round di finanziamento di Serie F da 1 miliardo di dollari, portando la sua valutazione a 13,8 miliardi di dollari (https://techcrunch.com/2024/05/21/scale-ai-raises-1-billion-at-a-13-8-billion-valuation/) mentre la corsa globale per dati di addestramento AI ad alta fedeltà raggiunge un punto critico. Il round, guidato da Accel con la partecipazione di Nvidia, Amazon e Meta, segnala una massiccia scommessa istituzionale sul 'data engine' come principale collo di bottiglia per lo sviluppo di modelli frontier. L'espansione di Scale AI arriva in un momento critico in cui l'offerta di dati pubblici di alta qualità da Internet si sta esaurendo, costringendo i laboratori AI a concentrarsi sulla generazione di dati su misura con intervento umano e su sofisticate pipeline di dati sintetici.
Il Passaggio al Licensing di Dati Premium
Il finanziamento di Scale AI è sintomatico di un più ampio pivot di mercato in cui i dati non sono più trattati come una commodity, ma come un asset strategico di alto valore. Questa tendenza è ulteriormente evidenziata dalla partnership pluriennale di News Corp con OpenAI, un accordo stimato in oltre 250 milioni di dollari (https://www.reuters.com/technology/news-corp-strikes-content-licensing-deal-with-openai-2024-05-22/) in cinque anni. Secondo l'accordo, OpenAI ottiene l'accesso ai contenuti attuali e archiviati di importanti pubblicazioni come The Wall Street Journal e The Times, fornendo le capacità di ragionamento di alto livello che solo i dati editoriali professionali possono offrire. Questa mossa suggerisce che l'era dello 'scraping gratuito' è effettivamente finita, sostituita da un mercato strutturato per la proprietà intellettuale concessa in licenza.
Infrastrutture e Capitale di Governance
Con l'aumento del volume di dati proprietari sotto gestione, l'infrastruttura per supportarli sta attirando capitali da record. CoreWeave ha recentemente ottenuto un finanziamento di debito di 7,5 miliardi di dollari (https://www.reuters.com/technology/coreweave-raises-75-bln-debt-led-by-blackstone-magnetar-2024-05-17/) per espandere la sua impronta di data center, garantendo la capacità di calcolo necessaria per elaborare questi enormi nuovi set di dati. Contemporaneamente, la governance dei dati sta diventando una tesi di investimento autonoma. Atlan ha raccolto 105 milioni di dollari di Serie C (https://atlan.com/news/series-c-funding/) per aiutare le imprese a gestire i loro 'data estate', garantendo che i dati immessi nei modelli AI siano conformi, puliti e tracciabili, un prerequisito per qualsiasi implementazione AI di livello enterprise.
L'Ascesa di Asset Dati Specializzati
Oltre agli LLM per scopi generali, i dati specializzati per l'AI verticale stanno vedendo premi di valutazione significativi. DeepL, lo specialista della traduzione linguistica, ha ottenuto un investimento di 300 milioni di dollari a una valutazione di 2 miliardi di dollari (https://www.forbes.com/sites/iainmartin/2024/05/22/deepl-the-german-ai-translation-startup-hits-2-billion-valuation-with-300-million-investment/) per raddoppiare i suoi dataset linguistici proprietari. Questo evidenzia un crescente mercato secondario per dati di 'livello esperto' che superano le capacità delle informazioni generiche raccolte dal web. Nel frattempo, la guida autonoma rimane il settore più intensivo in termini di dati, come dimostra la Serie C di Wayve da 1,05 miliardi di dollari (https://wayve.ai/news/series-c/) guidata da SoftBank, che mira a commercializzare l''Embodied AI' attraverso l'elaborazione di dati sensoriali su larga scala.
Perché è importante per i proprietari di dati
Per i proprietari di dati, gli accordi di Scale AI e News Corp confermano che siamo entrati nella 'Fase di Raccolta' dell'economia AI. Dati di alta qualità e verificati da esseri umani sono ora la risorsa più scarsa nella catena di approvvigionamento AI. I proprietari di archivi proprietari, documentazione tecnica specializzata o dati sensoriali del mondo reale non stanno più solo 'immagazzinando' informazioni; sono seduti sulla materia prima per la prossima generazione di AI sovrane e enterprise. Le strategie di monetizzazione si stanno spostando da vendite una tantum a modelli di licenza ricorrenti, in cui il valore dei dati è indicizzato alle prestazioni e ai ricavi dei modelli che addestrano.
d-nvest trasforma gli asset di dati dietro queste operazioni in opportunità valutate e attuabili.
Esplora la pipeline →