Scale AI Assicura 1 Miliardo di Dollari nella Serie F a una Valutazione di 13,8 Miliardi di Dollari
Il round guidato da Accel posiziona Scale AI come la principale 'Data Foundry' per lo sviluppo di modelli AI all'avanguardia.
Scale AI ha finalizzato un round di finanziamento di Serie F da 1 miliardo di dollari (https://scale.com/blog/series-f) che eleva la sua valutazione post-money a un importo dichiarato di 13,8 miliardi di dollari (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation). Guidato da Accel con una significativa partecipazione di Nvidia, Amazon e Meta, il round segnala un massiccio pivot di capitale verso il 'collo di bottiglia dei dati' che attualmente affrontano i maggiori sviluppatori di Large Language Model (LLM). Mentre l'industria si muove oltre l'era dello 'scraping del web aperto', la missione di Scale AI di costruire una 'Data Foundry' rappresenta l'investimento più significativo fino ad oggi nella creazione di asset di dati etichettati da esperti e ad alta densità per l'IA sovrana e aziendale.
L'Industrializzazione dei Dati AI
L'iniezione di 1 miliardo di dollari (https://scale.com/blog/series-f) non è semplicemente un round di crescita; è una mossa infrastrutturale. Scale AI si sta posizionando come la raffineria essenziale per la materia prima del XXI secolo. Il finanziamento sarà utilizzato per scalare il loro 'Data Engine', che fornisce il Reinforcement Learning from Human Feedback (RLHF) necessario per spingere i modelli oltre gli attuali plateau di ragionamento. Con investitori come Cisco Investments, Intel Capital e AMD Ventures (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation) che si uniscono alla cap table, l'accordo sottolinea un consenso intersettoriale: la prossima generazione di prestazioni AI sarà vinta attraverso la qualità dei dati, non solo il volume di calcolo.
Accordi di Licenza Raggiungono il Picco
Il round di Scale AI coincide con un'ondata senza precedenti di accordi di acquisizione dati diretti tra costruttori di modelli e proprietari di contenuti premium. In particolare, News Corp ha firmato un accordo pluriennale con OpenAI (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d) del valore di circa 250 milioni di dollari in cinque anni (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d). Questa partnership concede a OpenAI l'accesso agli archivi e ai contenuti attuali di The Wall Street Journal, Barron’s e The Times, segnando un chiaro spostamento verso dataset autorizzati e di alta autorità. Allo stesso modo, la partnership di OpenAI con Reddit (https://openai.com/index/openai-and-reddit-partnership/) fornisce accesso in tempo reale all'API dei dati di Reddit, consentendo l'integrazione di dati conversazionali incentrati sull'uomo in ChatGPT e altri prodotti.
Capitalizzare sui Dati Incarnati e Specializzati
Oltre agli LLM basati su testo, il mercato degli asset di dati specializzati sta vedendo massicci afflussi di capitale. Wayve ha recentemente assicurato 1,05 miliardi di dollari (https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/) in un round di Serie C guidato da SoftBank per sviluppare 'Embodied AI' per la guida autonoma. Questo accordo evidenzia il premio posto sui 'dati edge' – informazioni sensoriali del mondo reale che non possono essere replicate dalla sola generazione sintetica. A supporto di questo ecosistema ricco di dati, CoreWeave ha raccolto 1,1 miliardi di dollari (https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/) per espandere la sua infrastruttura cloud specializzata, progettata specificamente per gestire l'enorme throughput richiesto per i carichi di lavoro di addestramento AI intensivi sui dati.
Il Contrattacco Normativo e dei Diritti
Mentre il valore degli asset di dati sale alle stelle, i titolari dei diritti si muovono aggressivamente per proteggere la loro proprietà intellettuale. Sony Music Group ha emesso un avvertimento formale a oltre 700 aziende AI (https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/), dichiarando un esplicito 'opt-out' dallo scraping non autorizzato di dati per l'addestramento AI. Questo segue una serie di accordi di licenza, come l'accordo di OpenAI con Vox Media (https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt) e The Atlantic (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/), suggerendo che l'era del 'fair use' per i dati di addestramento viene rapidamente sostituita da un mercato strutturato e multimiliardario per i diritti sui contenuti.
Perché è importante per i proprietari di dati
Per i proprietari di dati istituzionali, la valutazione di Scale AI e l'accordo News Corp confermano che i dataset proprietari non sono più asset secondari: sono la leva principale nell'economia dell'IA. La transizione da accordi di licenza da 250 milioni di dollari a round di finanziamento da 1 miliardo di dollari per le raffinerie di dati indica che i 'dati puliti ed etichettati da esperti' sono ora una classe di asset distinta. I proprietari di dati unici, ad alta velocità o storicamente profondi dovrebbero dare priorità alla governance dei dati e alla 'AI-readiness' per catturare le valutazioni premium ora stabilite dai maggiori attori del mercato.
d-nvest trasforma gli asset di dati dietro queste operazioni in opportunità valutate e attuabili.
Esplora la pipeline →