Scale AI haalt $1 miljard Series F op om Data Engine voor Frontier Modellen te schalen
Accel leidt massale ronde met waardering van datalabelgigant op $13,8 miljard nu de vraag naar hoogwaardige AI-trainingssets piekt.
Scale AI heeft een Series F-financieringsronde van $1 miljard afgesloten, waardoor de waardering is gestegen tot een bekendgemaakte $13,8 miljard (https://techcrunch.com/2024/05/21/scale-ai-raises-1-billion-at-a-13-8-billion-valuation/) nu de wereldwijde race om high-fidelity AI-trainingsdata een hoogtepunt bereikt. De ronde, geleid door Accel met deelname van Nvidia, Amazon en Meta, signaleert een massale institutionele weddenschap op de 'data engine' als de belangrijkste bottleneck voor de ontwikkeling van frontier modellen. De expansie van Scale AI komt op een cruciaal moment waarop het aanbod van hoogwaardige openbare internetdata bijna uitgeput raakt, waardoor AI-labs gedwongen worden over te schakelen op op maat gemaakte, door mensen gestuurde data-generatie en geavanceerde synthetische datapijplijnen.
De verschuiving naar premium data-licenties
De financiering van Scale AI is symptomatisch voor een bredere marktverschuiving waarbij data niet langer als een grondstof wordt behandeld, maar als een waardevol strategisch bezit. Deze trend wordt verder aangetoond door de baanbrekende meerjarige samenwerking van News Corp met OpenAI, een deal die naar schatting meer dan $250 miljoen (https://www.reuters.com/technology/news-corp-strikes-content-licensing-deal-with-openai-2024-05-22/) over vijf jaar waard is. Onder de overeenkomst krijgt OpenAI toegang tot actuele en gearchiveerde content van grote publicaties zoals The Wall Street Journal en The Times, wat de hoog-redenerende capaciteiten biedt die alleen professionele redactionele data kan leveren. Deze stap suggereert dat het tijdperk van 'gratis scraping' effectief voorbij is, vervangen door een gestructureerde markt voor gelicentieerde IP.
Infrastructuur en governance kapitaal
Naarmate het volume van beheerde propriëtaire data toeneemt, trekt de infrastructuur die dit ondersteunt recordkapitaal aan. CoreWeave heeft onlangs een bekendgemaakte schuldfinanciering van $7,5 miljard verkregen (https://www.reuters.com/technology/coreweave-raises-75-bln-debt-led-by-blackstone-magnetar-2024-05-17/) om zijn datacenter footprint uit te breiden, waardoor de rekenkracht voor het verwerken van deze enorme nieuwe datasets wordt gegarandeerd. Tegelijkertijd wordt datagovernance een op zichzelf staande investeringsthese. Atlan haalde een bekendgemaakte Series C-ronde van $105 miljoen op (https://atlan.com/news/series-c-funding/) om ondernemingen te helpen hun 'data estates' te beheren, zodat de data die in AI-modellen wordt gevoerd, compliant, schoon en traceerbaar is – een voorwaarde voor elke enterprise-grade AI-implementatie.
De opkomst van gespecialiseerde data-assets
Naast algemene LLM's zien gespecialiseerde data voor verticale AI aanzienlijke waarderingspremies. DeepL, de specialist in taalvertalingen, heeft een bekendgemaakte investering van $300 miljoen verkregen met een waardering van $2 miljard (https://www.forbes.com/sites/iainmartin/2024/05/22/deepl-the-german-ai-translation-startup-hits-2-billion-valuation-with-300-million-investment/) om te investeren in zijn propriëtaire linguïstische datasets. Dit benadrukt een groeiende secundaire markt voor 'expert-grade' data die de mogelijkheden van generieke web-gecrawlde informatie overstijgt. Ondertussen blijft autonoom rijden de meest data-intensieve verticale, geïllustreerd door Wayve's bekendgemaakte Series C van $1,05 miljard (https://wayve.ai/news/series-c/) geleid door SoftBank, dat 'Embodied AI' wil commercialiseren door middel van grootschalige sensor dataverwerking.
Waarom het ertoe doet voor data-eigenaren
Voor data-eigenaren bevestigen de deals van Scale AI en News Corp dat we de 'Oogstfase' van de AI-economie zijn ingegaan. Hoogwaardige, door mensen geverifieerde data is nu de schaarste grondstof in de AI-toeleveringsketen. Eigenaren van propriëtaire archieven, gespecialiseerde technische documentatie of real-world sensordata 'slaan' informatie niet langer alleen op; ze zitten op de grondstof voor de volgende generatie soevereine en enterprise AI. Monetisatiestrategieën verschuiven van eenmalige verkopen naar terugkerende licentiemodellen, waarbij de waarde van de data wordt geïndexeerd aan de prestaties en inkomsten van de modellen die het traint.
d-nvest zet de data-activa achter deze deals om in gescoorde, bruikbare kansen.
Verken de pijplijn →