fundingdata licensingscale aiai infrastructure22 juni 2026

Scale AI haalt $1 miljard op in Series F-ronde met een waardering van $13,8 miljard

Door Accel geleide ronde positioneert Scale AI als de primaire 'Data Foundry' voor de ontwikkeling van geavanceerde AI-modellen.

Scale AI heeft een Series F-financieringsronde van $1 miljard (https://scale.com/blog/series-f) afgerond, waarmee de waardering na de financiering wordt verhoogd tot een bekendgemaakte $13,8 miljard (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation). Geleid door Accel met significante deelname van Nvidia, Amazon en Meta, signaleert de ronde een massale kapitaalverschuiving naar de 'data bottleneck' waarmee de grootste ontwikkelaars van Large Language Models (LLM's) momenteel worden geconfronteerd. Nu de industrie het tijdperk van 'het scrapen van het open web' voorbij is, vertegenwoordigt de missie van Scale AI om een 'Data Foundry' te bouwen de meest significante investering tot nu toe in de creatie van door experts gelabelde, hoog-dichte data-assets voor soevereine en zakelijke AI.

De Industrialisatie van AI-data

De injectie van $1 miljard (https://scale.com/blog/series-f) is niet zomaar een groeirond; het is een infrastructuurspeel. Scale AI positioneert zichzelf als de essentiële raffinaderij voor de grondstof van de 21e eeuw. De financiering zal worden gebruikt om hun 'Data Engine' op te schalen, die de Reinforcement Learning from Human Feedback (RLHF) levert die nodig is om modellen voorbij de huidige redeneerplateaus te duwen. Met investeerders zoals Cisco Investments, Intel Capital en AMD Ventures (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation) die de cap table vervoegen, onderstreept de deal een consensus binnen de sector: de volgende generatie AI-prestaties zal worden gewonnen door datakwaliteit, niet alleen door rekenkracht.

Licentieovereenkomsten bereiken een hoogtepunt

De Scale AI-ronde valt samen met een ongekende golf van directe data-acquisitieovereenkomsten tussen modelbouwers en premium contenteigenaren. Met name News Corp sloot een meerjarige overeenkomst met OpenAI (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d) ter waarde van een geschatte $250 miljoen over vijf jaar (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d). Dit partnerschap geeft OpenAI toegang tot archieven en huidige content van The Wall Street Journal, Barron's en The Times, wat een definitieve verschuiving markeert naar gelicentieerde, hoog-autoriteit datasets. Evenzo biedt OpenAI's partnerschap met Reddit (https://openai.com/index/openai-and-reddit-partnership/) realtime toegang tot de Reddit Data API, waardoor mensgerichte conversationele data kan worden geïntegreerd in ChatGPT en andere producten.

Kapitaliseren op belichaamde en gespecialiseerde data

Naast tekstgebaseerde LLM's ziet de markt voor gespecialiseerde data-assets enorme kapitaalinstromen. Wayve haalde onlangs $1,05 miljard op (https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/) in een Series C-ronde geleid door SoftBank om 'Embodied AI' voor autonoom rijden te ontwikkelen. Deze deal benadrukt de premie die wordt geplaatst op 'edge data'—real-world sensorische informatie die niet alleen door synthetische generatie kan worden gerepliceerd. Ter ondersteuning van dit data-intensieve ecosysteem haalde CoreWeave $1,1 miljard op (https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/) om zijn gespecialiseerde cloudinfrastructuur uit te breiden, specifiek ontworpen om de enorme doorvoer te verwerken die nodig is voor data-intensieve AI-trainingsworkloads.

De Reglementaire en Rechten Backlash

Nu de waarde van data-assets omhoogschiet, bewegen rechthebbenden zich agressief om hun intellectuele eigendom te beschermen. Sony Music Group heeft een formele waarschuwing uitgegeven aan meer dan 700 AI-bedrijven (https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/), waarin een expliciete 'opt-out' wordt verklaard van ongeautoriseerd data scrapen voor AI-training. Dit volgt op een reeks licentieovereenkomsten, zoals de deal van OpenAI met Vox Media (https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt) en The Atlantic (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/), wat suggereert dat het tijdperk van 'fair use' voor trainingsdata snel wordt vervangen door een gestructureerde, multi-miljardenmarkt voor contentrechten.

Waarom het ertoe doet voor data-eigenaren

Voor institutionele data-eigenaren bevestigen de waardering van Scale AI en de News Corp-deal dat propriëtaire datasets geen secundaire activa meer zijn—ze zijn de primaire hefboom in de AI-economie. De overgang van licentieovereenkomsten van $250 miljoen naar financieringsrondes van $1 miljard voor data-raffinaderijen geeft aan dat 'schone, door experts gelabelde data' nu een aparte activaklasse is. Eigenaren van unieke, hoog-velocity of historisch diepe data moeten prioriteit geven aan datagovernance en 'AI-readiness' om de premiewaarden te innen die nu worden vastgesteld door de grootste spelers van de markt.

d-nvest zet de data-activa achter deze deals om in gescoorde, bruikbare kansen.

Verken de pijplijn →