Scale AI haalt $1 miljard op in Series F-ronde met een waardering van $13,8 miljard
Door Accel geleide ronde positioneert Scale AI als de primaire 'Data Foundry' voor de ontwikkeling van geavanceerde AI-modellen.
Scale AI heeft een Series F-financieringsronde van $1 miljard (https://scale.com/blog/series-f) afgerond, waarmee de waardering na de financiering wordt verhoogd tot een bekendgemaakte $13,8 miljard (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation). Geleid door Accel met significante deelname van Nvidia, Amazon en Meta, signaleert de ronde een massale kapitaalverschuiving naar de 'data bottleneck' waarmee de grootste ontwikkelaars van Large Language Models (LLM's) momenteel worden geconfronteerd. Nu de industrie het tijdperk van 'het scrapen van het open web' voorbij is, vertegenwoordigt de missie van Scale AI om een 'Data Foundry' te bouwen de meest significante investering tot nu toe in de creatie van door experts gelabelde, hoog-dichte data-assets voor soevereine en zakelijke AI.
De Industrialisatie van AI-data
De injectie van $1 miljard (https://scale.com/blog/series-f) is niet zomaar een groeirond; het is een infrastructuurspeel. Scale AI positioneert zichzelf als de essentiƫle raffinaderij voor de grondstof van de 21e eeuw. De financiering zal worden gebruikt om hun 'Data Engine' op te schalen, die de Reinforcement Learning from Human Feedback (RLHF) levert die nodig is om modellen voorbij de huidige redeneerplateaus te duwen. Met investeerders zoals Cisco Investments, Intel Capital en AMD Ventures (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation) die de cap table vervoegen, onderstreept de deal een consensus binnen de sector: de volgende generatie AI-prestaties zal worden gewonnen door datakwaliteit, niet alleen door rekenkracht.
Licentieovereenkomsten bereiken een hoogtepunt
De Scale AI-ronde valt samen met een ongekende golf van directe data-acquisitieovereenkomsten tussen modelbouwers en premium contenteigenaren. Met name News Corp sloot een meerjarige overeenkomst met OpenAI (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d) ter waarde van een geschatte $250 miljoen over vijf jaar (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d). Dit partnerschap geeft OpenAI toegang tot archieven en huidige content van The Wall Street Journal, Barron's en The Times, wat een definitieve verschuiving markeert naar gelicentieerde, hoog-autoriteit datasets. Evenzo biedt OpenAI's partnerschap met Reddit (https://openai.com/index/openai-and-reddit-partnership/) realtime toegang tot de Reddit Data API, waardoor mensgerichte conversationele data kan worden geĆÆntegreerd in ChatGPT en andere producten.
Kapitaliseren op belichaamde en gespecialiseerde data
Naast tekstgebaseerde LLM's ziet de markt voor gespecialiseerde data-assets enorme kapitaalinstromen. Wayve haalde onlangs $1,05 miljard op (https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/) in een Series C-ronde geleid door SoftBank om 'Embodied AI' voor autonoom rijden te ontwikkelen. Deze deal benadrukt de premie die wordt geplaatst op 'edge data'āreal-world sensorische informatie die niet alleen door synthetische generatie kan worden gerepliceerd. Ter ondersteuning van dit data-intensieve ecosysteem haalde CoreWeave $1,1 miljard op (https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/) om zijn gespecialiseerde cloudinfrastructuur uit te breiden, specifiek ontworpen om de enorme doorvoer te verwerken die nodig is voor data-intensieve AI-trainingsworkloads.
De Reglementaire en Rechten Backlash
Nu de waarde van data-assets omhoogschiet, bewegen rechthebbenden zich agressief om hun intellectuele eigendom te beschermen. Sony Music Group heeft een formele waarschuwing uitgegeven aan meer dan 700 AI-bedrijven (https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/), waarin een expliciete 'opt-out' wordt verklaard van ongeautoriseerd data scrapen voor AI-training. Dit volgt op een reeks licentieovereenkomsten, zoals de deal van OpenAI met Vox Media (https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt) en The Atlantic (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/), wat suggereert dat het tijdperk van 'fair use' voor trainingsdata snel wordt vervangen door een gestructureerde, multi-miljardenmarkt voor contentrechten.
Waarom het ertoe doet voor data-eigenaren
Voor institutionele data-eigenaren bevestigen de waardering van Scale AI en de News Corp-deal dat propriĆ«taire datasets geen secundaire activa meer zijnāze zijn de primaire hefboom in de AI-economie. De overgang van licentieovereenkomsten van $250 miljoen naar financieringsrondes van $1 miljard voor data-raffinaderijen geeft aan dat 'schone, door experts gelabelde data' nu een aparte activaklasse is. Eigenaren van unieke, hoog-velocity of historisch diepe data moeten prioriteit geven aan datagovernance en 'AI-readiness' om de premiewaarden te innen die nu worden vastgesteld door de grootste spelers van de markt.
d-nvest zet de data-activa achter deze deals om in gescoorde, bruikbare kansen.
Verken de pijplijn ā