fundingdata licensingscale aiai infrastructure22. Juni 2026

Scale AI sichert sich 1 Mrd. USD Series F Finanzierung bei 13,8 Mrd. USD Bewertung

Die von Accel angeführte Runde positioniert Scale AI als primäre 'Data Foundry' für die Entwicklung von Frontier-KI-Modellen.

Scale AI hat eine Series F Finanzierungsrunde über 1 Milliarde US-Dollar (https://scale.com/blog/series-f) abgeschlossen, die seine Bewertung nach der Finanzierung auf bekanntlich 13,8 Milliarden US-Dollar (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation) erhöht. Die von Accel angeführte Runde mit erheblicher Beteiligung von Nvidia, Amazon und Meta signalisiert eine massive Kapitalverschiebung hin zum 'Daten-Engpass', mit dem die größten Entwickler von Large Language Models (LLMs) derzeit konfrontiert sind. Da die Branche die Ära des 'Scraping des offenen Webs' hinter sich lässt, stellt Scale AIs Mission, eine 'Data Foundry' aufzubauen, die bisher bedeutendste Investition in die Schaffung von von Experten gelabelten, hochdichten Datenassets für souveräne und unternehmensweite KI dar.

Die Industrialisierung von KI-Daten

Die 1-Milliarden-Dollar-Spritze (https://scale.com/blog/series-f) ist nicht nur eine Wachstumsrunde; es ist ein Infrastruktur-Play. Scale AI positioniert sich als die wesentliche Raffinerie für den Rohstoff des 21. Jahrhunderts. Die Finanzierung wird verwendet, um ihre 'Data Engine' zu skalieren, die Reinforcement Learning from Human Feedback (RLHF) bereitstellt, das notwendig ist, um Modelle über aktuelle Denkplateaus hinaus zu treiben. Mit Investoren wie Cisco Investments, Intel Capital und AMD Ventures (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation), die dem Cap Table beitreten, unterstreicht der Deal einen branchenübergreifenden Konsens: Die nächste Generation der KI-Leistung wird durch Datenqualität gewonnen, nicht nur durch Rechenleistung.

Lizenzierungsvereinbarungen erreichen Fieberhöhe

Die Scale AI-Runde fällt mit einer beispiellosen Welle direkter Datenakquisitionsvereinbarungen zwischen Modellentwicklern und Premium-Content-Besitzern zusammen. Insbesondere News Corp unterzeichnete eine mehrjährige Vereinbarung mit OpenAI (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d), die auf geschätzte 250 Millionen US-Dollar über fünf Jahre (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d) geschätzt wird. Diese Partnerschaft gewährt OpenAI Zugang zu Archiven und aktuellen Inhalten von The Wall Street Journal, Barron's und The Times und markiert eine definitive Verlagerung hin zu lizenzierten, hochautoritativen Datensätzen. Ebenso bietet OpenAIs Partnerschaft mit Reddit (https://openai.com/index/openai-and-reddit-partnership/) Echtzeit-Zugriff auf die Reddit Data API, was die Integration von menschenzentrierten Konversationsdaten in ChatGPT und andere Produkte ermöglicht.

Kapitalisierung auf verkörperte und spezialisierte Daten

Über textbasierte LLMs hinaus verzeichnet der Markt für spezialisierte Datenassets massive Kapitalzuflüsse. Wayve sicherte sich kürzlich 1,05 Milliarden US-Dollar (https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/) in einer Series C Runde unter der Leitung von SoftBank, um 'Embodied AI' für autonomes Fahren zu entwickeln. Diese Vereinbarung unterstreicht die Wertschätzung für 'Edge-Daten' – reale sensorische Informationen, die nicht allein durch synthetische Generierung repliziert werden können. Zur Unterstützung dieses datenintensiven Ökosystems sammelte CoreWeave 1,1 Milliarden US-Dollar (https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/) zur Erweiterung seiner spezialisierten Cloud-Infrastruktur, die speziell für die Bewältigung des massiven Durchsatzes entwickelt wurde, der für datenintensive KI-Trainings-Workloads erforderlich ist.

Der regulatorische und rechtliche Rückschlag

Da der Wert von Datenassets in die Höhe schnellt, gehen Rechteinhaber aggressiv vor, um ihr geistiges Eigentum zu schützen. Sony Music Group gab eine formelle Warnung an über 700 KI-Unternehmen (https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/) heraus und erklärte ein explizites 'Opt-out' vom unbefugten Data Scraping für KI-Training. Dies folgt auf eine Reihe von Lizenzvereinbarungen, wie die OpenAI-Vereinbarung mit Vox Media (https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt) und The Atlantic (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/), was darauf hindeutet, dass die Ära des 'Fair Use' für Trainingsdaten schnell durch einen strukturierten Multi-Milliarden-Dollar-Markt für Content-Rechte ersetzt wird.

Warum es für Dateneigentümer wichtig ist

Für institutionelle Dateneigentümer bestätigen die Scale AI-Bewertung und die News Corp-Vereinbarung, dass proprietäre Datensätze keine sekundären Vermögenswerte mehr sind – sie sind der primäre Hebel in der KI-Wirtschaft. Der Übergang von Lizenzvereinbarungen über 250 Millionen US-Dollar zu Finanzierungsrunden über 1 Milliarde US-Dollar für Datenraffinerien deutet darauf hin, dass 'saubere, von Experten gelabelte Daten' nun eine eigene Anlageklasse darstellen. Eigentümer einzigartiger, hochvolumiger oder historisch tiefer Daten sollten Data Governance und 'KI-Bereitschaft' priorisieren, um die Premium-Bewertungen zu erzielen, die nun von den größten Akteuren des Marktes festgelegt werden.

d-nvest verwandelt die Datenbestände hinter diesen Deals in bewertete, umsetzbare Möglichkeiten.

Pipeline erkunden →