fundingdata licensingscale aiai infrastructure22 juin 2026

Scale AI lève 1 milliard de dollars en Série F à une valorisation de 13,8 milliards de dollars

Cette levée de fonds, menée par Accel, positionne Scale AI comme la principale 'Fonderie de Données' pour le développement de modèles d'IA de pointe.

Scale AI a finalisé une levée de fonds de 1 milliard de dollars en Série F (https://scale.com/blog/series-f) qui porte sa valorisation post-financement à un montant déclaré de 13,8 milliards de dollars (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation). Menée par Accel avec une participation significative de Nvidia, Amazon et Meta, cette levée de fonds signale un pivot massif de capitaux vers le 'goulot d'étranglement des données' auquel sont actuellement confrontés les plus grands développeurs de grands modèles linguistiques (LLM). Alors que l'industrie dépasse l'ère du 'scraping du web ouvert', la mission de Scale AI de construire une 'Fonderie de Données' représente l'investissement le plus important à ce jour dans la création d'actifs de données experts et de haute densité pour l'IA souveraine et d'entreprise.

L'industrialisation des données d'IA

L'injection de 1 milliard de dollars (https://scale.com/blog/series-f) n'est pas simplement une levée de fonds pour la croissance ; c'est un investissement dans l'infrastructure. Scale AI se positionne comme la raffinerie essentielle pour la matière première du 21e siècle. Le financement sera utilisé pour faire évoluer son 'Moteur de Données', qui fournit le Reinforcement Learning from Human Feedback (RLHF) nécessaire pour dépasser les plateaux de raisonnement actuels des modèles. Avec des investisseurs tels que Cisco Investments, Intel Capital et AMD Ventures (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-at-13-8-billion-valuation) rejoignant la table des actionnaires, cette transaction souligne un consensus intersectoriel : la prochaine génération de performance de l'IA sera remportée grâce à la qualité des données, et non seulement au volume de calcul.

Les accords de licence atteignent un point culminant

La levée de fonds de Scale AI coïncide avec une vague sans précédent d'accords d'acquisition de données directs entre les constructeurs de modèles et les détenteurs de contenu premium. Notamment, News Corp a signé un accord pluriannuel avec OpenAI (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d) d'une valeur estimée à 250 millions de dollars sur cinq ans (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-80860d4d). Ce partenariat accorde à OpenAI l'accès aux archives et au contenu actuel du Wall Street Journal, de Barron's et du Times, marquant un changement définitif vers des ensembles de données sous licence et à haute autorité. De même, le partenariat d'OpenAI avec Reddit (https://openai.com/index/openai-and-reddit-partnership/) offre un accès en temps réel à l'API de données de Reddit, permettant l'intégration de données conversationnelles centrées sur l'humain dans ChatGPT et d'autres produits.

Capitaliser sur les données incarnées et spécialisées

Au-delà des LLM basés sur le texte, le marché des actifs de données spécialisés connaît d'énormes afflux de capitaux. Wayve a récemment levé 1,05 milliard de dollars (https://www.reuters.com/business/autos-transportation/uk-ai-start-up-wayve-raises-105-bln-softbank-led-funding-2024-05-07/) lors d'une levée de fonds de Série C menée par SoftBank pour développer l'IA incarnée pour la conduite autonome. Cette transaction souligne la prime accordée aux 'données de périphérie' – des informations sensorielles du monde réel qui ne peuvent être reproduites par la génération synthétique seule. Pour soutenir cet écosystème riche en données, CoreWeave a levé 1,1 milliard de dollars (https://techcrunch.com/2024/05/01/coreweave-raises-1-1b-at-a-19b-valuation/) pour étendre son infrastructure cloud spécialisée, conçue spécifiquement pour gérer le débit massif requis pour les charges de travail d'entraînement d'IA gourmandes en données.

Le contrecoup réglementaire et des droits

Alors que la valeur des actifs de données monte en flèche, les détenteurs de droits agissent agressivement pour protéger leur propriété intellectuelle. Sony Music Group a émis un avertissement formel à plus de 700 entreprises d'IA (https://variety.com/2024/music/news/sony-music-warns-ai-companies-using-content-without-permission-1236006080/), déclarant un 'opt-out' explicite du scraping de données non autorisé pour l'entraînement de l'IA. Ceci fait suite à une série d'accords de licence, tels que l'accord d'OpenAI avec Vox Media (https://www.theverge.com/2024/5/13/24155488/openai-vox-media-licensing-deal-chatgpt) et The Atlantic (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-announce-strategic-content-and-product-partnership/678526/), suggérant que l'ère du 'fair use' pour les données d'entraînement est rapidement remplacée par un marché structuré de plusieurs milliards de dollars pour les droits de contenu.

Pourquoi cela est important pour les propriétaires de données

Pour les propriétaires institutionnels de données, la valorisation de Scale AI et l'accord de News Corp confirment que les ensembles de données propriétaires ne sont plus des actifs secondaires – ils sont le levier principal dans l'économie de l'IA. La transition des accords de licence de 250 millions de dollars vers des levées de fonds de 1 milliard de dollars pour les raffineries de données indique que les 'données propres et étiquetées par des experts' constituent désormais une classe d'actifs distincte. Les propriétaires de données uniques, à haute vélocité ou historiquement profondes devraient prioriser la gouvernance des données et la 'préparation à l'IA' pour capturer les valorisations premium actuellement fixées par les plus grands acteurs du marché.

d-nvest transforme les actifs de données derrière ces transactions en opportunités évaluées et exploitables.

Explorer le pipeline →
Scale AI lève 1 milliard de dollars en Série F à une valorisation de 13,8 milliards de dollars | d-nvest