funding rounddata licensingai infrastructuredata governance24 juin 2026

Scale AI sécurise 1 milliard de dollars en Série F pour développer son moteur de données pour les modèles de pointe

Accel mène une levée de fonds massive valorisant le géant de l'étiquetage de données à 13,8 milliards de dollars alors que la demande d'ensembles de formation IA de haute qualité atteint son paroxysme.

Scale AI a clôturé une levée de fonds de 1 milliard de dollars en Série F, propulsant sa valorisation à 13,8 milliards de dollars (https://techcrunch.com/2024/05/21/scale-ai-raises-1-billion-at-a-13-8-billion-valuation/) alors que la course mondiale pour des données de formation IA de haute fidélité atteint son paroxysme. La levée de fonds, menée par Accel avec la participation de Nvidia, Amazon et Meta, signale un pari institutionnel massif sur le "moteur de données" comme principal goulot d'étranglement pour le développement de modèles de pointe. L'expansion de Scale AI intervient à un moment critique où l'offre de données publiques de haute qualité sur Internet approche de l'épuisement, forçant les laboratoires d'IA à se tourner vers la génération de données sur mesure, impliquant l'intervention humaine, et des pipelines de données synthétiques sophistiqués.

Le passage à la licence de données premium

Le financement de Scale AI est symptomatique d'un pivot de marché plus large où les données ne sont plus traitées comme une commodité mais comme un actif stratégique de grande valeur. Cette tendance est encore démontrée par le partenariat pluriannuel historique de News Corp avec OpenAI, un accord estimé à plus de 250 millions de dollars (https://www.reuters.com/technology/news-corp-strikes-content-licensing-deal-with-openai-2024-05-22/) sur cinq ans. En vertu de l'accord, OpenAI accède au contenu actuel et archivé de publications majeures comme The Wall Street Journal et The Times, fournissant les capacités de raisonnement élevé que seules les données éditoriales professionnelles peuvent offrir. Cette décision suggère que l'ère du "scraping gratuit" est effectivement terminée, remplacée par un marché structuré pour la propriété intellectuelle sous licence.

Infrastructure et capital de gouvernance

Alors que le volume de données propriétaires sous gestion gonfle, l'infrastructure pour le supporter attire des capitaux record. CoreWeave a récemment obtenu un financement par dette de 7,5 milliards de dollars (https://www.reuters.com/technology/coreweave-raises-75-bln-debt-led-by-blackstone-magnetar-2024-05-17/) pour étendre son empreinte de centres de données, garantissant la capacité de calcul nécessaire au traitement de ces nouveaux ensembles de données massifs. Simultanément, la gouvernance des données devient une thèse d'investissement autonome. Atlan a levé 105 millions de dollars en Série C (https://atlan.com/news/series-c-funding/) pour aider les entreprises à gérer leurs "parcs de données", garantissant que les données alimentant les modèles d'IA sont conformes, propres et traçables – un prérequis pour tout déploiement d'IA de niveau entreprise.

L'essor des actifs de données spécialisés

Au-delà des LLM à usage général, les données spécialisées pour l'IA verticale connaissent des primes de valorisation significatives. DeepL, le spécialiste de la traduction linguistique, a obtenu un investissement de 300 millions de dollars à une valorisation de 2 milliards de dollars (https://www.forbes.com/sites/iainmartin/2024/05/22/deepl-the-german-ai-translation-startup-hits-2-billion-valuation-with-300-million-investment/) pour doubler ses ensembles de données linguistiques propriétaires. Cela met en évidence un marché secondaire croissant pour les données "de niveau expert" qui dépassent les capacités des informations génériques extraites du web. Pendant ce temps, la conduite autonome reste le secteur le plus gourmand en données, illustré par la Série C de 1,05 milliard de dollars de Wayve (https://wayve.ai/news/series-c/) menée par SoftBank, qui vise à commercialiser l'"IA incarnée" grâce au traitement de données de capteurs à grande échelle.

Pourquoi c'est important pour les propriétaires de données

Pour les propriétaires de données, les accords Scale AI et News Corp confirment que nous sommes entrés dans la "Phase de Récolte" de l'économie de l'IA. Les données de haute qualité, vérifiées par l'homme, sont désormais la ressource la plus rare dans la chaîne d'approvisionnement de l'IA. Les propriétaires d'archives propriétaires, de documentation technique spécialisée ou de données de capteurs du monde réel ne font plus seulement "stocker" des informations ; ils détiennent la matière première pour la prochaine génération d'IA souveraines et d'entreprise. Les stratégies de monétisation passent des ventes ponctuelles aux modèles de licence récurrents, où la valeur des données est indexée sur la performance et les revenus des modèles qu'elles entraînent.

d-nvest transforme les actifs de données derrière ces transactions en opportunités évaluées et exploitables.

Explorer le pipeline →
Scale AI sécurise 1 milliard de dollars en Série F pour développer son moteur de données pour les modèles de pointe | d-nvest