Scale AI lève 1 milliard de dollars en Série F à une valorisation de 13,8 milliards de dollars pour sa chaîne d'approvisionnement de données
Accel mène une levée de fonds massive pour développer l'étiquetage de données et la génération de données synthétiques pour les modèles d'IA de pointe.
Scale AI a finalisé une levée de fonds de 1 milliard de dollars de série F (https://scale.com/blog/series-f) qui valorise le leader de l'infrastructure de données à 13,8 milliards de dollars (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-from-accel-nvidia-at-13-8-billion-value). Menée par la société de capital-risque Accel, cette levée de fonds signale un changement décisif sur le marché de l'IA : alors que la puissance de calcul devient une commodité, le principal avantage concurrentiel s'est déplacé vers la chaîne d'approvisionnement des données. L'investissement comprend la participation de poids lourds stratégiques tels que Nvidia, Amazon, Meta et Intel Capital (https://scale.com/blog/series-f), soulignant le consensus industriel selon lequel des données de haute qualité, annotées par des humains, sont le carburant essentiel des modèles de pointe de nouvelle génération.
L'industrialisation de l'étiquetage des données
L'injection de capital est destinée à l'expansion de la "Data Foundry" de Scale AI, une opération sophistiquée qui combine des systèmes automatisés avec une main-d'œuvre mondiale de spécialistes humains pour affiner les données brutes en ensembles d'entraînement structurés. Contrairement aux débuts de l'IA, où le simple étiquetage d'images suffisait, la demande actuelle se concentre sur le raisonnement complexe, le codage et la compréhension multimodale. Scale AI se positionne désormais comme l'intermédiaire essentiel entre les données numériques brutes et l'intelligence raffinée requise par les développeurs de LLM. Cette augmentation massive de la valorisation par rapport à sa précédente valorisation post-money de 7,3 milliards de dollars en 2021 (https://www.bloomberg.com/news/articles/2024-05-21/scale-ai-raises-1-billion-from-accel-nvidia-at-13-8-billion-value) reflète la croissance exponentielle du volume et de la complexité des données requises pour les systèmes d'IA agentiques.
L'IA physique et la frontière des données autonomes
L'investissement dans Scale AI coïncide avec une augmentation plus large du financement de l'"IA physique" – des systèmes qui interagissent avec le monde réel par le biais de capteurs et d'actionneurs. Un exemple frappant est la récente levée de fonds de 1,05 milliard de dollars de série C pour Wayve (https://wayve.ai/news/series-c-funding/), menée par SoftBank Group. Wayve est un pionnier de l'"Embodied AI" pour la conduite autonome, un secteur qui nécessite des données physiques spécialisées et de haute fidélité que Scale AI est de plus en plus équipée pour traiter. La convergence de ces deux transactions – 1 milliard de dollars pour Scale et 1,05 milliard de dollars pour Wayve – met en évidence un pivot du marché vers les startups capables de résoudre simultanément le "goulot d'étranglement des données" dans les domaines physique et numérique.
Le passage du scraping à la licence structurée
Alors que les régulateurs resserrent le filet sur la collecte non autorisée de données, le marché des actifs de données sous licence explose. Cette semaine, l'industrie a noté l'accord pluriannuel estimé à 250 millions de dollars entre News Corp et OpenAI (https://www.reuters.com/technology/news-corp-strikes-multi-year-content-partnership-with-openai-2024-05-22/), qui accorde à OpenAI l'accès au contenu de publications telles que The Wall Street Journal et The Times. Ceci fait suite à un partenariat similaire où Reddit a accepté de concéder sa licence de données à OpenAI (https://www.reuters.com/technology/reddit-shares-jump-partnership-with-openai-2024-05-16/), permettant à la société d'IA de s'entraîner sur des données conversationnelles en temps réel. Ces accords représentent une nouvelle ère de "données autorisées", où les ensembles de données de grande valeur ne sont plus collectés par scraping mais sont traités comme des actifs premium avec des frais de licence récurrents, une tendance que l'infrastructure de Scale AI est conçue pour faciliter à grande échelle.
Réglementation et norme mondiale des données
La toile de fond de ces flux de capitaux massifs est l'adoption formelle de l'AI Act de l'UE (https://www.consilium.europa.eu/en/press/press-releases/2024/05/21/artificial-intelligence-ai-act-council-gives-final-green-light-to-the-first-worldwide-rules-on-ai/), le premier cadre complet de réglementation de l'IA au monde. La loi impose une stricte transparence concernant les données utilisées pour entraîner les modèles d'IA à usage général. Pour les propriétaires de données et les fournisseurs d'infrastructure comme Scale AI, cette réglementation agit comme un catalyseur de croissance ; elle oblige les développeurs d'IA à s'éloigner des sources de données opaques vers des ensembles de données traçables, de haute qualité et conformes à la loi. Ce vent arrière réglementaire entraîne de nouveaux investissements dans les plateformes de gouvernance des données, telles qu'Atlan, qui a récemment obtenu une levée de fonds de 105 millions de dollars de série C (https://atlan.com/news/atlan-raises-105m-series-c-led-by-gic-and-meritech-capital/) pour aider les entreprises à gérer leurs parcs de données prêts pour l'IA.
Pourquoi c'est important pour les propriétaires de données
Pour les propriétaires de données, la levée de fonds de Scale AI et le partenariat avec News Corp prouvent que les données ne sont plus un sous-produit de l'activité – elles sont le produit principal. La valorisation de 13,8 milliards de dollars d'une entreprise qui étiquette et structure principalement des données démontre que la "raffinerie" est aussi précieuse que le "pétrole". Les propriétaires de jeux de données propriétaires, que ce soit dans les médias, la santé ou la logistique physique, ont désormais une voie claire vers la monétisation par le biais de modèles de licence et de partenariat structurés. Alors que l'industrie se dirige vers l'IA physique et la transparence réglementée, la prime sur les données propres, légales et de haute fidélité ne fera qu'augmenter, faisant des actifs de données l'une des classes les plus lucratives du paysage d'investissement moderne.
d-nvest transforme les actifs de données derrière ces transactions en opportunités évaluées et exploitables.
Explorer le pipeline →