Cisco lance un fonds d'IA de 1 milliard de dollars soutenant Scale AI et Cohere
Le géant des réseaux Cisco s'engage à hauteur de 1 milliard de dollars pour soutenir les startups d'IA à forte croissance, en mettant l'accent sur l'infrastructure axée sur les données.
Cisco Systems a officiellement lancé un fonds d'investissement mondial de 1 milliard de dollars (https://newsroom.cisco.com/c/r/newsroom/en/us/a/press-releases/2024/06/cisco-launches-1b-global-ai-investment-fund.html) pour renforcer le développement de solutions d'IA sécurisées et fiables, marquant un changement stratégique significatif vers la couche d'infrastructure gourmande en données. Le titan des réseaux s'est déjà engagé à hauteur de 200 millions de dollars (https://www.reuters.com/technology/cisco-launches-1-billion-ai-investment-fund-2024-06-04/) de ce capital auprès de leaders de l'industrie, dont Scale AI (https://scale.com/blog/series-f), qui a récemment atteint une valorisation de 13,8 milliards de dollars (https://scale.com/blog/series-f), ainsi que des développeurs de modèles fondamentaux Cohere et Mistral AI. Cette démarche signale une évolution des priorités du capital-risque d'entreprise (CVC), où l'accent n'est plus uniquement mis sur les applications logicielles, mais sur les pipelines de données sous-jacents et l'efficacité de calcul nécessaires pour soutenir l'IA d'entreprise.
La thèse d'investissement axée sur les données
La stratégie d'investissement de Cisco se concentre sur le "tissu conjonctif" de la pile d'IA. En soutenant Scale AI, Cisco sécurise une participation dans le moteur d'étiquetage et de curation de données le plus important au monde, essentiel pour transformer les données brutes de l'entreprise en ensembles d'entraînement de haute qualité. Ceci intervient alors que la demande de jeux de données spécialisés augmente, comme en témoigne l'acquisition par SAP de WalkMe pour 1,5 milliard de dollars (https://news.sap.com/2024/06/sap-to-acquire-walkme/), une transaction conçue pour capturer les données d'interaction utilisateur afin d'alimenter l'assistant IA "Joule" de SAP. Le fonds Cisco vise à combler le fossé entre le matériel réseau et les charges de travail gourmandes en données des LLM, en garantissant que le flux d'informations à travers les réseaux d'entreprise est optimisé pour l'entraînement et l'inférence des modèles.
Infrastructure et demandes de données souveraines
L'afflux de capitaux dans l'écosystème des données d'IA est accompagné d'une expansion massive de l'infrastructure physique. Le fournisseur de cloud spécialisé CoreWeave a annoncé un investissement de 2,2 milliards de dollars (https://www.bloomberg.com/news/articles/2024-06-03/coreweave-to-invest-2-2-billion-in-european-data-centers) pour construire trois nouveaux centres de données en Europe, ciblant spécifiquement la Norvège, la Suède et l'Espagne. Cette expansion est motivée par la demande croissante de solutions de données souveraines, où les entreprises et les gouvernements exigent que l'entraînement de l'IA se déroule dans des juridictions légales spécifiques. De même, Intel a obtenu une coentreprise de 11 milliards de dollars (https://www.intel.com/content/www/us/en/newsroom/news/intel-announces-11-billion-investment-from-brookfield.html) avec Brookfield pour financer son usine Fab 34 en Irlande, renforçant ainsi le socle de calcul nécessaire pour traiter les actifs de données d'IA en plein essor dans le monde.
Réglementation et frontière de la licence
Alors que les investissements affluent dans le secteur, les régulateurs resserrent les règles sur la manière dont les données sont collectées et utilisées. Dans une décision historique, la législature de l'État de New York a adopté le SAFE Kids Act (https://www.governor.ny.gov/news/governor-hochul-majority-leader-stewart-cousins-and-speaker-heastie-announce-agreement-landmark), qui vise à restreindre l'utilisation des flux algorithmiques addictifs et la collecte non autorisée de données sur les mineurs. Cette pression réglementaire oblige les entreprises d'IA à rechercher des sources de données légitimes, entraînant une augmentation des accords de licence. Perplexity AI serait en discussion (https://www.reuters.com/technology/perplexity-ai-plans-revenue-sharing-deal-with-publishers-2024-06-03/) avec des éditeurs pour établir un modèle de partage des revenus, suivant la voie de The Atlantic et Vox Media (https://www.theatlantic.com/press-releases/archive/2024/05/the-atlantic-and-openai-partnership/678531/), qui ont récemment signé des accords de licence pluriannuels avec OpenAI pour fournir des données éditoriales de haute qualité pour l'entraînement des modèles.
Valorisation du marché et benchmarking
L'appétit du marché pour les actifs liés à l'IA reste insatiable. La capitalisation boursière de Nvidia a récemment atteint un record de 2,8 billions de dollars (https://www.cnbc.com/2024/06/04/nvidia-shares-hit-record-high-as-market-cap-nears-apple.html), alimentée par la demande pour les puces H100 et les puces "Rubin" nouvellement annoncées. Pour apporter de la transparence à ce marché en évolution rapide, Hugging Face a lancé un Open Medical LLM Leaderboard (https://huggingface.co/blog/leaderboard-medicalllm), fournissant un benchmark standardisé pour la performance des données dans le secteur de la santé. Ce benchmarking est essentiel pour que les propriétaires de données puissent valoriser leurs actifs avec précision lorsqu'ils entrent sur le marché.
Pourquoi c'est important pour les propriétaires de données
Pour les propriétaires de données, le fonds Cisco et l'acquisition par SAP soulignent un changement fondamental : l'entreprise est désormais le principal client pour les données de haute fidélité. Alors que les fournisseurs d'infrastructure comme CoreWeave et Intel augmentent leurs capacités pour répondre aux demandes de calcul, le goulot d'étranglement reste la disponibilité de jeux de données structurés et conformes à la loi. L'émergence de modèles de partage des revenus de la part d'acteurs comme Perplexity AI suggère que la fenêtre de la collecte de données "gratuite" se ferme, remplacée par un marché formel où les actifs de données sont traités comme des instruments financiers à haut rendement. Les propriétaires de données d'entreprise propriétaires, en particulier dans les industries réglementées, détiennent désormais le carburant le plus précieux de l'économie de l'IA.
d-nvest transforme les actifs de données derrière ces transactions en opportunités évaluées et exploitables.
Explorer le pipeline →