EvolutionaryScale lève 142 millions de dollars pour des modèles d'IA de données biologiques
D'anciens chercheurs de Meta dirigent le tour de table d'amorçage pour licencier et faire évoluer les modèles de conception de protéines ESM-3 pour la découverte de médicaments.
EvolutionaryScale a obtenu 142 millions de dollars (https://www.reuters.com/technology/ai-startup-evolutionaryscale-raises-142-million-with-backing-amazon-nvidia-2024-06-17/) lors d'une levée de fonds de démarrage divulguée, afin d'accélérer le développement de modèles d'IA générative pour la biologie, marquant un moment décisif pour la monétisation des actifs de données scientifiques spécialisés. Dirigée par d'anciens chercheurs de Meta AI, la startup lance ESM-3, un modèle linguistique de pointe entraîné sur un ensemble de données propriétaire comprenant 2,78 milliards de protéines (https://techcrunch.com/2024/06/17/evolutionaryscale-seed-biological-ai/). La levée de fonds a vu la participation de titans de l'industrie, dont NVentures (Nvidia) et Amazon Web Services (AWS), signalant un changement stratégique vers des données de haute fidélité et spécifiques au domaine comme principal moteur de valorisation de l'IA.
La Frontière des Données Biologiques : ESM-3 et le Capital d'Amorçage de 142 M$
La proposition de valeur principale d'EvolutionaryScale réside dans sa capacité à simuler des milliards d'années d'évolution biologique par le biais de données. L'investissement divulgué de 142 millions de dollars (https://www.bloomberg.com/news/articles/2024-06-17/ex-meta-scientists-raise-142-million-for-biological-ai-startup) valorise l'entreprise à une estimation de 1 milliard de dollars (https://www.reuters.com/technology/ai-startup-evolutionaryscale-raises-142-million-with-backing-amazon-nvidia-2024-06-17/), reflétant la prime élevée accordée aux 98 milliards de paramètres du modèle ESM-3. Contrairement aux LLM à usage général, ESM-3 est entraîné sur des séquences biologiques structurées, ce qui lui permet de générer des protéines entièrement nouvelles qui n'existent pas dans la nature. Cette capacité de « biologie programmable » repose sur l'acquisition et le traitement de vastes ensembles de données génomiques et protéomiques, que l'entreprise a l'intention de concéder sous licence à des géants pharmaceutiques pour la découverte de médicaments et l'ingénierie environnementale.
L'Infrastructure comme Vecteur : Le Coup de Maître de KKR à 50 Md$
Alors qu'EvolutionaryScale se concentre sur la couche d'intelligence des données, l'infrastructure physique nécessaire au traitement de tels actifs connaît des afflux de capitaux sans précédent. KKR et Energy Capital Partners (ECP) ont annoncé un partenariat stratégique de 50 milliards de dollars (https://www.reuters.com/business/energy/kkr-energy-capital-partners-form-50-bln-strategic-partnership-ai-2024-06-17/) pour accélérer le développement de centres de données et d'infrastructures énergétiques. Cet engagement pluriannuel divulgué répond au « goulot d'étranglement » de l'économie des données : les demandes énergétiques massives des clusters d'entraînement de l'IA. Pour les propriétaires d'actifs de données, cette montée en puissance de l'infrastructure garantit que la liquidité et la capacité de traitement pour les ensembles de données à grande échelle resteront robustes, même si la complexité des modèles évolue exponentiellement.
Souveraineté Européenne et le Rempart de Données de Mistral
Le marché mondial des données est également façonné par des champions régionaux visant la « souveraineté des données ». Mistral AI, basée à Paris, a récemment clôturé une série B de 600 millions d'euros (640 millions de dollars) (https://techcrunch.com/2024/06/11/mistral-ai-raises-600-million-at-a-5-8-billion-valuation/) à une valorisation divulguée de 5,8 milliards d'euros (https://www.ft.com/content/88d68994-633b-419b-9c71-f76e736a617c). La stratégie de Mistral repose fortement sur des ensembles de données multilingues et curatés qui offrent une alternative compétitive aux modèles centrés sur les États-Unis. En sécurisant un financement massif auprès d'investisseurs tels que General Catalyst et Lightspeed, Mistral se positionne pour diriger le marché européen de la licence de données d'entreprise, où la réglementation locale et la confidentialité des données sont primordiales.
Points de Blocage Réglementaires : L'Impasse de Meta sur les Données Européennes
Cependant, l'acquisition de données pour l'entraînement de l'IA fait l'objet d'un examen réglementaire croissant. Meta Platforms a été contraint de suspendre ses plans d'utiliser les données des utilisateurs européens de Facebook et Instagram pour entraîner ses modèles d'IA, suite à une demande de la Commission irlandaise de protection des données. Cette décision, motivée par des plaintes du groupe de défense NOYB, met en évidence un fossé croissant dans la disponibilité des données. Alors que les entreprises américaines et asiatiques peuvent continuer à collecter de vastes ensembles de données publiques, les entreprises européennes doivent naviguer dans un paysage « le consentement d'abord », ce qui pourrait faire augmenter le prix du marché pour les ensembles de données sous licence et conformes à la loi.
Pourquoi c'est important pour les propriétaires de données
Les transactions EvolutionaryScale et KKR soulignent un changement fondamental dans la chaîne de valeur de l'IA : la transition de la suprématie algorithmique à la suprématie des données et de l'énergie. Pour les propriétaires d'ensembles de données propriétaires, que ce soit dans la biologie, la finance ou le droit, le lancement d'ESM-3 prouve que les données spécialisées peuvent atteindre des valorisations de plusieurs milliards de dollars indépendamment des LLM à usage général. Alors que l'infrastructure de calcul s'étend grâce à des pactes de 50 milliards de dollars et que les barrières réglementaires s'élèvent en Europe, la rareté de données de haute qualité et « propres » entraînera probablement une nouvelle vague d'accords de licence à haute valeur. Les données ne sont plus seulement une entrée ; elles sont l'actif de capital principal de l'économie de l'intelligence de 2026.
d-nvest transforme les actifs de données derrière ces transactions en opportunités évaluées et exploitables.
Explorer le pipeline →