bio datafundingai licensingsovereign data18 juin 2026

EvolutionaryScale sécurise 142 millions de dollars pour développer des modèles de données biologiques pour l'IA

La levée de fonds d'amorçage, dirigée par Nat Friedman et Daniel Gross, vise la monétisation de vastes ensembles de données biologiques.

Share on LinkedIn

EvolutionaryScale a finalisé une levée de fonds d'amorçage divulguée de 142 millions de dollars (https://www.bloomberg.com/news/articles/2024-06-18/ai-startup-evolutionaryscale-raises-142-million-to-design-proteins) pour commercialiser son modèle ESM3, une IA basée sur des transformeurs entraînée sur un ensemble de données propriétaire de 278 millions de séquences protéiques. La levée de fonds, dirigée par Nat Friedman, Daniel Gross et Lux Capital (https://techcrunch.com/2024/06/18/evolutionaryscale-raises-142m-from-nat-friedman-daniel-gross-and-lux-capital-to-pioneer-generative-ai-for-biology/), positionne la startup comme un challenger principal dans la course à l'application des architectures de grands modèles linguistiques (LLM) aux actifs de données biologiques, un secteur précédemment dominé par AlphaFold de DeepMind.

Les enjeux élevés des actifs de données biologiques

La valeur fondamentale d'EvolutionaryScale réside dans son modèle ESM3, qui a été entraîné à l'aide d'environ 1 billion de teraflops de puissance de calcul – un investissement massif dans le traitement des données de séquences biologiques (https://www.evolutionaryscale.ai/blog/esm3-release). Contrairement aux LLM à usage général entraînés sur du texte extrait du web, les actifs d'EvolutionaryScale sont construits sur des données génomiques et protéomiques de haute fidélité. Cette démarche signale une tendance de marché plus large où les valorisations les plus élevées se déplacent vers les entreprises qui possèdent ou organisent des ensembles de données spécialisés et non publics. En traitant le code génétique comme un langage, EvolutionaryScale crée effectivement un nouveau marché pour la conception de protéines synthétiques, où les « données » sont l'ensemble d'instructions de la vie elle-même.

Souveraineté des données d'entreprise : le pacte HPE-Nvidia

Alors qu'EvolutionaryScale se concentre sur les données biologiques, le marché d'entreprise plus large se tourne vers le contrôle localisé des données. Hewlett Packard Enterprise (HPE) et Nvidia ont récemment lancé "NVIDIA AI Computing by HPE" (https://www.hpe.com/us/en/newsroom/press-release/2024/06/hpe-and-nvidia-announce-nvidia-ai-computing-by-hpe-to-accelerate-the-generative-ai-industrial-revolution.html), une solution co-développée conçue pour permettre aux entreprises d'entraîner des modèles d'IA sur leurs propres silos de données privés. Ce partenariat répond à la demande croissante de "Private AI", où les actifs de données ne quittent jamais le pare-feu de l'entreprise. Alors que la capitalisation boursière de Nvidia a atteint 3,34 billions de dollars (https://www.reuters.com/technology/nvidia-set-overtake-microsoft-worlds-most-valuable-company-2024-06-18/) cette semaine, l'accent s'est déplacé de la simple vente de matériel vers l'infrastructure de données sous-jacente qui alimente ces modèles à l'échelle industrielle.

Précédents juridiques en matière de scraping et de licence de données

La valorisation des actifs de données est également façonnée par de nouvelles frontières juridiques. Dans une décision historique, un juge américain s'est récemment rangé du côté de Bright Data dans sa bataille juridique contre Meta (https://www.reuters.com/legal/meta-loses-bid-block-bright-data-scraping-its-sites-2024-06-18/), concluant que le scraping de données accessibles au public ne viole pas les conditions d'utilisation de Meta. Cette décision est une victoire cruciale pour les marchés de données et les agrégateurs, renforçant la légalité de la collecte de données publiques pour l'entraînement de l'IA. Parallèlement, le Moyen-Orient émerge comme un centre d'investissement dans les données souveraines, comme en témoigne l'accord divulgué de 2 milliards de dollars (https://www.reuters.com/technology/etisalat-aws-invest-2-bln-uae-cloud-expansion-2024-06-17/) entre Etisalat (e&) et AWS pour étendre les capacités de cloud et d'IA aux Émirats arabes unis au cours de la prochaine décennie.

Acquisitions stratégiques dans l'intelligence des données cloud

La consolidation dans le secteur des données se poursuit alors que les principaux acteurs s'orientent vers l'acquisition de couches d'intelligence spécialisées. Nvidia acquerrait apparemment Shoreline.io pour un montant estimé à 100 millions de dollars (https://www.bloomberg.com/news/articles/2024-06-17/nvidia-is-said-to-acquire-software-startup-shoreline). La technologie de Shoreline se concentre sur l'automatisation de la réponse aux incidents dans les environnements cloud, fournissant à Nvidia un flux riche de données opérationnelles pour optimiser la gestion des centres de données pilotée par l'IA. Cela s'inscrit dans un schéma d'"acqui-hiring" et d'acquisitions d'actifs de données visant à renforcer la fiabilité des clusters massifs requis pour l'entraînement des modèles de nouvelle génération.

Pourquoi c'est important pour les propriétaires de données

Pour les propriétaires de données, la levée de fonds d'EvolutionaryScale et la décision concernant Bright Data soulignent deux voies divergentes mais lucratives : la monétisation d'ensembles de données propriétaires hyper-spécialisés et la viabilité continue de l'agrégation de données publiques. Alors que la demande des entreprises pour "Private AI" croît via l'alliance HPE-Nvidia, la prime sur les actifs de données propres, étiquetés et conformes à la loi n'a jamais été aussi élevée. Les propriétaires d'ensembles de données uniques dans les domaines de la biologie, de la finance et des opérations industrielles sont désormais positionnés comme les décideurs ultimes dans une économie de l'IA qui a dépassé l'ère du "compute-first" pour entrer dans une réalité "data-first".

Data Academy