bio datafundingai licensingsovereign data18 de junio de 2026

EvolutionaryScale Asegura $142M para Escalar Modelos de Datos Biológicos para IA

La ronda semilla, liderada por Nat Friedman y Daniel Gross, apunta a la monetización de enormes conjuntos de datos biológicos.

Share on LinkedIn

EvolutionaryScale ha finalizado una ronda de financiación inicial revelada de $142 millones (https://www.bloomberg.com/news/articles/2024-06-18/ai-startup-evolutionaryscale-raises-142-million-to-design-proteins) para comercializar su modelo ESM3, una IA basada en transformadores entrenada con un conjunto de datos propietario de 278 millones de secuencias de proteínas. La ronda, liderada por Nat Friedman, Daniel Gross y Lux Capital (https://techcrunch.com/2024/06/18/evolutionaryscale-raises-142m-from-nat-friedman-daniel-gross-and-lux-capital-to-pioneer-generative-ai-for-biology/), posiciona a la startup como un contendiente principal en la carrera por aplicar arquitecturas de modelos de lenguaje grandes (LLM) a activos de datos biológicos, un sector previamente dominado por AlphaFold de DeepMind.

Las Altas Apuestas de los Activos de Datos Biológicos

El valor central de EvolutionaryScale reside en su modelo ESM3, que fue entrenado utilizando aproximadamente 1 billón de teraflops de potencia computacional, una inversión masiva en el procesamiento de datos de secuencias biológicas (https://www.evolutionaryscale.ai/blog/esm3-release). A diferencia de los LLM de propósito general entrenados con texto extraído de la web, los activos de EvolutionaryScale se basan en datos genómicos y proteómicos de alta fidelidad. Este movimiento señala una tendencia de mercado más amplia donde las valoraciones más altas se están desplazando hacia empresas que poseen o curan conjuntos de datos especializados y no públicos. Al tratar el código genético como un lenguaje, EvolutionaryScale está creando efectivamente un nuevo mercado para el diseño de proteínas sintéticas, donde los "datos" son el conjunto de instrucciones para la vida misma.

Soberanía de Datos Empresariales: El Pacto HPE-Nvidia

Mientras EvolutionaryScale se enfoca en datos biológicos, el mercado empresarial más amplio está pivotando hacia el control de datos localizado. Hewlett Packard Enterprise (HPE) y Nvidia lanzaron recientemente "NVIDIA AI Computing by HPE" (https://www.hpe.com/us/en/newsroom/press-release/2024/06/hpe-and-nvidia-announce-nvidia-ai-computing-by-hpe-to-accelerate-the-generative-ai-industrial-revolution.html), una solución co-desarrollada diseñada para permitir a las corporaciones entrenar modelos de IA en sus propios silos de datos privados. Esta asociación aborda la creciente demanda de "IA Privada", donde los activos de datos nunca abandonan el firewall corporativo. A medida que la capitalización de mercado de Nvidia alcanzó los $3.34 billones (https://www.reuters.com/technology/nvidia-set-overtake-microsoft-worlds-most-valuable-company-2024-06-18/) esta semana, el enfoque se ha desplazado de la mera venta de hardware a la infraestructura de datos subyacente que impulsa estos modelos a escala industrial.

Precedentes Legales en Extracción y Licencia de Datos

La valoración de los activos de datos también está siendo moldeada por nuevos límites legales. En una sentencia histórica, un juez de EE. UU. se puso recientemente del lado de Bright Data en su batalla legal contra Meta (https://www.reuters.com/legal/meta-loses-bid-block-bright-data-scraping-its-sites-2024-06-18/), concluyendo que la extracción de datos públicamente accesibles no viola los términos de servicio de Meta. Esta decisión es una victoria crítica para los mercados y agregadores de datos, reforzando la legalidad de la recopilación de datos públicos para el entrenamiento de IA. Simultáneamente, Oriente Medio está emergiendo como un centro para la inversión en datos soberanos, evidenciado por el acuerdo revelado de Etisalat (e&) y AWS de $2 mil millones (https://www.reuters.com/technology/etisalat-aws-invest-2-bln-uae-cloud-expansion-2024-06-17/) para expandir las capacidades de datos en la nube y de IA en los EAU durante la próxima década.

Adquisiciones Estratégicas en Inteligencia de Datos en la Nube

La consolidación en el sector de datos continúa a medida que los principales actores se mueven para adquirir capas de inteligencia especializadas. Nvidia está adquiriendo Shoreline.io por un estimado de $100 millones (https://www.bloomberg.com/news/articles/2024-06-17/nvidia-is-said-to-acquire-software-startup-shoreline). La tecnología de Shoreline se enfoca en automatizar la respuesta a incidentes en entornos de nube, proporcionando a Nvidia un rico flujo de datos operativos para optimizar la gestión de centros de datos impulsada por IA. Esto sigue un patrón de "acqui-hiring" y adquisiciones de activos de datos destinadas a reforzar la fiabilidad de los clústeres masivos requeridos para el entrenamiento de modelos de próxima generación.

Por qué importa para los propietarios de datos

Para los propietarios de datos, la ronda de EvolutionaryScale y la sentencia de Bright Data subrayan dos caminos divergentes pero lucrativos: la monetización de conjuntos de datos propietarios hiper-especializados y la viabilidad continua de la agregación de datos públicos. A medida que la demanda empresarial de "IA Privada" crece a través de la alianza HPE-Nvidia, la prima sobre activos de datos limpios, etiquetados y legalmente conformes nunca ha sido tan alta. Los propietarios de conjuntos de datos únicos en biología, finanzas y operaciones industriales ahora están posicionados como los árbitros definitivos en una economía de IA que ha superado la era del "cómputo primero" hacia una realidad del "dato primero".

Data Academy