EvolutionaryScale asegura $142M para modelos de IA de datos biológicos
Investigadores de Meta lideran ronda semilla para licenciar y escalar modelos de diseño de proteínas ESM-3 para el descubrimiento de fármacos.
EvolutionaryScale ha obtenido $142 millones (https://www.reuters.com/technology/ai-startup-evolutionaryscale-raises-142-million-with-backing-amazon-nvidia-2024-06-17/) en una ronda de financiación inicial revelada para acelerar el desarrollo de modelos de IA generativa para la biología, marcando un momento crucial para la monetización de activos de datos científicos especializados. Liderada por ex investigadores de Meta AI, la startup lanza ESM-3, un modelo de lenguaje de vanguardia entrenado en un conjunto de datos propietario que comprende 2.78 mil millones de proteínas (https://techcrunch.com/2024/06/17/evolutionaryscale-seed-biological-ai/). La ronda contó con la participación de titanes de la industria, incluidos NVentures (Nvidia) y Amazon Web Services (AWS), lo que indica un cambio estratégico hacia datos de alta fidelidad y específicos del dominio como el próximo impulsor principal de la valoración de la IA.
La Frontera de los Datos Biológicos: ESM-3 y los $142M Iniciales
El núcleo de la propuesta de valor de EvolutionaryScale radica en su capacidad para simular miles de millones de años de evolución biológica a través de datos. La inversión revelada de $142 millones (https://www.bloomberg.com/news/articles/2024-06-17/ex-meta-scientists-raise-142-million-for-biological-ai-startup) valora a la empresa en un estimado de $1 mil millones (https://www.reuters.com/technology/ai-startup-evolutionaryscale-raises-142-million-with-backing-amazon-nvidia-2024-06-17/), reflejando la alta prima asignada a los 98 mil millones de parámetros del modelo ESM-3. A diferencia de los LLM de propósito general, ESM-3 se entrena con secuencias biológicas estructuradas, lo que le permite generar proteínas completamente nuevas que no existen en la naturaleza. Esta capacidad de "biología programable" se basa en la adquisición y el procesamiento de enormes conjuntos de datos genómicos y proteómicos, que la empresa pretende licenciar a gigantes farmacéuticos para el descubrimiento de fármacos y la ingeniería ambiental.
Infraestructura como Vehículo: La Jugada de Poder de $50B de KKR
Mientras EvolutionaryScale se enfoca en la capa de inteligencia de datos, la infraestructura física necesaria para procesar dichos activos está experimentando entradas de capital sin precedentes. KKR y Energy Capital Partners (ECP) han anunciado una asociación estratégica de $50 mil millones (https://www.reuters.com/business/energy/kkr-energy-capital-partners-form-50-bln-strategic-partnership-ai-2024-06-17/) para acelerar el desarrollo de centros de datos e infraestructura de energía. Este compromiso multianual revelado aborda el "cuello de botella" de la economía de datos: las enormes demandas energéticas de los clústeres de entrenamiento de IA. Para los propietarios de activos de datos, este aumento de infraestructura garantiza que la liquidez y la capacidad de procesamiento para conjuntos de datos a gran escala seguirán siendo sólidas, incluso a medida que la complejidad del modelo escala exponencialmente.
Soberanía Europea y el Foso de Datos de Mistral
El mercado global de datos también está siendo moldeado por campeones regionales que buscan la "soberanía de datos". Mistral AI, con sede en París, cerró recientemente una Serie B de 600 millones de euros (640 millones de dólares) (https://techcrunch.com/2024/06/11/mistral-ai-raises-600-million-at-a-5-8-billion-valuation/) con una valoración revelada de 5.8 mil millones de euros (https://www.ft.com/content/88d68994-633b-419b-9c71-f76e736a617c). La estrategia de Mistral se basa en gran medida en conjuntos de datos curados y multilingües que ofrecen una alternativa competitiva a los modelos centrados en EE. UU. Al asegurar una financiación masiva de inversores como General Catalyst y Lightspeed, Mistral se está posicionando para liderar el mercado europeo en licencias de datos empresariales, donde la regulación local y la privacidad de los datos son primordiales.
Puntos de Estrangulamiento Regulatorios: El Impasse de Datos de Meta en la UE
Sin embargo, la adquisición de datos para el entrenamiento de IA enfrenta un escrutinio regulatorio cada vez mayor. Meta Platforms se ha visto obligada a pausar sus planes de utilizar datos de usuarios europeos de Facebook e Instagram para entrenar sus modelos de IA tras una solicitud de la Comisión de Protección de Datos de Irlanda. Esta medida, impulsada por quejas del grupo de defensa NOYB, resalta una creciente brecha en la disponibilidad de datos. Mientras que las empresas estadounidenses y asiáticas pueden continuar extrayendo vastos conjuntos de datos públicos, las empresas europeas deben navegar por un panorama de "consentimiento primero", lo que podría aumentar el precio de mercado de los conjuntos de datos licenciados y legalmente conformes.
Por qué importa para los propietarios de datos
Los acuerdos de EvolutionaryScale y KKR subrayan un cambio fundamental en la cadena de valor de la IA: la transición de la supremacía algorítmica a la supremacía de datos y energía. Para los propietarios de conjuntos de datos propietarios, ya sea en biología, finanzas o derecho, el lanzamiento de ESM-3 demuestra que los datos especializados pueden alcanzar valoraciones de miles de millones de dólares independientemente de los LLM de propósito general. A medida que la infraestructura de cómputo se expande a través de pactos de $50 mil millones y los muros regulatorios se elevan en Europa, la escasez de datos de alta calidad y "limpios" probablemente impulsará una nueva ola de acuerdos de licencia de alto valor. Los datos ya no son solo una entrada; son el principal activo de capital de la economía de la inteligencia de 2026.
d-nvest convierte los activos de datos detrás de estos acuerdos en oportunidades puntuadas y accionables.
Explorar el pipeline →