Formation Bio asegura $372M Serie D para descubrimiento de fármacos con IA y datos
Liderada por a16z y Sanofi, la ronda acelera la misión de Formation Bio de automatizar el desarrollo de fármacos a través de datos propietarios.
Formation Bio ha cerrado una ronda de financiación Serie D de $372 millones (revelado) para escalar su plataforma de ensayos clínicos nativa de IA y acelerar la adquisición de activos de datos farmacéuticos. La ronda fue liderada por Andreessen Horowitz (a16z) con una participación significativa del gigante global de la salud Sanofi, lo que señala un cambio importante en cómo la industria valora la intersección de datos clínicos propietarios e IA generativa.
La Industrialización de Datos Biológicos
A diferencia de las organizaciones de investigación por contrato (CRO) tradicionales, Formation Bio opera como una empresa farmacéutica habilitada por tecnología que construye su propia cartera mediante la adquisición de fármacos en etapa clínica. El núcleo de su estrategia reside en su motor de datos propietario, que utiliza IA para automatizar el diseño de ensayos, el reclutamiento de pacientes y el análisis de datos. Este enfoque especializado en activos de datos biológicos se refleja en el reciente lanzamiento de EvolutionaryScale, que recaudó $142 millones (revelado) para desarrollar "LLMs biológicos" capaces de diseñar nuevas proteínas. Estas operaciones subrayan una tendencia de mercado más amplia donde el valor de un conjunto de datos ya no reside solo en su volumen, sino en su capacidad para generar resultados biológicos de alta fidelidad y accionables.
La participación de Sanofi es particularmente estratégica. Al integrar las capacidades de IA de Formation Bio, el gigante farmacéutico tiene como objetivo reducir las tasas de fracaso tradicionalmente altas de los ensayos clínicos. Esta asociación sigue un patrón de grandes empresas establecidas invirtiendo fuertemente en la infraestructura de datos de sus disruptores para asegurarse un asiento en la mesa de la próxima generación de descubrimiento de fármacos. El capital se utilizará específicamente para adquirir nuevos candidatos a fármacos y refinar aún más los modelos de IA que gestionan el flujo masivo de datos de ensayos.
Fosos de Infraestructura y Recuperación
La carrera por controlar la canalización de datos no se limita a la biotecnología. A medida que los modelos de IA se vuelven más comoditizados, el enfoque se ha desplazado hacia el "foso de datos"—la información propietaria y la infraestructura necesaria para procesarla en tiempo real. Esto fue evidente en la reciente adquisición de Rockset (revelado) por parte de OpenAI, una empresa de bases de datos analíticas en tiempo real. Al incorporar la tecnología de Rockset internamente, OpenAI está fortaleciendo sus capacidades de Generación Aumentada por Recuperación (RAG), permitiendo que sus modelos interactúen de manera más eficiente con los activos de datos empresariales. De manera similar, Apple y Meta han discutido una asociación (estimado) para integrar los modelos Llama de Meta en Apple Intelligence, un movimiento que cerraría la brecha entre los pesos de los modelos de Meta y el vasto ecosistema de datos de usuario de Apple.
El panorama de inversión sigue siendo agresivo para quienes construyen el hardware fundamental para procesar estos conjuntos de datos. Etched aseguró $120 millones en financiación Serie A (revelado) para desarrollar un chip especializado, Sohu, diseñado específicamente para ejecutar modelos transformer. Esta optimización a nivel de hardware es una respuesta directa a los enormes requisitos de cómputo de las aplicaciones de IA intensivas en datos de hoy.
La Rendición de Cuentas Regulatoria para los Datos de Entrenamiento
Sin embargo, la rápida monetización de los activos de datos se enfrenta a un desafío legal significativo. La Recording Industry Association of America (RIAA), que representa a gigantes como Sony y Universal, ha presentado demandas contra las startups de música con IA Suno y Udio. Los demandantes buscan daños estatutarios de hasta $150,000 por obra infractora (exposición legal estimada), alegando que las empresas utilizaron música con derechos de autor sin licencia para entrenar sus modelos. Este litigio representa un momento crucial para la economía de datos: si los tribunales dictaminan que entrenar con datos públicos sin licencia no es "uso justo", el costo de los conjuntos de entrenamiento de alta calidad se disparará, alterando fundamentalmente la economía unitaria del desarrollo de IA.
Por qué importa para los propietarios de datos
La ronda de Formation Bio y el litigio de la RIAA representan dos caras de la misma moneda para los propietarios de datos. Por un lado, los conjuntos de datos especializados y de alta integridad en campos como la biología y la medicina están obteniendo primas masivas y impulsando rondas de financiación de nueve cifras. Por otro lado, la era de los datos de entrenamiento "gratuitos" está llegando a su fin. Para los propietarios de activos de datos, el mensaje es claro: el mercado se está moviendo hacia un modelo formal de licencia y adquisición. Ya sea que posea resultados de ensayos clínicos, catálogos musicales o datos empresariales en tiempo real, sus activos son ahora el principal cuello de botella, y el principal impulsor de valor, en la carrera global de IA.
d-nvest convierte los activos de datos detrás de estos acuerdos en oportunidades puntuadas y accionables.
Explorar el pipeline →