biotechai fundingdrug discoveryclinical dataventure capital25. Juni 2026

Formation Bio sichert sich 372 Mio. USD Serie D für KI-gestützte Medikamentenentdeckung

Die von a16z und Sanofi angeführte Runde beschleunigt die Mission von Formation Bio zur Automatisierung der Medikamentenentwicklung durch proprietäre Daten.

Formation Bio hat eine Serie-D-Finanzierungsrunde über 372 Millionen US-Dollar (bekannt gegeben) abgeschlossen, um seine KI-native klinische Plattform zu skalieren und den Erwerb von pharmazeutischen Daten zu beschleunigen. Die Runde wurde von Andreessen Horowitz (a16z) angeführt, mit erheblicher Beteiligung des globalen Gesundheitsriesen Sanofi, was einen bedeutenden Wandel in der Bewertung der Schnittstelle von proprietären klinischen Daten und generativer KI durch die Branche signalisiert.

Die Industrialisierung biologischer Daten

Im Gegensatz zu traditionellen Auftragsforschungsinstituten (CROs) agiert Formation Bio als technologiegestütztes Pharmaunternehmen, das seine eigene Pipeline durch den Erwerb von Medikamenten in der klinischen Phase aufbaut. Der Kern ihrer Strategie liegt in ihrer proprietären Daten-Engine, die KI zur Automatisierung von Studiendesign, Patientenrekrutierung und Datenanalyse einsetzt. Dieser spezialisierte Fokus auf biologische Daten spiegelt sich in der kürzlichen Einführung von EvolutionaryScale wider, das 142 Millionen US-Dollar (bekannt gegeben) zur Entwicklung "biologischer LLMs" zur Gestaltung neuer Proteine gesammelt hat. Diese Deals unterstreichen einen breiteren Markttrend, bei dem der Wert eines Datensatzes nicht mehr nur in seinem Volumen liegt, sondern in seiner Fähigkeit, hochgradig präzise, umsetzbare biologische Ergebnisse zu generieren.

Die Beteiligung von Sanofi ist besonders strategisch. Durch die Integration der KI-Fähigkeiten von Formation Bio zielt der Pharmariese darauf ab, die traditionell hohen Ausfallraten klinischer Studien zu reduzieren. Diese Partnerschaft folgt einem Muster, bei dem etablierte Unternehmen stark in die Dateninfrastruktur ihrer Disruptoren investieren, um sich einen Platz in der nächsten Generation der Medikamentenentdeckung zu sichern. Das Kapital wird speziell für den Erwerb neuer Medikamentenkandidaten und die weitere Verfeinerung der KI-Modelle verwendet, die den massiven Zustrom von Studiendaten verwalten.

Infrastruktur- und Abruf-Moats

Das Rennen um die Kontrolle der Datenpipeline beschränkt sich nicht auf die Biotech-Branche. Da KI-Modelle zunehmend standardisiert werden, hat sich der Fokus auf den "Daten-Moat" verlagert – die proprietären Informationen und die Infrastruktur, die für deren Echtzeitverarbeitung erforderlich sind. Dies zeigte sich in der kürzlichen Übernahme von Rockset (bekannt gegeben) durch OpenAI, einem Unternehmen für Echtzeit-Analyse-Datenbanken. Durch die Integration der Rockset-Technologie in das eigene Haus stärkt OpenAI seine Retrieval-Augmented Generation (RAG)-Fähigkeiten und ermöglicht seinen Modellen eine effizientere Interaktion mit Unternehmensdaten. Ähnlich haben Apple und Meta Berichten zufolge eine Partnerschaft (geschätzt) diskutiert, um Metas Llama-Modelle in Apple Intelligence zu integrieren, eine Maßnahme, die die Lücke zwischen Metas Modellgewichten und Apples riesigem Ökosystem von Benutzerdaten schließen würde.

Die Investitionslandschaft bleibt aggressiv für diejenigen, die die grundlegende Hardware zur Verarbeitung dieser Datensätze entwickeln. Etched sicherte sich 120 Millionen US-Dollar in einer Serie-A-Finanzierung (bekannt gegeben) zur Entwicklung eines spezialisierten Chips, Sohu, der speziell für die Ausführung von Transformer-Modellen entwickelt wurde. Diese Optimierung auf Hardware-Ebene ist eine direkte Reaktion auf die massiven Rechenanforderungen der heutigen datenintensiven KI-Anwendungen.

Die regulatorische Abrechnung für Trainingsdaten

Die schnelle Monetarisierung von Datenbeständen steht jedoch vor einer erheblichen rechtlichen Herausforderung. Die Recording Industry Association of America (RIAA), die Giganten wie Sony und Universal vertritt, hat Klagen gegen die KI-Musik-Startups Suno und Udio eingereicht. Die Kläger fordern pauschale Schadensersatzansprüche von bis zu $150.000 pro verletztem Werk (geschätzte rechtliche Haftung) und behaupten, dass die Unternehmen urheberrechtlich geschützte Musik ohne Lizenz zum Trainieren ihrer Modelle verwendet haben. Diese Rechtsstreitigkeiten stellen einen entscheidenden Moment für die Datenwirtschaft dar: Wenn die Gerichte entscheiden, dass das Training auf öffentlichen Daten ohne Lizenz kein "Fair Use" ist, werden die Kosten für hochwertige Trainingsdatensätze in die Höhe schnellen und die Stückkosten der KI-Entwicklung grundlegend verändern.

Warum es für Dateneigentümer wichtig ist

Die Runde von Formation Bio und die RIAA-Rechtsstreitigkeiten stellen für Dateneigentümer zwei Seiten derselben Medaille dar. Einerseits erzielen spezialisierte, hochintegre Datensätze in Bereichen wie Biologie und Medizin massive Prämien und treiben Finanzierungsrunden in neunstelliger Höhe an. Andererseits neigt sich die Ära der "kostenlosen" Trainingsdaten dem Ende zu. Für Eigentümer von Datenbeständen ist die Botschaft klar: Der Markt bewegt sich hin zu einem formalen Lizenzierungs- und Akquisitionsmodell. Ob Sie Ergebnisse klinischer Studien, Musikkataloge oder Echtzeit-Unternehmensdaten besitzen, Ihre Vermögenswerte sind jetzt der primäre Engpass – und der primäre Werttreiber – im globalen KI-Rennen.

d-nvest verwandelt die Datenbestände hinter diesen Deals in bewertete, umsetzbare Möglichkeiten.

Pipeline erkunden →