licensingai traininglitigationdata acquisition26. Juni 2026

OpenAI und Time schließen mehrjährigen Datenlizenzvertrag ab

Die Partnerschaft sichert den Zugang zu 101 Jahren Archivdaten für das KI-Training und stärkt den Markt für 'Pay-to-Train'.

OpenAI hat eine mehrjährige Lizenzvereinbarung mit dem Time Magazine geschlossen, um 101 Jahre Archivmaterial in seine generativen KI-Modelle zu integrieren (https://openai.com/index/time-and-openai-partnership/). Diese Partnerschaft gewährt dem KI-Labor Zugang zu Millionen von Artikeln aus der langen Geschichte von Time und ermöglicht es seinen Produkten – einschließlich ChatGPT –, auf Originalberichte zu verweisen und Links zurückzulegen, während die Daten zur Verbesserung der Modellgenauigkeit und der faktischen Fundierung genutzt werden. Obwohl die finanziellen Bedingungen nicht bekannt gegeben wurden, deuten Branchenmaßstäbe darauf hin, dass der Deal der Bewertungstendenz der früheren Vereinbarung von OpenAI mit News Corp in Höhe von 250 Millionen US-Dollar (geschätzt) folgt (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-81014532).

Der strategische Schwenk zu lizenzierten Archiven

Der Deal mit Time stellt eine kritische Säule in OpenAIs Strategie dar, seine Trainingspipelines von der rechtlichen und regulatorischen Volatilität im Zusammenhang mit Web-Scraping zu isolieren. Durch die Sicherung eines Jahrhunderts hochwertiger, von Menschen verifizierter Daten baut OpenAI effektiv einen 'Burggraben' an lizenzierten Informationen auf. Dieser Schritt betrifft nicht nur den Zugang zu Inhalten, sondern auch die strukturelle Integrität des Datenvermögens. Times Archive bieten einen chronologischen Datensatz globaler Ereignisse, der für das Training von Modellen zum Verständnis historischer Kontexte und langfristiger narrativer Verschiebungen von unschätzbarem Wert ist. Dies folgt einem breiteren Trend, bei dem Verlage ihre Archive nicht mehr als statische Geschichte, sondern als dynamische Trainingsressourcen für das generative Zeitalter betrachten.

Die Alternative zur Klage: Eine Warnung über 1,6 Milliarden US-Dollar

Die Dringlichkeit formeller Lizenzierung wird durch den massiven rechtlichen Druck unterstrichen, der gegen die unlizenzierte Datennutzung aufgebaut wird. Diese Woche reichte die Recording Industry Association of America (RIAA), die Giganten wie Sony Music und Universal Music Group vertritt, eine wegweisende Klage wegen Urheberrechtsverletzung in Höhe von 1,6 Milliarden US-Dollar (geschätzt) gegen die KI-Musik-Startups Suno und Udio ein (https://www.reuters.com/legal/major-record-labels-sue-ai-firms-suno-udio-copyright-infringement-2024-06-24/). Die Kläger fordern pauschale Schadensersatzansprüche von bis zu 150.000 US-Dollar (bekannt gegeben) pro verletztem Werk (https://www.theverge.com/2024/6/24/24184792/riaa-suno-udio-ai-music-copyright-lawsuit). Diese aggressive Klage dient als Marktsignal: Die Ära des 'Scrape-and-Apologize' geht zu Ende, und die Kosten für unlizenzierte Daten werden nun von den Gerichten mit einem Aufschlag bepreist.

Konsolidierung der Dateninfrastruktur

Über die Lizenzierung hinaus erlebt der Markt für datenzentrierte Infrastruktur eine rasche Konsolidierung. OpenAI erwarb kürzlich Rockset, ein Unternehmen für Echtzeit-Such- und Analyse-Datenbanken, für eine nicht bekannt gegebene Summe, die auf Hunderte von Millionen geschätzt wird (https://openai.com/index/openai-acquires-rockset/). Diese Übernahme ist ein direkter Schritt zur Verbesserung von 'Retrieval-Augmented Generation' (RAG), der es Unternehmenskunden ermöglicht, ihre eigenen proprietären Datenbestände effizienter zu indizieren. Gleichzeitig bleibt die Investitionslandschaft für datenintensive KI robust; Etched schloss kürzlich eine Series-A-Runde über 120 Millionen US-Dollar (bekannt gegeben) ab, um spezialisierte Chips zu entwickeln, die die Verarbeitung von Transformer-basierten Datenarchitekturen optimieren (https://techcrunch.com/2024/06/25/etched-raises-120m-to-build-an-ai-chip-that-only-runs-transformers/).

Globale Regulierung und die Datenknappheit

Regulierungsbehörden erschweren die Landschaft der Datenbeschaffung weiter. Die Europäische Kommission hat Apple kürzlich beschuldigt, gegen den Digital Markets Act (DMA) verstoßen zu haben, insbesondere im Hinblick auf die 'Steering'-Regeln des Tech-Giganten, die einschränken, wie Entwickler ihre eigenen Kundendaten und Beziehungen verwalten können (https://ec.europa.eu/commission/presscorner/detail/en/ip_24_3433). Da die Regulierungsbehörden die Datenportabilität und das Lock-in in Ökosystemen verschärfen, steigt der Wert von 'First-Party'-lizenzierten Daten – wie den Archiven von Time – nur noch weiter an. Unternehmen, die ihre Datenpipelines besitzen und klare Eigentumsrechte an ihren Trainingsdatensätzen haben, verschaffen sich im aktuellen Kapitalumfeld einen erheblichen Wettbewerbsvorteil.

Warum es für Dateneigentümer wichtig ist

Für institutionelle Dateneigentümer bestätigen der OpenAI-Time-Deal und die gleichzeitige RIAA-Klage, dass hochwertige, strukturierte Datensätze nun die wertvollste Ware in der KI-Lieferkette sind. Wir bewegen uns auf einen gespaltenen Markt zu: einen hochwertigen 'White Market' für lizenzierte, saubere Daten und einen risikoreichen 'Grey Market' für gescrapte Inhalte. Dateneigentümer sollten die Kuratierung und rechtliche Prüfung ihrer Archive priorisieren, da das von YouTube und OpenAI eingeführte 'Pauschalpreis'-Lizenzmodell zum Standard-Exit für proprietäre Inhaltsvermögenswerte wird. Die Bewertung Ihrer Daten ist nicht mehr an Seitenaufrufe gebunden, sondern an ihre Nützlichkeit als grundlegendes Trainingsgewicht.

d-nvest verwandelt die Datenbestände hinter diesen Deals in bewertete, umsetzbare Möglichkeiten.

Pipeline erkunden →