OpenAI schließt Lizenzabkommen über 250 Mio. USD mit News Corp
Der Fünfjahresvertrag sichert Premium-Journalismus-Archive von WSJ und Barron's für KI-Training und -Inferenz.
OpenAI hat eine wegweisende Content-Lizenzvereinbarung mit News Corp formalisiert, ein Deal, der auf über 250 Millionen US-Dollar (https://www.wsj.com/business/media/openai-news-corp-deal-250-million-4d642b5d) über einen Zeitraum von fünf Jahren geschätzt wird. Diese offengelegte Partnerschaft gewährt dem von Microsoft unterstützten KI-Giganten Zugang zu aktuellen und archivierten Inhalten von wichtigen Publikationen, darunter The Wall Street Journal, Barron’s, MarketWatch und The Times, und wandelt damit hochwertige journalistische Inhalte effektiv in einen hochpräzisen Trainingsstrom für seine Weltmodelle der nächsten Generation um. Dieser Schritt signalisiert eine strategische Neuausrichtung von OpenAI, um seine Datenpipeline von den wachsenden rechtlichen und ethischen Risiken im Zusammenhang mit unbefugtem Web-Scraping zu isolieren.
Der strategische Wert von Premium-Textdaten
Die Vereinbarung ist nicht nur ein defensives rechtliches Manöver; sie ist eine kalkulierte Wette auf die überlegene Leistung kuratierter, hochautoritativer Datensätze. Da die Spitzenmodelle an die Grenzen der öffentlich verfügbaren Internetdaten stoßen, tritt die Branche in eine Phase der „Datenknappheit“ ein, in der die Qualität der Tokens wichtiger ist als das reine Volumen. Durch die Sicherung des News Corp-Archivs erhält OpenAI Zugang zu jahrzehntelang strukturierten, faktengeprüften und kontextreich angereicherten menschlichen Schlussfolgerungen. Dies ist entscheidend für die Verbesserung der faktischen Genauigkeit und der Schlussfolgerungsfähigkeiten von Modellen wie GPT-5, die darauf abzielen, als zuverlässigere Agenten in professionellen und finanziellen Umgebungen zu fungieren. Der Deal ist so strukturiert, dass OpenAI das Recht erhält, Inhalte als Antwort auf Benutzeranfragen anzuzeigen, wodurch die Grenze zwischen Suchmaschinen und generativen KI-Schnittstellen weiter verschwimmt.
Scale AI und die 1-Milliarde-Dollar-Infrastruktur der Datenfülle
Der institutionelle Vorstoß für hochwertige Daten wird durch die kürzlich abgeschlossene Serie-F-Finanzierungsrunde von Scale AI in Höhe von 1 Milliarde US-Dollar (https://techcrunch.com/2024/05/21/scale-ai-raises-1-billion-at-a-13-8-billion-valuation/) weiter untermauert, die das Unternehmen mit $13,8 Milliarden (https://www.reuters.com/technology/scale-ai-raises-1-billion-valuation-doubles-138-billion-2024-05-21/) bewertete. Scale AI fungiert als kritischer Vermittler in der Daten-Asset-Wirtschaft und stellt die menschliche Beteiligung (HITL) und das RLHF (Reinforcement Learning from Human Feedback) bereit, die erforderlich sind, um Rohdaten – wie die Archive von News Corp – in maschinenlesbare Trainingsdatensätze umzuwandeln. Diese Finanzierungsrunde, angeführt von Accel mit Beteiligung von Staatsfonds, unterstreicht, dass die physische und menschliche Infrastruktur zur Datenverarbeitung nun genauso wertvoll ist wie die Rechenleistung selbst. Da sich Weltmodelle zur Verarbeitung multimodaler Eingaben – Video, Audio und Sensordaten – weiterentwickeln, steigt die Komplexität der Kennzeichnung dieser Assets exponentiell an, was einen massiven Burggraben für diejenigen schafft, die die Datenlieferkette kontrollieren.
DeepL und der Aufstieg spezialisierter Daten-Burgen
Während allgemeine Modelle um Nachrichtenarchive kämpfen, beweisen spezialisierte KI-Unternehmen den Wert von Nischen-Datenbeständen. DeepL, der deutsche Spezialist für Übersetzungs-KI, sicherte sich kürzlich 300 Millionen US-Dollar (https://www.reuters.com/technology/ai-startup-deepl-valued-2-billion-after-latest-funding-round-2024-05-22/) an Investitionen bei einer Bewertung von 2 Milliarden US-Dollar (https://techcrunch.com/2024/05/22/deepl-the-ai-translation-startup-is-now-valued-at-2b/). Der Erfolg von DeepL basiert auf einem proprietären Datensatz hochwertiger Übersetzungen, der größere Modelle übertrifft, die auf verrauschteren Daten trainiert wurden. Dies bestätigt einen wachsenden Trend im d-nvest-Intelligenzbereich: Dateneigentümer, die über einzigartige, branchenspezifische Datensätze (rechtlich, medizinisch oder sprachlich) verfügen, sehen ihre Vermögensbewertungen in die Höhe schnellen, da allgemeine KI-Unternehmen nach spezialisierten „Wissens-Burgen“ suchen, um ihre Angebote zu differenzieren.
Regulatorische Leitplanken: Der EU-KI-Act verabschiedet
Der Markt für Datenabkommen operiert nun unter einem neuen globalen Standard. Der Europäische Rat hat dem EU-KI-Act, dem weltweit ersten umfassenden Rahmenwerk für künstliche Intelligenz, die endgültige Zustimmung (https://www.consilium.europa.eu/en/press/press-releases/2024/05/21/artificial-intelligence-ai-act-council-gives-final-green-light-to-the-first-worldwide-rules-on-ai/) erteilt. Die Verordnung führt strenge Transparenzanforderungen für allgemeine KI-Modelle ein, einschließlich der Verpflichtung, detaillierte Zusammenfassungen der für das Training verwendeten Daten bereitzustellen. Diese regulatorische Klarheit wird voraussichtlich den Trend zu formellen Lizenzvereinbarungen beschleunigen, da Unternehmen die Einstufung als „Hochrisiko“ und potenzielle Strafen im Zusammenhang mit nicht konformer Datenbeschaffung vermeiden wollen. Für Dateninvestoren verwandelt der EU-KI-Act die Datenherkunft von einer rechtlichen Fußnote in einen primären Bewertungsfaktor.
Warum es für Dateneigentümer wichtig ist
Für Eigentümer hochwertiger, strukturierter Datenbestände ist der Deal zwischen OpenAI und News Corp ein Wendepunkt, der einen klaren Marktpreis für Premium-Inhalte festlegt. Wir bewegen uns von einer Ära der Datenausbeutung hin zu einer Ära der Datenmonetarisierung. Da KI-Entwickler ihren Fokus auf „Weltmodelle“ verlagern, die ein tiefes kontextuelles Verständnis und faktische Fundierung erfordern, verschiebt sich die Verhandlungsmacht zurück zu den Content-Erstellern. Dateneigentümer sollten ihre Archive nicht länger als historische Aufzeichnungen betrachten, sondern als hochrentable liquide Vermögenswerte, die wiederholt über verschiedene KI-Vertikalen hinweg lizenziert werden können. Der Schlüssel zur Maximierung des Wertes liegt in der Datenbereitschaft: Sicherstellen, dass Archive digitalisiert, Metadaten-reich und rechtlich für das KI-Training freigegeben sind.
d-nvest verwandelt die Datenbestände hinter diesen Deals in bewertete, umsetzbare Möglichkeiten.
Pipeline erkunden →