News Corp et Meta concluent un accord de licence de données IA d'une valeur de 50 millions de dollars par an
L'accord de cinq ans accorde à Meta l'accès au contenu premium du Wall Street Journal et de Barron's pour l'entraînement de l'IA.
News Corp a obtenu une estimation de 50 millions de dollars par an (https://www.journalismpakistan.com/news-details.php?id=32491) dans le cadre d'un pacte de licence pluriannuel avec Meta Platforms, afin de fournir des données journalistiques de haute qualité pour l'écosystème d'IA générative du géant technologique. L'accord, divulgué le 26 juin 2026, accorde à Meta l'accès au contenu actuel et archivé de mastheads prestigieux, notamment The Wall Street Journal, Barron's et The New York Post (https://apnews.com/article/news-corp-openai-deal-250-million-5-years), ainsi qu'à des titres britanniques et australiens majeurs. Cette décision signale un changement stratégique pour Meta, qui s'est historiquement appuyée sur le scraping du web public, alors qu'elle cherche désormais à sécuriser des "données de frontière" pour alimenter ses suites de modèles Llama et Nova.
Le nouveau plancher pour les actifs de données premium
L'accord établit un plancher de prix significatif pour la licence de données de niveau entreprise dans le secteur de l'actualité. Les analystes notent que ce partenariat fait suite à un accord similaire de 250 millions de dollars sur cinq ans (https://timesofindia.indiatimes.com/technology/tech-news/openais-250-million-deal-with-news-corp-gets-it-over-a-dozen-news-publications-to-train-its-ai-model/articleshow/110360492.cms) précédemment conclu entre News Corp et OpenAI. Le marché des données d'entraînement à haute fidélité se resserre, les éditeurs se divisant de plus en plus en deux camps : ceux qui poursuivent en justice, comme The New York Times, et ceux qui optent pour la monétisation commerciale. La tendance à la licence s'accélère à l'échelle mondiale, comme en témoigne le journal brésilien Folha (https://www.journalismpakistan.com/news-details.php?id=32491), qui a réglé son différend juridique avec OpenAI cette semaine en signant un accord commercial peu après avoir conclu un partenariat avec Google.
Infrastructure et fondations de données souveraines
À mesure que les accords de licence prennent de l'ampleur, l'infrastructure nécessaire pour gérer ces ensembles de données massifs se développe. Le 27 juin 2026, VAST Data a annoncé un partenariat élargi avec Sharon AI pour construire une fondation de données d'IA souveraine de 600 pétaoctets (https://www.tipranks.com/news/vast-data-weekly-recap) en Australie. Ce projet vise à fournir la couche de données sécurisée et haute performance nécessaire aux charges de travail Python et d'inférence à grande échelle, simplifiant le passage des projets pilotes aux applications d'IA en temps réel pour les entreprises. Pendant ce temps, le secteur financier assiste à l'essor de la monétisation de données "agentiques" ; Visa et Alchemy ont rapporté que leur nouvelle carte AgentCard (https://www.americanbanker.com/news/visas-agentic-ai-push-includes-a-card-for-bots) pour les agents IA a obtenu 78 000 inscriptions (https://www.americanbanker.com/news/visas-agentic-ai-push-includes-a-card-for-bots) au cours de ses premières 48 heures, soulignant l'émergence rapide d'une économie machine à machine alimentée par des jetons de données en temps réel.
Conformité réglementaire et transparence
La flambée de l'activité de licence est également une réponse aux phases finales de mise en œuvre de l'AI Act de l'UE (https://www.consilium.europa.eu/en/press/press-releases/2024/05/21/artificial-intelligence-ai-act-council-gives-final-green-light-to-the-first-worldwide-rules-on-ai/), qui impose une plus grande transparence concernant les ensembles de données utilisés pour entraîner les modèles d'IA générale (GPAI). Des entreprises comme Google étendent leur programme pilote News AI (https://www.mediapost.com/publications/article/396266/google-news-seeks-broader-publisher-permissions-fo.html) pour inclure The Washington Post et The Guardian, offrant aux éditeurs une voie de monétisation par le biais d'"aperçus d'articles alimentés par l'IA" plutôt que par le trafic de référence de recherche traditionnel. Cette pression réglementaire oblige les développeurs d'IA à nettoyer leurs chaînes d'approvisionnement, faisant des données sous licence et vérifiées par l'homme l'actif le plus précieux de la pile d'IA.
Pourquoi c'est important pour les propriétaires de données
Pour les propriétaires de données, l'accord News Corp-Meta prouve que les archives premium ne sont plus de simples enregistrements historiques, mais des actifs liquides à haut rendement. Alors que les laboratoires d'IA sont confrontés à un examen juridique et réglementaire croissant concernant la provenance des données, le "taux de prise" pour les ensembles de données propriétaires augmente. Les propriétaires de données spécialisées et de haute intégrité ont désormais un levier sans précédent pour négocier des flux de revenus récurrents pluriannuels de plusieurs millions de dollars qui compensent le déclin des modèles traditionnels de publicité numérique et de trafic.
Sources
d-nvest transforme les actifs de données derrière ces transactions en opportunités évaluées et exploitables.
Explorer le pipeline →