La RIAA fa per Suno e Udio 150.000 $ per canzone per scraping di dati
Sony, Universal e Warner Music Group richiedono ingenti risarcimenti per l'addestramento senza licenza su set di dati audio protetti da copyright.
La Recording Industry Association of America (RIAA), che rappresenta i colossi del settore Sony Music Entertainment, Universal Music Group e Warner Records, ha intentato una causa storica che richiede danni statutari fino a 150.000 $ per opera violata (https://www.reuters.com/legal/music-labels-sue-ai-startups-suno-udio-over-copyright-infringement-2024-06-24/) contro le startup di musica AI Suno e Udio. La controversia, depositata oggi nei tribunali federali del Massachusetts e di New York, segna una escalation critica nella battaglia globale per la valutazione e la protezione legale degli asset di dati proprietari utilizzati per addestrare modelli AI generativi.
L'alto costo dell'addestramento senza licenza
Le cause legali sostengono che Suno e Udio abbiano commesso una violazione del copyright "massiccia" tramite lo scraping di decenni di musica registrata per addestrare i loro modelli generativi. Secondo i documenti, Suno avrebbe violato 662 canzoni protette da copyright (https://www.theverge.com/2024/6/24/24184792/riaa-suno-udio-ai-music-copyright-lawsuit), mentre Udio è accusata di aver sottratto 1.670 registrazioni (https://www.billboard.com/business/legal/suno-udio-sued-major-labels-copyright-infringement-1235716123/). Al massimo statutario di 150.000 $ per opera, le potenziali passività dichiarate per queste startup potrebbero raggiungere centinaia di milioni di dollari, creando un significativo onere finanziario per il settore dell'audio generativo.
I querelanti sostengono che queste società AI non stiano semplicemente creando nuovi strumenti, ma stiano "rubando" il valore espressivo degli artisti umani per creare prodotti commerciali concorrenti. Questo caso colpisce il cuore della difesa del "fair use" attualmente citata da molti sviluppatori AI, i quali affermano che l'addestramento su dati pubblici o raccolti sia trasformativo e quindi legalmente ammissibile senza licenza.
Un passaggio verso licenze applicate
L'azione della RIAA arriva mentre il mercato per dati di addestramento di alta qualità si sposta dallo scraping aperto alle licenze strutturate. Mentre Suno e Udio affrontano contenziosi, altri attori optano per la via dell'"accordo". A titolo di confronto, OpenAI ha recentemente ottenuto un accordo di licenza pluriennale con News Corp, valutato circa 250 milioni di dollari (https://www.nytimes.com/2024/05/22/business/media/openai-news-corp-deal.html) per accedere al suo vasto archivio di contenuti giornalistici. Questa dicotomia evidenzia una crescente divisione nell'ecosistema AI: coloro che pagano per gli asset di dati e coloro che rischiano contenziosi esistenziali aggirando il mercato delle licenze.
Inoltre, la domanda di dati specializzati sta guidando massicci afflussi di capitale. Formation Bio ha recentemente annunciato un round di finanziamento di Serie D da 160 milioni di dollari (https://www.bloomberg.com/news/articles/2024-06-26/openai-sanofi-back-formation-bio-s-160-million-funding-round) supportato da Sanofi e OpenAI, specificamente per costruire pipeline di sviluppo di farmaci basate sull'AI, una mossa che sottolinea il premio posto sui dati di alta integrità e specifici per settore.
Infrastruttura e interoperabilità dei dati
I rischi legali legati all'acquisizione di dati stanno influenzando anche l'attività di M&A nello strato dell'infrastruttura dati. Databricks ha recentemente chiuso l'acquisizione di Tabular per oltre 1 miliardo di dollari (https://www.bloomberg.com/news/articles/2024-06-04/databricks-to-buy-data-management-startup-tabular-for-over-1-billion), un accordo volto a unificare i formati data lakehouse e fornire alle imprese pipeline di dati più pulite e conformi per l'addestramento AI. Man mano che regolatori e detentori di diritti stringono la rete, la capacità di tracciare e verificare la provenienza dei dati di addestramento diventa un vantaggio competitivo fondamentale.
In Europa, anche la pressione normativa è in aumento. La Commissione Europea ha recentemente accusato Apple di violare il Digital Markets Act (DMA) (https://www.cnbc.com/2024/06/24/eu-charges-apple-with-breaching-digital-markets-act.html), concentrandosi su come il colosso tecnologico controlla i dati degli sviluppatori e l'accesso all'ecosistema. Questo scrutinio normativo, unito all'aggressiva azione legale della RIAA, suggerisce che l'era del "raccolta dati non regolamentata" sta rapidamente volgendo al termine.
Perché è importante per i proprietari di dati
Per i proprietari di set di dati di alto valore, sia nella musica, nel giornalismo o nella sanità, la causa della RIAA è un segnale rialzista. Rafforza il principio che i dati proprietari hanno un valore di mercato specifico e di alto valore che non può essere aggirato sotto la maschera del progresso tecnologico. Man mano che i precedenti legali stabiliscono il tetto di responsabilità di 150.000 $ per opera, il minimo per le negoziazioni di licenza aumenterà naturalmente. I proprietari di dati hanno ora un mandato chiaro: monetizzare i propri asset attraverso partnership strutturate o prepararsi a difendere il loro valore in tribunale, dove i potenziali rendimenti derivanti da contenziosi potrebbero presto rivaleggiare con quelli degli accordi di licenza tradizionali.
d-nvest trasforma gli asset di dati dietro queste operazioni in opportunità valutate e attuabili.
Esplora la pipeline →