licensingai traininglitigationdata acquisition26 يونيو 2026

OpenAI و Time تبرمان صفقة ترخيص بيانات متعددة السنوات

الشراكة تؤمن الوصول إلى 101 عامًا من البيانات الأرشيفية لتدريب الذكاء الاصطناعي، مما يعزز سوق 'الدفع مقابل التدريب'.

أبرمت OpenAI اتفاقية ترخيص متعددة السنوات مع مجلة Time لدمج 101 عامًا من المحتوى الأرشيفي في نماذج الذكاء الاصطناعي التوليدية الخاصة بها (https://openai.com/index/time-and-openai-partnership/). تمنح هذه الشراكة مختبر الذكاء الاصطناعي إمكانية الوصول إلى ملايين المقالات من تاريخ Time العميق، مما يسمح لمنتجاتها - بما في ذلك ChatGPT - بالاستشهاد والربط بالتقارير الأصلية أثناء استخدام البيانات لتحسين دقة النموذج وترسيخ الحقائق. بينما تظل الشروط المالية غير معلنة، تشير معايير الصناعة إلى أن الصفقة تتبع مسار تقييم اتفاقية OpenAI السابقة البالغة 250 مليون دولار (تقديري) مع News Corp (https://www.wsj.com/business/media/news-corp-openai-content-licensing-deal-81014532).

التحول الاستراتيجي نحو الأرشيفات المرخصة

تمثل الصفقة مع Time ركيزة أساسية في استراتيجية OpenAI لعزل خطوط أنابيب التدريب الخاصة بها عن التقلبات القانونية والتنظيمية المحيطة بكشط الويب. من خلال تأمين قرن من البيانات عالية الجودة والمتحقق منها بشريًا، تقوم OpenAI ببناء 'خندق' من الذكاء المرخص. هذه الخطوة لا تتعلق فقط بالوصول إلى المحتوى؛ بل تتعلق بالسلامة الهيكلية لأصل البيانات. توفر أرشيفات Time مجموعة بيانات زمنية للأحداث العالمية، وهي لا تقدر بثمن لتدريب النماذج على فهم السياق التاريخي وتحولات السرد طويلة الأجل. يتبع هذا اتجاهًا أوسع حيث لم يعد الناشرون ينظرون إلى أرشيفاتهم على أنها تاريخ ثابت، بل كأصول تدريب ديناميكية لعصر التوليد.

بديل التقاضي: تحذير بقيمة 1.6 مليار دولار

تتأكد الحاجة الملحة للترخيص الرسمي من خلال الضغط القانوني الهائل المتزايد ضد استخدام البيانات غير المرخصة. هذا الأسبوع، رفعت جمعية صناعة التسجيلات الأمريكية (RIAA)، التي تمثل عمالقة مثل Sony Music و Universal Music Group، دعوى قضائية تاريخية بقيمة 1.6 مليار دولار (تقديري) لانتهاك حقوق النشر ضد شركات الموسيقى الناشئة في مجال الذكاء الاصطناعي Suno و Udio (https://www.reuters.com/legal/major-record-labels-sue-ai-firms-suno-udio-copyright-infringement-2024-06-24/). يسعى المدعون إلى الحصول على تعويضات قانونية تصل إلى 150,000 دولار (معلن) لكل عمل تم انتهاكه (https://www.theverge.com/2024/6/24/24184792/riaa-suno-udio-ai-music-copyright-lawsuit). تعمل هذه الدعاوى القضائية العدوانية كإشارة للسوق: عصر 'الكشط والاعتذار' ينتهي، وتكلفة البيانات غير المرخصة يتم تسعيرها الآن بعلاوة من قبل المحاكم.

توحيد البنية التحتية للبيانات

بالإضافة إلى الترخيص، يشهد سوق البنية التحتية المرتكزة على البيانات توحيدًا سريعًا. استحوذت OpenAI مؤخرًا على Rockset، وهي شركة قواعد بيانات للبحث والتحليلات في الوقت الفعلي، مقابل مبلغ غير معلن يقدر بمئات الملايين (https://openai.com/index/openai-acquires-rockset/). هذا الاستحواذ هو خطوة مباشرة لتعزيز 'التوليد المعزز بالاسترجاع' (RAG)، مما يسمح لمستخدمي المؤسسات بفهرسة أصول بياناتهم الخاصة بشكل أكثر كفاءة. في الوقت نفسه، يظل المشهد الاستثماري للذكاء الاصطناعي كثيف البيانات قويًا؛ أغلقت Etched مؤخرًا جولة تمويل من الفئة A بقيمة 120 مليون دولار (معلن) لتطوير شرائح متخصصة تعمل على تحسين معالجة هياكل البيانات القائمة على المحولات (https://techcrunch.com/2024/06/25/etched-raises-120m-to-build-an-ai-chip-that-only-runs-transformers/).

التنظيم العالمي وضغط البيانات

تزيد الهيئات التنظيمية من تعقيد مشهد اكتساب البيانات. اتهمت المفوضية الأوروبية مؤخرًا شركة Apple بانتهاك قانون الأسواق الرقمية (DMA)، مستهدفة على وجه التحديد قواعد 'التوجيه' الخاصة بالعملاق التكنولوجي التي تحد من كيفية إدارة المطورين لبياناتهم وعلاقاتهم مع العملاء (https://ec.europa.eu/commission/presscorner/detail/en/ip_24_3433). مع تشديد المنظمين على قابلية نقل البيانات وإغلاق الأنظمة البيئية، تزداد قيمة البيانات المرخصة 'من الطرف الأول' - مثل أرشيفات Time - فقط. تجد الشركات التي تمتلك خطوط أنابيب بياناتها ولديها سند قانوني واضح لمجموعات التدريب الخاصة بها نفسها في ميزة تنافسية كبيرة في بيئة رأس المال الحالية.

لماذا يهم لأصحاب البيانات

بالنسبة لأصحاب البيانات المؤسسية، تؤكد صفقة OpenAI-Time والتقاضي المتزامن لـ RIAA أن مجموعات البيانات عالية الجودة والمنظمة هي الآن السلعة الأكثر قيمة في سلسلة توريد الذكاء الاصطناعي. نحن نتحرك نحو سوق مقسم: 'سوق أبيض' عالي القيمة للبيانات المرخصة والنظيفة، و 'سوق رمادي' عالي المخاطر للمحتوى المكتشط. يجب على أصحاب البيانات إعطاء الأولوية لتنظيم وتدقيق أرشيفاتهم قانونيًا، حيث أصبح نموذج الترخيص 'المبلغ الإجمالي' الذي روّجت له YouTube و OpenAI هو المخرج القياسي لأصول المحتوى المملوكة. لم يعد تقييم بياناتك مرتبطًا بعدد المشاهدات، بل بفائدتها كوزن تدريب أساسي.

يحول d-nvest أصول البيانات وراء هذه الصفقات إلى فرص قابلة للتنفيذ ومقيمة.

استكشف خط الأنابيب ←
OpenAI و Time تبرمان صفقة ترخيص بيانات متعددة السنوات | d-nvest