Poolside AI تؤمن 400 مليون دولار بتقييم 2 مليار دولار لنماذج LLMs لتوليد الأكواد والبيانات
تقود Coatue و Dragoneer استثمارًا ضخمًا في الشركة الناشئة التي تتخذ من باريس مقرًا لها لتوسيع أصولها الخاصة لتوليد الأكواد.
تقترب Poolside AI من إتمام صفقة لجمع ما يقدر بـ 400 مليون دولار (https://www.bloomberg.com/news/articles/2024-06-27/ai-coding-startup-poolside-is-raising-400-million-at-2-billion-valuation) في جولة تمويل جديدة ستقيم الشركة عند 2 مليار دولار (https://www.bloomberg.com/news/articles/2024-06-27/ai-coding-startup-poolside-is-raising-400-million-at-2-billion-valuation). تشير الجولة، بقيادة Coatue Management و Dragoneer Investment Group (https://techcrunch.com/2024/06/27/poolside-the-latest-genai-startup-to-move-to-france-is-nearing-a-400m-raise-at-a-2b-valuation/)، إلى رهان ضخم على البيانات المتخصصة المطلوبة لنقل نماذج اللغة الكبيرة (LLMs) من المحادثة العامة إلى هندسة البرمجيات المستقلة. من خلال تركيز عملياتها في باريس، تضع Poolside نفسها في قلب منظومة المواهب والبيانات الأوروبية للذكاء الاصطناعي، مستهدفة بشكل خاص قواعد الأكواد الخاصة وسير عمل المطورين التي تحدد الحدود التالية لأدوات الإنتاجية.
خندق البيانات المتخصص: ما وراء نماذج LLMs العامة
يعكس ضخ رأس المال في Poolside AI تحولًا أوسع في السوق نحو أصول البيانات المتخصصة. بينما وصلت النماذج للأغراض العامة إلى سقف فائدتها، فإن الشركات الناشئة التي تركز على مجموعات البيانات المتخصصة وعالية الدقة تحقق تقييمات متميزة. تتمحور استراتيجية Poolside حول تدريب النماذج على مستودعات ضخمة ومنظمة من الأكواد، والتي تتطلب دقة أعلى بكثير من مجموعات البيانات النصية القياسية. ينعكس هذا الاتجاه في القطاع البيولوجي، حيث كشفت EvolutionaryScale مؤخرًا عن جولة تمويل أولية بقيمة 142 مليون دولار (https://www.reuters.com/technology/ai/ai-biology-startup-evolutionaryscale-raises-142-million-2024-06-25/) لتسويق نموذجها ESM3. تم تدريب ESM3 على 2.7 مليار تسلسل بروتيني مذهل (https://techcrunch.com/2024/06/25/evolutionaryscale-is-biologys-ai-frontier-lab/)، مما يوضح أن أصول البيانات الأكثر قيمة اليوم هي تلك التي ترسم اللبنات الأساسية للعلم والهندسة.
حروب الترخيص: الأرشيفات مقابل الوصول في الوقت الفعلي
بينما تؤمن الشركات الناشئة التمويل لبناء النماذج، تقوم شركات الذكاء الاصطناعي الكبرى بتأمين أرشيفات البيانات التاريخية بقوة. أبرمت OpenAI اتفاقية ترخيص محتوى متعددة السنوات مع Time (https://openai.com/index/time-partnership/)، مما يمنحها الوصول إلى 101 عامًا من المحتوى الأرشيفي (https://www.theverge.com/2024/6/27/24187515/openai-time-magazine-licensing-deal-ai-training) لتحسين نماذجها وتقديم استجابات مستشهد بها داخل ChatGPT. تتبع هذه الصفقة نمطًا من الشراكات عالية القيمة مع ناشرين مثل News Corp و Axel Springer، مما يحدد سعر سوق واضح للبيانات النصية ذات السلطة العالية. بالنسبة لأصحاب البيانات، تمثل هذه الصفقات تحولًا من الاستضافة السلبية إلى إدارة الأصول النشطة، حيث ينمو الطلب على المعلومات القابلة للتحقق والتي نسقها البشر استجابة مباشرة لانتشار "القمامة" التي تم إنشاؤها بواسطة الذكاء الاصطناعي عبر الإنترنت.
الضغوط التنظيمية وسلامة البيانات
ومع ذلك، فإن السباق على البيانات يواجه احتكاكات قانونية وتنظيمية كبيرة. رفعت جمعية صناعة التسجيلات الأمريكية (RIAA) دعاوى قضائية ضد مولدات الموسيقى بالذكاء الاصطناعي Suno و Udio (https://www.reuters.com/legal/major-record-labels-sue-ai-firms-suno-udio-over-copyright-infringement-2024-06-24/)، مطالبة بتعويضات قانونية تصل إلى 150,000 دولار لكل عمل تم انتهاكه (https://www.billboard.com/business/legal/labels-sue-suno-udio-ai-copyright-infringement-1235716182/). في الوقت نفسه، واجهت شركة التصميم العملاقة Figma ردود فعل عنيفة بسبب سياسات بيانات تدريب الذكاء الاصطناعي الخاصة بها (https://www.theverge.com/2024/6/27/24187315/figma-ai-tools-config-2024-training-data)، مما أجبر الشركة على توضيح آليات الانسحاب الخاصة بها لمستخدمي المؤسسات. تشير هذه الأحداث إلى أنه بينما يتوفر رأس المال للذكاء الاصطناعي كثيف البيانات بوفرة، فإن عصر "الغرب المتوحش" للكشط غير المعوض يقترب من نهايته. الشركات مثل Glean، التي تجري محادثات لجمع 250 مليون دولار (https://www.reuters.com/technology/ai-startup-glean-talks-raise-250-mln-45-bln-valuation-source-says-2024-06-25/) بتقييم 4.5 مليار دولار (https://www.reuters.com/technology/ai-startup-glean-talks-raise-250-mln-45-bln-valuation-source-says-2024-06-25/)، تنجح من خلال التركيز على بيانات المؤسسات الداخلية الآمنة والمسموح بها بدلاً من المحتوى المكتشط من الويب العام.
لماذا يهم أصحاب البيانات
يثبت تقييم Poolside AI والدعاوى القضائية ضد الشركات الناشئة في مجال الموسيقى أن السوق ينقسم: يتم تحويل البيانات العامة إلى سلع، بينما تصبح أصول البيانات المتخصصة وعالية النزاهة المصدر الأساسي للألفا. بالنسبة لأصحاب البيانات، تكمن الفرصة في الانتقال من الترخيص لمرة واحدة إلى نماذج البيانات كخدمة (DaaS) المتكررة والمنظمة. مع بدء قانون الذكاء الاصطناعي للاتحاد الأوروبي في فرض الشفافية في مجموعات التدريب، ستصبح أصل البيانات لا تقل قيمة عن البيانات نفسها، مما يحول الامتثال إلى ميزة تنافسية لحاملي البيانات المؤسسية.
يحول d-nvest أصول البيانات وراء هذه الصفقات إلى فرص قابلة للتنفيذ ومقيمة.
استكشف خط الأنابيب ←