EvolutionaryScale تؤمن 142 مليون دولار لتوسيع نماذج البيانات البيولوجية
تغلق الشركة الناشئة جولة تمويل أولية لبناء ذكاء اصطناعي توليدي باستخدام مجموعة بيانات تضم 2.78 مليار تسلسل بروتيني.
أغلقت EvolutionaryScale جولة تمويل أولية معلنة بقيمة 142 مليون دولار (https://www.forbes.com/sites/alexkonrad/2024/06/25/evolutionaryscale-raises-142-million-for-biology-ai/) لتسريع تطوير نماذج الذكاء الاصطناعي التوليدي المدربة على مجموعات بيانات بيولوجية ضخمة. تضع هذه الجولة، بقيادة Nat Friedman و Daniel Gross و Lux Capital، الشركة في موقع يمكنها من التعامل مع علم الأحياء كأصل بيانات قابل للبرمجة، مستفيدة من نموذجها الجديد ESM3 الذي تم تدريبه على مجموعة بيانات تضم 2.78 مليار تسلسل بروتيني (https://www.evolutionaryscale.ai/blog/esm3-release). تؤكد هذه المحطة على القيمة المتزايدة للبيانات غير النصية والمتخصصة في السباق نحو قدرات الذكاء الاصطناعي المتطورة.
صعود أصول البيانات البيولوجية
على عكس نماذج اللغة الكبيرة للأغراض العامة التي تقوم بكشط الويب العام، فإن القيمة المقترحة لـ EvolutionaryScale مبنية على تنسيق ومعالجة المعلومات البيولوجية المتخصصة. نموذج ESM3 هو نموذج توليدي متعدد الوسائط يمكنه الاستدلال على تسلسل البروتينات وهيكلها ووظيفتها. من خلال معالجة تريليونات نقاط البيانات (https://www.evolutionaryscale.ai/blog/esm3-release) من العالم الطبيعي، تهدف الشركة الناشئة إلى تمكين الباحثين من "برمجة" بروتينات جديدة، مما قد يقلل من جداول اكتشاف الأدوية من سنوات إلى أسابيع. يسلط هذا النهج "ChatGPT لعلم الأحياء" الضوء على اتجاه سوق أوسع: تحقيق الدخل من مجموعات البيانات العلمية الخاصة وعالية الدقة التي لا يمكن تكرارها بسهولة بواسطة الزواحف العامة.
الترخيص مقابل التقاضي: المعركة على حقوق البيانات
يأتي تمويل الشركات الناشئة كثيفة البيانات مثل EvolutionaryScale في الوقت الذي يصل فيه المشهد القانوني لاكتساب البيانات إلى نقطة الغليان. أبرمت OpenAI و Time Magazine مؤخرًا اتفاقية شراكة محتوى وترخيص متعددة السنوات (https://openai.com/index/openai-and-time-sign-multi-year-content-partnership-and-strategic-alliance/)، مما يمنح OpenAI الوصول إلى أرشيف Time الذي يعود إلى 101 عام. في حين لم يتم الكشف عن الشروط المالية الدقيقة، يشير محللو الصناعة إلى صفقة News Corp المقدرة بـ 250 مليون دولار مع OpenAI (https://www.reuters.com/technology/news-corp-strikes-ai-content-licensing-deal-with-openai-2024-05-22/) كمعيار للقسط الذي يتم وضعه الآن على الصحافة البشرية الموثقة.
على العكس من ذلك، أصبحت تكلفة اكتساب البيانات غير المرخصة باهظة الثمن. تسعى RIAA، التي تمثل شركات التسجيلات الكبرى مثل Sony و Universal، إلى الحصول على تعويضات قانونية تصل إلى 150,000 دولار لكل عمل (https://www.reuters.com/legal/music-labels-sue-suno-udio-ai-copyright-infringement-2024-06-24/) في دعوى قضائية ضد الشركات الناشئة في مجال الموسيقى بالذكاء الاصطناعي Suno و Udio. مع استخدام مئات الآلاف من التسجيلات المزعومة دون إذن، يمكن أن تصل المسؤولية الإجمالية إلى ما يقدر بـ 13.5 مليار دولار (https://www.reuters.com/legal/music-labels-sue-suno-udio-ai-copyright-infringement-2024-06-24/). هذا الضغط القانوني يجبر على الانتقال من الدفاع عن "الاستخدام العادل" إلى سوق بيانات منظم حيث لكل رمز تدريبي أصل وسعر واضح.
تدفق رأس المال إلى البنية التحتية كثيفة البيانات
أدى الطلب على الذكاء الاصطناعي الجاهز للبيانات أيضًا إلى استثمارات ضخمة في البنية التحتية. حصلت Helsing، وهي شركة دفاعية أوروبية للذكاء الاصطناعي، على مبلغ معلن قدره 450 مليون يورو (https://www.reuters.com/technology/defense-ai-startup-helsing-raises-450-mln-euro-funding-round-2024-07-04/) في جولة من السلسلة C، مما يقيم الشركة بسعر يقدر بـ 5 مليارات يورو (https://www.bloomberg.com/news/articles/2024-06-17/defense-ai-startup-helsing-is-said-to-near-400-million-funding). تعتمد أنظمة الدفاع التي تعمل بالبرمجيات من Helsing على المعالجة في الوقت الفعلي لبيانات أجهزة الاستشعار في ساحة المعركة، مما يمثل قطاعًا حاسمًا لتحقيق الدخل من أصول البيانات في القطاع العام. وبالمثل، جمعت Etched.ai مبلغًا معلنًا قدره 120 مليون دولار (https://techcrunch.com/2024/06/25/etched-raises-120m-to-build-a-chip-that-only-runs-transformer-models/) لبناء شرائح متخصصة مصممة خصيصًا للتعامل مع إنتاجية البيانات الضخمة التي تتطلبها نماذج Transformer.
في مجال التكنولوجيا القانونية، يُقال إن الشركة الناشئة Harvey تجري محادثات لجمع رأس مال جديد بتقييم يقدر بـ 2 مليار دولار (https://techcrunch.com/2024/06/25/legal-ai-startup-harvey-is-raising-600m-from-google-at-a-2b-valuation/). الأصل الأساسي لـ Harvey هو وصولها إلى البيانات القانونية الخاصة ومعالجتها، مما يثبت بشكل أكبر أن السوق يكافئ الشركات التي تتحكم في "خندق البيانات" بدلاً من الخوارزمية فقط.
لماذا يهم أصحاب البيانات
بالنسبة لأصحاب البيانات المؤسسيين، تؤكد صفقات EvolutionaryScale و OpenAI-Time أن عصر كشط البيانات المجاني قد انتهى. لم تعد البيانات مجرد منتج ثانوي لعمليات الأعمال؛ إنها فئة أصول أساسية. سواء كانت تسلسلات بيولوجية، أو أرشيفات تاريخية، أو سوابق قانونية، فإن السوق يوفر الآن مسارين متميزين: شراكات ترخيص بمليارات الدولارات لأولئك الذين يتعاونون، ودعاوى قضائية بمليارات الدولارات لأولئك الذين تم الاستيلاء على أصولهم دون موافقة. مع تخصص نماذج الذكاء الاصطناعي بشكل أكبر، ستستمر قيمة مجموعات البيانات المتخصصة وعالية النزاهة في التفوق على قيمة المحتوى العام المكتشط من الويب.
يحول d-nvest أصول البيانات وراء هذه الصفقات إلى فرص قابلة للتنفيذ ومقيمة.
استكشف خط الأنابيب ←