biological aiphysical aifunding rounddata licensing4 يوليو 2026

EvolutionaryScale تؤمن 142 مليون دولار لبيانات الذكاء الاصطناعي البيولوجي

باحثون سابقون في Meta يطلقون ESM3، نموذج رائد تم تدريبه على 2.7 مليار تسلسل بروتيني لبرمجة البيولوجيا.

أغلقت EvolutionaryScale جولة تمويل أولية معلنة بقيمة 142 مليون دولار (https://www.evolutionaryscale.ai/blog/esm3-release) بقيادة Nat Friedman و Daniel Gross و Lux Capital لتسويق نماذج الذكاء الاصطناعي الرائدة للبيانات البيولوجية. يمثل ضخ رأس المال هذا أحد أكبر مراحل التمويل الأولية في تاريخ الذكاء الاصطناعي الذي يركز على التكنولوجيا الحيوية، مما يشير إلى شهية سوقية قوية لـ "الذكاء الاصطناعي المادي" - الأنظمة القادرة على فهم ومعالجة اللبنات الأساسية للعالم المادي. في صميم الصفقة يأتي إطلاق ESM3، وهو نموذج توليدي تم تدريبه على مجموعة بيانات مملوكة وعامة تمتد عبر 2.7 مليار تسلسل بروتيني (https://www.evolutionaryscale.ai/blog/esm3-release)، مما يسمح للباحثين "ببرمجة" البيولوجيا بفعالية من خلال محاكاة مليارات السنين من التطور في بيئة رقمية.

الميزة متعددة الوسائط في أصول البيانات البيولوجية

على عكس الإصدارات السابقة لنماذج لغة البروتين، فإن ESM3 هو نموذج رائد متعدد الوسائط. فهو لا يتنبأ بالبنية فحسب؛ بل يستدل عبر التسلسل والبنية والوظيفة في وقت واحد. من خلال معالجة مجموعة بيانات تضم 2.7 مليار تسلسل وهياكلها ثلاثية الأبعاد المقابلة (https://www.evolutionaryscale.ai/blog/esm3-release)، يمكن للنموذج توليد بروتينات جديدة تمامًا غير موجودة في الطبيعة. هذه القدرة تحول البيانات البيولوجية من سجل سلبي للتطور إلى أصل نشط لاكتشاف الأدوية، واحتجاز الكربون، وعلوم المواد. تضع الشركة، التي أسسها الفريق وراء مشروع ESM الخاص بـ Meta، نفسها كـ "OpenAI للبيولوجيا"، وتقدم نسخة من النموذج للمجتمع العلمي مع الاحتفاظ بنسخ عالية السعة للشراكات التجارية.

الذكاء الاصطناعي المادي والتحول في تحقيق الدخل من البيانات

تسلط صفقة EvolutionaryScale الضوء على اتجاه أوسع حيث تتحول أصول البيانات الأكثر قيمة من النصوص التي يولدها الإنسان إلى ملاحظات العالم المادي. بينما تواجه نماذج اللغة الكبيرة للنصوص تناقصًا في العوائد وعقبات قانونية بشأن حقوق النشر، تقدم البيانات البيولوجية جبهة واسعة وغير مستغلة. تم تدريب نموذج ESM3 باستخدام ما يقرب من 1.0 × 10^24 عملية حسابية (FLOPS) (https://www.evolutionaryscale.ai/blog/esm3-release)، وهو نطاق كان مخصصًا سابقًا لنماذج الأغراض العامة من الدرجة الأولى. يؤكد هذا الاستثمار على التكلفة العالية - والعائد المحتمل العالي - لتدريب النماذج على بيانات مادية متخصصة وعالية الدقة. مع نضوج الذكاء الاصطناعي المادي، من المتوقع أن تتجاوز تراخيص مجموعات البيانات البيولوجية والكيميائية والروبوتية المنظمة قيمة البيانات المجمعة من الويب بشكل عام من حيث القيمة لكل رمز مميز.

المشهد التنافسي: حواجز البيانات في علوم الحياة

تدخل EvolutionaryScale سوقًا تهيمن عليه حاليًا AlphaFold 3 من DeepMind، ولكن مع تركيز مميز على التصميم التوليدي بدلاً من مجرد التنبؤ بالبنية. يتحول الحاجز التنافسي في هذا القطاع بعيدًا عن بنية النموذج نحو حجم وجودة مجموعة التدريب. من خلال فتح أوزان نسخة 1.4 مليار معلمة من ESM3، تحاول الشركة وضع معيار الصناعة لتمثيل البيانات البيولوجية. في الوقت نفسه، تؤمن جهات فاعلة أخرى في النظام البيئي خطوط أنابيب بياناتها الخاصة؛ على سبيل المثال، يُقال إن Poolside تجري محادثات لجمع ما يقدر بـ 500 مليون دولار، وفقًا لبلومبرج، لتطبيق مبادئ نماذج الأساس المماثلة على بيانات هندسة البرمجيات، مما يوضح بشكل أكبر الاندفاع للسيطرة على مجالات بيانات عمودية محددة.

التنظيم وقانونية اكتساب البيانات

مع توسع هذه النماذج، يظل الإطار القانوني لكيفية اكتساب البيانات نقطة تحول حاسمة للمستثمرين. في حكم مهم لصناعة البيانات، قضت محكمة أمريكية مؤخرًا لصالح Bright Data في معركتها القانونية الطويلة مع Meta (https://brightdata.com/blog/court-rules-in-favor-of-bright-data)، مؤكدة أن كشط البيانات العامة لا ينتهك قانون الاحتيال وإساءة استخدام الكمبيوتر (CFAA) أو يخل بالعقود عندما لا تكون البيانات خلف تسجيل دخول. يوفر هذا الحكم درعًا قانونيًا حيويًا لشركات الذكاء الاصطناعي مثل EvolutionaryScale التي تعتمد على جمع قواعد البيانات العلمية العامة على نطاق واسع لتعزيز مجموعات التدريب الخاصة بها. ومع ذلك، يتزايد الضغط التنظيمي في أماكن أخرى؛ أبلغت المفوضية الأوروبية مؤخرًا Apple برأيها الأولي بأن قواعد متجر التطبيقات الخاصة بها تنتهك قانون الأسواق الرقمية (https://ec.europa.eu/commission/presscorner/detail/en/ip_24_3433)، وهو تذكير بأن حراس البيانات يخضعون لتدقيق متزايد فيما يتعلق بكيفية تحكمهم في الوصول إلى بيانات النظام البيئي.

الابتكارات في البنية التحتية والترخيص

تتطور أيضًا البنية التحتية المطلوبة لمعالجة مجموعات البيانات البيولوجية هذه. أعلنت Etched مؤخرًا عن جولة تمويل أولية بقيمة 120 مليون دولار (https://www.etched.com/announcing-etched) لبناء شرائح متخصصة لنماذج المحولات، بهدف توفير كفاءة الحوسبة اللازمة للجيل القادم من الذكاء الاصطناعي المادي كثيف البيانات. على جبهة الترخيص، أطلقت Perplexity AI "برنامج الناشرين" الجديد (https://www.perplexity.ai/hub/blog/perplexity-publishers-program) لإنشاء نموذج لمشاركة الإيرادات مع مالكي البيانات، بما في ذلك Time و Der Spiegel. يمثل هذا التحرك نضجًا لسوق البيانات للذكاء الاصطناعي، مبتعدًا عن الكشط غير المصرح به نحو اتفاقيات ترخيص منظمة ومتعددة السنوات توفر لشركات الذكاء الاصطناعي خطوط أنابيب بيانات مستقرة وعالية الجودة مع تعويض المبدعين الأصليين.

لماذا يهم أصحاب البيانات

بالنسبة لأصحاب البيانات، تثبت صفقة EvolutionaryScale أن مجموعات البيانات المتخصصة للغاية وغير النصية - مثل تسلسلات الجينوم أو هياكل البروتين - هي الآن من بين الأصول الأكثر قيمة في اقتصاد الذكاء الاصطناعي. مع انتقال نماذج الأساس إلى العلوم المادية، فإن القدرة على توفير بيانات نظيفة ومنظمة ومصادر أخلاقية لـ "الذكاء الاصطناعي المادي" ستؤدي إلى فرض رسوم ترخيص مميزة. يجب على أصحاب البيانات التركيز على تدقيق مجموعات البيانات المملوكة لديهم لإمكاناتها التوليدية، حيث يتحول السوق بسرعة من مجرد تخزين البيانات إلى الترخيص النشط للأصول لتدريب النماذج وضبطها.

يحول d-nvest أصول البيانات وراء هذه الصفقات إلى فرص قابلة للتنفيذ ومقيمة.

استكشف خط الأنابيب ←