biological aidata acquisitionfunding roundbiotech dataregulation25 يونيو 2026

EvolutionaryScale تؤمن 142 مليون دولار لتدريب الذكاء الاصطناعي على 2.8 مليار تسلسل بروتيني

بقيادة Lux Capital، تستهدف شركة الذكاء الاصطناعي البيولوجي سوق اكتشاف الأدوية ببيانات جينومية مملوكة.

أنهت EvolutionaryScale جولة تمويل أولية بقيمة 142 مليون دولار (https://techcrunch.com/2024/06/25/evolutionaryscale-is-building-a-chatgpt-for-biology-with-142m-from-nat-friedman-and-lux-capital/) لتسويق ESM3، وهو نموذج ذكاء اصطناعي توليدي تم تدريبه على مجموعة ضخمة من 2.78 مليار تسلسل بروتيني (https://www.forbes.com/sites/alexkonrad/2024/06/25/evolutionaryscale-raises-142-million-for-biological-ai/). تشير الجولة، بقيادة Lux Capital وNat Friedman وDaniel Gross، بمشاركة Amazon وNVentures (ذراع الاستثمار لشركة Nvidia)، إلى تحول حاسم في سوق الأصول البيانية: الانتقال من نماذج اللغة الكبيرة للأغراض العامة إلى نماذج البيانات البيولوجية المتخصصة وعالية الدقة. يمثل ESM3 أحد أكبر تطبيقات البيانات العلمية في عصر الذكاء الاصطناعي، حيث يضم 98 مليار معلمة (https://www.forbes.com/sites/alexkonrad/2024/06/25/evolutionaryscale-raises-142-million-for-biological-ai/) والقدرة على محاكاة 500 مليون سنة من التطور لتصميم بروتينات جديدة.

حدود البيانات البيولوجية

على عكس مجموعات البيانات الغنية بالنصوص التي دعمت الموجة الأولى من الذكاء الاصطناعي التوليدي، فإن القيمة المقترحة لـ EvolutionaryScale مبنية بالكامل على تنسيق ومعالجة البيانات الجينومية والبروتينية. من خلال التدريب على مليارات التسلسلات، تقوم الشركة فعليًا بإنشاء طبقة "بيولوجيا قابلة للبرمجة". يؤكد هذا التحرك على الأولوية القصوى الممنوحة حاليًا للبيانات العلمية المنظمة، والتي تعد أندر وأصعب في الاستيعاب من نصوص الويب العامة. تشير مشاركة Amazon وNvidia (https://techcrunch.com/2024/06/25/evolutionaryscale-is-building-a-chatgpt-for-biology-with-142m-from-nat-friedman-and-lux-capital/) إلى أن مزودي البنية التحتية حريصون على تأمين موطئ قدم في خط أنابيب البيانات البيولوجية، والذي من المتوقع أن يُحدث ثورة في قطاع البحث والتطوير الصيدلاني البالغ قيمته تريليون دولار.

استحواذ OpenAI الاستراتيجي على البيانات

لا يقتصر السعي لتحقيق كفاءة البيانات على علم الأحياء. أعلنت OpenAI مؤخرًا عن استحواذها على Rockset (https://openai.com/index/openai-to-acquire-rockset/)، وهي شركة قواعد بيانات للبحث والتحليلات في الوقت الفعلي. يعد هذا الاستحواذ خطوة تكتيكية واضحة لتعزيز قدرات OpenAI في مجال التوليد المعزز بالاسترجاع (RAG). من خلال دمج تقنية Rockset، يمكن لـ OpenAI فهرسة والاستعلام بشكل أكثر فعالية عن مجموعات البيانات الضخمة التي يوفرها شركاؤها من المؤسسات، وتحويل مستودعات البيانات الثابتة إلى معلومات ديناميكية وقابلة للتنفيذ. يسلط هذا الاتفاق الضوء على الأهمية المتزايدة لواجهة "البيانات إلى النموذج" - وهي طبقة البرامج التي تحدد مدى كفاءة وصول الذكاء الاصطناعي إلى أصول المؤسسات الخاصة والاستدلال عليها.

سباق الاستحواذ على البيانات السريرية

لزيادة التأكيد على قيمة الأصول البيانية، دخلت HEALWELL AI في اتفاقية نهائية لـ الاستحواذ على BioPharma Services (https://www.globenewswire.com/news-release/2024/06/24/2903058/0/en/HEALWELL-AI-to-Acquire-BioPharma-Services-a-Leading-Full-Service-Contract-Research-Organization.html) مقابل ما يقرب من 11.5 مليون دولار (https://www.globenewswire.com/news-release/2024/06/24/2903058/0/en/HEALWELL-AI-to-Acquire-BioPharma-Services-a-Leading-Full-Service-Contract-Research-Organization.html). BioPharma Services هي منظمة بحث تعاقدية (CRO) كاملة الخدمات تمتلك أصول بيانات قوية للتجارب السريرية. بالنسبة لـ HEALWELL، هذا ليس مجرد توسع في الخدمات ولكنه استحواذ استراتيجي على خط أنابيب بيانات. يعد الوصول إلى بيانات التجارب السريرية عالية الجودة هو العائق الأساسي أمام اكتشاف الأدوية المدفوع بالذكاء الاصطناعي والطب الشخصي، ويمثل الاستحواذ على منظمة بحث تعاقدية مصدرًا مباشرًا وخاصًا للبيانات "الحقيقية" المطلوبة لتدريب نماذج التشخيص والعلاج.

الجدران التنظيمية وقابلية نقل البيانات

مع ارتفاع قيمة الأصول البيانية، تتحرك الجهات التنظيمية لضمان عدم حصر هذه القيمة خلف "الحدائق المسورة" لشركات التكنولوجيا الكبرى. أصدرت المفوضية الأوروبية مؤخرًا نتائج أولية تفيد بأن Apple تنتهك قانون الأسواق الرقمية (DMA) (https://ec.europa.eu/commission/presscorner/detail/en/ip_24_3433). يشمل تركيز التحقيق قواعد توجيه Apple، التي تمنع المطورين من توجيه المستهلكين بحرية إلى عروض وأنظمة بيئية بيانات بديلة. هذا الضغط التنظيمي هو جزء من اتجاه عالمي أوسع يهدف إلى فرض قابلية نقل البيانات وقابلية التشغيل البيني. بالنسبة لمستثمري البيانات، هذه الأحكام حاسمة: فهي تشير إلى مستقبل ستخضع فيه السيطرة على بيانات المستخدم والقدرة على تحقيق الدخل منها من خلال الترخيص الثانوي لتدقيق مكثف لمكافحة الاحتكار.

لماذا يهم أصحاب البيانات

توضح صفقات EvolutionaryScale وHealwell أن الأصول البيانية الأكثر ربحًا لم تعد موجودة في "الويب المفتوح" بل في مجالات متخصصة ذات حواجز دخول عالية مثل علم الجينوم والطب السريري. بالنسبة لأصحاب البيانات، فإن الدرس واضح: السوق يتحرك بعيدًا عن ترخيص البيانات بالجملة نحو مجموعات بيانات منظمة وعالية الدقة يمكن استيعابها مباشرة بواسطة معماريات الذكاء الاصطناعي المتخصصة. سواء كانت تسلسلات بروتينية أو بيانات مؤسسية في الوقت الفعلي، تكمن القيمة في قدرة البيانات الفريدة على حل مشاكل محددة وعالية القيمة التي لا تستطيع النماذج ذات الأغراض العامة معالجتها. يجب أن تركز استراتيجيات تحقيق الدخل على نظافة البيانات والامتثال التنظيمي والقدرة على التكامل مع أحدث معماريات RAG والتوليدية.

يحول d-nvest أصول البيانات وراء هذه الصفقات إلى فرص قابلة للتنفيذ ومقيمة.

استكشف خط الأنابيب ←
EvolutionaryScale تؤمن 142 مليون دولار لتدريب الذكاء الاصطناعي على 2.8 مليار تسلسل بروتيني | d-nvest