Egypt News

تعمل Google على جعل برنامج AlphaFold طليقًا في الجينوم البشري بأكمله

بعد أسبوع واحد فقط من وصف مجموعة DeepMind AI التابعة لشركة Google أخيرًا جهودها في مجال البيولوجيا بالتفصيل ، أصدرت الشركة ورقة تشرح كيفية تحليلها تقريبًا لكل بروتين مشفر في الجينوم البشري وتوقعت بنيته المحتملة ثلاثية الأبعاد – وهي بنية يمكن أن تكون حاسمة لفهم المرض وتصميم العلاجات. في المستقبل القريب جدًا ، سيتم إصدار كل هذه الهياكل بموجب ترخيص المشاع الإبداعي عبر المعهد الأوروبي للمعلومات الحيوية ، الذي يستضيف بالفعل قاعدة بيانات رئيسية لهياكل البروتين.

في مؤتمر صحفي مرتبط بإصدار الصحيفة ، أوضح ديميس هاسابيس من DeepMind أن الشركة لا تتوقف عند هذا الحد. بالإضافة إلى العمل الموصوف في الورقة ، ستصدر الشركة تنبؤات هيكلية لجينوم 20 كائنًا بحثيًا رئيسيًا ، من الخميرة إلى ذباب الفاكهة إلى الفئران. في المجموع ، سيشمل إطلاق قاعدة البيانات ما يقرب من 350.000 بنية بروتينية.

ماذا يوجد في الهيكل؟

لقد وصفنا للتو برنامج DeepMind الأسبوع الماضي ، لذلك لن نخوض في الكثير من التفاصيل هنا. هذا الجهد عبارة عن نظام قائم على الذكاء الاصطناعي ومُدرَّب على بنية البروتينات الموجودة التي تم تحديدها (غالبًا بشق الأنفس) من خلال التجارب المعملية. يستخدم النظام هذا التدريب ، بالإضافة إلى المعلومات التي يحصل عليها من عائلات البروتينات المرتبطة بالتطور ، للتنبؤ بكيفية طي سلسلة البروتين من الأحماض الأمينية في الفضاء ثلاثي الأبعاد.

يمكن للبنية ثلاثية الأبعاد التي تنتجها أن تعطينا معلومات مهمة حول البروتين ، مثل كيفية تفاعله مع البروتينات والمواد الكيميائية الأخرى وأين تحدث التفاعلات الكيميائية للبروتين. باستخدام الهيكل ، يمكن للباحثين معرفة كيف تغيرت طفرات معينة ، مثل تلك التي تسبب الأمراض الوراثية ، وظيفة البروتين. يمكن للباحثين أيضًا استخدام الهيكل لتصميم مواد كيميائية يمكنها التفاعل مع البروتين وتغيير وظيفته ، وهو الأمر الذي أدى إلى علاجات لمختلف أنواع السرطان وفيروس نقص المناعة البشرية.

عادة ، يتم تحديد هذه الهياكل عن طريق عزل البروتين وتجهيزه للتصوير وقصفه بالإلكترونات. هذه الأساليب صعبة وتستغرق وقتًا طويلاً ، وغالبًا ما تفشل. تقدر الورقة البحثية أن عقودًا من العمل المخبري قد تركت لنا معلومات هيكلية لـ 17 بالمائة فقط من المجموعة الكاملة للبروتينات البشرية.

وهذا يفسر سبب قضاء الباحثين عقودًا في البحث عن طرق للتنبؤ بهياكل البروتينات باستخدام تسلسل الأحماض الأمينية التي تتكون منها. ولكن قبل AlphaFold ، لم تكن دقة البرنامج عالية بما يكفي لتكون مفيدة باستمرار.

جمع البروتين البشري

لم يحاول DeepMind التنبؤ ببنية كل بروتين في الجينوم البشري. بعضها كبير جدًا بحيث لا يمكن التعامل معه بسهولة. (حددت الشركة الحد الأقصى للحجم عند 2700 من الأحماض الأمينية ، وهو للأسف أصغر من الجين الذي قضيته جزءًا من استنساخ ما بعد المستند.) لكن معظم البروتينات أصغر بكثير من ذلك ، لذا فإن العدد النهائي هو 98.5 بالمائة من المتوقع البروتينات في الجينوم. يُتوقع وجود بعض هذه البروتينات فقط بناءً على سمات تسلسل الحمض النووي داخل الجينوم البشري.

بنفس القدر من الأهمية ، يتضمن AlphaFold تقديرًا للثقة يسجل مدى احتمالية أن تكون تنبؤاته دقيقة. أخيرًا ، البرنامج واثق من موقع حوالي 60 في المائة من الأحماض الأمينية التي تنبأ بها ، وهو واثق جدًا بما يزيد قليلاً عن الثلث. بعبارة أخرى ، يمتلك الباحثون تنبؤًا واثقًا بشأن معظم بنية 40٪ من البروتينات البشرية. من الواضح أن هذا يعني أن هناك قدرًا كبيرًا من العمل يجب القيام به قبل أن نتمكن من القول إن لدينا سيطرة جيدة على المجموعة الكاملة من البروتينات البشرية. لكن هذا لا يزال ملف كثير أكثر من 18 بالمائة لدينا هياكل فعلية.

هناك أيضًا مجموعة كبيرة من البروتينات التي لا يتم تمثيلها جيدًا بواسطة الهياكل الموجودة. يصعب عزل تلك الموجودة في غشاء الخلية والعمل معها ، لذلك لم يحل الباحثون العديد من هياكل بروتينات الغشاء هذه. ولكن على الرغم من وجود عدد أقل من الأمثلة في بيانات التدريب الخاصة بها ، يبدو أن AlphaFold يتعامل مع الهياكل بشكل جيد إلى حد معقول.

أين يواجه النظام مشاكل؟ لا تشكل العديد من البروتينات ببساطة بنية محددة – في الواقع ، يبدو أن وظيفتها تعتمد على وجود بنية مرنة تمامًا لكي تؤدي وظيفتها. من الواضح أنه من الصعب إجراء أي تنبؤات دقيقة عن البنية هنا ، نظرًا لأن هذه البروتينات (عادةً ، أقسام من البروتينات) لا تحتوي على أي منها. هناك أيضًا العديد من البروتينات التي تأخذ هيكلها فقط عندما تتلامس مع بروتين أو مادة كيميائية أخرى. نظرًا لأن AlphaFold لا يحتوي على هذه المعلومات ، فلا يوجد الكثير يمكنه القيام به.

بشكل عام ، وجد فريق DeepMind أن AlphaFold لديه ثقة منخفضة جدًا في تنبؤاته للمناطق المضطربة ، ويمكنهم استخدام هذه المعلومات لتحديد مناطق البروتينات التي من المحتمل أن تكون غير منظمة.

كل شيء يتم طرحه للعامة

في وقت ما في المستقبل القريب (ربما بحلول الوقت الذي تقرأ فيه هذا) ، ستكون كل هذه البيانات متاحة على موقع ويب مخصص يستضيفه المعهد الأوروبي للمعلومات الحيوية ، وهو منظمة يمولها الاتحاد الأوروبي تصف نفسها جزئيًا كما يلي: جعل البيانات البيولوجية العامة في العالم متاحة مجانًا للمجتمع العلمي عبر مجموعة من الخدمات والأدوات “. لن تكون بيانات AlphaFold استثناء؛ بمجرد نشر الرابط أعلاه ، يمكن لأي شخص استخدامه لتنزيل معلومات عن البروتين البشري الذي يختاره.

أو ، كما هو مذكور أعلاه ، نسخة الماوس أو الخميرة أو ذبابة الفاكهة. الكائنات الحية العشرين التي ستشهد إطلاق بياناتها هي أيضًا مجرد بداية. قال ديميس هاسابيس من DeepMind أنه خلال الأشهر القليلة المقبلة ، سيستهدف الفريق كل تسلسل جيني متاح في قواعد بيانات الحمض النووي. بحلول الوقت الذي يتم فيه هذا العمل ، يجب أن يكون أكثر من 100 مليون بروتين قد تنبأ بهياكل. واختتم حسابيس الجزء الخاص به من الإعلان بالقول: “نعتقد أن هذه هي أهم مساهمة قدمها الذكاء الاصطناعي للعلم حتى الآن”. سيكون من الصعب الجدال خلاف ذلك.

ومع ذلك ، لا تزال هناك بعض المشكلات التي يتعين حلها. سيكون هناك بلا شك تحسينات على الخوارزمية مع مرور الوقت ، لذلك ستكون هناك حاجة إلى نظام للتعامل مع التحديث والإصدار في قاعدة البيانات الرئيسية. قام DeepMind أيضًا بإنشاء رمز AlphaFold مفتوح المصدر ، لذلك هناك احتمالية لوجود مفترقات ومضاعفات أخرى.

لكن هذه المشاكل هي مصدر قلق للمستقبل. في الوقت الحالي ، يمكننا جميعًا الجلوس ومشاهدة الخوادم وهي تجهد لخدمة كل عالم أحياء على هذا الكوكب لديه فضول لمعرفة ما إذا كان البروتين الذي يثير اهتمامهم لديه بنية عالية الجودة.

(باستثناء مؤلفك المتواضع ، نظرًا لأن البروتين الذي اخترته كان كبيرًا بشكل مزعج).

طبيعة، 2021. DOI: 10.1038 / s41586-021-03828-1 (حول DOIs).

المصدر: مواقع أخبارية

أخبار مصر اخبار رياضية
اظهر المزيد

سوزان الجندي

كاتبة/ محررة في مجال الصحة والتغذية ولايف ستايل. لدي كتب الكترونية باللغة العربية والإنجليزية في تلك المجالات.

مقالات ذات صلة

اترك رد

زر الذهاب إلى الأعلى