آلفافولد، معرفی و آموزش پایگاه Alphafold

محتوای جدول

فهرست مطالب

آلفا فولد، قهرمان علم زیست‌شناسی در کشف رازهای حیات

در دنیای پیچیده زیست‌شناسی، پروتئین‌ها به عنوان مولکول‌های کلیدی در عملکرد سلول‌ها و ارگانیسم‌ها شناخته می‌شوند. اما ساختار دقیق این پروتئین‌ها چه تأثیری بر فعالیت‌های بیولوژیکی آن‌ها دارد. الفا فولد به عنوان یک فناوری پیشرفته، به ما این امکان را می‌دهد که به عمق ساختار پروتئین‌ها نفوذ کنیم و رازهای پنهان آن‌ها را کشف کنیم.

این ارائه به بررسی چگونگی عملکرد الفا فولد و تکنیک‌های پیشرفته آن می‌پردازد که به دانشمندان کمک می‌کند تا ساختار سه‌بعدی پروتئین‌ها را با دقت بی‌نظیری پیش‌بینی کنند. همچنین، تأثیر این فناوری بر تحقیقات بیولوژیکی و پزشکی را تحلیل خواهیم کرد و نشان خواهیم داد که چگونه الفا فولد می‌تواند به توسعه درمان‌های نوین و داروهای موثر در برابر بیماری‌های مختلف کمک کند.

این سفر به اعماق پروتئین‌ها، نه تنها به درک بهتر ما از حیات کمک می‌کند، بلکه می‌تواند درهای جدیدی به سوی درمان‌های نوین و درک عمیق‌تری از بیماری‌ها باز کند. توسعه یافته است که ساختار سه بعدی پروتئین را از روی توالی اسید آمینه آن پیش بینی می کند.

در CASP14، AlphaFold به‌عنوان بهترین روش پیش‌بینی ساختار پروتئین با فاصله‌ای زیاد برگزیده شد و پیش‌بینی‌هایی با دقت بالا ارائه کرد. در حالی که این سیستم هنوز برخی محدودیت‌ها را دارد، نتایج  CASPنشان می‌دهد که AlphaFold پتانسیل فوری برای کمک به ما در درک ساختار پروتئین‌ها و پیشبرد تحقیقات بیولوژیکی دارد.

الفا فولد یک سیستم هوش مصنوعی است که توسط گوگل دیپ‌مایند توسعه یافته و ساختار سه‌بعدی یک پروتئین را از توالی اسیدهای آمینه آن پیش‌بینی می‌کند. این سیستم به طور مرتب دقتی رقابتی با آزمایشات را به دست می‌آورد.

گوگل دیپ‌مایند و مؤسسه بیوانفورماتیک اروپا (EMBL-EBI) با هم همکاری کرده‌اند تاAlphaFold  را ایجاد کنند و این پیش‌بینی‌ها را به‌طور رایگان در اختیار جامعه علمی قرار دهند. آخرین نسخه پایگاه داده شامل بیش از ۲۰۰ میلیون ورودی است که پوشش وسیعی از UniProt (مخزن استاندارد توالی‌های پروتئینی و حاشیه‌نویسی‌ها) را فراهم می‌کند. این پایگاه اطلاعات طبقه بندی شده ای برای پروتئوم انسان و پروتئوم ۴۷ ارگانیسم کلیدی دیگر که در تحقیقات و سلامت جهانی مهم هستند، ارائه می‌دهد.

پس از خواندن این مقاله پاسخ سوالات زیر را خواهید یافت:

  • آلفا فولد چیست و چگونه کار می‌کند؟
  • چه کاربردهایی برای آلفا فولد در علم زیست‌شناسی وجود دارد؟
  • آلفا فولد چه مزایایی نسبت به روش‌های سنتی دارد؟
  • چالش‌ها و محدودیت‌های آلفا فولد چیست؟
  • آینده آلفا فولد چگونه خواهد بود و چه تأثیری بر علم و فناوری خواهد گذاشت؟

تاریخچه پیشبینی ساختار پروتئین ها

پیش‌بینی ساختار پروتئین‌ها یکی از چالش‌های بزرگ در زیست‌شناسی مولکولی و بیوانفورماتیک است. این فرآیند از زمان‌های قدیم آغاز شده و با پیشرفت تکنولوژی و الگوریتم‌ها، تحولاتی را تجربه کرده است. در دهه 1970 با پیشرفت هایی در روش های تجربی و دستیابی به تکنیک هایی همچون کریستالوگرافی اشعه ایکس و NMR برای تعیین ساختار پروتئین ها به کارگرفته شد. در این میان نرم افزار های ابتدایی نیز برای پردازش کامپیوتری این پروتئین ها توسعه می یافتند ولی عمدتا به پیشرفت قابل توجهی منجر نمیشد.

در دهه 1980 با پیشرفت هایی در الگوریتم های بهینه سازی برای پیش بینی ساختار پروتئین ها بر اساس اصول ترمودینامیک حاصل شد. از طرفی پایگاه های داده ای برای پروتئین ها همچون PDB برای ذخیره و اشتراک گذاری اطلاعات ساختاری پروتئین ها ایجاد شدند.

در اوایل دهه 1990 کشف  روش های محاسباتی مثل دینامیک مولکولی و شبیه سازی مونت کارلو با پیشرفت هایی در زمینه یادگیری ماشین (Machine learning) همراه بود. از سال 1994 با به وجود آمدن رقابتی به نام CASP (ارزیابی انتقادی پیش بینی ساختار پروتئین) پیشرفت چشمگیری در تلاش دانشمندان سراسر دنیا برای پیشبینی ساختار پروتئین ها با ابزار محاسباتی پدید آمد.

این روند تا سال 2016 ادامه داشت که با ظهور هوش مصنوعی یادگیری عمیق و با توسعه تیم DeepMind انقلابی در پیشبینی ساختار پروتئین ها  ایجاد شد.

CASP (ارزیابی انتقادی پیش‌بینی ساختار) یک آزمایش جامع و بین‌المللی است که به ارزیابی و مقایسه تکنیک‌های پیش‌بینی ساختار پروتئین می‌پردازد. CASP یک رقابت عمومی است که به منظور تعیین وضعیت پیشرفته در مدل‌سازی ساختار پروتئین از توالی اسید آمینه سازماندهی شده توسط مرکز پیش‌بینی ساختار پروتئین انجام می‌شود. CASP یک مسابقه دوسالانه است که در آن شرکت‌کنندگان مدل‌هایی را ارائه می‌دهند که سعی در پیش‌بینی مجموعه‌ای از پروتئین‌ها دارند که ساختارهای تجربی آن‌ها هنوز عمومی نشده است.

مدل‌های ارائه شده با نتایج تجربی توسط گروه های مستقل مقایسه می‌شوند. این آزمایش به صورت کاملا محرمانه انجام می‌شود، به طوری که شرکت‌کنندگان به ساختارهای تجربی دسترسی ندارند و ارزیابان نیز نمی‌دانند که چه کسانی مدل‌ها را ارائه کرده‌اند.

آلفافولد در رقابت های CASP

در دسامبر 2018، در رقابت CASP13 این آلفافولد بود که با یک جهشی قابل توجه نسبت به سال های پیش، برنده جایزه شد. این نخستین کاربرد موثر هوش مصنوعی در تعیین ساختار پروتئین ها بود. در نوامبر 2020، نسخه بهبود یافته  از آلفافولد جایزه CASP14 را برد. به گفته یکی از بنیانگذاران CASP، جان مولت، آلفافولد در مقیاس 100 امتیازی دقت پیش‌بینی برای اهداف پروتئینی با درجه سختی متوسط، حدود 90 امتیاز کسب کرد. آلفافولد در سال 2021 به صورت متن باز منتشر شد و در CASP15 در سال 2022، در حالی که در رقابت های CASP شرکت نکرد، تقریباً تمام تیم‌های با رتبه بالا از آلفافولد یا تغییرات آن استفاده کردند. 

مقایسه عملکرد آلفافولد در مقایسه برندگان سال های مختلف رقابت CASP

آلفافولد یک جهشی شگرف در پیش‌بینی ساختار پروتئین را نمایان می‌کند. آلفافولد قادر است دامنه‌های بیشتری را با دقت بالا نسبت به هر سیستم دیگری که در CASP13 شرکت کرده است، پیش‌بینی کند، به‌ویژه در محدوده امتیاز TM-score 0.6–0.7

 آلفافولد با استفاده از تکنیک‌های FM (تیم برنده CASP12) موفق به کسب z-score جمعی برابر با 52.8 شد که برای برنده قبلی 36.6 بود. علاوه بر این، با ترکیب تیم های FM و TBM/FM، AlphaFold امتیاز 68.3 را کسب کرد.

در مسابقه CASP14، آلفافولد2 به دستاوردی دست یافته است که می‌توان آن را یک پیشرفت در مسئله تا شدن پروتئین‌ها تلقی کرد. آلفافولد2 نتایج فوق‌العاده‌ای هم در مقایسه با سایر رقبا و همچنین در مقایسه با سایر برندگان سال های گذشته به دست آورد. راه‌حل دیپ مایند به‌طور قابل توجهی از همه 145 راه‌حل دیگر شرکت‌کننده در مسابقه CASP14 پیشی گرفت و با نمره z مجموع 244.0217 به رتبه نخست دست یافت. این درحالی بود که نزدیک‌ترین رقیب نمره z مجموع 92.1241 را کسب کرده بود. تقریباً دو سوم پیش‌بینی‌ها از نظر کیفیت با ساختارهای تجربی قابل مقایسه بودند.

آلفافولد نتایجی خارج از مسابقه CASP نیز دارد. پیش‌بینی‌های آلفافولد در برابر ساختار ORF3a اعتبارسنجی شده‌اند، جایی که نتایج به دست آمده مشابه ساختارهایی بوده‌اند که بعداً به‌طور تجربی تعیین شده‌اند، با وجود طبیعت چالش‌برانگیز آن‌ها و داشتن توالی‌های مرتبط بسیار کم.

اهمیت فولدینگ (تا خوردن) پروتئین

عملکرد بیولوژیکی یک پروتئین توسط ساختار سه‌بعدی آن تعیین می‌شود که در توالی اسید آمینه‌اش کدگذاری شده است. برای اینکه پروتئین‌ها از نظر بیولوژیکی فعال باشند، باید ساختارهای سه‌بعدی خاصی را به خود بگیرند. تغییرات در ساختار پروتئین می‌تواند رفتار آن را به طور کامل تغییر دهد، به طوری که میتواند پروتئین را غیرفعال کرده و یا از بین ببرد. شناسایی و کنترل فولدینگ پروتئین به‌طور قابل‌توجهی بزرگ‌ترین چالش در زیست‌شناسی ساختاری است.

پروتئین‌های دناتوره شده، که تقریباً تمام ساختار سه‌بعدی آن‌ها مختل شده است، می‌توانند از حالت نامنظم تصادفی خود به یک ساختار منحصر به فرد و مشخص دوباره فولد شوند، که در آن فعالیت بیولوژیکی تقریباً به طور کامل بازگردانی می‌شود. این نشان می‌دهد که آن‌ها امکان بازسازی در محیط آزمایشگاهی را دارند و نشان می‌دهد که ساختار فولدینگ سه‌بعدی پروتئین در خود توالی کدگذاری شده و به فرآیند خارجی وابسته نیست.

پیچیدگی پیشبینی فولدینگ پروتئین

یکی از مشکلات در پیش‌بینی فولدینگ پروتئین ها این است که در حال حاضر راه آسانی برای محاسبه پتانسیل الکتروستاتیک دقیق، انرژی‌های پیوندهایی که کمی کشیده شده‌اند، یا در ساختارهای غیرایده‌آل وجود ندارد. مگر اینکه به شبیه‌سازی‌های مکانیک کوانتومی کند و بسیار پرهزینه متوسل شویم.

یکی دیگر از موانع مهم در پیش‌بینی فولدینگ پروتئین، وجود حالت های مختلف برای ساختار فضایی آن است. با فرض اینکه پیوندها دارای طول ثابت هستند، در یک پروتئین با طول متوسط 50 اسید آمینه (اندازه متوسط یک پروتئین انسانی 375 است)، هر اسید آمینه دارای دو پیوند چرخشی در ساختار اصلی است (زوایا سای و فی)، و تنها با در نظر گرفتن افزایش‌های 10 درجه، به 10036 یا 1072 حالت ممکن می‌رسیم که عدد بسیار بزرگی است.

تکنیک‌های پیش‌بینی ساختار

1) شبیه‌سازی‌های فیزیکی

شبیه‌سازی‌های فیزیکی، بر اساس شبیه‌سازی مکانیک کوانتومی، از نخستین تلاش‌ها در پیش‌بینی فولدینگ پروتئین‌ها به شمار می‌روند. ایده اصلی در اینجا اتکا به شبیه‌سازی‌های دینامیک مولکولی برای به دست آوردن فرایند فولدینگ پروتئین است.

2) مونتاژ قطعه ای (Fragment Assembly)

مدل‌ها از قطعه‌های کوتاه و متصل به هم از ستون فقرات (backbone) پروتئین‌های با ساختار شناخته شده ساخته می‌شوند. انتخاب قطعه‌ها معمولاً بر اساس شباهت توالی و همچنین پیش‌بینی ویژگی‌های ساختاری محلی مانند ساختار ثانویه یا زوایای چرخشی backbone انجام می‌شود. تجمع‌های چندگانه‌ای از قطعه‌ها تولید می‌شود و سپس با استفاده از یک معیار ارزش انرژی با دقت ارزیابی می‌شود. برای کاندیداهای با کمترین میزان انرژی (دارای پایداری بالا)، از یک معیار ارزش با دقت بالاتر و در نتیجه هزینه محاسباتی بیشتر استفاده می‌شود تا بهترین کاندید برای پیش‌بینی انتخاب شود. فرم تغییر یافته و پیشرفته تر این رویکرد به عنوان بهترین پیش‌بینی‌کننده‌ها در CASP9  و CASP10 شناخته شدند و در CASP11 نیز در میان دو ابزار برتر بودند.

3) ماشین لرنینگ

تکنیک‌های ماشین لرنینگ تاریخچه طولانی در کاربردهای تحلیل ساختار پروتئین دارند. در ابتدا به عنوان اجزای یک جریان کاری برای پیش‌بینی ویژگی‌های یک‌بعدی مانند زوایای چرخشی backbone یا ساختار ثانویه استفاده می‌شدند، اما اخیراً شاهد رونق این حوزه با رویکردهای انتها به انتها (end-to-end) بوده‌ایم. آثاری همچون “یادگیری قابل تفکیک انتها به انتها از ساختار پروتئین و سپس معماری‌های AlphaFold ایجاد شده توسط DeepMind قدرت واقعی پیش‌بینی یادگیری ماشین را نشان دادند. استراتژی‌های موفق از پردازش تصویر و پردازش زبان طبیعی، مانند شبکه‌های عصبی کانولوشنی و مکانیزم توجه، در معماری‌های طراحی شده برای پیش‌بینی چینش صحیح یک پروتئین گنجانده شده‌اند.

آلفا فولد به عنوان ابزاری از خانواده هوش مصنوعی

همانطور که گفته شد، آلفافولد یک سیستم هوش مصنوعی است که برای حل مشکل تاخوردگی پروتئین طراحی شده است. این سیستم یک درکی نسبت به تکامل پروتئین ها دارد که شبکه عصبی کانولوشنی عمیق، به عنوان جزء اصلی آن عمل می‌کند. این سیستم توالی‌ای را که برای آن فولدینگ مورد نظر است، همراه با هم‌ترازی توالی‌های چندگانه (MSA) دریافت می‌کند. آلفافولد از الگوریتمی بهره می‌برد که نشان می‌دهد زیرواحدها در تماس فضایی تمایل دارند الگوهای جهش‌های همگرا را نشان دهند. (یعنی رفتاری را نشان میدهند که در طی روند تکامل در سایر پروتئین ها حفظ شده است.)

ساختار (معماری) آلفافولد

ساختار آلفافولد شامل دو بخش است:

1. شبکه عصبی کانولوشنی: این شبکه توالی پروتئین و ویژگی‌های هم‌راستای چندگانه را به‌عنوان ورودی می‌گیرد و سطح پتانسیل خاص پروتئین را خروجی می‌دهد.

2. نزول گرادیان: در این مرحله، چندین اجرای نزول گرادیان برای پیدا کردن ساختاری که بهترین پایداری را برای انرژی پتانسیل پروتئین به‌دست آورد، انجام می‌شود.

شبکه عصبی کانولوشنی عمیق 

با استفاده از دیستوگرام‌ها (هیستوگرام‌های فاصله بین باقی‌مانده‌ها)، می‌توان مشکل پیدا کردن ساختار 3 بعدی پروتئین را مانند یک مشکل بینایی کامپیوتری تفسیر کرد. دیستوگرام‌ها با استفاده از یک شبکه عمیق آمینواسید ها تولید می‌شوند. این شبکه فاصله‌های بین اتم‌های پروتئین و همچنین زوایای چرخشی بین آمینواسید ها را پیش بینی میکند.

نزول گرادیان بر روی پتانسیل خاص پروتئین 

در این مرحله، یک میدان پتانسیل خاص پروتئین ساخته می‌شود که بر روی آن حداقل انرژی (بیشترین پایداری) با استفاده از نزول گرادیان محاسبه می‌شود. برای بهبود نتایج، یک الگوریتم ژنتیکی نیز برای پیدا کردن ساختاری با کمترین پتانسیل به‌کار می‌رود.

آلفافولد2 نیز از یک جاسازی استفاده می‌کند که شامل دنباله‌های کامل پیدا شده توسط MSA و الگوهای پتانسیل است، در حالی که راه‌حل قبلی تنها آمار MSA را دریافت می‌کرد. این به آلفافولد2 درک غنی‌تر و پیچیده‌تری از فضای پروتئین می‌دهد. 

جاسازی مفاهیم فیزیکی و هندسی در معماری به جای یک فرآیند جستجو انجام می‌شود. این به‌طور قابل توجهی فضای جستجو را محدود کرده و عملکرد بهتری را با عدم کاوش یا حتی در نظر گرفتن پیکربندی‌های فیزیکی غیرممکن فراهم می‌کند. 

جایگزینی شبکه عصبی کانولوشن با یک معماری مبتنی بر توجه، جریان اطلاعات سفت و سخت از همسایگان محلی شبکه‌های کانولوشنی را با جریانی که به‌طور دینامیک توسط شبکه کنترل می‌شود، جایگزین می‌کند.

استفاده از مدل به‌صورت تکراری با استفاده از SE(3)-Transformer تکراری اجازه می‌دهد تا گرادیان‌ها در سرتاسر معماری پراکنده شوند و قطع ارتباط بین پیش‌بینی‌های فاصله جفتی و ساختار سه بعدی که در مدل اولیه آلفافولد مشاهده می‌شود، از بین برود.

کاربرد های آلفافولد

عملکرد فوق‌العاده پیش‌بینی ساختار پروتئین توسط آلفافولد و انتشار بیش از ۲۰۰ میلیون ساختار پروتئین، در حال دگرگونی زیست‌شناسی ساختاری است و تأثیر عمیقی بر زمینه‌های زیست‌شناسی و پزشکی که به اطلاعات ساختاری پروتئین نیاز دارند، خواهد گذاشت. آلفافولد و ساختارهای پیش‌بینی‌شده آن به محققان این امکان را می‌دهد که فرصت بیشتری برای حل مسائلی که قبلاً به شدت چالش‌برانگیز تلقی می‌شدند، داشته باشند. در ادامه، پیشرفت‌های کاربردهای  آلفافولد در زمینه‌های زیست‌شناسی و پزشکی را بررسی خواهیم کرد.

زیست شناسی ساختاری

بدون شک، زیست‌شناسی ساختاری بیشترین تأثیر را از  آلفافولد دریافت کرده است. به جای اینکه بگوییم آلفافولد ممکن است زیست‌شناسان ساختاری را بیکار کند، ما ترجیح می‌دهیم به این دیدگاه اشاره کنیم که آلفافولد و ساختارهای پیش‌بینی‌شده آن، روش‌های انجام زیست‌شناسی ساختاری را تغییر خواهند داد، از جمله کریستالوگرافی اشعه ایکس، میکروسکوپی الکترونی با دمای پایین (cryo-EM) و طیف‌سنجی NMR  .

الف) استفاده به عنوان الگو: ساختارهای پیش‌بینی‌شده می‌توانند به عنوان الگوهایی برای جایگزینی مولکولی در حل ساختارهای کریستالوگرافی اشعه ایکس مورد استفاده قرار گیرند، که نشان می‌دهد فازبندی سنتی سلنومتیونین تقریباً ضروری نیست.

ب) کمک به تعیین ساختار: این ساختارهای پیش‌بینی‌شده می‌توانند در تعیین ساختار تجمع‌های بزرگ پروتئینی با استفاده از cryo-EM  مفید باشند، که معمولاً به ساختارهای پروتئین‌های مؤلفه یا دامنه‌های آن‌ها به عنوان نقطه شروع نیاز دارد.

ج) استفاده در :NMR همچنین می‌توان از ساختارهای پیش‌بینی‌شده در استفاده از NMR برای حل ساختار پروتئین بهره‌مند شد. معمولاً تعیین ساختار de novo دومین ها یا پروتئین‌ها با استفاده از NMR که زمان‌بر است، ممکن است با ساختارهای AlphaFold جایگزین شود.

در حال حاضر، بسیاری از کاربردهای موفق در این زمینه وجود دارد. به عنوان مثال، Hu و همکاران از کریستالوگرافی اشعه ایکس و پیش‌بینی آلفافولد برای تعیین ساختار دامنه VP8 (VP8B) پروتئین راسی در روتاویروس‌های گروه B استفاده کردند. در این مطالعه، نویسندگان پروتئین VP8B را بیان و خالص‌سازی کردند و سپس بلورهای این پروتئین را به دست آوردند و داده‌های پراش اشعه ایکس را دریافت کردند. در فرآیند حل ساختار سه‌بعدی این پروتئین، به جای استفاده از روش سنتی فازبندی سلنومتیونین، از آلفافولد برای تولید یک مدل جستجوی مناسب برای جایگزینی مولکولی استفاده کردند. نتایج نشان داد که ساختار پیش‌بینی‌شده آلفافولد تقریباً به‌طور کامل با چگالی پراش مطابقت دارد. علاوه بر شکل کلی، آلفافولد همچنین با دقت بالایی جهت‌گیری زنجیره‌های جانبی را پیش‌بینی کرد که بسیار نزدیک به آنچه در آزمایش‌ها تعیین شده بود، بود. نکته قابل توجه این است که آن‌ها یک حالت جدید چینش را با آلفافولد پیدا کردند که هرگز در پروتئین‌های همولوژی گزارش نشده بود.

Hutin و همکاران به تازگی ساختار هلیکاز DNA ویروس واکسینیا، هلیکاز-پرایمیز D5، را با استفاده از ترکیب cryo-EM و پیش‌بینی آلفافولد کشف کردند. ساختار به‌دست‌آمده D5 یک هسته هلیکاز AAA+ را نشان می‌دهد که با دامنه‌های N- و C-terminal احاطه شده است. ساختار D5 پیش‌بینی‌شده توسط AF2 به‌طور قابل توجهی به ساخت مدل کمک کرد. دامنه N-terminal که دارای وضوح ۳.۹ Å است، یک حلقه محکم و مشخص تشکیل می‌دهد، در حالی که وضوح به سمت C-terminus کاهش می‌یابد، که هنوز هم امکان تطابق ساختار پیش‌بینی‌شده را فراهم می‌کند. این ساختار محاسبات آلفافولد را برای تعداد زیادی از ساختارهای هلیکاز ویروسی مرتبط با D5 تأیید می‌کند.

Jin و همکاران ساختار کمپلکس سیگنال اینترلوکین (IL)−27 را با استفاده از cryo-EM و با کمک پیش‌بینی آلفافولد حل کردند، که از طریق آن یک مکانیسم جدید برای مونتاژ و فعال‌سازی کمپلکس شناسایی گیرنده IL-27 را منتشر کردند. Skalidis و همکاران از cryo-EM و آلفافولد برای توصیف ساختار‌های متابولون‌دار یک پیش‌ریبوزوم 60S، سنتاز اسید چرب و هسته‌های کمپلکس دی هیدروژناز پیرووات/اکسوگلوتارات E2 استفاده کردند. اگرچه بازسازی‌های سه‌بعدی cryo-EM با وضوح بین ۳.۸۴ تا ۴.۵۲ Å از جمع‌آوری کمتر از ۳۰۰۰ میکروگراف از یک بخش سلولی منفرد حل شده بود، آلفافولد الگوهای پیوند هیدروژنی پلی‌پپتید را در این محدوده وضوح قابل تشخیص کرد. این نتایج یک رویکرد یکپارچه را پیشنهاد کردند که به‌وسیله یادگیری ماشینی تقویت شده و امکان توصیف cryo-EM از عصاره‌های سلولی را فراهم می‌کند.

مطالعات مشابه دیگری نیز وجود دارد که در آن‌ها آلفافولد به کمک تعیین ساختار استفاده می‌شود و برخی از این مطالعات آلفافولد و روش‌های تجربی را ترکیب می‌کنند تا بررسی کنند آیا ساختار پروتئین به درستی حل شده است یا خیر، به‌عنوان مثال، ترکیب آلفافولد با کریستالوگرافی اشعه ایکس، cryo-EM، NMR و چندین روش دیگر.

علاوه بر تعیین ساختار، پیش‌بینی آلفافولد حتی می‌تواند به طراحی ساختارهای بیان نیز اعمال شود. این قابلیت‌ها به محققان این امکان را می‌دهد که بهتر تعیین کنند نقاط شروع و پایان یک دومین در توالی کجا واقع شده و از نواحی کم‌سازمان اجتناب کنند. نادیده گرفتن نواحی کم‌سازمان از توالی‌های پروتئینی معمولاً به طراحی پروتئین‌های نوترکیب برای تحقیقات مربوط به ساختارها کمک می‌کند.

کشف دارو با آلفافولد

کشف دارو یکی از زمینه‌های اصلی کاربرد است که به اطلاعات ساختاری پروتئین نیاز دارد. اگرچه سطح اعتماد به پیش‌بینی‌ها متفاوت است، اما ساختارهای پیش‌بینی‌شده توسط آلفافولد می‌توانند به طور قابل توجهی کشف داروهای مبتنی بر ساختار را ترویج دهند، به ویژه در برابر اهداف پروتئینی که اطلاعات ساختاری محدود یا هیچ‌گونه اطلاعاتی ندارند. در حال حاضر، ساختارهای پروتئینی که در کشف داروهای مبتنی بر ساختار استفاده می‌شوند، عمدتاً از بانک داده پروتئینی (PDB) به دست می‌آیند. با این حال، تعداد ساختارهای پروتئینی در پایگاه داده PDB نسبتاً محدود است و از پاسخگویی به تقاضای فعلی برای کشف داروها فاصله دارد. انتظار می‌رود انتشار ساختارهای کل جهان پروتئین، پروژه‌های کشف داروی موجود و جدید را تسریع کند.

Zhang و همکاران به تازگی از برنامه داکینگ مولکولی Glide برای ارزیابی عملکرد غربالگری مجازی در برابر ۲۸ هدف دارویی رایج استفاده کردند که هرکدام دارای ساختار تجربی شناخته‌شده و یک ساختار آلفافولد هستند. ساختارهای آلفافولد در زمینه عامل غنی‌سازی، عملکرد قابل مقایسه‌ای با ساختارهای تجربی نشان دادند. نتایج به وضوح نشان می‌دهند که ساختارهای آلفافولد می‌توانند به طور کامل جایگزین ساختارهای تجربی در غربالگری مجازی شوند.

Ren و همکاران از AF2 در موتورهای کشف داروی مبتنی بر هوش مصنوعی خود استفاده کردند که شامل یک پلتفرم بیوانفورماتیک به نام پاندا اومیکس و یک پلتفرم شیمی سنتزی به نام Chemistry42 است. PandaOmics اهداف مورد نظر را فراهم می‌کند و Chemistry42 مسئول تولید مولکول‌ها بر اساس ساختارهای پیش‌بینی‌شده آلفافولد است و سپس مولکول‌های انتخاب‌شده سنتز و در آزمایش‌های بیولوژیکی آزمایش می‌شوند. از طریق این رویکرد، آن‌ها یک ترکیب کوچک مؤثر برای CDK20 (کیناز وابسته به سایکلین20) با مقدار Kd برابر با ۸.۹ ± ۱.۶ میکرومول در ۳۰ روز از انتخاب هدف و پس از سنتز فقط ۷ ترکیب کشف کردند. این ترکیب در آن زمان اولین مولکول کوچک تارگت شده بر CDK20 بود و این کار اولین نمایش موفقیت‌آمیز آلفافولد در فرایند کشف داروی اولیه است.

Weng و همکاران از آلفافولد برای پیش‌بینی ساختار سه‌بعدی WSB1 (پروتئین WD-40) که یک هدف بالقوه جدید ضدسرطانی است و اطلاعات ساختاری سه‌بعدی آن در دسترس نیست، استفاده کردند. سپس ساختار پیش‌بینی‌شده با شبیه‌سازی‌های دینامیک مولکولی بهینه‌سازی شد. ساختار سه‌بعدی بهینه‌شده WSB1 به عنوان ساختار گیرنده برای انجام داکینگ مولکولی به منظور غربالگری مهارکننده‌های WSB1 استفاده شد. در نهایت، آن‌ها تعدادی ترکیب فعال بالقوه به دست آوردند. در میان این ترکیبات، G490-0341 بهترین ساختار پایدار را نشان داد و شایسته تحقیقات و توسعه بیشتر بود.

Liang و همکاران JMJD8 را به عنوان یک آنکوژن جدید مرتبط با سرکوب ایمنی و ترمیم DNA از طریق تحلیل بیوانفورماتیک شناسایی کردند. سپس آن‌ها از آلفافولد برای پیش‌بینی ساختار سه‌بعدی JMJD8 استفاده کرده و غربالگری مجازی برای بازیابی مهارکننده‌های JMJD8 انجام دادند. Liu و همکاران یک روش کشف داروی چند هدفه پیشنهاد کردند و این روش را برای کشف داروهای هیپوترمی درمانی به کار بردند. در این مطالعه، آن‌ها ابتدا ساختار تمام اهداف پروتئینی مرتبط را با استفاده از آلفافولد و RoseTTAFold پیش‌بینی کردند. پس از آن، آن‌ها از داکینگ مولکولی برای تخمین تعامل بین پروتئین‌ها و داروها استفاده کرده و داروهای تک یا ترکیب‌های دارویی مناسب را تعیین کردند. با توجه به اختلاف وزن‌های اهداف پروتئینی متفاوت، این رویکرد می‌تواند به طور مؤثری از مهار پروتئین‌های مفید جلوگیری کند در حالی که پروتئین‌های مضر را مهار می‌کند.

به جز مثال‌های فوق، برخی تحقیقات نیز نشان دادند که کیفیت زنجیره جانبی مدل‌شده توسط آلفافولد برای کشف دارو کافی نیست و برخی مطالعات اخیر نیز نشان دادند که آزمون داکینگ مبتنی بر ساختارهای پیش‌بینی‌شده آلفافولد عملکرد ضعیفی دارد.

طراحی پروتئین با آلفافولد

طراحی پروتئین به معنای ایجاد پروتئین‌های جدید با ساختارها و عملکردهای مورد نظر است. طراحی پروتئین به صورت -de novo یک هدف بنیادی دیرینه در زیست‌شناسی سنتزی است. این یک وظیفه پیچیده و چالش‌برانگیز است که عمدتاً به دلیل دشواری در پیش‌بینی قابل اعتماد ساختارهای سه‌بعدی پروتئین از توالی‌های اسید آمینه محدود شده است. آلفافولد و سایر الگوریتم‌های یادگیری ماشین (مانند RoseTTAFold و مدل‌های زبانی اخیر) احتمالاً این مانع را برطرف می‌کنند. به هیچ وجه نمی‌توان اغراق کرد که با پیش‌بینی آلفافولد ، ما وارد یک عصر جدید در طراحی پروتئین خواهیم شد. برخی از مثال‌های معمول طراحی پروتئین با استفاده از آلفافولد به شرح زیر است:

Jendrusch و همکاران یک چارچوب محاسباتی برای طراحی پروتئین به صورت de novo توسعه دادند که آلفافولد را به عنوان یک پیشبینی کننده در یک فرآیند طراحی قابل بهینه‌سازی قرار می‌دهد. این یک چارچوب قابل تنظیم برای طراحی پروتئین از طریق بهینه‌سازی توالی با استفاده از الگوریتم‌های تکاملی است. این کار به مطالعات قبلی در زمینه طراحی پروتئین با بهره‌گیری از پیش‌بینی‌کننده‌های ساختاری گسترش می‌یابد. تمامیت ساختارهای پیش‌بینی‌شده با استفاده از روش‌های استاندارد تجزیه و تحلیل ساختار پروتئین و شبیه‌سازی‌های دینامیک مولکولی دقیق تأیید و اعتبارسنجی شده است. آن‌ها همچنین یک کاربرد بالقوه از روش خود را در طراحی مونومرها، دیمرها و الیگومرهای پروتئینی جدید، و همچنین بایندرهای پروتئینی برای پروتئین‌های هدف و پروتئین‌هایی که در هنگام تشکیل کمپلکس تغییر شکل می‌دهند، نشان دادند.

پیش‌بینی تارگت مولکول با آلفافولد

پیش‌بینی تارگت، شامل شناسایی‌ هدف اصلی و غیرهدف، نه تنها برای درک فرآیندهای فیزیولوژیکی و پاتولوژیکی مهم است، بلکه برای شناسایی اهداف دارویی جدید و ارزیابی انتخاب‌پذیری داروها نیز ضروری است. روش‌های تجربی برای شناسایی تارگت، مانند روش‌های مختلف مبتنی بر نمایه سازی پروتئین بر اساس فعالیت (ABPP)، اغلب هزینه‌بر و زمان‌بر هستند. پیش‌بینی تارگت با کمک کامپیوتر می‌تواند دامنه شناسایی هدف را محدود کند که معمولاً بر اساس داکینگ پروتئین-لیگاند، که معمولاً به آن داکینگ معکوس گفته می‌شود، انجام می‌شود. پیش‌تر، داکینگ معکوس با چالشی از کمبود ساختارهای سه‌بعدی تمام پروتئین‌های ممکن مواجه بود. ساختارهای آلفافولد فرصتی بی‌سابقه برای توسعه روش‌های پیش‌بینی تارگت قابل اجرا فراهم می‌کنند.

Wang و همکاران از ساختارهای آلفافولد برای ساخت اولین پایگاه داده برای تمام پروتئین‌های موجود در پروتئوم انسانی استفاده کردند که به آن پایگاه داده CavitySpace می‌گویند. CavitySpace می‌تواند برای شناسایی اهداف جدید برای داروهای شناخته‌شده در تحقیقات بازپیکربندی دارو یا عوارض جانبی استفاده شود. این پایگاه داده به راحتی می‌تواند برای پیش‌بینی هدف از طریق داکینگ معکوس مورد استفاده قرار گیرد. روند ساخت این پایگاه داده به شرح زیر است: آن‌ها ۲۳,۳۹۱ پروتئین انسانی را از پایگاه داده ساختار پروتئین آلفافولد و ۶,۹۵۶ پروتئین مرجع انسانی را از PDB جمع‌آوری کردند. سپس، آن‌ها از CAVITY، ابزاری که توسط همان گروه تحقیقاتی برای شناسایی تمام حفره‌های ممکن بر روی سطوح پروتئینی توسعه یافته است، برای شناسایی تمام حفره‌های بالقوه بر روی سطوح پروتئین‌ها استفاده کردند. پایگاه داده CavitySpace به صورت رایگان در http://www.pkumdl.cn:8000/cavityspace در دسترس است. همچنین مطالعات دیگری وجود دارد که آلفافولد را برای پیش‌بینی هدف به کار برده‌اند.

پیش‌بینی عملکرد پروتئین با آلفافولد

در حال حاضر، هنوز بسیاری از پروتئین‌ها وجود دارند که عملکرد آنها ناشناخته یا به خوبی تعیین نشده است. از آنجا که ساختارهای سه‌بعدی پروتئین‌ها به طور کامل عملکرد آنها را تعیین می‌کنند، این ویژگی می‌تواند برای ایجاد مدل‌های پیش‌بینی عملکرد پروتئین مبتنی بر داده‌ها مورد استفاده قرار گیرد. با این حال، تعداد ناکافی ساختارهای پروتئینی موجود، عملکرد این مدل‌ها را به شدت محدود می‌کند. ساختارهای پیش‌بینی‌شده توسط آلفافولد یک راه‌حل امیدوارکننده برای این مشکل ارائه می‌دهند و انتظار می‌رود که با افزایش تعداد نمونه‌های آموزشی، عملکرد این مدل‌ها را بهبود ببخشند.

Ma و همکاران اخیراً یک مطالعه جامع انجام دادند تا بررسی کنند آیا ساختارهای پیش‌بینی‌شده توسط آلفافولد می‌توانند عملکرد پیش‌بینی عملکرد پروتئین را بهبود بخشند. در این مطالعه، آن‌ها یک رویکرد پیشرفته مبتنی بر ساختار برای پیش‌بینی عملکرد پروتئین پیشنهاد کردند و یک مجموعه داده مرجع جدید ساختند. سپس آن‌ها ارزیابی کردند که آیا عملکرد مدل پیش‌بینی عملکرد پروتئین می‌تواند با اضافه کردن ساختارهای پروتئینی پیش‌بینی‌شده توسط آلفافولد به مجموعه داده آموزشی بهبود یابد. آن‌ها همچنین تفاوت‌های عملکرد بین دو مدل را که به‌طور جداگانه با ساختارهای پیش‌بینی‌شده توسط آلفافولد و فقط با ساختارهای واقعی پروتئین آموزش داده شده بودند، مقایسه کردند. نتایج آن‌ها نشان داد که مدل‌های پیش‌بینی عملکرد پروتئین مبتنی بر ساختار می‌توانند از داده‌های بیوانفورماتیکی که شامل ساختارهای پیش‌بینی‌شده توسط آلفافولد هستند، بهره‌مند شوند. حتی مدل آموزش‌دیده تنها با استفاده از ساختارهای پیش‌بینی‌شده توسط آلفافولد2 عملکرد قابل مقایسه‌ای با مدل مبتنی بر ساختارهای واقعی پروتئین که از طریق آزمایشات حل شده‌اند، داشت. این نشان می‌دهد که ساختارهای پیش‌بینی‌شده توسط آلفافولد تقریباً به طور یکسان در پیش‌بینی عملکرد پروتئین مؤثر بودند.

نمایش‌های ویژگی ساختاری قابل تفسیر و فشرده برای پیش‌بینی دقیق خواص و عملکرد پروتئین‌ها مهم هستند. در یک مطالعه اخیر، Rappoport و Jinich نمایش‌های ویژگی سه‌بعدی ساختارهای پروتئینی را با استفاده از منحنی‌های پرکننده فضا ساختند و ارزیابی کردند که در آن ساختارهای پروتئینی پیش‌بینی‌شده توسط آلفافولد استفاده شدند. در این مطالعه، دو پیش‌بینی زیرلایه آنزیمی به عنوان مطالعات موردی استفاده شد: متیل‌انتقال‌دهنده‌های وابسته به S-ادنوزین ‌متیونین (SAM-MTases) و دهیدروژناز/کاهش‌دهنده‌های زنجیره کوتاه (SDRs). همان‌طور که نتایج آن‌ها نشان می‌دهد، عملکرد آنزیمی می‌توانست از نمایش‌های ویژگی بر اساس ساختارهای سه‌بعدی SAM-MTAses و SDRs با دقت خوبی پیش‌بینی شود.

با جستجوی پروتئین‌هایی که حاوی دامنه Zα (دامنه پروتئینی Z-DNA/Z-RNA که به‌طور تجربی تأیید شده است) از پایگاه داده ساختار پیش‌بینی‌شده آلفافولد2  هستند، Bartas و همکاران ۱۸۵ پروتئین با یک دامنه Zα احتمالی شناسایی کردند که ممکن است به Z-DNA/Z-RNA متصل شوند و نقش مهمی در فرآیندهای سلولی مختلف ایفا کنند. همچنین تحقیقات جالب دیگری وجود دارد که آلفافولد را در پیش‌بینی عملکرد پروتئین دخیل می‌کند.

بررسی تعاملات پروتئین-پروتئین با آلفافولد

تعامل پروتئین-پروتئین (PPI) به فرآیندی اشاره دارد که در آن دو یا چند مولکول پروتئینی از طریق پیوندهای غیرکووالانسی یک کمپلکس پروتئینی تشکیل می‌دهند. اکثر پروتئین‌ها برای انجام عملکردهای خود نیاز دارند که پروتئین‌های دیگر را از طریق پروتئین-پروتئین اینترکشن (PPI) جذب کنند. درک ساختار پروتئین‌های در حال تعامل، یک گام اساسی در راستای کشف عملکرد و مکانیزم پروتئین‌ها است. با این حال، ابزارهای محاسباتی کافی برای تولید ساختارهای دقیق کمپلکس‌های پروتئینی وجود ندارد. ظهور آلفافولد می‌تواند به شدت به این حوزه کمک کند.

Evans و همکاران آلفافولد را برای پیش‌بینی کمپلکس‌های چند زنجیره‌ای گسترش دادند و این سیستم AlphaFold-Multimer نامیده شد. در یک مجموعه داده مرجع از ۱۷ پروتئین هترودیمر بدون الگو، آن‌ها حداقل دقت متوسطی را در ۱۴ هدف و دقت بالایی را در ۶ هدف به دست آوردند. آن‌ها همچنین ساختارهایی را برای یک مجموعه داده بزرگ شامل بیش از ۴,۰۰۰ کمپلکس پروتئینی اخیر پیش‌بینی کردند و از این میان، تمام رابط‌های غیر تکراری با هویت الگوی پایین را از این کمپلکس‌های پروتئینی امتیازدهی کردند. برای رابط‌های هترومر، آن‌ها موفق به پیش‌بینی رابط در ۶۷٪ موارد شدند و ۲۳٪ از موارد با دقت بالا پیش‌بینی شدند. برای رابط‌های هومومر نیز در ۶۹٪ موارد رابط را به‌طور مؤثر پیش‌بینی کردند و در ۳۴٪ از موارد پیش‌بینی‌های با دقت بالایی تولید کردند. تمام این نتایج عملکرد برتری را در مقایسه با رویکردهای موجود نشان دادند. AlphaFold2-multimers اکنون برای پیش‌بینی ساختارهای کمپلکس پروتئین-پروتئین استفاده می‌شود. به‌عنوان مثال، Gómez-Marín و همکاران از AlphaFold-multimer برای پیش‌بینی مدل‌های کمپلکس PHF14-HMG20A استفاده کردند. Ivanov و همکاران نیز از AlphaFold-multimer برای پیش‌بینی ساختار هومودیمر CYP102A1 استفاده کردند.

به‌تازگی، Bryant و همکاران از آلفافولد برای پیش‌بینی کمپلکس‌های پروتئینی هترودیمر استفاده کردند. در این کار، آن‌ها اثر داکینگ را با استفاده از خط لوله آلفافولد2 ترکیب‌شده با MSAs ورودی مختلف بررسی کردند تا رابطه بین کیفیت مدل خروجی و این ورودی‌ها را مطالعه کنند. با امتیازدهی به مدل‌های PPI متعدد با یک امتیاز DockQ پیش‌بینی‌شده (pDockQ)، آن‌ها توانستند مدل‌های نادرست را با اطمینان بالا از یکدیگر تشخیص دهند (pDockQ ≥ 0.23). آن‌ها نتیجه‌گیری کردند که داکینگ مبتنی بر آلفافولد عملکرد بهتری نسبت به یک روش داکینگ دیگر دارد.

 

Yin و همکاران عملکرد آلفافولد را در پیش‌بینی ساختارهای کمپلکس‌های پروتئینی از توالی‌های آمینو اسید بررسی کردند. آن‌ها از ۱۵۲ کمپلکس پروتئینی هترودیمر متنوع برای تشکیل یک مجموعه داده آزمایشی مرجع استفاده کردند. در این آزمایش، ۴۳٪ از مواردی که مدل‌های نزدیک به حالت طبیعی داشتند به‌عنوان نتایج پیش‌بینی برتر توسط آلفافولد تولید شدند که به‌طور قابل توجهی عملکرد روش داکینگ پروتئین–پروتئین بدون اتصال (۹٪) را بهتر کردند. برای بررسی اثر AlphaFold_Multimer در پیش‌بینی تعامل آنتی‌بود–آنتی‌ژن، نویسندگان از مجموعه‌ای از ساختارهای آنتی‌بود–آنتی‌ژن استفاده کردند که به‌تازگی منتشر شده بودند. نتایج آزمایش تأیید کردند که نرخ موفقیت پایینی برای مدل‌سازی کمپلکس‌های آنتی‌بود–آنتی‌ژن وجود دارد. آن‌ها همچنین مشاهده کردند که از طریق الگوریتم، کمپلکس‌های گیرنده T cell–آنتی‌ژن نیز به‌طور دقیق مدل‌سازی نشده‌اند. این یافته‌ها نشان می‌دهند که آلفافولد در مدیریت شناسایی ایمنی تطبیقی با چالش‌هایی مواجه است. Gao و همکاران یک سیستم مبتنی بر آلفافولد به نام AlphaFold Complex توسعه دادند که می‌تواند تعاملات فیزیکی مستقیم را در پروتئین‌های چند زنجیره‌ای پیش‌بینی کند. برخلاف رویکردهای معمول، جفت‌های MSAs برای AlphaFold Complex ضروری نیستند. این سیستم به‌طور قابل توجهی از AlphaFold-Multimer بهبود یافته و دقت بالاتری را در مقایسه با برخی از روش‌های داکینگ پروتئین–پروتئین پیچیده به دست می‌آورد. علاوه بر این، نویسندگان معیارهایی را برای پیش‌بینی تعاملات مستقیم پروتئین–پروتئین بین جفت‌های دلخواه پروتئین معرفی کردند و AlphaFold Complex را بر روی پروتئوم E. coli و همچنین برخی مجموعه‌های آزمایشی چالش‌برانگیز اعتبارسنجی کردند.

علاوه بر PPI، آلفافولد همچنین می‌تواند در پیش‌بینی تعاملات پپتید–پروتئین استفاده شود. به‌عنوان مثال، Tsaban و همکاران یک استراتژی مبتنی بر آلفافولد برای مدل‌سازی کمپلکس پپتید–پروتئین پیشنهاد کردند که نیازی به اطلاعات MSA برای شریک پپتید نداشت. به این ترتیب، تغییرات کنفورماسیونی ناشی از اتصال گیرنده قابل مدیریت بودند. نتایج نشان می‌دهد که آلفافولد می‌تواند انتظار داشته باشد که بینش ساختاری در مورد دامنه وسیعی از کمپلکس‌های پپتید–پروتئین ارائه دهد.

بررسی مکانیسم عمل بیولوژیکی اغلب پیچیده است و چالشی باقی می‌ماند. مطالعات مکانیسم عمل بیولوژیکی شامل جنبه‌های مختلفی از جمله نحوه تعامل دارو با هدف، مکانیزم کاتالیز آنزیم‌های بیولوژیکی و غیره می‌باشد.

روش‌های داکینگ مولکولی در شبیه‌سازی‌های کامپیوتری به‌طور گسترده‌ای برای پیش‌بینی تعامل دارو و هدف استفاده شده‌اند. با این حال، این نوع روش‌ها به شدت به ساختارهای پروتئینی موجود وابسته هستند. آلفافولد یک رویکرد جایگزین برای به‌دست آوردن ساختارهای دقیق پروتئین فراهم می‌کند. Wong و همکاران داکینگ مولکولی را با AF2 برای پیش‌بینی تعاملات پروتئین-لیگاند ترکیب کردند. آن‌ها با موفقیت تعاملات بین ۲۹۶ پروتئین که شامل پروتئوم اساسی Escherichia coli بود و ۲۱۸ ترکیب آنتی‌بیوتیکی فعال و ۱۰۰ ترکیب غیر فعال را پیش‌بینی کردند. آن‌ها فعالیت آنزیمی ۱۲ پروتئین اساسی را که با هر ترکیب آنتی‌بیوتیکی درمان شده بودند، اندازه‌گیری کردند تا عملکرد مدل را ارزیابی کنند. این تحقیق نشان می‌دهد که رویکردهای پیشرفته در مدل‌سازی تعاملات پروتئین-لیگاند، به‌ویژه با استفاده از روش‌های مبتنی بر یادگیری ماشین، برای بهره‌برداری بهتر از آلفافولد در مطالعات مکانیسم عمل و کشف داروها نیاز است.

اکسیداسیون لاکتات با NAD+ به‌عنوان پذیرنده الکترون یک واکنش بسیار انرژی‌بر است. برخی از باکتری‌های بی‌هوازی با استفاده از انشعاب/ادغام الکترون (FBEB/FBEC) مبتنی بر فلافین، که شامل لاکتات دهیدروژناز (Ldh) به همراه EtfA و EtfB است، که پروتئین‌های انتقال‌دهنده الکترون هستند، بر این مانع انرژی غلبه می‌کنند. با این حال، مکانیزم عمل به‌خوبی درک نشده است. در یک مطالعه اخیر، Kayastha و همکاران از محاسبات آلفافولد استفاده کردند و یک حالت جدید B (متصل به انشعاب) قابل قبول به‌دست آوردند که اجازه می‌دهد الکترون بین FAD های شاتل و پایه EtfAB منتقل شود. بر اساس یافته‌ها، آن‌ها یک مکانیزم کاتالیز یکپارچه برای فرآیند FBEC ارائه دادند.

Liang و همکاران تعیین‌کننده‌های زیرلایه و مکانیزم شناسایی سپاراز، که یک پروتئاز سیستئینی غول‌پیکر است، را بررسی کردند. در مخمر جوانه‌زنی، آن‌ها یک موتیف محافظت‌شده در پایین‌دست محل برش شناسایی کردند. با استفاده از آلفافولد و شبیه‌سازی‌های دینامیک مولکولی، آن‌ها کشف کردند که در یک شکاف محافظت‌شده نزدیک به شیار اتصال‌دهنده مهارکننده سپاراز، این موتیف توسط سپاراز شناسایی می‌شود. این اتصال به‌طور متقابل انحصاری است و نیاز به تغییر شکل سپاراز دارد. تحقیقات آن‌ها می‌تواند به دانشمندان کمک کند تا درک عمیق‌تری از مکانیزم شناسایی زیرلایه و فعال‌سازی سپاراز به‌دست آورند.

Lorenz و همکاران از آلفافولد برای پیش‌بینی ساختار دامنه‌های KRAB انتخاب‌شده استفاده کردند. آن‌ها یک بدنه L شکل محافظت‌شده از دو α-هلیکس را در تمام دامنه‌های KRAB کشف کردند. این ساختار به یک آرایش فضایی معمولی به‌ویژه برای mKRABAB پس از جایگزینی اسید آمینه و همراه با یک هلیکس سوم ارائه شده توسط mKRAB-B تغییر یافت. این موضوع بینش‌های بنیادی درباره چگونگی تشکیل کمپلکس KRAB با TRIM28 ارائه می‌دهد. McMullen و همکاران از مخمر دریافتند که EKP-GCSF و GCSF به‌طور مشابه به گیرنده GCSF-R متصل می‌شوند. به‌طور مشابه، برای مطالعه اثرات ساختاری EKP بر GCSF، آن‌ها مدل‌سازی محاسباتی را با استفاده از آلفافولد در ترکیب با شبیه‌سازی‌های دینامیک مولکولی انجام دادند. مدل‌سازی محاسباتی نشان می‌دهد که EKP رفتار ساختاری GCSF را تغییر نمی‌دهد، که نشان می‌دهد EKP مانع اتصال گیرنده نمی‌شود. علاوه بر این، شکل اولیه EKP-GCSF از AlphaFold نشان می‌دهد که EKP که در اطراف GCSF قرار دارد ممکن است شواهدی از محافظت حرارتی EKP بر GCSF ارائه دهد.

کاربردهای دیگر آلفافولد

علاوه بر حوزه‌های کاربردی ذکر شده در بالا، پیش‌بینی آلفافولد همچنین می‌تواند در برخی دیگر از زمینه‌ها مانند تکامل پروتئین، مطالعات درمان بیماری‌های نادر، اثرات جهش بر درمان، طراحی واکسن و غیره مورد استفاده قرار گیرد. به‌عنوان مثال، Tang و همکاران رابطه بین تکامل ارگانیسم و تکامل پروتئین را بر اساس ساختارهای پروتئوم ۴۸ ارگانیسم پیش‌بینی‌شده توسط آلفافولد بررسی کردند. آن‌ها برخی پدیده‌های جالب را کشف کردند، از جمله: (۱) پروتئین‌های سازنده ارگانیسم‌های با پیچیدگی بالاتر دارای شعاع چرخش بزرگ‌تر، نسبت‌های مارپیچی بالاتر و لرزش‌های کندتر هستند، و (۲) درجه بالاتر تخصص عملکردی پروتئین‌ها با درجه بالاتر پیچیدگی ارگانیسم‌ها مرتبط است. این تحقیق دیدگاه‌های جدیدی درباره چگونگی افزایش تنوع عملکردی پروتئین‌ها و کاهش ابعاد منیفولد دینامیک پروتئین‌ها در فرآیند تکامل ارائه می‌دهد. Sebastiano و همکاران دریافتند که ساختارهای پروتئینی پیش‌بینی‌شده توسط آلفافولد پتانسیل کمک به مطالعات درمان بیماری‌های نادر را دارند. در این تحقیق، نویسندگان بر روی Alsin، پروتئینی که مسئول بیماری‌های نادر نورون حرکتی است، تمرکز کردند. با استفاده از ساختارهای پروتئینی پیش‌بینی‌شده توسط AF2، آن‌ها پروفایل انعطاف‌پذیری Alsin و جهش‌های آن و مدل‌های دیمری/تترامری Alsin مسئول عمل فیزیولوژیکی‌اش را ارزیابی کردند. آن‌ها نتیجه‌گیری کردند که تلاش‌های کشف دارو برای بیماری‌های مرتبط با Alsin باید ادامه یابد. Yang و همکاران از آلفافولد برای پیش‌بینی ساختارهای پروتئین‌های S، N و M واریانت Omicron SARS-CoV-2 استفاده کردند. آن‌ها به‌طور دقیق تحلیل کردند که چگونه پروتئین S و اجزای آن، S1 RBD و NTD تحت تأثیر جهش‌ها قرار گرفته‌اند و همچنین چگونه واکسن‌ها و درمان‌های فعلی SARS-CoV-2 تحت تأثیر این جهش‌ها قرار خواهند گرفت. Zeng و همکاران از آلفافولد برای طراحی یک واکسن ساقه هماگلوتینین به نام “B60-Stem-8070” استفاده کردند. این واکسن عملکرد بهتری نسبت به آنتی‌ژن ساقه هماگلوتینینین اصلی نشان داد.

آلفافولد برنده جایزه نوبل شیمی 2024

در سال گذشته جایزه نوبل شیمی 2024 به دیوید بیکر، جان جامپر و دمیس هسابیس برای ارائه آلفافولد تعلق گرفت.

دیوید بیکر (David Baker) متولد 6 اکتبر 1962 (14 مهر 1341) در آمریکا، بیوشیمیست و زیست‌شناس محاسباتی است که روش‌هایی را برای طراحی پروتئین‌ها و پیش‌بینی ساختارهای سه‌بعدی آن‌ها راه‌اندازی کرده است. او استاد بیوشیمی هنریتا و اوبری دیویس، محقق مؤسسه پزشکی هاوارد و استادیار علوم ژنوم، مهندسی ژنتیک، مهندسی شیمی و علوم کامپیوتر در دانشگاه واشنگتن است. بیکر و همکارانش با توسعه برنامه‌های هوش مصنوعی، موفق به حل مسائل مربوط به پیش‌بینی ساختار پروتئین شدند. او همچنین در سال 2022 جایزه وایلی را دریافت کرد. گروه تحقیقاتی بیکر یکی پس از دیگری پروتئین‌های مصنوعی تولید کرده است. از بعضی از این پروتئین‌ها می‌توان به‌عنوان دارو، واکسن و مواد نانو و حسگرهای کوچک استفاده کرد.

جان مایکل جامپر (John M. Jumper) دانشمند آمریکایی شرکت هوش مصنوعی دیپ‌مایند است. جامپر و همکارانش، آلفا فولد را طراحی کردند که یک مدل هوش مصنوعی برای پیش‌بینی ساختارهای پروتئینی از توالی اسیدهای آمینه آن‌ها با دقت بالا است. جامپر در دانشگاه شیکاگو تحصیل کرده است.

دمیس هسابیس (Demis Hassabis) متولد 27 ژوئیه 1976 (5 مرداد 1355) دانشمند علوم رایانه، محقق هوش مصنوعی و کارآفرین بریتانیایی است. او در ابتدای کار خود برنامه‌نویس و طراح بازی‌های ویدیویی هوش مصنوعی بود. وی مدیر اجرایی و یکی از بنیانگذاران شرکت هوش مصنوعی دیپ‌مایند و Isomorphic Labs و نیز مشاور هوش مصنوعی دولت انگلیس است.

چالش ها و محدودیت های آلفافولد

با اینکه آلفافولد یک انقلابی در زیست‌شناسی ساختاری است، اما در حال حاضر  تا حد زیادی بر روی ساختارهای پروتئینی موجود در بانک داده پروتئین (Protein Data Bank) استوار است که در که به وسیله ی کریستالوگرافی اشعه ایکس به دست آمده اند. بنابراین، بیشتر به‌عنوان یک پیش‌بینی‌کننده وضعیت ساختاری بر اساس شرایط تجربی شناخته می شود که از پیشبینی برخی از استثناهایی که ممکن است به وقوع بپیوندد ناتوان است.به علاوه برخی محدودیت‌های ذاتی در روش‌ها و تکنیک‌ها، کاربردهای پیش‌بینی آلفافولد را در بسیاری از جنبه‌ها محدود می‌کند که به‌طور خلاصه به شرح زیر است:

1) دینامیک پروتئین

دینامیک پروتئین یک حوزه تحقیقاتی بسیار مهم است. ساختار پروتئین پیش‌بینی‌شده توسط آلفافولد یک حالت ایستا است. با این حال، پروتئین‌ها بسیار پویا  هستند و دارای چندین حالت مختلف می‌باشند. بسیاری از پروتئین‌های فیزیولوژیکی و پاتولوژیکی مهم (مانند پروتئین‌های کانال یونی) تغییرات کنفورماسیونی بسیار ظریفی در حالت‌های فعال مختلف دارند و همچنین به دلیل ترکیب با پروتئین‌های مختلف در داخل و خارج از سلول، اشکال فضایی متغیری را نشان می‌دهند. اما آلفافولد معمولاً تنها یک شکل از آن پروتئین را ارائه می‌دهد که دشوار است تنوع کنفورماسیونی پروتئین‌ها را پوشش دهد. با این حال، این به این معنا نیست که نمی‌توان دینامیک پروتئین را با آلفافولد مشاهده کرد. بر اساس چندین مطالعه اخیر، آلفافولد هنوز هم می‌تواند برای برخی تحلیل‌های دینامیک پروتئین مورد استفاده قرار گیرد. به عنوان مثال، اخیراً به کمک آلفافولد روش هایی برای نمایش کنفورماسیون های جایگزین ترانسپورترهای توپولوژیکی متنوع و همچنین گیرنده‌های انتقال سیگنال G-protein-coupled را ارائه دادند. مطالعات حاکی از آن است که آلفافولد در شناسایی دقیق کنفورماسیونی پروتئین های بزرگ با چندین دمین (مثل یک گیرنده تراغشایی با دامنه بزرگ خارج‌سلولی)، محدودیت هایی دارد که اشاره به لزوم طراحی روش‌های جدید یادگیری عمیق برای پیش‌بینی مجموعه‌ای از حالات بیوفیزیکی مرتبط دارد.

2) ساختارهای نواحی بی‌نظم پروتئین‌ها

آلفافولد در پیش‌بینی ساختار پروتئین‌ها در مواردی که توالی‌های کمتری برای مقایسه همپوشانی در دسترس باشد و نواحی که از نظم طبیعی درون مولکولی پیروی نمیکنند، مانند لوپ‌ها، عملکرد خوبی ندارد. ساختارهای لوپ در حالت جامد نسبتاً پایدار هستند، اما در محلول‌ها بسیار ناپایدارند. با وجود تمام روش‌های جدید هنوز هم آلفافولد برای پیشبینی مورفولوژی، دینامیک و تعاملات نواحی بی‌نظم پروتئین‌ها و به ویژه در حالت محلول‌ با چالش هایی روبه رو است.

3) ساختارهای پروتئین‌ها در ترکیب با مولکول‌های کوچک یا پروتئین‌های دیگر

لیگاندهای مولکول‌های کوچک یا پروتئین‌ها ممکن است باعث تغییر شکل یک پروتئین شوند. مثال بارز این تغییرات، برخی مولکول‌های کوچک یا پپتیدهایی هستند که به محلی از پروتئین آنزیم متصل می‌شوند که متفاوت از محل اتصال لیگاند اندوژن است تا تغییرات کنفورماسیونی ایجاد کند و در نتیجه فعالیت آنزیم را تغییر دهد. علاوه بر این مولکول ها، بسیاری از لیگاندها که به محل لیگاند متصل می‌شوند نیز می‌توانند تغییرات کنفورماسیونی ایجاد کنند. آلفافولد برای تعیین اینکه پروتئین‌ها چگونه در حضور لیگاندها یا پروتئین‌های دیگر تغییر شکل می‌دهند، طراحی نشده است.

4) ساختارهای پروتئین‌ها با جهش‌های نقطه‌ای

جهش‌های نقطه‌ای به‌طور مکرر در پروتئین‌ها، به‌ویژه در حالت پاتولوژیک، مشاهده می‌شوند. درک اثر جهش‌های نادرست بر ساختار پروتئین ممکن است به کشف مکانیزم‌های بیولوژیکی یا پاتولوژیکی آن‌ها کمک کند. حتی اگر آلفافولد بتواند ساختارهای نوع وحشی (WT) را پیش‌بینی کند، احتمالاً در پیش‌بینی اثر جهش‌های نادرست بر ساختارهای سه‌بعدی پروتئین‌ها عملکرد ضعیفی دارد. اگرچه تحقیقات نشان می‌دهند که آلفافولد می‌تواند اثر فنوتیپی جهش‌های نادرست را پیش‌بینی کند، اما همچنین مشاهده شده است که عملکرد پیش‌بینی جهش‌های نادرست در سایر مطالعات دقیق نیست و فقط ارتباطات ضعیف یا عدم ارتباط بین معیارهای خروجی آلفافولد و تغییرات در پایداری یا عملکرد پروتئین وجود دارد.

5) ساختارهای پروتئین‌ها با تغییرات پس از ترجمه

تغییرات پس از ترجمه، مانند فسفوریلاسیون، متیلاسیون، استیلاسیون و گلیکوزیلاسیون، در پروتئین‌ها رایج هستند. این تغییرات پس از ترجمه ممکن است منجر به تغییرات کنفورماسیونی در ساختارهای پروتئینی شوند. به عنوان مثال، فسفوریلاسیون کینازهای غیرفعال در لوپ فعال آن‌ها معمولاً منجر به تغییرات کنفورماسیونی بزرگ می‌شود و در نهایت کینازها را فعال می‌کند. با این حال، آلفافولد فقط می‌تواند ساختار پروتئین‌ها را بر اساس توالی آمینو اسید آن‌ها پیش‌بینی کند و تغییرات پس از ترجمه در باقیمانده‌ها قابل شناسایی نیستند. بنابراین، تغییرات کنفورماسیونی ناشی از تغییرات پس از ترجمه با آلفافولد فعلی قابل پیش‌بینی نیستند.

6) محدودیت‌ها در روش‌ها و تکنیک‌ها

در نهایت باید ذکر کنیم که آلفافولد خود دارای برخی محدودیت‌ها در روش‌ها و تکنیک‌ها است. به عنوان مثال: (۱) مدل‌های یادگیری عمیق در حال حاضر تفسیرپذیری پایینی دارند؛ (۲) پیش‌بینی ساختاری آلفافولد بر اساس داده‌های MSA است، یعنی تعداد زیادی توالی مرتبط با تکامل برای پیش‌بینی ساختارها نیاز است که ممکن است عوارض جانبی مانند سرعت پیش‌بینی نسبتاً کند را به همراه داشته باشد. در مقایسه، مدل‌های زبانی (مانند ESMfold و RGN) امکان پیش‌بینی ساختار پروتئین به‌صورت انتها به انتها را به‌طور مستقیم از توالی‌های آمینو اسید با سرعت و دقت بالا فراهم می‌کنند.

چالش های اخلاقی آلفافولد

استفاده از آلفافولد و فناوری‌های مشابه در زمینه زیست‌شناسی و بیوانفورماتیک با چالش‌های اخلاقی متعددی همراه است. در زیر به برخی از این چالش‌ها اشاره می‌شود:

  • داده‌های حساس: ممکن است اطلاعات مربوط به پروتئین‌ها و ژن‌ها که توسط آلفافولد پیش‌بینی می‌شود، شامل داده‌های حساس یا خصوصی باشد.
  • استفاده نادرست از اطلاعات همانند سلاح های بیولوژیکی و میکروبی
  • تغییر در روش‌های تحقیق: استفاده گسترده از این فناوری ممکن است روش‌های سنتی تحقیق را تحت تأثیر قرار دهد و به کاهش تنوع در رویکردهای تحقیقاتی منجر شود.
  • تأثیر بر مشاغل: اتوماسیون در پیش‌بینی ساختار پروتئین‌ها ممکن است به کاهش نیاز به نیروی کار انسانی در برخی زمینه‌ها منجر شود.

خلاصه و جمع بندی از آلفافولد

عملکرد عالی آلفافولد در پیش‌بینی ساختار پروتئین به همراه انتشار ساختارهای بیش از 200 میلیون پروتئین پیش‌بینی‌شده توسط آن، در حال دگرگون کردن زیست‌شناسی ساختاری است. آلفافولد قطعاً تأثیر قابل‌توجهی بر تحقیقات نیازمند اطلاعات ساختار پروتئین خواهد داشت و می‌تواند در بسیاری از زمینه‌ها مانند کشف دارو، طراحی پروتئین، پیش‌بینی تارگت، پیش‌بینی عملکرد پروتئین، تعاملات پروتئین-پروتئین (PPI)، مکانیزم‌های بیولوژیکی عمل و دیگر زمینه‌ها، علاوه بر زیست‌شناسی ساختاری تجربی، مورد استفاده قرار گیرد. با وجود اینکه زمان بسیار کوتاهی از توسعه آلفافولد می‌گذرد، ما هم‌اکنون شاهد تعدادی از کاربردهای موفق بوده‌ایم. ما بر این باوریم که با گذشت زمان، کاربردهای بیشتری یا زمینه‌های جدید کاربردی توسعه خواهد یافت، به عنوان مثال، طراحی ماشین‌های پروتئینی با عملکردهای پیچیده یا خاص، طراحی موجودات جدید و تشخیص بیماری. با این حال، پیش‌بینی آلفافولد یک درمان همه‌جانبه نیست و هنوز مسائل زیادی وجود دارد که نیاز به حل شدن دارند، از جمله دینامیک پروتئین، ساختارهای نواحی بی‌نظم پروتئین‌ها، ساختارهای جهش‌یافته، ساختارهای کمپلکس پروتئین-لیگاند، ساختارهای پروتئین‌ها با تغییرات پس از ترجمه و غیره. با توسعه بیشتر الگوریتم‌های هوش مصنوعی، داده‌های روزافزون و قدرت محاسباتی، انتظار می‌رود که در آینده شگفتی‌های بیشتری به ما برسد.

آلفافولد یک جهش بزرگ در حل مشکل تا شدن پروتئین است. آلفافولد تأثیر زیادی در صنعت خواهد داشت و پیش‌بینی تا شدن پروتئین را کم‌هزینه‌تر و در دسترس‌تر می‌کند. این پتانسیل را دارد که سرعت کشفیات را در هر زمینه‌ای که پروتئین‌ها نقش مهمی ایفا می‌کنند، تسریع بخشد.

امروزه علاوه بر ساختارهای پروتئین، پیشبینی ساختار های RNA ها نیز مورد توجه است و ساختارهای پیچیده تر پروتئین و RNA ممکن است نقاط تمرکز جدید در “عصر پس از آلفافولد ” باشند.

در نهایت، ما منتظر پیشرفت‌های جدید هوش مصنوعی در زیست‌شناسی ساختاری و دستاوردهای بیشتر در زمینه کاربرد آلفافولد در آینده هستیم.

منابع و مقالات رفرنس

https://www.nature.com/articles/s41586-021-03819-2

https://www.nature.com/articles/s42003-023-05489-4

https://www.nature.com/articles/s41392-023-01381-z

https://pubmed.ncbi.nlm.nih.gov/35757294/

https://pubmed.ncbi.nlm.nih.gov/35976160/

https://pubmed.ncbi.nlm.nih.gov/34757056/

مطالب دیگر نوکلئوبیت