تعمل طريقة اختيار الجسيمات المتقدمة ل cryo-EM ، وهي CryoSieve ، على تحسين دقة خريطة الكثافة عن طريق إزالة غالبية الجسيمات في الأكوام النهائية ، كما هو موضح من خلال تطبيقها على مجموعة بيانات في العالم الحقيقي.
على مدى العقد الماضي ، أدت التطورات في التكنولوجيا والمنهجية في مجال المجهر الإلكتروني المبرد (cryo-EM) وتحليل الجسيمات المفردة (SPA) إلى تحسين قدرتنا بشكل كبير على الفحص الهيكلي عالي الدقة للجزيئات البيولوجية الكبيرة. وقد بشر هذا التقدم بعصر جديد من الرؤى الجزيئية ، ليحل محل علم البلورات بالأشعة السينية باعتباره الطريقة السائدة ويقدم إجابات على الأسئلة الطويلة الأمد في علم الأحياء. نظرا لأن cryo-EM لا يعتمد على التبلور ، وهو قيد كبير على علم البلورات بالأشعة السينية ، فإنه يلتقط جزيئات متفاوتة الجودة. وبالتالي ، فإن اختيار الجسيمات أمر بالغ الأهمية ، حيث تؤثر جودة الجسيمات المختارة بشكل مباشر على دقة خريطة الكثافة المعاد بناؤها. يعمل النهج التكراري المبتكر لاختيار الجسيمات ، المسمى CryoSieve ، على تحسين جودة خرائط الكثافة المعاد بناؤها بشكل كبير عن طريق تقليل عدد الجسيمات في المكدس النهائي بشكل فعال. تظهر الأدلة التجريبية أن هذه الطريقة يمكن أن تقضي على غالبية الجسيمات في المداخن النهائية ، مما يؤدي إلى تحسن ملحوظ في جودة خرائط الكثافة. توضح هذه المقالة سير العمل التفصيلي لهذا النهج وتعرض تطبيقه على مجموعة بيانات في العالم الحقيقي.
أصبح المجهر الإلكتروني المبرد (cryo-EM) تحليل الجسيمات المفردة (SPA) طريقة مهيمنة لتحديد خرائط الكثافة ثلاثية الأبعاد عالية الدقة للجزيئات البيولوجية الكبيرة. نظرا لسلسلة من الابتكارات التكنولوجية1،2،3،4،5،6 ، المسماة ثورة القرار7 ، فإن cryo-EM لديه القدرة على تحديد هياكل الجزيئات البيولوجية الكبيرة بدقة ذرية تصل إلى معدل غير مسبوق. يمثل هذا الاختراق بداية حقبة جديدة في الرؤى الجزيئية ، متجاوزا علم البلورات بالأشعة السينية باعتباره التقنية السائدة والإجابة على الأسئلة البيولوجية طويلة الأمد.
يختلف Cryo-EM SPA عن علم البلورات بالأشعة السينية من خلال عدم الحاجة إلى تبلور الجزيئات البيولوجية الكبيرة. بدلا من ذلك، يتجمد المحلول الذي يحتوي على الجزيئات الحيوية الكبيرة المستهدفة بسرعة في الجليد الزجاجي. ثم يتم تصويره بحزمة إلكترونية لإنتاج سلسلة من الصور المجهرية ، متجاوزا الحاجة إلى التبلور8. بعد ذلك ، يتم استخدام خوارزميات انتقاء الجسيمات لاستخراج الجسيمات الخام الفردية من هذه الصور المجهرية4،9،10،11،12. نظرا لأن cryo-EM لا يعتمد على التبلور ، فمن الطبيعي أن تكون الجسيمات المستخرجة تالفة في الغالب أو في حالات مطابقة غير مرغوب فيها ، مما يستلزم جولات متعددة من اختيار الجسيمات لتحقيق خريطة كثافة عالية الدقة. في معالجة صور cryo-EM SPA ، يعد اختيار الجسيمات أمرا بالغ الأهمية للحصول على خرائط كثافة عالية الدقة13.
في cryo-EM SPA ، تشتمل طرق اختيار الجسيمات القياسية على تصنيف ثنائي الأبعاد (2D) وثلاثي الأبعاد (3D)14. يصنف تصنيف 2D الجسيمات إلى عدد محدد مسبقا من المجموعات ، مما ينتج عنه صورة متوسطة ودقة 2D تقديرية لكل فئة. يمكن للباحثين بعد ذلك فحص هذه الفئات بصريا ، وإزالة الجسيمات من مجموعات منخفضة الدقة لاستخدام الجسيمات المتبقية في عمليات إعادة البناء التي تهدف إلى تحقيق دقة أعلى. بمجرد إنشاء أوضاع الجسيمات باستخدام خوارزميات الصقل ، سيشرع الباحثون في تصنيف 3D ، وتجميع الجسيمات في فئات متعددة. يتيح ذلك الفحص البصري لخريطة الكثافة المعاد بناؤها لكل فئة ، مما يسمح باستبعاد الجسيمات غير المرغوب فيها ، مثل تلك الموجودة في المطابقات غير المرغوب فيها. بعد جولات متعددة من التصنيف ، يتم الحصول على مجموعة نهائية تضم جزيئات عالية الجودة نسبيا. هذه المداخن النهائية مفيدة في إنتاج خرائط كثافة الدقة الذرية أو شبه الذرية.
أثبتت تشو وزملاؤها أنه يمكن إجراء مزيد من اختيار الجسيمات على هذه المداخن النهائية15. يمكن تطبيق CryoSieve15 ، وهي طريقة تكرارية مبتكرة لاختيار الجسيمات ، لتحسين جودة خريطة الكثافة النهائية عن طريق تقليل عدد الجسيمات بشكل كبير. في حين أن معايير وبرامج فرز الجسيمات الأخرى ، مثل طريقة الارتباط المتبادل (NCC)16 ، ونهج اتساق الرسم البياني الزاوي (AGC)17 ، وتصنيف عدم المحاذاة5 ، قيد الاستخدام حاليا داخل المجال ، فقد ثبت أن هذه الطريقة تتفوق على هذه الخوارزميات من حيث الفعالية.
في هذه الدراسة ، نقدم دليلا مفصلا للعملية برمتها. كدراسة حالة ، قمنا بتطبيق هذه الطريقة الجديدة على مجموعة بيانات أداة تشذيب هيماجلوتينين الإنفلونزا (إدخال EMPYAR: 10097) 18 ، والتي تتضمن 130000 جسيم في مكدسها النهائي. نجح الإجراء الذي أجريناه في التخلص من حوالي 73.8٪ من الجسيمات من المكدس النهائي لمجموعة البيانات هذه ، مما أدى إلى تحسين دقة خريطة الكثافة المعاد بناؤها من 4.11 Å إلى 3.62 Å. بالإضافة إلى أداة تشذيب هيماجلوتينين للأنفلونزا ، يتم عرض النتائج من مجموعات بيانات متعددة في المنشور السابق15 ، والتي تعرض مجموعة متنوعة من الدقة والأوزان الجزيئية للجزيئات الحيوية.
يقف Cryo-EM كتقنية محورية لتوضيح هياكل الجزيئات البيولوجية. في هذه العملية ، بعد جمع البيانات عبر الفحص المجهري ، يعد استخراج الجسيمات من الصور المجهرية أمرا ضروريا ، يليه تصنيفها على مراحل متعددة لتجميع المكدس النهائي. ويتمثل أحد التحديات الشائعة في غلبة الجسيمات التالفة أو المطابقة بشكل غير مرغوب فيه، مما يؤكد الحاجة إلى الاختيار المتكرر للجسيمات للحصول على خرائط عالية الكثافة. وهذا يجعل اختيار الجسيمات خطوة حاسمة في cryo-EM SPA لتحقيق خرائط كثافة عالية الجودة. تشمل تقنيات اختيار الجسيمات الحالية خوارزمية التحقق الإحصائي غير المائل22 ، والنهج القائم على درجة z23 ، وطريقة تقدير الدقة الزاوية24.
يظهر CryoSieve كأداة قيمة في هذا السياق ، وهو بارع في التخلص من عدد كبير من الجسيمات الدخيلة من المكدس النهائي. لا يعزز هذا التخفيض الكفاءة الحسابية لإعادة الإعمار فحسب ، بل يبسط العملية أيضا. وهو يوفر مجموعة شاملة لاختيار الجسيمات، حيث يتوقف مدى تجاهل الجسيمات وما يترتب على ذلك من تحسن في الاستبانة إلى حد كبير على نوعية البيانات الأولية والمنهجيات المستخدمة في معالجة البيانات.
في هذه المخطوطة ، قدمنا سير عمل كامل لغربلة الجسيمات باستخدام مجموعة بيانات الحالة الحقيقية لأداة تشذيب الهيماجلوتينين للأنفلونزا (إدخال EMPYAR: 10097). يمكن تلخيص الخطوات التي تمت تغطيتها ومناقشتها هنا على أنها غربلة الجسيمات وإعادة تقديرها. حقق الحجم النهائي المعاد بناؤه ثلاثي الأبعاد دقة 3.62 Å ، وكانت السلاسل الجانبية في حلزونات ألفا أكثر وضوحا في الحجم بعد المعالجة مقارنة بخريطة الكثافة المنشورة.
CryoSieve هي طريقة مفتوحة المصدر متوفرة على GitHub (https://github.com/mxhulab/cryosieve). يمكن أيضا العثور على برنامج تعليمي مفصل على صفحته الرئيسية. يمكن للمستخدمين تثبيته واستخدامه باتباع البرنامج التعليمي. بالإضافة إلى ذلك ، يتم توفير وحدتين ، cryosieve-csrefine و cryosieve-csrhbfactor. تم تصميم وحدة cryosieve-csrefine خصيصا لأتمتة التنفيذ المتسلسل للعمليات المختلفة داخل CryoSPARC (الملف التكميلي 5). وتشمل هذه العمليات استيراد مداخن الجسيمات وإجراء وظائف التحسين المتجانس أو الصقل غير المنتظم. من ناحية أخرى ، تم تصميم وحدة cryosieve-csrhbfactor لأتمتة تحديد عامل Rosenthal-Henderson B من خلال الاستفادة من قدرات cryosieve-csrefine (الملف التكميلي 6).
في الوقت الحاضر ، يقتصر تطبيق هذه الطريقة على سيناريوهات التشكل الفردية. وبالتالي ، في الحالات التي تمثل فيها الجسيمات توافقات متعددة ، تكون قدراتها محدودة. ينصح المستخدمون بالانخراط في البداية في تصنيف 3D لفصل جزيئات المطابقات المتباينة قبل توظيفها لاختيار الجسيمات المكررة. علاوة على ذلك ، على الرغم من أن الطريقة توضح الكفاءة في تصفية أكثر من 50٪ من الجسيمات من المكدس النهائي ، إلا أن أصول هذه الجسيمات المهملة والأسباب الكامنة وراء مساهمتها الضئيلة في جودة إعادة الإعمار لا تزال غير واضحة. تتطلب هذه الفجوة في الفهم إجراء بحث إضافي لمعالجة هذا القيد بشكل شامل وربما تصحيحه.
هناك ثلاث طرق موجودة ممكنة لفرز الجسيمات أو غربلة الجسيمات. بادئ ذي بدء ، يمكن ل cisTEM4 الإبلاغ عن درجة لكل صورة جسيم واحدة بعد تحسين 3D. يمكن للمستخدمين فرز الجسيمات باستخدام درجة cisTEM لتجاهل الجسيمات. نهج اتساق الرسم البياني الزاوي (AGC)17 هو أيضا طريقة للتخلص من الجسيمات المنحرفة. علاوة على ذلك ، فإن تصنيف عدم المحاذاة5 هو طريقة تقليدية للتخلص من الجسيمات باستخدام تصنيف 3D. قارنا جودة الجسيمات المحتفظ بها بهذه الطرق مع CryoSieve ووجدنا أن الجسيمات المحتفظ بها من CryoSieve ذات جودةأعلى 15. تتفوق الطريقة المعروضة هنا بشكل كبير على الطرق البديلة وتحقق أقل عدد من الجسيمات بنفس الدقة.
كما هو موضح في النتيجة ، فإن غالبية الجسيمات في المكدس النهائي cryo-EM لا تساهم في إعادة بناء خريطة الكثافة. بعبارة أخرى ، من بين جميع الجسيمات التي تم جمعها أثناء التقاط الصور ، فإن قلة مختارة فقط ، وهي أفضل مجموعة فرعية ، تساهم بالفعل في إعادة البناء النهائية. وبالتالي ، فإن نسبة هذه المجموعة الفرعية النهائية إلى العدد الإجمالي للجسيمات المجمعة يمكن أن تكون بمثابة مقياس كمي لتقييم جودة العينة. كلما زادت هذه النسبة ، كانت جودة العينة أفضل. على الرغم من التطورات التقنية التي جعلت cryo-EM في متناول علماء الأحياء الهيكلية ، لا يزال إعداد العينات يمثل عنق الزجاجة الرئيسي في سير العمل. وبالتالي يركز العلماء والمهندسون جهودهم على هذا التحدي25. في تحليل الجسيمات المفردة (SPA) ، يتكون تحضير العينة من خطوتين حاسمتين: تحسين العينة وإعداد الشبكة. الأول ينطوي على تنقية العينة مع الحفاظ على حالتها الكيميائية الحيوية المثلى. يستلزم هذا الأخير إعداد العينة للتحليل في المجهر ، بما في ذلك المعالجة الكيميائية أو البلازما للشبكة ، وترسب العينة ، والتزجيج. تم اقتراح العديد من التقنيات لمعالجة عدم الاستقرار الجزيئي ، لكن فعالية نهج واحد على الآخر تعتمد على خصائص العينة25,26. في الوقت الحالي ، تتأثر نتائج إعداد الشبكة بشدة بخبرة المستخدم وتجربته ، مما قد يجعل العملية تستغرق وقتا طويلا وصعبة27,28. تشكل المتغيرات العديدة التي تمت مواجهتها في إعداد العينة والشبكة تحديات في إقامة علاقات السبب والنتيجة ، حيث لا يمكن للباحثين تقييم العينة إلا على المستوى الجزيئي باستخدام المجهر. نتيجة لذلك ، لا تزال الإحصاءات الكمية من مقارنات بين بروتوكولات إعداد العينات والشبكة المختلفة غير موجودة ، ومن الضروري اتباع نهج منهجي للتحقيق في الاتجاهات وفهم الآليات الأساسية لسلوك العينة29.
The authors have nothing to disclose.
تم دعم هذا العمل من قبل أكاديمية Shenzhen للبحوث والترجمة (إلى M.H.) ، ومركز الابتكار المتقدم للبيولوجيا الهيكلية (إلى M.H.) ، ومركز بكين لأبحاث الحدود للبنية البيولوجية (إلى M.H.) ، والبرنامج الوطني للبحث والتطوير الرئيسي في الصين (رقم 2021YFA1001300) (إلى C.B.) ، والمؤسسة الوطنية للعلوم الطبيعية في الصين (رقم 12271291) (إلى C.B.) ، والمؤسسة الوطنية للعلوم الطبيعية في الصين (رقم 12071244) (إلى Z.S.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |