تحليل الجسيمات المفردة في المجهر الإلكترون المبرد هو واحد من التقنيات الرئيسية المستخدمة لتحديد بنية الفرق البيولوجية بدقة عالية. Scipion يوفر الأدوات اللازمة لإنشاء خط أنابيب كامل لمعالجة المعلومات التي تم الحصول عليها من المجهر وتحقيق إعادة بناء 3D من العينة البيولوجية.
أصبح المجهر الإلكتروني المبرد واحدة من أهم الأدوات في البحوث البيولوجية للكشف عن المعلومات الهيكلية للجزيئات الكبيرة بدقة شبه ذرية. في تحليل الجسيمات المفردة ، يتم تصوير العينة الهزازة بواسطة شعاع إلكترون وتنتج أجهزة الكشف في نهاية عمود المجهر أفلاما لتلك العينة. تحتوي هذه الأفلام على آلاف الصور لجسيمات متطابقة في اتجاهات عشوائية. تحتاج البيانات إلى المرور عبر سير عمل معالجة الصور مع خطوات متعددة للحصول على وحدة التخزين النهائية المعاد بناؤها ثلاثية الأبعاد. الهدف من سير عمل معالجة الصور هو تحديد معلمات الاستحواذ لتكون قادرة على إعادة بناء العينة قيد الدراسة. يوفر Scipion جميع الأدوات اللازمة لإنشاء سير العمل هذا باستخدام حزم معالجة الصور المتعددة في إطار تكاملي ، مما يسمح أيضا بتتبع النتائج. في هذه المقالة يتم تقديم سير عمل معالجة الصور بالكامل في Scipion ومناقشته مع البيانات القادمة من حالة اختبار حقيقية ، مما يعطي جميع التفاصيل اللازمة للانتقال من الأفلام التي تم الحصول عليها بواسطة المجهر إلى إعادة بناء 3D نهائية عالية الدقة. كما تتم مناقشة قوة استخدام أدوات التوافق التي تسمح بالجمع بين الأساليب، وتأكيد النتائج على طول كل خطوة من سير العمل، وتحسين دقة النتائج التي تم الحصول عليها.
في المجهر الإلكترون المبرد (cryo-EM) ، يعد تحليل الجسيمات المفردة (SPA) للعينات المجمدة المائية الزخوبة أحد أكثر المتغيرات استخداما ونجاحا للتصوير للجزيئات الجزيئية البيولوجية ، لأنه يسمح بفهم التفاعلات الجزيئية ووظيفة الفرق البيولوجية1. ويرجع الفضل في ذلك إلى التقدم الأخير في تقنية التصوير هذه التي أدت إلى “ثورة القرار” 2 وسمحت بالتصميم الناجح للهياكل البيولوجية ثلاثية الأبعاد ذات الدقة شبه الذرية. حاليا، كان أعلى قرار المحرز في SPA cryo-EM 1.15 Å ل apoferritin3 (EMDB الدخول: 11668). وتشمل هذه التطورات التكنولوجية تحسينات في إعداد العينة4، واكتساب الصورة5، وطرق معالجة الصور6. تركز هذه المقالة على هذه النقطة الأخيرة.
باختصار ، فإن الهدف من أساليب معالجة الصور هو تحديد جميع معلمات الاستحواذ لعكس عملية تصوير المجهر واستعادة البنية ثلاثية الأبعاد للعينة البيولوجية قيد الدراسة. هذه المعلمات هي كسب الكاميرا ، والحركة الناجمة عن شعاع ، وانحرافات المجهر (أساسا defocus) ، والتوجه الزاوي 3D وترجمة كل جسيم ، والحالة تشكيلية في حالة وجود عينة مع التغيرات تشكيلية. ومع ذلك ، فإن عدد المعلمات مرتفع جدا ويتطلب cryo-EM استخدام صور منخفضة الجرعة لتجنب تلف الإشعاع ، مما يقلل بشكل كبير من نسبة الإشارة إلى الضوضاء (SNR) للصور المكتسبة. وبالتالي، لا يمكن حل المشكلة بشكل قاطع، وجميع البارامترات التي يجب حسابها يمكن أن تكون تقديرات فقط. على طول سير عمل معالجة الصور ، يجب تحديد المعلمات الصحيحة ، مع تجاهل المعلمات المتبقية للحصول في النهاية على إعادة بناء ثلاثية الأبعاد عالية الدقة.
يتم جمع البيانات التي تم إنشاؤها بواسطة المجهر في إطارات. تبسيط، إطار يحتوي على عدد من الإلكترونات التي وصلت إلى موقف معين (بكسل) في الصورة، كلما يتم استخدام أجهزة الكشف عن عد الإلكترونات. في مجال معين من العرض، يتم تجميع عدة إطارات وهذا ما يسمى فيلم. كما يتم استخدام جرعات الإلكترون منخفضة لتجنب الأضرار الإشعاعية التي يمكن أن تدمر العينة، وSNR منخفضة جدا والأطر المقابلة لنفس الفيلم تحتاج إلى أن يكون متوسط للحصول على صورة تكشف عن معلومات هيكلية حول العينة. ومع ذلك ، لا يتم تطبيق متوسط بسيط فحسب ، بل يمكن أن تعاني العينة من نوبات وأنواع أخرى من الحركات خلال وقت التصوير بسبب الحركة الناجمة عن الحزمة التي تحتاج إلى تعويض. تنشأ الإطارات التي يتم تعويضها ومتوسطها في التحول صورة مصغرة.
بمجرد الحصول على الصور الدقيقة ، نحتاج إلى تقدير الانحرافات التي أدخلها المجهر لكل منها ، والتي تسمى وظيفة نقل التباين (CTF) ، والتي تمثل التغيرات في تباين المجهر كدالة للتردد. ثم، يمكن اختيار الجسيمات واستخراجها، وهو ما يسمى التقاط الجسيمات. يجب أن يكون كل جسيم صورة صغيرة تحتوي على نسخة واحدة فقط من العينة قيد الدراسة. هناك ثلاث عائلات من الخوارزميات لاختيار الجسيمات: 1) تلك التي تستخدم فقط بعض المعلمات الأساسية لظهور الجسيمات للعثور عليها في مجموعة كاملة من micrographs (على سبيل المثال، حجم الجسيمات)، 2) تلك التي تعلم كيف تبدو الجسيمات من المستخدم أو مجموعة مدربة مسبقا، و 3) تلك التي تستخدم قوالب الصور. كل عائلة لها خصائص مختلفة سيتم عرضها لاحقا.
سيتم استخدام المجموعة المستخرجة من الجسيمات الموجودة في الصور الدقيقة في عملية تصنيف ثنائية الأبعاد لها هدفان: 1) تنظيف مجموعة الجسيمات عن طريق التخلص من المجموعة الفرعية التي تحتوي على صور الضوضاء النقية أو الجسيمات المتداخلة أو القطع الأثرية الأخرى ، و 2) يمكن استخدام الجسيمات المتوسطة التي تمثل كل فئة كمعلومات أولية لحساب حجم أولي ثلاثي الأبعاد.
حساب حجم 3D الأولي هو الخطوة الحاسمة التالية. يمكن النظر إلى مشكلة الحصول على البنية ثلاثية الأبعاد على أنها مشكلة تحسين في مشهد حل متعدد الأبعاد ، حيث الحد الأدنى العالمي هو أفضل وحدة تخزين ثلاثية الأبعاد تمثل الهيكل الأصلي ، ولكن يمكن العثور على العديد من الحلول المحلية الصغيرة التي تمثل حلول دون المستوى الأمثل ، وحيث يكون من السهل جدا الوقوع في الفخ. يمثل الحجم الأولي نقطة البداية لعملية البحث ، لذلك يمكن أن يمنعنا تقدير الحجم الأولي السيئ من العثور على الحد الأدنى العالمي. من الحجم الأولي، ستساعد خطوة التصنيف ثلاثي الأبعاد على اكتشاف حالات تشكيلية مختلفة وتنظيف مجموعة الجسيمات مرة أخرى. والهدف من ذلك هو الحصول على مجموعة متجانسة هيكليا من الجسيمات. بعد ذلك، ستكون خطوة التحسين ثلاثية الأبعاد مسؤولة عن تحسين المعلمات الزاوي والترجمة لكل جسيم للحصول على أفضل حجم ثلاثي الأبعاد ممكن.
وأخيرا، في الخطوات الأخيرة، يمكن شحذ وإعادة بناء 3D التي تم الحصول عليها ومصقول. الشحذ هو عملية لزيادة الترددات العالية للحجم المعاد بناؤه ، والتلميع هو خطوة لزيادة صقل بعض المعلمات ، مثل CTF أو تعويض الحركة الناجم عن الحزمة ، على مستوى الجسيمات. كما يمكن استخدام بعض إجراءات التحقق من الصحة لفهم الدقة المحققة بشكل أفضل في نهاية سير العمل.
وبعد كل هذه الخطوات، ستساعد عمليات التتبع والالتحام7 على إعطاء معنى بيولوجي لإعادة البناء ثلاثي الأبعاد التي تم الحصول عليها، من خلال بناء نماذج ذرية من طراز دي نوفو أو تركيب النماذج القائمة. وإذا تحقق قرار عال، فإن هذه العمليات ستخبرنا بمواقف الهياكل البيولوجية، حتى الذرات المختلفة، في هيكلنا.
Scipion8 يسمح بإنشاء سير العمل كله الجمع بين حزم معالجة الصور الأكثر صلة بطريقة تكاملية. Xmipp9، Relion10، CryoSPARC11، Eman12، Spider13، Cryolo14، Ctffind15، CCP416، Phenix17، ويمكن تضمين العديد من الحزم في Scipion. كما أنه يتضمن جميع الأدوات اللازمة للاستفادة من التكامل والتشغيل البيني والتتبع والقابلية لإعادة الإنتاج لجعل تتبع كامل لسير عمل معالجة الصور بالكامل8.
واحدة من أقوى الأدوات التي تسمح لنا Scipion باستخدامها هي توافق الآراء ، مما يعني مقارنة النتائج التي تم الحصول عليها بعدة طرق في خطوة واحدة من المعالجة ، مما يجعل مزيجا من المعلومات التي تنقلها أساليب مختلفة لتوليد مخرجات أكثر دقة. وهذا يمكن أن يساعد على تعزيز الأداء وتحسين الجودة المحققة في المعلمات المقدرة. لاحظ أنه يمكن إنشاء سير عمل أبسط بدون استخدام أساليب توافق الآراء؛ ومع ذلك، فقد رأينا قوة هذه الأداة22,25 وسير العمل المعروض في هذه المخطوطة سيستخدمها في عدة خطوات.
سيتم شرح جميع الخطوات التي تم تلخيصها في الفقرات السابقة بالتفصيل في القسم التالي ودمجها في سير عمل كامل باستخدام Scipion. كما سيتم عرض كيفية استخدام أدوات توافق الآراء لتحقيق اتفاق أعلى في النواتج الناتجة. وتحقيقا لتلكوم 80S، اختيرت مجموعة البيانات المثلية ل Plasmodium falciparum 80S Ribosome (إدخال EMPIAR: 10028، إدخال EMDB: 2660). يتم تشكيل مجموعة البيانات من قبل 600 فيلم من 16 إطارا من حجم 4096×4096 بكسل في حجم بكسل من 1.34Å التي اتخذت في بولارا FEI 300 مع كاميرا FEI فالكون الثاني، مع قرار ذكرت في EMDB هو 3.2Å18 .
حاليا، التبريد-EM هو أداة رئيسية للكشف عن هيكل 3D من العينات البيولوجية. عندما يتم جمع بيانات جيدة مع المجهر، وأدوات المعالجة المتاحة تسمح لنا للحصول على إعادة بناء 3D من الجزيئات الكلية قيد الدراسة. معالجة البيانات Cryo-EM قادرة على تحقيق دقة شبه ذرية، وهو أمر أساسي لفهم السلوك الوظيفي للجزيء الكلي، وهو أيضا أمر بالغ الأهمية في اكتشاف المخدرات.
Scipion هو برنامج يسمح بإنشاء سير العمل بأكمله يجمع بين حزم معالجة الصور الأكثر ملاءمة بطريقة تكاملية ، مما يساعد على تتبع وإعادة إنتاج سير عمل معالجة الصور بأكمله. Scipion يوفر مجموعة كاملة جدا من الأدوات لتنفيذ المعالجة؛ ومع ذلك، يعتمد الحصول على عمليات إعادة بناء عالية الدقة بشكل كامل على جودة البيانات المكتسبة وكيفية معالجة هذه البيانات.
للحصول على إعادة بناء ثلاثية الأبعاد عالية الدقة ، فإن المطلب الأول هو الحصول على أفلام جيدة من المجهر ، والتي تحافظ على المعلومات الهيكلية بدقة عالية. إذا لم يكن هذا هو الحال، سير العمل لن تكون قادرة على استخراج معلومات عالية الوضوح من البيانات. ثم، يجب أن يكون سير عمل المعالجة الناجح قادرا على استخراج الجسيمات التي تتوافق حقا مع البنية والعثور على اتجاهات هذه الجسيمات في الفضاء ثلاثي الأبعاد. إذا فشلت أي من الخطوات في سير العمل، سيتم تخفيض جودة وحدة التخزين المعاد بناؤها. يسمح Scipion باستخدام حزم مختلفة في أي من خطوات المعالجة ، مما يساعد على العثور على النهج الأكثر ملاءمة لمعالجة البيانات. وعلاوة على ذلك، وبفضل توفر العديد من الحزم، يمكن استخدام أدوات توافق الآراء، التي تعزز الدقة من خلال التوصل إلى اتفاق في النواتج المقدرة لمختلف الأساليب. كما تمت مناقشته بالتفصيل في قسم النتائج التمثيلية العديد من أدوات التحقق من الصحة وكيفية تحديد النتائج الدقيقة وغير الدقيقة في كل خطوة من سير العمل، للكشف عن المشاكل المحتملة، وكيفية محاولة حلها. هناك عدة نقاط تفتيش على طول البروتوكول التي يمكن أن تساعد على تحقيق ما إذا كان البروتوكول قيد التشغيل بشكل صحيح أم لا. بعض من أهمها: الانتقاء، التصنيف 2D، تقدير الحجم الأولي، والمحاذاة ثلاثية الأبعاد. التحقق من المدخلات، وتكرار الخطوة بطريقة مختلفة، أو باستخدام توافق الآراء، هي الخيارات المتاحة في Scipion التي يمكن للمستخدم استخدامها لإيجاد حلول عندما تظهر القضايا.
فيما يتعلق بالنهج السابقة لدمج الحزمة في مجال Cryo-EM ، Appion31 هو الوحيد الذي يسمح بالتكامل الحقيقي لحزم البرامج المختلفة. ومع ذلك ، يرتبط Appion بإحكام مع Leginon32 ، وهو نظام لجمع الصور الآلي من المجاهر الإلكترونية. الفرق الرئيسي مع Scipion هو أن نموذج البيانات والتخزين أقل اقترانا. في مثل هذه الطريقة ، لإنشاء بروتوكول جديد في Scipion ، يحتاج فقط إلى تطوير سيناريو Python. ومع ذلك، في Appion، يجب على المطور كتابة البرنامج النصي وتغيير قاعدة البيانات الأساسية. وباختصار، تم تطوير Scipion لتبسيط الصيانة والتمدد.
قدمنا في هذه المخطوطة سير عمل كامل لمعالجة Cryo-EM ، باستخدام مجموعة بيانات الحالة الحقيقية ل Plasmodium falciparum 80S Ribosome (إدخال EMPIAR: 10028 ، إدخال EMDB: 2660). يمكن تلخيص الخطوات التي تمت تغطيتها ومناقشتها هنا على أنها محاذاة الأفلام وتقدير CTF واختيار الجسيمات والتصنيف 2D وتقدير الخريطة الأولي والتصنيف ثلاثي الأبعاد والصقل ثلاثي الأبعاد والتقييم والمعالجة اللاحقة. واستخدمت مجموعات مختلفة من المقترحات، وطبقت أدوات توافق الآراء في العديد من هذه الخطوات. حقق المجلد النهائي المعاد بناؤه ثلاثي الأبعاد قرارا قدره 3 Å ، وفي حجم ما بعد المعالجة ، يمكن تمييز بعض الهياكل الثانوية ، مثل ألفا – helices ، مما يساعد على وصف كيفية ترتيب الذرات في الفضاء.
يوضح سير العمل المعروض في هذه المخطوطة كيف يمكن استخدام Scipion للجمع بين حزم Cryo-EM المختلفة بطريقة مباشرة ومتكاملة لتبسيط المعالجة ، والحصول على نتيجة أكثر موثوقية في نفس الوقت.
في المستقبل ، فإن تطوير أساليب وحزم جديدة سوف تستمر في النمو والبرمجيات مثل Scipion لدمج بسهولة كل منهم سيكون أكثر أهمية للباحثين. وستكون نهج توافق الآراء أكثر أهمية حتى في هذه الحالات، عندما تتوفر الكثير من الأساليب ذات الأساس المختلف، مما يساعد على الحصول على تقديرات أكثر دقة لجميع البارامترات التي تنطوي عليها عملية إعادة الإعمار في كريو -م. تتبع وإعادة إنتاجها هي المفتاح في عملية البحث وأسهل لتحقيق مع Scipion بفضل وجود إطار مشترك لتنفيذ مهام سير العمل كاملة.
The authors have nothing to disclose.
يود المؤلفون أن يعترفوا بالدعم الاقتصادي من: وزارة العلوم والابتكار الإسبانية من خلال المنح: PID2019-104757RB-I00/AEI/10.13039/501100011033، “Comunidad Autónoma de Madrid” من خلال المنحة: S2017/BMD-3817، Instituto de Salud Carlos III, PT17/0009/0010 (ISCIII-SGEFI/ERDF)، الاتحاد الأوروبي (الاتحاد الأوروبي) والأفق 2020 من خلال المنحة: INSTRUCT – ULTRA (INFRADEV-03-2016-2017، اقتراح: 731005)، الحياة EOSC (INFRAEOSC-04-2018، اقتراح: 824087) و iNEXT – Discovery (اقتراح: 871037) و HighResCells (ERC – 2018 – SyG ، الاقتراح: 810057). وقد حظي المشروع الذي أدى إلى هذه النتائج بدعم من مؤسسة “لا كايكا” (ID 100010434). رمز الزمالة هو LCF/BQ/DI18/11660021. وقد حصل هذا المشروع على تمويل من برنامج أفق 2020 للبحث والابتكار التابع للاتحاد الأوروبي بموجب اتفاق منحة ماري سكلودوسكا كوري رقم 713673. يقر المؤلفون بدعم واستخدام موارد مشروع “أوتات”، وهو مشروع لاندمارك إسفري.