ניתוח חלקיקים בודדים במיקרוסקופיה קריו-אלקטרונית היא אחת הטכניקות העיקריות המשמשות לקביעת מבנה ההרכבים הביולוגיים ברזולוציה גבוהה. Scipion מספקת את הכלים ליצירת הצינור כולו לעיבוד המידע שנרכש על ידי המיקרוסקופ ולהשיג שחזור תלת מימדי של הדגימה הביולוגית.
מיקרוסקופיה קריו-אלקטרונית הפכה לאחד הכלים החשובים ביותר במחקר ביולוגי כדי לחשוף את המידע המבני של מקרומולקולים ברזולוציה כמעט אטומית. בניתוח חלקיקים בודדים, המדגם המהולל הוא בתמונה על ידי קרן אלקטרונים ואת הגלאים בסוף עמוד המיקרוסקופ לייצר סרטים של מדגם זה. סרטים אלה מכילים אלפי תמונות של חלקיקים זהים באוריינטציות אקראיות. הנתונים צריכים לעבור דרך זרימת עבודה של עיבוד תמונה עם שלבים מרובים כדי להשיג את אמצעי האחסון המשוחזר של תלת-ממד הסופי. המטרה של זרימת העבודה של עיבוד תמונה היא לזהות את פרמטרי הרכישה כדי להיות מסוגל לשחזר את הדגימה תחת מחקר. Scipion מספקת את כל הכלים ליצירת זרימת עבודה זו באמצעות מספר חבילות עיבוד תמונה במסגרת אינטגרטיבית, המאפשרות גם את המעקב אחר התוצאות. במאמר זה כל זרימת העבודה עיבוד תמונה ב Scipion מוצג ונדון עם נתונים המגיעים ממקרה בדיקה אמיתי, נותן את כל הפרטים הדרושים כדי לעבור מהסרטים המתקבלים על ידי המיקרוסקופ לשחזור תלת-ממדי סופי ברזולוציה גבוהה. כמו כן, העוצמה של שימוש בכלי קונצנזוס המאפשרים שילוב שיטות, ואישור תוצאות לאורך כל שלב של זרימת העבודה, שיפור הדיוק של התוצאות שהושגו, נדון.
במיקרוסקופיה קריו-אלקטרונית (cryo-EM), ניתוח חלקיקים יחיד (SPA) של דגימות מיובשות קפואות הוא אחד הווריאנטים הנפוצים והמצליחים ביותר של הדמיה עבור מקרומולקולות ביולוגיות, שכן הוא מאפשר להבין אינטראקציות מולקולריות ואת הפונקציה של הרכבים ביולוגיים1. זאת הודות להתקדמות האחרונה בטכניקת הדמיה זו שהולידה את “מהפכת הרזולוציה” 2 ואפשרה קביעה מוצלחת של מבנים תלת-ממדיים ביולוגיים ברזולוציה כמעט אטומית. נכון לעכשיו, הרזולוציה הגבוהה ביותר שהושגה בספא cryo-EM היה 1.15 Å עבור apoferritin3 (ערך EMDB: 11668). התפתחויות טכנולוגיות אלה כוללות שיפורים בהכנת המדגם4, ברכישת התמונה5 ובשיטות עיבוד התמונה6. מאמר זה מתמקד בנקודה אחרונה זו.
בקצרה, המטרה של שיטות עיבוד התמונה היא לזהות את כל הפרמטרים הרכישה כדי הפוך את תהליך ההדמיה של המיקרוסקופ ולשחזר את המבנה 3D של הדגימה הביולוגית תחת המחקר. פרמטרים אלה הם הרווח של המצלמה, התנועה הנגרמת על ידי קרן, הסטיות של המיקרוסקופ (בעיקר defocus), הכיוון הזוויתי התלת-ממדי ותרגום של כל חלקיק, ואת המצב הקונפורמציה במקרה של דגימה עם שינויים קונפורמיים. עם זאת, מספר הפרמטרים גבוה מאוד ו- cryo-EM דורש שימוש בתמונות במינון נמוך כדי למנוע נזק לקרינה, מה שמפחית באופן משמעותי את יחס האות לרעש (SNR) של התמונות שנרכשו. לכן, לא ניתן לפתור את הבעיה באופן חד משמעי וכל הפרמטרים שיש לחשב בלבד יכולים להיות הערכות. לאורך זרימת העבודה של עיבוד התמונה, יש לזהות את הפרמטרים הנכונים, תוך מחיקת הפרמטרים הנותרים כדי להשיג סוף סוף שחזור תלת-ממדי ברזולוציה גבוהה.
הנתונים הנוצרים על ידי המיקרוסקופ נאספים במסגרות. בפישוט, מסגרת מכילה את מספר האלקטרונים שהגיעו למיקום מסוים (פיקסל) בתמונה, בכל פעם שנעשה שימוש בגלאי ספירת אלקטרונים. בשדה ראייה מסוים, נאספים מספר מסגרות וזה נקרא סרט. כמו מינונים אלקטרונים נמוכים משמשים כדי למנוע נזק קרינה שיכול להרוס את המדגם, SNR הוא נמוך מאוד ואת המסגרות המתאימות לאותו סרט צריך להיות ממוצע כדי לקבל תמונה חושפת מידע מבני על המדגם. עם זאת, לא רק ממוצע פשוט מוחל, המדגם יכול לסבול משמרות וסוגים אחרים של תנועות במהלך זמן ההדמיה בשל התנועה המושרה קרן כי צריך לפצות. המסגרות בפיצוי משמרת וממוצע מקורן במיקרוגרף.
לאחר קבלת המיקרוגרפים, עלינו להעריך את הסטיות שהוצגו על ידי המיקרוסקופ עבור כל אחת מהן, הנקראת פונקציית העברת ניגודיות (CTF), המייצגת את השינויים בניגוד למיקרוגרף כפונקציה של תדירות. לאחר מכן, ניתן לבחור ולחלץ את החלקיקים, הנקראים קטיף חלקיקים. כל חלקיק צריך להיות תמונה קטנה המכילה רק עותק אחד של הדגימה הנחקרת. ישנן שלוש משפחות של אלגוריתמים לקטיף חלקיקים: 1) אלה שמשתמשים רק בפרמטריזציה בסיסית כלשהי של מראה החלקיק כדי למצוא אותם בכל קבוצת המיקרוגרפים (למשל, גודל החלקיקים), 2) אלה שלומדים כיצד נראים החלקיקים מהמשתמש או מערכה מאומנת מראש, ו -3) אלה המשתמשים בתבניות תמונה. לכל משפחה יש מאפיינים שונים שיוצגו מאוחר יותר.
קבוצת החלקיקים המופקת שנמצאת במיקרוגרפים תשמש בתהליך סיווג דו-ממדי בעל שתי מטרות: 1) ניקוי קבוצת החלקיקים על ידי השלכת קבוצת המשנה המכילה תמונות רעש טהורות, חלקיקים חופפים או חפצים אחרים, ו-2) החלקיקים הממוצעים המייצגים כל מחלקה יכולים לשמש כמידע ראשוני לחישוב נפח ראשוני תלת-ממדי.
חישוב אמצעי האחסון ההתחלתי של 3D הוא השלב המכריע הבא. הבעיה של השגת המבנה 3D ניתן לראות כבעיית אופטימיזציה בנוף פתרון רב ממדי, שבו המינימום הגלובלי הוא אמצעי האחסון 3D הטוב ביותר המייצג את המבנה המקורי, אבל כמה minima מקומי המייצג פתרונות תת-אופטימליים ניתן למצוא, ואיפה זה מאוד קל להילכד. אמצעי האחסון ההתחלתי מייצג את נקודת ההתחלה של תהליך החיפוש, כך שהערכה ראשונית שגויה של נפח יכולה למנוע מאיתנו למצוא את המינימום הכללי. מהנפח הראשוני, שלב סיווג תלת-ממדי יעזור לגלות מצבים קונפורמיים שונים ולנקות שוב את מערכת החלקיקים; המטרה היא להשיג אוכלוסייה הומוגנית מבחינה מבנית של חלקיקים. לאחר מכן, שלב עידון תלת-ממדי יהיה אחראי על עידון הפרמטרים הזוויתיים והתרגום עבור כל חלקיק כדי לקבל את נפח 3D הטוב ביותר האפשרי.
לבסוף, בשלבים האחרונים, ניתן לחדד ולצחצח את שחזור תלת-ממד שהושג. חידוד הוא תהליך של הגברת התדרים הגבוהים של הנפח המשוחזר, והליטוש הוא צעד כדי לחדד עוד יותר כמה פרמטרים, כמו CTF או פיצוי תנועה הנגרמת על ידי קרן, ברמה של חלקיקים. כמו כן, ניתן להשתמש בהליכי אימות מסוימים כדי להבין טוב יותר את הרזולוציה שהושגה בסוף זרימת העבודה.
לאחר כל השלבים הללו, תהליכי האיתור והעגינה7 יסייעו לתת משמעות ביולוגית לשחזור תלת-ממדי המתקבל, על ידי בניית מודלים אטומיים דה נובו או התאמת מודלים קיימים. אם ברזולוציה גבוהה מושגת, תהליכים אלה יגידו לנו את עמדות המבנים הביולוגיים, אפילו של האטומים השונים, במבנה שלנו.
Scipion8 מאפשר ליצור את כל זרימת העבודה המשלבת את חבילות עיבוד התמונה הרלוונטיות ביותר באופן אינטגרטיבי. Xmipp9, Relion10, CryoSPARC11, Eman12, Spider13, Cryolo14, Ctffind15, CCP416, Phenix17 וחבילות רבות נוספות ניתן לכלול ב- Scipion. כמו כן, הוא משלב את כל הכלים הדרושים לטובת השילוב, יכולת שיתוף, עקיבות ויכולת רבייה כדי לבצע מעקב מלא אחר כל זרימת העבודה של עיבוד התמונה8.
אחד הכלים החזקים ביותר כי Scipion מאפשר לנו להשתמש הוא הקונצנזוס, כלומר להשוות את התוצאות שהושגו עם כמה שיטות בשלב אחד של העיבוד, מה שהופך שילוב של המידע המועבר על ידי שיטות שונות כדי ליצור פלט מדויק יותר. זה יכול לעזור לשפר את הביצועים ולשפר את האיכות שהושגה בפרמטרים המשוערים. שים לב שניתן לבנות זרימת עבודה פשוטה יותר ללא שימוש בשיטות קונצנזוס; עם זאת, ראינו את העוצמה של כלי זה22,25 ואת זרימת העבודה המוצגת בכתב יד זה ישתמש בו במספר שלבים.
כל השלבים שסוכמו בפסקאות הקודמות יותבררו בפירוט בסעיף הבא וישולבו בזרימת עבודה מלאה באמצעות Scipion. כמו כן, יוצגו כיצד להשתמש בכלי הקונצנזוס כדי להשיג הסכם גבוה יותר בתפוקות שנוצרו. לכך נבחרה ערכת הנתונים לדוגמה של פלסמודיום פאלסיפארום 80S ריבוזום (ערך EMPIAR: 10028, ערך EMDB: 2660). ערכת הנתונים נוצרת על ידי 600 סרטים של 16 מסגרות בגודל 4096×4096 פיקסלים בגודל פיקסלים בגודל פיקסלים של 1.34Å שצולם ב- FEI POLARA 300 עם מצלמת FEI FALCON II, עם רזולוציה מדווחת ב- EMDB היא 3.2Å18 .
נכון לעכשיו, cryo-EM הוא כלי מפתח לחשוף את המבנה 3D של דגימות ביולוגיות. כאשר נתונים טובים נאספים עם המיקרוסקופ, כלי העיבוד הזמינים יאפשרו לנו להשיג שחזור תלת-ממדי של המאקרומולקול הנחקר. עיבוד נתונים Cryo-EM הוא מסוגל להשיג רזולוציה כמעט אטומית, שהוא המפתח להבנת ההתנהגות התפקודית של macromolecule והוא גם חיוני בגילוי סמים.
Scipion היא תוכנה המאפשרת ליצור את כל זרימת העבודה המשלבת את חבילות עיבוד התמונה הרלוונטיות ביותר באופן אינטגרטיבי, המסייע למעקב ולשחזור של כל זרימת העבודה של עיבוד תמונה. Scipion מספק קבוצה שלמה מאוד של כלים כדי לבצע את העיבוד; עם זאת, קבלת שחזורים ברזולוציות גבוהות תלויה לחלוטין באיכות הנתונים שנרכשו ובאופן עיבוד הנתונים הללו.
כדי לקבל שחזור תלת-ממדי ברזולוציה גבוהה, הדרישה הראשונה היא להשיג סרטים טובים מהמיקרוסקופ, אשר משמרים מידע מבני לרזולוציה גבוהה. אם זה לא המקרה, זרימת העבודה לא תוכל לחלץ מידע בחדות גבוהה מהנתונים. לאחר מכן, זרימת עבודה מוצלחת של עיבוד אמורה להיות מסוגלת לחלץ חלקיקים שבאמת תואמים למבנה ולמצוא את הכיוונים של חלקיקים אלה בחלל 3D. אם אחד מהשלבים בזרימת העבודה נכשל, איכות אמצעי האחסון המשוחזר תיפגע. Scipion מאפשרת להשתמש בחבילות שונות בכל אחד שלבי העיבוד, אשר מסייע למצוא את הגישה המתאימה ביותר לעיבוד הנתונים. יתר על כן, הודות לחבילות רבות זמינות, כלי קונצנזוס, המגבירים את הדיוק על ידי מציאת הסכם בתפוקות המשוערות של שיטות שונות, ניתן להשתמש. כמו כן, הוא נדון בפירוט בסעיף תוצאות מייצגות מספר כלי אימות וכיצד לזהות תוצאות מדויקות ולא מדויקות בכל שלב בזרימת העבודה, כדי לזהות בעיות פוטנציאליות וכיצד לנסות לפתור אותן. ישנם מספר נקודות ביקורת לאורך הפרוטוקול שיכולים לעזור להבין אם הפרוטוקול פועל כראוי או לא. חלק מהרלוונטיים ביותר הם: איסוף, סיווג 2D, הערכת נפח ראשונית ויישור תלת-ממדי. בדיקת הקלט, חזרה על השלב בשיטה אחרת, או באמצעות קונצנזוס, הן אפשרויות זמינות ב- Scipion שהמשתמש יכול להשתמש בהן כדי למצוא פתרונות כאשר מופיעות בעיות.
לגבי הגישות הקודמות לשילוב חבילות בתחום Cryo-EM, Appion31 הוא היחיד המאפשר שילוב אמיתי של חבילות תוכנה שונות. עם זאת, Appion מחוברת קשר הדוק עם Leginon32, מערכת לאוסף אוטומטי של תמונות ממיקרוסקופים אלקטרונים. ההבדל העיקרי עם Scipion הוא כי מודל נתונים ואחסון הם פחות מצמידים. באופן כזה, כדי ליצור פרוטוקול חדש בסיפיון, רק תסריט פייתון צריך להיות מפותח. עם זאת, ב- Appion, על המפתח לכתוב את קובץ ה- Script ולשנות את מסד הנתונים המשמש כבסיס. לסיכום, Scipion פותחה כדי לפשט את התחזוקה וההרחבה.
הצגנו בכתב יד זה זרימת עבודה מלאה לעיבוד Cryo-EM, תוך שימוש במערך הנתונים האמיתי של פלסמודיום פאלסיפארום 80S ריבוזום (ערך EMPIAR: 10028, ערך EMDB: 2660). ניתן לסכם את השלבים המכוסים ונדונים כאן כיישור סרט, הערכת CTF, קטיף חלקיקים, סיווג דו-ממדי, הערכת מפה ראשונית, סיווג תלת-ממדי, עידון תלת-ממד, הערכה ולאחר עיבוד. נעשה שימוש בחבילות שונות וכלי קונצנזוס הוחלו בכמה שלבים אלה. הנפח המשוחזר בתלת-ממד האחרון השיג רזולוציה של 3 Å, ובנפח שלאחר העיבוד ניתן להבחין בין כמה מבנים משניים, כמו אלפא-הליס, המסייע לתאר כיצד אטומים מסודרים בחלל.
זרימת העבודה המוצגת בכתב יד זה מראה כיצד ניתן להשתמש ב- Scipion כדי לשלב חבילות Cryo-EM שונות בצורה פשוטה ואינטגרטיבית כדי לפשט את העיבוד, ולהשיג תוצאה אמינה יותר בו זמנית.
בעתיד, פיתוח שיטות וחבילות חדשות ימשיך לגדול ותוכנות כמו Scipion כדי לשלב בקלות את כולם יהיה אפילו יותר חשוב עבור החוקרים. גישות קונצנזוס יהיו רלוונטיות יותר גם אז, כאשר שפע של שיטות עם בסיס שונה יהיה זמין, עוזר להשיג הערכות מדויקות יותר של כל הפרמטרים הכרוכים בתהליך השיקום Cryo-EM. מעקב ושחזור הם המפתח בתהליך המחקר וקל יותר להשיג עם Scipion הודות למסגרת משותפת לביצוע זרימות עבודה שלמות.
The authors have nothing to disclose.
המחברים מבקשים להכיר בתמיכה כלכלית מ: משרד המדע והחדשנות הספרדי באמצעות מענקים: PID2019-104757RB-I00/AEI/10.13039/501100011033, “Comunidad Autónoma de Madrid” באמצעות גרנט: S2017/BMD-3817, מכון סאלוד קרלוס השלישי, PT17/0009/0010 (ISCIII-SGEFI/ERDF), האיחוד האירופי (האיחוד האירופי) ואופק 2020 באמצעות מענק: INSTRUCT – ULTRA (אינפרא-די.וי-03-2016-2017, הצעה: 731005), EOSC Life (INFRAEOSC-04-2018, הצעה: 824087), iNEXT – דיסקברי (הצעה: 871037) ו HighResCells (ERC – 2018 – SyG, הצעה: 810057). הפרויקט שהוליד תוצאות אלה זכה לתמיכת מלגה מקרן “לה Caixa” (ID 100010434). קוד המלגה הוא LCF / BQ / DI18 / 11660021. פרויקט זה קיבל מימון מתוכנית המחקר והחדשנות Horizon 2020 של האיחוד האירופי במסגרת הסכם המענקים מארי Skłodowska-Curie מס ‘ 713673. המחברים מכירים בתמיכה ובשימוש במשאבים של Instruct, פרויקט ESFRI של לנדמרק.