שיטת בחירת חלקיקים מתקדמת עבור cryo-EM, כלומר CryoSieve, משפרת את רזולוציית מפת הצפיפות על ידי הסרת רוב החלקיקים בערימות סופיות, כפי שהודגם באמצעות היישום שלה על מערך נתונים בעולם האמיתי.
במהלך העשור האחרון, התקדמות הטכנולוגיה והמתודולוגיה בתחום מיקרוסקופ אלקטרונים קריוגני (cryo-EM) ניתוח חלקיק יחיד (SPA) שיפרו באופן משמעותי את יכולתנו לבחינה מבנית ברזולוציה גבוהה של מקרומולקולות ביולוגיות. התקדמות זו הובילה לעידן חדש של תובנות מולקולריות, שהחליפו את קריסטלוגרפיית קרני הרנטגן כשיטה השלטת וסיפקו תשובות לשאלות ותיקות בביולוגיה. מכיוון ש- cryo-EM אינו תלוי בהתגבשות, שהיא מגבלה משמעותית של קריסטלוגרפיה של קרני רנטגן, הוא לוכד חלקיקים באיכות משתנה. כתוצאה מכך, בחירת החלקיקים היא קריטית, שכן איכות החלקיקים שנבחרו משפיעה ישירות על הרזולוציה של מפת הצפיפות המשוחזרת. גישה איטרטיבית חדשנית לבחירת חלקיקים, המכונה CryoSieve, משפרת באופן משמעותי את האיכות של מפות צפיפות משוחזרות על ידי הפחתה יעילה של מספר החלקיקים בערימה הסופית. ראיות ניסיוניות מראות כי שיטה זו יכולה לחסל את רוב החלקיקים בערימות הסופיות, וכתוצאה מכך שיפור ניכר באיכות מפות הצפיפות. מאמר זה מתאר את זרימת העבודה המפורטת של גישה זו ומציג את היישום שלה על מערך נתונים בעולם האמיתי.
מיקרוסקופ אלקטרונים קריוגני (cryo-EM) ניתוח חלקיק יחיד (SPA) הפך לשיטה דומיננטית לקביעת מפות צפיפות תלת-ממדיות ברזולוציה גבוהה של מקרומולקולות ביולוגיות. בשל סדרה של חידושים טכנולוגיים 1,2,3,4,5,6, בשם מהפכת רזולוציה 7, ל- cryo-EM יש את היכולת לקבוע את המבנים של מקרומולקולות ביולוגיות ברזולוציה אטומית בקצב חסר תקדים. פריצת דרך זו מסמנת את תחילתו של עידן חדש בתובנות מולקולריות, תוך עקיפת קריסטלוגרפיית קרני רנטגן כטכניקה השלטת ומענה על שאלות ביולוגיות ותיקות.
Cryo-EM SPA סוטה מקריסטלוגרפיה של קרני רנטגן בכך שאינו דורש התגבשות של מקרומולקולות ביולוגיות. במקום זאת, תמיסה המכילה את המקרומולקולות הביולוגיות של המטרה קופאת במהירות בקרח זגוגית. לאחר מכן הוא מצולם עם קרן אלקטרונים כדי לייצר סדרה של מיקרוגרפים, תוך עקיפת הצורך בהתגבשות8. לאחר מכן, אלגוריתמים לקטיף חלקיקים משמשים לחילוץ חלקיקים גולמיים בודדים ממיקרוגרפים אלה 4,9,10,11,12. מכיוון ש- cryo-EM אינו תלוי בהתגבשות, טבעי שחלקיקים שחולצו ניזוקו בעיקר או במצבים קונפורמטיביים לא רצויים, מה שמחייב סבבים מרובים של בחירת חלקיקים כדי להשיג מפת צפיפות ברזולוציה גבוהה. בעיבוד תמונה cryo-EM SPA, בחירת חלקיקים חיונית לקבלת מפות צפיפות ברזולוציה גבוהה13.
ב- cryo-EM SPA, שיטות בחירת חלקיקים סטנדרטיות כוללות סיווג דו-ממדי (2D) ותלת ממדי (3D)14. סיווג דו-ממדי מסווג חלקיקים למספר מוגדר מראש של קבוצות, ומניב תמונה ממוצעת ורזולוציה דו-ממדית משוערת עבור כל מחלקה. לאחר מכן חוקרים יכולים לבחון חזותית את המחלקות האלה, ולהסיר חלקיקים מקבוצות ברזולוציה נמוכה יותר כדי להשתמש בשאר החלקיקים בשחזורים שמטרתם להשיג רזולוציה גבוהה יותר. לאחר קביעת תנוחות החלקיקים באמצעות אלגוריתמי עידון, החוקרים ימשיכו בסיווג תלת-ממדי, ויקבצו חלקיקים למספר מחלקות. זה מאפשר בדיקה חזותית של מפת הצפיפות המשוחזרת עבור כל מחלקה, ומאפשר הרחקה של חלקיקים לא רצויים, כגון אלה מקונפורמציות לא רצויות. לאחר מספר סבבי סיווג, מתקבלת ערימה סופית המורכבת מחלקיקים באיכות גבוהה יחסית. ערימות סופיות אלה מסייעות בהפקת מפות צפיפות ברזולוציה אטומית או כמעט אטומית.
ג’ו ועמיתיה הוכיחו כי ניתן לבצע בחירת חלקיקים נוספת בערימות הסופיות האלה15. CryoSieve15, שיטה איטרטיבית חדשנית לבחירת חלקיקים, ניתנת ליישום כדי לשפר את איכות מפת הצפיפות הסופית על ידי הפחתה משמעותית במספר החלקיקים. בעוד שקריטריונים ותוכנות אחרות למיון חלקיקים, כגון שיטת המתאם הצולב המנורמל (NCC)16, גישת עקביות הגרף הזוויתי (AGC)17 וסיווג אי-יישור5, נמצאים כיום בשימוש בתחום, שיטה זו הוכחה כבעלת ביצועים טובים יותר מאלגוריתמים אלה במונחים של יעילות.
במחקר זה אנו מציגים מדריך מפורט לתהליך כולו. כמקרה בוחן, יישמנו שיטה חדשה זו על מערך הנתונים של טרימר המגלוטינין לשפעת (ערך EMPIAR: 10097)18, הכולל 130,000 חלקיקים בערימה הסופית שלו. ההליך שלנו השליך בהצלחה כ-73.8% מהחלקיקים מהערימה הסופית של מערך נתונים זה, ושיפר את הרזולוציה של מפת הצפיפות המשוחזרת מ-4.11 Å ל-3.62 Å. בנוסף לטרימר המגלוטינין שפעת, תוצאות ממערכי נתונים מרובים מוצגות בפרסום מוקדם יותר15, המציגות מגוון רזולוציות ומשקלים מולקולריים של ביומולקולות.
Cryo-EM עומד כטכניקה מרכזית להבהרת המבנים של מולקולות ביולוגיות. בתהליך זה, לאחר איסוף נתונים באמצעות מיקרוסקופיה, חילוץ חלקיקים ממיקרוגרפים הוא חיוני, ולאחר מכן סיווגם במספר שלבים כדי להרכיב את הערימה הסופית. אתגר נפוץ הוא הדומיננטיות של חלקיקים פגומים או לא רצויים, מה שמדגיש את הצורך בבחירת חלקיקים חוזרת ונשנית כדי להשיג מפות צפיפות ברזולוציה גבוהה. זה הופך את בחירת החלקיקים לשלב קריטי ב- cryo-EM SPA להשגת מפות צפיפות באיכות גבוהה. טכניקות קיימות לבחירת חלקיקים כוללות את אלגוריתם האימות הסטטיסטי ללא הטיה22, הגישה מבוססת z-score23 ושיטת הערכת הדיוק הזוויתי24.
CryoSieve מתגלה ככלי רב ערך בהקשר זה, המיומן בסילוק מספר משמעותי של חלקיקים חיצוניים מהערימה הסופית. הפחתה זו לא רק משפרת את היעילות החישובית של השחזור אלא גם מייעלת את התהליך. הוא מציע חבילה מקיפה לבחירת חלקיקים, שבה מידת השלכת החלקיקים והשיפור ברזולוציה כתוצאה מכך תלויים במידה רבה באיכות הנתונים הראשונית ובמתודולוגיות המשמשות בעיבוד נתונים.
בכתב יד זה, הצגנו תהליך עבודה מלא של סינון חלקיקים באמצעות מערך הנתונים במקרה האמיתי של טרימר המגלוטינין שפעת (ערך EMPIAR: 10097). ניתן לסכם את השלבים המכוסים והנדונים כאן כסינון חלקיקים והערכה מחדש של תנוחות. הנפח המשוחזר הסופי בתלת-ממד השיג רזולוציה של 3.62 Å, ושרשראות הצד בסלילי אלפא היו ברורות יותר בנפח שלאחר העיבוד בהשוואה למפת הצפיפות שפורסמה.
CryoSieve היא שיטת קוד פתוח הזמינה ב- GitHub (https://github.com/mxhulab/cryosieve). הדרכה מפורטת ניתן למצוא גם בדף הבית שלה. משתמשים יכולים להתקין אותו ולהשתמש בו על-ידי ביצוע ערכת הלימוד. בנוסף, שני מודולים, cryosieve-csrefine ו cryosieve-csrhbfactor, מסופקים. מודול cryosieve-csrefine נוצר במיוחד כדי להפוך את הביצוע הרציף של פעולות שונות בתוך CryoSPARC (קובץ משלים 5). פעולות אלה כוללות ייבוא ערימות חלקיקים וביצוע עבודות ab initio, עידון הומוגני או עבודות עידון לא אחידות. מצד שני, מודול cryosieve-csrhbfactor נועד להפוך את הקביעה של גורם B רוזנטל-הנדרסון לאוטומטית על ידי מינוף היכולות של cryosieve-csrefine (קובץ משלים 6).
כיום, היישום של שיטה זו מוגבל לתרחישי קונפורמציה יחידים. כתוצאה מכך, במקרים שבהם חלקיקים מייצגים קונפורמציות מרובות, יכולותיהם מוגבלות. מומלץ למשתמשים לעסוק תחילה בסיווג תלת-ממדי כדי להפריד חלקיקים בעלי קונפורמציות שונות לפני השימוש בו לבחירת חלקיקים מעודנים. יתר על כן, למרות שהשיטה מפגינה מיומנות בסינון מעל 50% מהחלקיקים מהערימה הסופית, מקורם של חלקיקים אלה שהושלכו והסיבות העומדות בבסיסם לתרומתם הזניחה לאיכות השחזור עדיין אינם ברורים. פער זה בהבנה מחייב מחקר נוסף כדי לטפל באופן מקיף ואולי לתקן מגבלה זו.
קיימות שלוש שיטות אפשריות למיון חלקיקים או לסינון חלקיקים. ראשית, cisTEM4 יכול לדווח על ציון עבור כל תמונת חלקיק בודד לאחר עידון תלת-ממדי. משתמשים יכלו למיין חלקיקים באמצעות ציון cisTEM כדי להיפטר מחלקיקים. גישת עקביות הגרף הזוויתי (AGC)17 היא גם שיטה להשלכת חלקיקים שאינם מיושרים. יתר על כן, סיווג אי-יישור5 הוא דרך מסורתית להיפטר מחלקיקים באמצעות סיווג תלת-ממדי. השווינו את איכות החלקיקים שנשמרו בשיטות אלה עם CryoSieve ומצאנו שהחלקיקים השמורים של CryoSieve הם באיכות גבוהה יותר15. השיטה המוצגת כאן עולה באופן משמעותי על שיטות חלופיות ומשיגה את המספר הקטן ביותר של חלקיקים באותה רזולוציה.
כפי שהודגם בתוצאה, רוב החלקיקים במחסנית הסופית של cryo-EM אינם תורמים לשחזור מפת צפיפות. במילים אחרות, מבין כל החלקיקים שנאספו במהלך רכישת התמונה, רק מעטים נבחרים, כלומר תת-הקבוצה המשובחת ביותר, תורמים בפועל לשחזור הסופי. כתוצאה מכך, היחס בין תת-קבוצה סופית זו למספר הכולל של חלקיקים שנאספו יכול לשמש כמדד כמותי להערכת איכות הדגימה. ככל שיחס זה גבוה יותר, כך איכות המדגם טובה יותר. למרות ההתקדמות הטכנית שהפכה את cryo-EM לנגיש יותר לביולוגים מבניים, הכנת הדגימות נותרה צוואר בקבוק מרכזי בתהליך העבודה. מדענים ומהנדסים ממקדים אפוא את מאמציהם באתגר זה25 . בניתוח חלקיק יחיד (SPA), הכנת הדגימה מורכבת משני שלבים מכריעים: אופטימיזציה של הדגימה והכנת הרשת. הראשון כרוך בטיהור הדגימה תוך שמירה על מצבה הביוכימי האופטימלי. זה האחרון כרוך בהכנת הדגימה לניתוח במיקרוסקופ, כולל טיפול כימי או פלזמה של הרשת, תצהיר הדגימה, ויטריפיקציה. טכניקות רבות הוצעו כדי להתמודד עם חוסר יציבות מקרומולקולרית, אבל היעילות של גישה אחת על פני אחרת תלויה במאפייני המדגם25,26. נכון לעכשיו, תוצאות הכנת הרשת מושפעות מאוד מהמומחיות והניסיון של המשתמש, מה שיכול להפוך את התהליך לגוזל זמן ומאתגר27,28. המשתנים הרבים בהם נתקלים בהכנת הדגימה והרשת מציבים אתגרים ביצירת יחסי סיבה ותוצאה, שכן החוקרים יכולים להעריך את הדגימה רק ברמה המולקולרית באמצעות המיקרוסקופ. כתוצאה מכך, סטטיסטיקה כמותית מהשוואות של פרוטוקולי הכנת מדגם ורשת שונים עדיין חסרה, ויש צורך בגישה שיטתית כדי לחקור מגמות ולהבין את המנגנונים הבסיסיים של התנהגות המדגם29.
The authors have nothing to disclose.
עבודה זו נתמכה על ידי האקדמיה למחקר ותרגום של שנזן (ל- M.H.), מרכז החדשנות המתקדמת לביולוגיה מבנית (ל- M.H.), מרכז המחקר של גבול בייג’ינג למבנה ביולוגי (ל- M.H.), תוכנית המו”פ הלאומית של סין (No.2021YFA1001300) (ל- C.B.), הקרן הלאומית למדעי הטבע של סין (No.12271291) (ל- C.B.), והקרן הלאומית למדעי הטבע של סין (מס’ 12071244) (לז.ס.).
CryoSPARC | Structura Biotechnology Inc. Toronto, Canada | CryoSPARC (Cryo-EM Single Particle Ab-Initio Reconstruction and Classification) is a state of the art HPC software solution for complete processing of single-particle cryo-electron microscopy (cryo-EM) data. CryoSPARC is useful for solving cryo-EM structures of membrane proteins, viruses, complexes, flexible molecules, small particles, phase plate data and negative stain data. | |
EMPIAR-10097 Dataset | https://ftp.ebi.ac.uk/empiar/world_availability/10097/data/Particle-Stack/T40_HA_130K-Equalized-Particle-Stack.mrcs | This dataset comprises single-particle cryo-EM data of the Influenza Hemagglutinin trimer, characterized by its highly preferred orientation, collected using a 40-degree tilted collection strategy. | |
initial.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
mask.mrc | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | ||
RELION | 4.0-beta-2 | RELION (REgularised LIkelihood OptimisatioN) is an open-source software for cryo-electron microscopy (cryo-EM) data processing, particularly for refining macromolecular structures. Utilizing a Bayesian approach, it excels in separating signal from noise, enabling high-resolution structure determination. RELION supports single-particle analysis, tomography, and sub-tomogram averaging, and has become widely used in structural biology due to its effectiveness and user-friendly interface. | |
T40_HA_130K-Equalized_run-data_CryoSPARC_refined.star | https://github.com/mxhulab/cryosieve-demos/tree/master/EMPIAR-10097 | Metadata file for the final stack of particles from EMPIAR-10097 |