1. התקנה התקן את R, אם הוא עדיין לא מותקן.הערה: PAST כתוב ב- R, ולכן דורש שהמשתמשים שלו יתקנו R. בעת כתיבת שורות אלה, התקנת PAST ישירות מ- Bioconductor דורשת R4.0. ניתן להתקין גרסאות ישנות יותר של PAST מ- Bioconductor עבור R3.6, וניתן להתקין את PAST מגיתוב עבור משתמשים עם R3.5. ניתן להוריד הוראות התקנה R מהקישור הבא: https://www.r-project.org/. התקן את הגירסה העדכנית ביותר של RStudio שולחן העבודה או עדכן RStudio (אופציונלי).הערה: RStudio היא סביבה מועילה לעבודה עם שפת ה- R. ההתקנה שלו מומלצת, במיוחד עבור אלה שבוחרים להפעיל את PAST בשורת הפקודה ולא באמצעות יישום GUI מבריק. RStudio והוראות ההתקנה שלה ניתן למצוא בקישור הבא: https://rstudio.com/products/rstudio/. התקן את PAST מ- Bioconductor11 על-ידי ביצוע ההוראות בנושא מוליך ביולוגי.הערה: התקנה באמצעות מוליך ביולוגי אמורה לטפל בהתקנת יחסי התלות של PAST. בנוסף, ניתן להתקין את PAST מגיתוב12, אך התקנה מ- Github לא תתקין יחסי תלות באופן אוטומטי. התקן את PAST מבריק (אופציונלי). הורד את הקובץ “אפליקציה. R” מהדף מהדורות של מאגר Github: https://github.com/IGBB/PAST/releases/, וזכרו היכן ממוקם הקובץ שהורד.הערה: בעבר ניתן להשתמש על ידי קורא השיטות שלה ישירות עם R, אבל משתמשים שמכירים פחות R יכול להפעיל את היישום בעבר מבריק, המספק ממשק משתמש מודרך. PAST Shiny הוא סקריפט R הזמין בסניף shiny_app של מאגר גיטוב בעבר. בעבר מבריק ינסה להתקין את יחסי התלות שלה במהלך ההפעלה הראשונה. התחל בניתוח על-ידי הפעלת היישום באחת משלוש הדרכים המתוארות להלן. עבר מבריק עם RStudio באמצעות RStudio, צור פרוייקט חדש בתיקיה שבה היישום. R ממוקם. לחץ על קובץ | פרוייקט חדש ובחר תיקיה זו. לאחר יצירת פרוייקט חדש, פתח את היישום. קובץ R שהורד קודם לכן. RStudio מזהה את האפליקציה הזו. R היא אפליקציה מבריקה ויוצרת לחצן הפעל יישום בסרגל שמעל קוד המקור המוצג. לחץ על הפעל יישום. לאחר מכן RStudio תשיק חלון המציג את היישום PAST Shiny. מעבר מבריק עם מסוף R הפעל R והפעל את הקוד הבא כדי להפעיל את היישום המבריק של העבר: מבריק::runApp(‘נתיב/אל/תיקיה/עם/מבריק/אפליקציה. ר’. החלף את הטקסט במרכאות בתיקיה שאליה האפליקציה. R הורד, ולשמור את הציטוטים. עבר ללא R מבריק הפעל ספריה(PAST) במסוף R כדי לטעון את PAST. 2. התאמה אישית של ניתוח מבריק (אופציונלי) שנה את כותרת הניתוח מ”ניתוח חדש” למשהו שמשקף טוב יותר את סוג הניתוח המנוהל, המסייע לעקוב אחר ניתוחים מרובים (ראו איור 1). איור 1. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. שנה את מספר הליבות ואת המצב. הגדר את מספר הליבות למספר כלשהו בין 1 למספר הכולל במחשב, אך שים לב לכך שהעברת משאבים נוספים ל- PAST עשויה להאט פעולות אחרות במחשב. הגדר את המצב בהתבסס על התיאור בסעיף 6. 3. טען נתוני GWAS הערה: ודא כי נתוני GWAS מופרדים באמצעות כרטיסיות. ודא שקובץ השיוך מכיל את העמודות הבאות: תכונה, שם סמן, לוקוס או כרומוזום, מיקום על ערך הכרומוזום, p-value ו- R2 עבור הסמן. ודא שקובץ האפקטים מכיל את העמודות הבאות: תכונה, שם סמן, לוקוס או כרומוזום, מיקום על הכרומוזום ואפקט. סדר עמודות אלה אינו חשוב, שכן המשתמש יכול לציין את שמות העמודות בעת טעינת הנתונים. המערכת מתעלמת מעמודות נוספות. ניתן להשתמש ב- TASSEL13 כדי להפיק קבצים אלה. טען נתוני GWAS באמצעות מעבר מבריק. בחר קובץ שיוך וקובץ אפקטים באמצעות תיבות הבחירה קובץ שיוך וקובץ אפקטים. שנה את שמות העמודות בתיבות הקלט שם עמודת שיוך ועמודות אפקטים מתחת לתיבות בחירת הקבצים כדי לשקף את שמות העמודות בנתונים. איור 2. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. טען נתוני GWAS עם PAST במסוף R. שנה והפעל את הקוד הבא:gwas_data = load_GWAS_data(“path/to/association_file.tsv”, “path/to/effects_file.tsv”, association_columns = c(“תכונה”, “Marker”, “לוקוס”, “אתר”, “p”, “marker_R2”), effects_columns = c(“תכונה”, “מרקר”, “לוקוס”, “אתר”, “אפקט”) הערה: שנה את הנתיבים למיקום הממשי של קבצי GWAS. הערכים המסופקים עבור association_columns effects_columns הם ערכי ברירת המחדל. אם השמות אינם תואמים לערכי ברירת המחדל, ציין את שמות העמודות. אחרת, ניתן להשמיט אותם. 4. נתוני אי-שוויון הצמדה לטעינה (LD) הערה: ודא כי נתוני אי-שוויון ההצמדה (LD) מופרדים באמצעות כרטיסיות ומכילה את סוגי הנתונים הבאים: לוקוס, מיקום1, Site1, Position2, Site2, מרחק בזוגות בסיס בין מיקום1 ל- Position2 וערך R2. טען נתוני LD באמצעות מעבר מבריק. בחר את הקובץ המכיל נתוני LD. שנה את שמות העמודות בתיבות הקלט שמות עמודות LD מתחת לתיבת בחירת הקבצים כך שיתאימו לשמות העמודות בנתוני LD במידת הצורך. איור 3. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. טען נתוני LD עם PAST במסוף R. שנה והפעל את הקוד הבא כדי לטעון נתוני LD:LD = load_LD(“path/to/LD.tsv”, LD_columns = c(“Locus1”, “Position1”, “Site1”, “Position2”, “Site2”, “Dist_bp”, “R.2”)הערה: שנה את הנתיב למיקום הממשי של קובץ LD. הערכים המסופקים עבור LD_columns הם ערכי ברירת המחדל. אם השמות אינם תואמים לברירות מחדל אלה, ציין את השמות הנכונים של העמודות; אחרת, ניתן להשמיט אותם. 5. הקצה SNPs לגנים הערה: הורד או אתר ביאורים באופן אחר בתבנית GFF. ביאורים אלה ניתן למצוא לעתים קרובות במסדי נתונים מקוונים עבור אורגניזמים ספציפיים. היזהרו לגבי ביאורים באיכות נמוכה, שכן איכות נתוני הביאורים תשפיע על איכות ניתוח המסלול. ודא שהעמודה הראשונה של ביאורים אלה (הכרומוזום) תואמת לתבנית הלוקוס/כרומוזום בנתוני השיוך, האפקטים וה- LD. לדוגמה, הביאורים לא צריכים לקרוא לכרומוזום הראשון “chr1” אם קבצי הנתונים GWAS ו- LD מכנים את הכרומוזום הראשון “1”. הקצה SNPs לגנים עם בעבר מבריק.הערה: מידע נוסף על קביעת חתך R2 מתאים ניתן למצוא טאנג ואח’6, בסעיף שנקרא “SNP לאלגוריתם גנים לניתוח המסלול”. בחר את הקובץ המכיל ביאורים GFF. שקול איזה גודלחלון וחיתוך R 2 מתאימים ביותר למינים הנלקחים בחשבון ולשנות אם ברירות המחדל אינן מתאימות לנתונים שהועלו.הערה: ערכי ברירת המחדל ב- PAST משקפים בעיקר ערכים המתאימים לתירס. מספר הליבות שנקבעו בתחילת ניתוח ה- PAST Shiny (שלב 2.2) משמש בשלב זה. איור 4. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. הקצה SNPs לגנים עם PAST במסוף R. שנה והפעל את הקוד הבא כדי להקצות SNPs לגנים:גנים = assign_SNPs_to_genes(gwas_data, LD, “path/to/anotations.gff”, c(“גן”), 1000, 0.8, 2)הערה: בקוד לדוגמה זה, מסופקות מספר הצעות ברירת מחדל: 1000 הוא גודל החלון סביב SNP כדי לחפש גנים; 0.8 הוא ערך הקיצוץ עבור R2; 2 הוא מספר הליבות המשמשות לעיבוד מקבילי. יש לשנות את הנתיב לביאורים גם למיקום הממשי של קובץ הביאורים. 6. גלה מסלולים משמעותיים הערה: ודא שקובץ הנתיבים מכיל את הנתונים הבאים בתבנית מופרדת באמצעות טאבים, עם שורה אחת עבור כל גן בכל מסלול: מזהה מסלול – מזהה כגון “PWY-6475-1”; תיאור מסלול – תיאור ארוך יותר של מה המסלולים לעשות כגון “טרנס-ליקופן biosynthesis”; גן – גן במסלול, אשר צריך להתאים את השמות המסופקים ביאורים. מידע מסלול ניתן למצוא ככל הנראה במסדי נתונים מקוונים עבור אורגניזמים ספציפיים, כגון MaizeGDB. האפשרות השנייה שצוינה על-ידי המשתמש היא המצב. “הגדלת” מתייחס פנוטיפים המשקפים כאשר ערך עולה של התכונה הנמדדת רצוי, כגון תשואה, בעוד “ירידה” מתייחס תכונה שבה ירידה בערכים הנמדדים מועילה, כגון דירוגי נזק חרקים. המשמעות של מסלולים נבדקת בשיטות שתוארו בעבר4,6,14. גלה מסלולים משמעותיים עם עבר מבריק. בחר את הקובץ המכיל נתוני מסלולים וודא שהמצב נבחר באפשרויות הניתוח. במידת הצורך, שנה את מספר הגנים שחייבים להיות במסלול כדי לשמור אותו לניתוח ואת מספר התמורות המשמשות ליצירת התפלגות ה- Null כדי לבדוק את משמעות ההשפעה. איור 5. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. הערה: מספר הליבות והמצב שהוגדר בתחילת ניתוח ה- PAST Shiny (שלב 2.2) משמש בשלב זה. מספר ברירת המחדל של הגנים מוגדר כיום על 5 גנים, כך שמסלולים עם פחות גנים ידועים יוסרו. המשתמש יכול להוריד ערך זה ל- 4 או 3, כדי לכלול מסלולים קצרים יותר, אך פעולה זו תסתכן בתוצאות חיוביות שגויות. הגדלת ערך זה יכולה להגדיל את כוח הניתוח אך תסיר מסלולים נוספים מהניתוח. שינוי מספר התמורות המשמשות מגדיל ומקטין את כוח הבדיקה. גלה מסלולים משמעותיים עם PAST במסוף R. שנה והפעל את הקוד הבא כדי לגלות מסלולים משמעותיים:rugplots_data <- find_pathway_significance (גנים, "path/to/paths.tsv", 5, "גדל", 1000, 2)הערה: בקוד לדוגמה זה, מסופקות מספר ברירות מחדל מוצעות. 5 הוא המספר המינימלי של גנים שחייבים להיות במסלול כדי לשמור על המסלול בניתוח, הגדלת מתייחסת לכמות הולכת וגדלה של התכונה הנמדדת (מומלץ שהמשתמש יפעל הן גדל והן יורד, ללא קשר לתכונה; פרשנות נתונים תהיה שונה עבור השניים, עם זאת), 1000 הוא מספר הפעמים לדגום את ההשפעות כדי לקבוע את התפלגות האפס, ו- 2 הוא מספר הליבות המשמשות לעיבוד מקבילי. שנה את הנתיב למיקום הממשי של קובץ הנתיבים. 7. צפו ברוגפלוטס צפה ברוגפלוטס עם עבר מבריק. לאחר העלאת כל הקלטים והגדרתם,לחץ על התחל ניתוח . מד התקדמות יופיע ויציין איזה שלב של הניתוח הושלם לאחרונה. לאחר השלמת הניתוח, PAST Shiny יעבור לכרטיסיה תוצאות. בעמודה השמאלית (שכותרתה “מסלולים”) תוצג טבלת תוצאות (הנקראת “נתיבים”) ו-Rugplots יוצגו בעמודה הימנית (שכותרתה “התוויות”). השתמש במחוון כדי לשלוט בפרמטרים של הסינון. כאשר רמת הסינון משביעת רצון, לחץ על לחצן הורד תוצאות בפינה הימנית התחתונה כדי להוריד את כל התמונות והטבלאות בנפרד לקובץ ZIP ששמו מופיע עם כותרת הניתוח. קובץ ZIP זה מכיל את הטבלה המסוננת, הטבלה הלא מסוננת ותמונה אחת לכל מסלול בטבלה המסוננת. איור 6. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. איור 7. אנא לחץ כאן כדי להציג גירסה גדולה יותר של איור זה. הצגת רוגלוטים עם עבר בקונסולת R שנה והפעל את הקוד הבא כדי לשמור את התוצאות:plot_pathways(rugplots_data, “pvalue”, 0.02, “גדל”, “output_folder”)הערה: בקוד לדוגמה זה, מסופקות מספר ברירות מחדל מוצעות. pvalue מספק את הנתונים שניתן להשתמש בהם לסינון מסלולים לא משמעותיים לאחר בחירת סף משמעות על-ידי המשתמש; 0.02 הוא ערך ברירת המחדל המשמש לסינון, והגדלה מתייחסת לכמות הולכת וגדלה של התכונה הנמדדת (מומלץ שהמשתמש יפעל הן גדל והן יורד, ללא קשר לתכונה; פרשנות הנתונים תהיה שונה עבור השניים, עם זאת); output_folder היא התיקיה שבה יכתבו התמונות והטבלאות (תיקיה זו חייבת להתקיים לפני הפעלת הפונקציה). טבלה של תוצאות מסוננות, התוצאות הלא מסוננות ותמונות בודדות עבור כל מסלול בתוצאות המסוננות נכתבות לתיקיה זו.