Summary

היסודות של ניתוח רב משתני של נתונים הדמייה

Published: July 24, 2010
doi:

Summary

המאמר הנוכחי מתאר את היסודות של ניתוח רב משתני וניגודים אותו לניתוח voxel חכם יותר נפוץ univariate. שני סוגי ניתוח מוחלים על סט נתונים קליניים, מדעי המוח. לפצל וחצי סימולציות משלים להראות שכפול טוב יותר את התוצאות של ערכות נתונים משתנים בלתי תלויים.

Abstract

טכניקות ניתוח רב משתני עבור נתונים הדמייה קיבלו לאחרונה תשומת לב הולכת וגוברת כפי שהם תכונות אטרקטיביות רבות כי לא ניתן לממש בקלות על ידי univariate יותר נפוץ, voxel חכמה, טכניקות<sup> 1,5,6,7,8,9</sup>. גישות מרובות משתנים להעריך מתאם / שונות משותפת של הפעלת פני אזורים במוח, מאשר בהליך על בסיס voxel-by-voxel. לפיכך, התוצאות שלהם יכולה להתפרש בקלות רבה יותר כמו חתימה של רשתות עצביות. גישות Univariate, מאידך גיסא, לא ניתן ישירות לכתובת מתאם אזוריים במוח. גישות מרובות משתנים יכול גם לגרום כוח סטטיסטי רב יותר בהשוואה טכניקות univariate, אשר נאלצים להעסיק תיקונים מחמירים מאוד voxel מבחינת השוואות מרובות. יתר על כן, טכניקות משתנים גם להשאיל את עצמם הרבה יותר טוב יישום פרוספקטיבי התוצאות מניתוח במערך אחד מערכי נתונים חדש לגמרי. טכניקות מרובות משתנים הם ולכן ממוקמת היטב כדי לספק מידע על ההבדלים מתאמים אומר עם התנהגות, בדומה לגישות univariate, עם כוח סטטיסטי פוטנציאל גדול והמחאות שחזור טוב יותר. לעומת יתרונות אלה היא מכשול גבוה הכניסה לשימוש גישות משתנים, מונעים יישום נפוץ יותר בקרב הקהילה. כדי הנוירולוג היכרות עם טכניקות ניתוח רב משתני, סקר ראשוני של השדה יכול להציג מגוון מבלבל של גישות, למרות דומה אלגוריתמית, מוצגים עם דגשים שונים, בדרך כלל על ידי אנשים עם רקע במתמטיקה. אנו מאמינים כי טכניקות ניתוח רב משתני יש פוטנציאל מספיק כדי להצדיק הפצת טוב יותר. החוקרים צריכים להיות מסוגלים להפעיל אותם בצורה מושכלת ונגיש. המאמר הנוכחי הוא ניסיון מבוא דידקטי של טכניקות משתנים למתחילים. הקדמה רעיונית מלווה עם יישום פשוט מאוד נתונים אבחון להגדיר מ הדמייה לאלצהיימר של היוזמה (ADNI), מדגימים בבהירות את ביצועים מעולים של הגישה משתנים.

Protocol

כדי לתת סקירה המושגית של ניתוח רב משתני נוכל תמונה מצב פשוט מאוד: נתונים היפותטי להגדיר עבור 50 משתתפים אנושיים, שם רק שלושה אזורים, מסומן כמו voxels (פיקסלים = 3 מימדי באיור 1) במוח נמדדו. (איור 1 הכנס כאן, לקרוא כיתוב כמו קול על גבי). המטרה הכללית של ניתוח רב משתני הוא לזהות את המקורות העיקריים של הנתונים השונות, ולאחר מכן מתאר את ההשפעות העיקריות של עניין את הנתונים במונחים של מקורות אלו שונות. תרשים 2 מציג דוגמה פשטנית. (איור 2 הכנס כאן, לקרוא את הכיתוב כמו קול על גבי). כעת אנו להחיל ניתוח הן univariate ו משתנים כדי להגדיר נתונים קליניים. אנחנו הורדת FDG-PET סריקות מנוחה של 95 חולים מוקדם של אלצהיימר בגיל 102 בהתאמה שולטת מאתר האינטרנט של יוזמת מחלת אלצהיימר הדמייה (http://www.loni.ucla.edu/ADNI/). אנחנו אקראי הרים 20 סריקות של שני חולים בקרות המיועד בהם מדגם הגזירה שלנו. הנותרים 75 ו 82 סריקות, בהתאמה, המהווים מדגם השכפול שלנו. המחלה Univariate ו משתני אלצהיימר (AD) סמנים עכשיו יהיה נגזרת במדגם הגזירה, והיעילות האבחון שלהם נבדק במדגם שכפול. עבור הסמן univariate, אנו הניגוד סריקות 20 לספירה עם 20 שולט סריקות במדגם הגזירה לקחת את המיקום המוח המציג את הירידה הגדולה ביותר אות PET ב חולי אלצהיימר כפי שמוצג על ידי מבחן טי. כדי לבדוק את יעילות האבחון של האזור הזה, אנחנו בודקים את הנתונים במדגם שכפול במיקום זה ואת העלילה אות PET שלה כפונקציה של מצב המחלה. עבור הסמן משתנים, אנחנו הראשונים לבצע PCA על 40 סריקות בשילוב במדגם הגזירה, ולאחר מכן לבנות דפוס שונות משותפת של 5 המרכיבים הראשונים הראשי שהנושא גורם דרוג מראה הבדל ממוצע מקסימלי בין חולי אלצהיימר בקרות בריא. (פרטים ניתן למצוא את הניירות האלה נציג 2). הדפוס השונות המשותפת אבחוני שהושג בצורה מדגם הגזירה לאחר מכן ולהבא המדגם שכפול. דרוג גורמים כתוצאה מכך נושא נרשמות כפונקציה של מצב המחלה. כדי לספק השוואה כללית יותר של שתי הגישות univariate ו משתנים משלב 4 ו -5, אנו מבצעים סימולציה "לפצל מדגם" וחזור על שני צעדים 1,000 פעמים על נתונים resampled, בכל פעם להרכיב מדגם הגזירה 20/20 ו 75/82 שכפול של חולי אלצהיימר ובריאה מחדש שולטת. סמני המחלה Univariate ו משתנים מחושבים מן המדגם הגזירה ועל סף החלטה מוגדר כך לכל היותר 1 שליטה בריאה היא misclassified כמו AD (סגוליות = 95%). סמני המחלה עם ספי הספציפיים שלהם אז הם החלטה מכאן ולהבא על דגימות שכפול. שגיאה הסיווג שיעורי במדגם שכפול נרשמות לכל חזרות resampling. נציג תוצאות ביצועים Univariate התוצאות ניתן לראות פירוט באיור 3. האזור של הגירעון הגדול ביותר FDG לספירה הקשורות נמצא ברכס הרקתי סופר, אזור Brodmann 38. השטח תחת עקומת ROC-מושגת היה AUC = 0.90. הכללה של הניגוד הזה המדגם שכפול היה די טוב עם שטח מתחת לעקומה ROC של AUC = 0.84. ביצועים משתני התוצאות ניתן לראות פירוט באיור 4. תחומי עם מקדמי חיובית, רומז שימור יחסי של האות מול המחלה נמצאו במוח הקטן, תוך אובדן האות הקשורים נמצא באזורים parietotemporal ו חזיתית, ואת cingulate gyrus האחורי. אזורים תחת ROC-עקומות הגזירה והן דגימות שכפול היו מעט יותר טוב מאשר סמן univariate ב 0.96 ו 0.88, בהתאמה. Split-מדגם סימולציות התוצאות ניתן לראות פירוט באיור 5. הנתון מראה כי סמן משתנים נותן שכפול אבחון טוב יותר של ביצועים מאשר סמן univariate. שיעור ממוצע שגיאה מוחלטת סמן משתנים הוא 0.203, ואילו עבור הסמן univariate הוא 0.307. . באיור 1 נתון זה פשוט מתאר את ההבדל בין אסטרטגיות אנליטית univariate ו משתנים: מערך היפותטי 3 מימדי נתונים מוצג באיור הזה. בצד שמאל, אין קשר בין 3 משתנים זממו. בצד ימין לעומת זאת, אפשר לראות מקור עיקרי השונות מצביעים על קשר חיובי בין כל שלושת voxels. ניתוח זה נחשב univariate מתכוון רק ערכים על בסיס voxel-by-voxel לא יכול להגיד שום הבדל בין שני תרחישים. ניתוח רב משתני, לעומת זאת, מזהה את המקורות העיקריים של וריאןce בנתונים (חץ אדום) לפני שתמשיך לבנות דפוסים עצביים ההפעלה טופס מקורות אלה. איור 2. שקופית זו מציגה בצורה פשוטה את ההישג הבסיסי של ניתוח כל הנתונים משתנים ב הדמייה. Y מערך נתונים (s, x), אשר תלוי במדד נושא זה, וכן מדד voxel x, המציין את מיקומו של voxel במוח, הוא לפרק את סכום של מספר תנאים. ראשית, תוצר של ציון גרידא נושא תלויי גורם, ssf (ים), דפוס שונות משותפת טהורה voxel תלויי, v (x). הפעלת שנית, כי לא ניתן להסביר על ידי דפוס השונות המשותפת נתפס בטווח רעש הנושא ו voxel תלויי, דואר (s, x). שני גרפיקה מתחת המשוואה לתת דוגמה של גורם דרוג הנושא דפוס שונות משותפת. כל משתתף מבטא את דפוס השונות המשותפת, רק במידה שונה, כפי שמוצג על ידי ציון הגורם הנושא. במקום שיש לעקוב אחר ההתנהגות של כל voxel בנפרד, דפוס שונות משותפת וביטוי הנושא שלה לספק סיכום חסכנית של המקור העיקרי של השונות. כגורם מגביר את נושא שינוי גודל גודל, אזורים מסומנים בכחול דפוס השונות המשותפת ירידה הפעלה הקשורים בהם, ואילו באזורים המצוין אדום בו זמנית להגדיל הפעלה הקשורים בהם. ציון הגורם הנושא יכול להיות מתואם עם משתנים חיצוניים בעלי עניין כמו גיל נושא או ביצועים התנהגותיים במשימה קוגניטיבית, לא תיקון להשוואות מרובות צריך להיות מיושם על המתאם הזה. כמה טכניקות הפירוק כאלה קיימים, אבל הכי נפוצה היא ניתוח מרכיבים עיקריים (PCA). זוהי טכניקה של בחירה עבורנו. לידיעתך, גורמים דרוג נושא ניתן להשיג על ידי הקרנת דפוס שונות משותפת לתוך כל קבוצה של נתונים ממדיות שווה, לא רק את מערכת הנתונים אשר הפיק את דפוס השונות המשותפת מלכתחילה. זה עושה את דפוסי השונות המשותפת מתאים ובדיקה אם המוח התנהגותיים יחסים נצפו ערכת נתונים אחד יכול להיות משוכפל להגדיר נתונים שונים. איור 3. נתון זה מראה את התוצאה של הניתוח univariate. בחלונית השמאלית התחתונה, ערכי האות FDG הם זממו באזור המציג את הגדולה לספירה הקשורות הגירעון במדגם הגזירה. קואורדינטות MNI שלו הם X = 2 מ"מ, Y = -48 מ"מ, Z ​​= 30 מ"מ (Precuneus / PCG, שטח Brodmann 31). הפאנל הימני התחתון מראה את האות FDG במיקום זה מאוד במדגם שכפול. אפשר להעריך כי ההבדלים בין חולי אלצהיימר FDG בקרות במדגם שכפול, בעוד משמעותי עדיין הכוללת, מופחתים עם חפיפה יותר בין הקבוצות. איור 4. נתון זה מראה את התוצאות של הניתוח משתנים. בפאנל העליון, אנו מציגים מספר פרוסות צירית המראים באופן משמעותי באזורים משוקלל שלילי חיובי (p <0.001) בדפוס השונות המשותפת של אדום וכחול, בהתאמה. שים לב, אנחנו מדורגים כל סריקה על ידי הערך הממוצע העולמי שלה, הצבע האדום כל כך כחול עולה עולה יחסית די מוחלט וירידה של האות PET עם חומרת המחלה. אזורים האדום ובכך רמז שימור יחסי מול המחלה, בעוד הכחול מציין הפסד של האות כתוצאה של המחלה. אזורים האדום נמצאות בעיקר במוח הקטן, בעוד אזורים כחולים מופיעים ברכס החגורה האחורית, אזורים parietotemporal ו חזיתית. הפאנל השמאלי התחתון: עשרות הגורם הנושא של דפוס לספירה הקשורות השונות המשותפת מוצגים במדגם הגזירה. עשרות נושא גבוהה נמצאים על חולי אלצהיימר. הפאנל הימני התחתון: עשרות גורם הנושא תוצאה של יישום פוטנציאלי של דפוס לספירה הקשורות השונות המשותפת המדגם שכפול הם זממו כאן. אפשר להעריך קלה החרפת הניגוד אבחון עם חפיפה מוגברת במדגם שכפול, אבל ההכללה של יעילות האבחון ניכרת יותר מאשר במקרה univariate. איור 5. נתון זה מראה את התוצאות של 1000 מפוצל מדגם סימולציות. ברשימה הם אמצעי וסטיות תקן של שיעורי univariate ו משתני שגיאה אבחון בדגימות שכפול. אפשר להעריך כי הכללה את הסמן של משתנים של ביצועים טובים יותר באופן משמעותי, אם כי מעט יותר משתנה הסמן של univariate.

Discussion

אנו מקווים לתת לצופה טעם של היסודות של ניתוח רב משתני: צופים המעוניינים מוזמנים לבדוק את אתר האינטרנט שלנו. בחירות כמה פרמטרים בניתוח רב משתנים נעשו שניתן בדיון נושא לוויכוח רב. חסכנו את הדיון בנושאים אלה במאמר זה כדי למנוע הסחת דעת מן הנושאים העיקריים. ראשית, בחרנו הראשון 6 מרכיבים עיקריים כדי לבנות דפוס לספירה הקשורות השונות המשותפת שלנו. ישנן סיבות תיאורטי בחירה זו אנו לא דנים 4. הבחירה מסוים של 6 מרכיבים עיקריים אף אינו קריטי לטיעון שלנו: אחד יכול לבחור בטווח 2-20 מחשבים ועדיין להשיג ביצועים מעולים הכללה של הסמן משתנים של פיצול מדגם סימולציות. התוצאות הם חזקים דומה לגבי בחירה של מספר נושאים הגזירה דגימות שכפול. בחרנו 20 הנבדקים בשתי קבוצות במדגם שכפול, אבל זה היה רק ​​בשביל הנוחות מתמטיים כדי להאיץ את החישובים. התוצאות שלנו על היתרונות היחסיים של שתי טכניקות יחזיק דומה אם המספרים של נושאים בדגימות הגזירה עלו.

שנית, אנו רק הציג את הסוג הבסיסי ביותר של ניתוח רב משתני. סיבוך ניכרת עם טכניקות השאולים מן הספרות-Machine Learning, טרנספורמציות ליניארי ולא ליניארי לפני PCA, וקמטים אחרים השונים האפשריים שיכולים להגביר את הביצועים הכללה אף יותר. לשם הפשטות אנו לא נגעתי על האפשרויות הללו במאמר זה.

Disclosures

The authors have nothing to disclose.

Acknowledgements

The author is grateful for NIH grant support:

NIH/NIBIB 5R01EB006204-03 Multivariate approaches to neuroimaging analysis

NIH/NIA 5R01AG026114-02 Early AD Detection with ASL MRI & Covariance Analysis

ADNI: Imaging data was provided by the Alzheimer’s Disease Neuroimaging Initiative (ADNI) (NIH U01AG024904). Data collection and sharing for this project was funded by the Alzheimer’s Disease Neuroimaging Initiative (ADNI) (National Institutes of Health Grant U01 AG024904). ADNI is funded by the National Institute on Aging, the National Institute of Biomedical Imaging and Bioengineering, and through generous contributions from the following: Abbott, AstraZeneca AB, Bayer Schering Pharma AG, Bristol-Myers Squibb, Eisai Global Clinical Development, Elan Corporation, Genentech, GE Healthcare, GlaxoSmithKline, Innogenetics ,Johnson and Johnson, Eli Lilly and Co., Medpace, Inc., Merck and Co., Inc., Novartis AG, Pfizer Inc, F. Hoffman-La Roche, Schering-Plough, Synarc, Inc., and Wyeth, as well as non-profit partners the Alzheimer’s Association and Alzheimer’s Drug Discovery Foundation, with participation from the U.S. Food and Drug Administration. Private sector contributions to ADNI are facilitated by the Foundation for the National Institutes of Health(http://www.fnih.org). The grantee organization is the Northern California Institute for Research and Education, and the study is coordinated by the Alzheimer’s Disease Cooperative Study at the University of California, San Diego. ADNI data are disseminated by the Laboratory for Neuro Imaging at the University of California, Los Angeles. This research was also supported by NIH grants P30 AG010129, K01 AG030514, and the Dana Foundation.

References

  1. Moeller, J. R., Strother, S. C. A regional covariance approach to the analysis of functional patterns in positron emission tomographic data. J Cereb Blood Flow Metab. 11 (2), A121-A121 (1991).
  2. Scarmeas, N. Covariance PET patterns in early Alzheimer’s disease and subjects with cognitive impairment but no dementia: utility in group discrimination and correlations with functional performance. Neuroimage. 23 (1), 35-35 (2004).
  3. Siedlecki, K. L. Examining the multifactorial nature of cognitive aging with covariance analysis of positron emission tomography data. J Int Neuropsychol Soc. 15 (6), 973-973 (2009).
  4. Burnham, K. P., Anderson, D. R. . Model selection and multimodel inference a practical information-theoretic approach. , (2002).
  5. Moeller, J. R., Strother, S. C., Sidtis, J. J., Rottenberg, D. A. Scaled subprofile model: a statistical approach to the analysis of functional patterns in positron emission tomographic data. J Cereb Blood Flow Metab. 7 (5), 649-649 (1987).
  6. Habeck, C. Multivariate and univariate neuroimaging biomarkers of Alzheimer’s disease. Neuroimage. 40 (4), 1503-1503 (2008).
  7. Habeck, C. A new approach to spatial covariance modeling of functional brain imaging data: ordinal trend analysis. Neural Comput. 17 (7), 1602-1602 (2005).
  8. McIntosh, A. R., Bookstein, F. L., Haxby, J. V., Grady, C. L. Spatial pattern analysis of functional brain images using partial least squares. Neuroimage. 3 Pt 1, 143-143 (1996).
  9. McIntosh, A. R., Lobaugh, N. J. Partial least squares analysis of neuroimaging data: applications and advances. Neuroimage. 23, S250-S250 (2004).

Play Video

Cite This Article
Habeck, C. G. Basics of Multivariate Analysis in Neuroimaging Data. J. Vis. Exp. (41), e1988, doi:10.3791/1988 (2010).

View Video