Summary

Basis van Multivariate Analyse in Neuroimaging gegevens

Published: July 24, 2010
doi:

Summary

Het huidige artikel beschrijft de basis van multivariate analyse en contrasten aan de meer algemeen gebruikte voxel-wijs univariate analyse. Beide soorten analyses worden toegepast op een klinisch-neurowetenschap dataset. Aanvullende split-half simulaties laten zien beter replicatie van de multivariate resultaten in onafhankelijke datasets.

Abstract

Multivariate analyse technieken voor neuro-imaging data zijn onlangs meer aandacht gekregen omdat ze veel aantrekkelijke functies die niet gemakkelijk kan worden gerealiseerd door de meer algemeen gebruikte univariate, voxel-wijs, technieken<sup> 1,5,6,7,8,9</sup>. Multivariate aanpak evalueren correlatie / covariantie van activatie over hersengebieden, in plaats van een procedure betreffende de voxel-by-voxel basis. Zo kunnen hun resultaten gemakkelijker worden geïnterpreteerd als een handtekening van de neurale netwerken. Univariate benaderingen, aan de andere kant, kan niet rechtstreeks interregionale correlatie in de hersenen. Multivariate aanpak kan ook leiden tot een grotere statistische power in vergelijking met univariate technieken, die worden gedwongen om zeer strenge correcties voor voxel-wise meerdere vergelijkingen gebruiken. Verder, multivariate technieken lenen zich ook veel beter om prospectieve toepassing van de resultaten van de analyse van een dataset geheel nieuwe datasets. Multivariate technieken zijn dus goed geplaatst om gegevens over de gemiddelde verschillen en correlaties met het gedrag, vergelijkbaar met univariate benaderingen, met mogelijk een grotere statistische power en een betere reproduceerbaarheid controles te bieden. In tegenstelling tot deze voordelen is de hoge drempel van de toegang tot het gebruik van multivariate methoden, het voorkomen van bredere toepassing in de gemeenschap. Om de neurowetenschapper vertrouwd te maken met multivariate analyse technieken, kan een eerste inventarisatie van het veld vormen een verbijsterende verscheidenheid van benaderingen dat, hoewel algoritmisch soortgelijke, worden met verschillende accenten, meestal door mensen met wiskunde achtergronden. Wij zijn van mening dat de multivariate analyse technieken hebben voldoende potentie om een ​​betere verspreiding te rechtvaardigen. Onderzoekers moeten in staat zijn om hen in dienst in een geïnformeerde en toegankelijke manier. Het huidige artikel is een poging tot een didactische introductie van multivariate technieken voor de beginner. Een conceptueel inleiding wordt gevolgd door een zeer eenvoudige toepassing om een ​​diagnostische gegevens die aan de ziekte van Alzheimer s Neuroimaging Initiative (ADNI), een duidelijk bewijs van de superieure prestaties van de multivariate aanpak.

Protocol

Om een ​​conceptueel overzicht van multivariate analyse kunnen we foto een heel eenvoudige situatie: een hypothetische dataset voor de 50 menselijke deelnemers, waar slechts drie regio's, zoals voxels (= drie-dimensionale pixels in figuur 1) aangeduid in de hersenen gemeten. (Plaats Figuur 1 hier, lees bijschrift als voice over.) De algemene doelstelling van multivariate analyse is om de belangrijkste bronnen van variantie te identificeren in de data, en vervolgens het beschrijven van de belangrijkste effecten van interesse in de gegevens in termen van deze bronnen van variantie. Figuur 2 toont een simplistisch voorbeeld. (Plaats Figuur 2 hier, lees bijschrift als voice over.) We hebben nu van toepassing op zowel univariate en multivariate analyse om een ​​klinische gegevens in te stellen. We FDG-PET-scans rusten gedownload voor 95 vroeg de ziekte van Alzheimer patiënten en 102 leeftijd gematchte controles van de website van de ziekte van Alzheimer Neuroimaging Initiative (http://www.loni.ucla.edu/ADNI/). We willekeurig gekozen 20-scans van zowel patiënten en controles en aangewezen ze als afleiding onze steekproef. De resterende 75 en 82 scans, respectievelijk, vormen onze replicatie steekproef. Univariate en multivariate de ziekte van Alzheimer (AD) markers zal nu worden afgeleid in de afleiding monster, en hun diagnostische effectiviteit getest in de replicatie monster. Voor de univariate marker, we het contrast van de 20 AD scans met de 20 controles scans in de afleiding monster en kies de hersenen plaats, dat de grootste daling in PET-signaal in het AD patiënten shows zoals aangetoond door een T-test. Voor het testen van de diagnostische werkzaamheid van deze regio, controleren we de gegevens in de replicatie monster op deze locatie en de plot zijn PET-signaal als functie van de ziekte status. Voor de multivariate marker, hebben we eerst een PCA op de gecombineerde 40 scans in de afleiding monster, en stelt vervolgens een covariantie patroon van de eerste vijf Principal Components waarvan het onderwerp schaalfactor toont een maximale gemiddelde verschil tussen AD patiënten en gezonde controles. (Details zijn te vinden in deze representatieve papieren 2.) De diagnostische covariantie patroon verkregen vormen de afleiding monster wordt prospectief vervolgens toegepast op de replicatie monster. De resulterende onderwerp schaalfactoren worden uitgezet als functie van de ziekte status. Om een ​​meer algemene vergelijking van beide univariate en multivariate aanpak uit stap 4 en 5, voeren we een 'split sample' simulatie en herhaal beide stappen 1.000 keer op geresampled data, elke keer dat de vorming van een 20/20 afleiding monster en een 75/82 replicatie van AD patiënten en gezonde controles opnieuw. Univariate en multivariate ziekte markers worden berekend op basis van de afleiding monster en de beslissing drempel is zodanig ingesteld dat bij de meeste een gezonde controle is ten onrechte aangezien voor AD (= specificiteit 95%). De ziekte markers met hun specifieke beslissing drempels worden vervolgens prospectief toegepast op de replicatie monsters. De classificatie fout tarieven in de replicatie steekproef zijn opgenomen voor alle resampling iteraties. Representatieve resultaten Univariate prestaties De resultaten zijn te zien in detail in figuur 3. De oppervlakte van de grootste AD-gerelateerde FDG tekort werd gevonden in de super temporale gyrus, Brodmann gebied 38. De oppervlakte onder de ROC-curve bereikte was de AUC = 0,90. De veralgemening van dit contrast met de replicatie monster was heel goed met een oppervlakte onder de ROC curve van de AUC = 0,84. Multivariate prestaties De resultaten zijn te zien in detail in figuur 4. Gebieden met positieve belastingen, zinspelen op een relatief behoud van het signaal in het gezicht van de ziekte werden gevonden in het cerebellum, terwijl de bijbehorende signaal verlies werd gevonden de parietotemporal en frontale gebieden, en de achterste cingulate gyrus. De gebieden onder ROC-curves, zowel in afleiding en replicatie monsters waren iets beter dan de univariate marker op 0,96 en 0,88 respectievelijk. Split-sample simulaties De resultaten zijn te zien in detail in figuur 5. De figuur laat zien dat de multivariate marker beter replicatie van diagnostische prestaties dan de univariate marker geeft. De gemiddelde totale foutenpercentage voor de multivariate marker is 0.203, terwijl voor de univariate marker is 0,307. . Figuur 1 Deze eenvoudige figuur beschrijft het verschil tussen univariate en multivariate analytische strategieën: een hypothetische 3-dimensionale dataset wordt weergegeven in deze illustratie. Aan de linkerkant is er geen correlatie bestaat tussen de drie variabelen geplot. Aan de rechterkant daarentegen ziet men een belangrijke bron van variantie wijst op een positieve correlatie tussen alle drie de voxels. Een univariate analyse dat slechts beschouwd als gemiddelde waarden over een voxel-by-voxel basis kon niet zien geen verschil tussen deze twee scenario's. Multivariate analyse, in tegenstelling, identificeert de belangrijkste bronnen van Variance in de gegevens (rode pijl) alvorens over te gaan tot neurale activering patronen te construeren vormen deze bronnen. Figuur 2. Deze slide toont in een vereenvoudigde vorm de basis uitvoering van elke multivariate analyse in neuroimaging data. De data-array Y (s, x), die afhankelijk is van een onderwerp index s, en een voxel-index x, waarop de locatie van de voxel in de hersenen, is ontleed in een som van meerdere termen. Eerste, een product van een zuiver subject-afhankelijke factor score, SSF (s), en een zuiver voxel-afhankelijke covariantie patroon, v (x). Ten tweede, activering, die niet kunnen worden verantwoord door de covariantie patroon wordt vastgelegd in een subject-en voxel-afhankelijke ruis termijn, e (s, x). De twee afbeeldingen hieronder de vergelijking een voorbeeld geven van het onderwerp schaalfactor en de covariantie patroon. Iedere deelnemer manifesteert de covariantie patroon, alleen maar om een ​​andere graad, zoals blijkt uit het onderwerp factor score. In plaats van bij te houden van het gedrag van elke voxel's afzonderlijk, de covariantie patroon en het onderwerp uitdrukking geven een spaarzame samenvatting van de belangrijkste bron van variantie. Als het onderwerp schaalfactor toename van de omvang, de gebieden aangeduid in het blauw in de covariantie patroon daling van de bijbehorende activering, terwijl de gebieden aangegeven in het rood gelijktijdig verhogen hun bijbehorende activeringssleutel. Het onderwerp factor score kan worden gecorreleerd met externe variabelen van belang, zoals onder leeftijd of gedrag prestaties in een cognitieve taak, en geen correctie voor meerdere vergelijkingen te worden toegepast op deze correlatie. Verschillende technieken voor een dergelijke ontleding bestaan, maar de meest voorkomende is een Principal Components Analysis (PCA). Dit is de techniek van de keuze voor ons. Merk op dat onderwerp schaalfactoren kunnen worden verkregen door het projecteren van de covariantie patroon in een dataset van gelijke dimensionaliteit, niet alleen de data set die de covariantie patroon in de eerste plaats geproduceerd. Dit maakt covariantie patronen geschikt voor het testen of de hersenen gedrag relaties die werden waargenomen in een data set kan worden gerepliceerd in een andere dataset. Figuur 3. Deze afbeelding toont het resultaat van de univariate analyse. In de linker paneel, worden de FDG signaal waarden die zijn uitgezet voor het gebied dat de grootste AD-gerelateerde tekort in de afleiding voorbeeld toont. De MNI coördinaten zijn x = 2 mm, Y = -48 mm, Z = 30mm (precuneus / PCG, Brodmann Area 31). Het onderste rechter paneel toont de FDG-signaal op dit locatie in de replicatie monster. Men kan begrijpen dat de FDG verschillen tussen AD patiënten en controles in de replicatie monster, terwijl de nog steeds grote geheel, worden verminderd met meer overlap tussen de groepen. Figuur 4. Deze figuur toont de resultaten van de multivariate analyse. In het bovenste paneel, we weer een aantal axiale plakken die aanzienlijk positief en negatief gewogen gebieden (p <0,001) in de covariantie patroon in rood en blauw zien, respectievelijk. Merk op dat we elke scan geschaald door haar wereldwijde gemiddelde waarde, zo rood en blauw kleur geven aan liever relatieve en absolute stijgingen en dalingen van de PET-signaal met ernst van de ziekte. Rode gebieden dus wijzen op de relatieve behoud in het gezicht van de ziekte, terwijl blauw duidt op een verlies van het signaal als gevolg van de ziekte. Rode gebieden zijn vooral te vinden in de kleine hersenen, terwijl de blauwe gebieden verschijnen in de achterste cingulate gyrus, parietotemporal en frontale gebieden. Linksonder: het onderwerp factor scores van de AD-gerelateerde covariantie patronen worden weergegeven in de afleiding monster. Hogere scores zijn onderwerp gevonden voor de AD patiënten. Lagere rechter paneel: het onderwerp factor scores als gevolg van de prospectieve toepassing van de AD-gerelateerde covariantie patroon van de replicatie monster zijn hier uitgezet. Men kan waarderen een lichte verslechtering van de diagnostische contrast met meer overlap in de replicatie monster, maar de veralgemening van de diagnostische werkzaamheid is merkbaar beter dan in het univariate geval. Figuur 5. Deze figuur toont de resultaten van de 1000 split-sample simulaties. Weergegeven zijn gemiddelden en standaarddeviaties van de univariate en multivariate diagnostische fouten in de replicatie monsters. Men kan begrijpen dat de multivariate marker de veralgemening van de prestaties aanzienlijk beter, hoewel iets meer variabel dan de univariate marker's.

Discussion

We hopen te hebben gegeven de kijker een smaak van de basisprincipes van multivariate analyse, geïnteresseerde kijkers worden aangespoord om onze website. Een aantal keuzes voor de parameters in de multivariate analyse werden gemaakt die kunnen onderhevig debat aanzienlijke debat. We gespaard de bespreking van deze kwesties in dit artikel om afleiding te vermijden van de grote problemen. Eerst hebben we gekozen voor de eerste 6 Principal Components aan onze AD-gerelateerde covariantie patroon te construeren. Er zijn theoretische redenen voor deze keuze dat we niet 4 te bespreken. De specifieke keuze van 6 Principal Components is echter niet van essentieel belang voor onze argument: men kan kiezen in het variëren van 2 tot 20 PC's en nog steeds te verkrijgen superieure prestaties veralgemening van de multivariate marker in de split-sample simulaties. De resultaten zijn op dezelfde robuust met betrekking tot de keuze van de nummers van de onderwerpen in afleiding en replicatie monsters. We hebben gekozen voor 20 thema's voor beide groepen in de replicatie monster, maar dit was puur voor het gemak wiskundige te versnellen van de berekeningen. Onze resultaten over de relatieve voordelen van beide technieken eveneens zou houden als de nummers van de vakken in de afleiding monsters werden verhoogd.

Ten tweede, wij alleen presenteerde de meest elementaire vorm van multivariate analyse. Aanzienlijke complicatie met technieken ontleend aan de Machine-Learning literatuur, lineaire en niet-lineaire transformaties voorafgaand aan de PCA, en diverse andere rimpels zijn haalbaar, dat kunnen de generalisatie prestaties te verhogen zelfs meer. Voor de eenvoud hebben we niet gehad over deze mogelijkheden in dit artikel.

Disclosures

The authors have nothing to disclose.

Acknowledgements

De auteur is dankbaar voor NIH subsidies:

NIH / NIBIB 5R01EB006204-03 Multivariate benaderingen van neuroimaging-analyse

NIH / NIA 5R01AG026114-02 Vroege AD Detection met ASL MRI & covariantieanalyse

ADNI: Imaging gegevens verstrekt door de ziekte van Alzheimer Neuroimaging Initiative (ADNI) (NIH U01AG024904). Het verzamelen van gegevens en het delen voor dit project werd gefinancierd door de ziekte van Alzheimer Neuroimaging Initiative (ADNI) (National Institutes of Health Grant U01 AG024904). ADNI wordt gefinancierd door het National Institute on Aging, het Nationaal Instituut voor Biomedical Imaging and Bioengineering, en door de gulle bijdragen van de volgende: Abbott, AstraZeneca AB, Bayer Schering Pharma AG, Bristol-Myers Squibb, Eisai Global Clinical Development, Elan Corporation, Genentech, GE Healthcare, GlaxoSmithKline, Innogenetics, Johnson en Johnson, Eli Lilly en Co, Medpace, Inc, Merck & Co, Inc, Novartis AG, Pfizer Inc, F. Hoffmann-La Roche, Schering-Plough, Synarc , Inc, en Wyeth, evenals non-profit partners van de Alzheimer's Association en de ziekte van Alzheimer Drug Discovery Foundation, met deelname van de Amerikaanse Food and Drug Administration. Prive-sector bijdragen aan ADNI worden vergemakkelijkt door de Stichting voor de National Institutes of Health ( http://www.fnih.org ). De gerechtigde organisatie is de Noord-Californische Instituut voor Onderzoek en Onderwijs, en de studie wordt gecoördineerd door de ziekte van Alzheimer coöperatieve Studeren aan de Universiteit van Californië, San Diego. ADNI gegevens worden verspreid door het Laboratorium voor Neuro Imaging aan de Universiteit van Californië, Los Angeles. Dit onderzoek werd ook gesteund door NIH subsidie ​​P30 AG010129, K01 AG030514, en de Dana Foundation.

References

  1. Moeller, J. R., Strother, S. C. A regional covariance approach to the analysis of functional patterns in positron emission tomographic data. J Cereb Blood Flow Metab. 11 (2), A121-A121 (1991).
  2. Scarmeas, N. Covariance PET patterns in early Alzheimer’s disease and subjects with cognitive impairment but no dementia: utility in group discrimination and correlations with functional performance. Neuroimage. 23 (1), 35-35 (2004).
  3. Siedlecki, K. L. Examining the multifactorial nature of cognitive aging with covariance analysis of positron emission tomography data. J Int Neuropsychol Soc. 15 (6), 973-973 (2009).
  4. Burnham, K. P., Anderson, D. R. . Model selection and multimodel inference a practical information-theoretic approach. , (2002).
  5. Moeller, J. R., Strother, S. C., Sidtis, J. J., Rottenberg, D. A. Scaled subprofile model: a statistical approach to the analysis of functional patterns in positron emission tomographic data. J Cereb Blood Flow Metab. 7 (5), 649-649 (1987).
  6. Habeck, C. Multivariate and univariate neuroimaging biomarkers of Alzheimer’s disease. Neuroimage. 40 (4), 1503-1503 (2008).
  7. Habeck, C. A new approach to spatial covariance modeling of functional brain imaging data: ordinal trend analysis. Neural Comput. 17 (7), 1602-1602 (2005).
  8. McIntosh, A. R., Bookstein, F. L., Haxby, J. V., Grady, C. L. Spatial pattern analysis of functional brain images using partial least squares. Neuroimage. 3 Pt 1, 143-143 (1996).
  9. McIntosh, A. R., Lobaugh, N. J. Partial least squares analysis of neuroimaging data: applications and advances. Neuroimage. 23, S250-S250 (2004).

Play Video

Cite This Article
Habeck, C. G. Basics of Multivariate Analysis in Neuroimaging Data. J. Vis. Exp. (41), e1988, doi:10.3791/1988 (2010).

View Video