Le présent article décrit les bases de l'analyse multivariée et il l'oppose à la plus couramment utilisée voxel-sage analyse univariée. Les deux types d'analyse sont appliquées à un ensemble de données cliniques-neurosciences. Supplémentaire moitié-moitié simulations montrent une meilleure reproduction des résultats multivariés ensembles de données indépendants.
Techniques d'analyse multivariée des données de neuro-imagerie ont récemment reçu une attention croissante car ils ont de nombreuses caractéristiques attrayantes qui ne peuvent pas être facilement réalisés par les plus couramment utilisés univariée, voxel-sage, les techniques<sup> 1,5,6,7,8,9</sup>. Des approches multivariées d'évaluer la corrélation / covariance de l'activation de toutes les régions du cerveau, plutôt que de procéder sur une base voxel par voxel-. Ainsi, leurs résultats peuvent être plus facilement interprété comme une signature de réseaux neuronaux. Des approches univariée, d'autre part, ne peut pas traiter directement de corrélation interrégionale dans le cerveau. Des approches multivariées peuvent également entraîner une plus grande puissance statistique par rapport aux techniques univariées, qui sont obligés d'employer des corrections très strictes pour voxel-sage des comparaisons multiples. En outre, les techniques multivariées se prêtent également bien mieux à l'application prospective des résultats de l'analyse d'un ensemble de données pour des ensembles de données entièrement nouvelle. Techniques multivariées sont donc bien placés pour fournir des informations sur les différences moyennes et les corrélations avec le comportement, à l'instar des approches univariées, avec une puissance statistique potentiellement supérieure et vérifie la reproductibilité mieux. Contrairement à ces avantages est la haute barrière d'entrée à l'utilisation d'approches multivariées, ce qui empêche l'application plus répandue dans la communauté. Pour le neuroscientifique à se familiariser avec les techniques d'analyse multivariée, une enquête initiale sur le terrain pourrait présenter une variété déconcertante d'approches qui, bien que algorithmiquement similaires, sont présentés avec des accents différents, généralement par des gens d'horizons mathématiques. Nous croyons que les techniques d'analyse multivariée ont un potentiel suffisant pour justifier une meilleure diffusion. Les chercheurs devraient être en mesure de les employer d'une manière éclairée et accessible. Le présent article est une tentative d'une introduction didactique des techniques multivariées pour le novice. Une introduction conceptuelle est suivie avec une application très simple à un ensemble de données de diagnostic de l'Initiative de l'Alzheimer Disease s neuroimagerie (ADNY), démontrant clairement la performance supérieure de l'approche multivariée.
Nous espérons avoir donné au spectateur un goût de l'essentiel de l'analyse multivariée; téléspectateurs intéressés sont encouragés à consulter notre site web. Un peu de choix pour les paramètres dans l'analyse multivariée ont été faites qui peuvent être soumis à un débat un débat considérable. Nous épargné la discussion de ces questions dans cet article pour éviter la distraction des enjeux majeurs. Tout d'abord, nous avons choisi le 6 premières composantes principales pour construire notre modèle de covariance AD-connexes. Il ya des raisons théoriques de ce choix que nous n'avons pas discuté 4. Le choix particulier de 6 Composantes Principales n'est cependant pas critique pour notre argument: on peut choisir dans la gamme de 2 à 20 PC et toujours obtenir une performance supérieure de généralisation du marqueur multivariée dans les simulations d'échantillons fractionnés. Les résultats sont également très fortes en ce qui concerne le choix du nombre de sujets en dérivation et des échantillons de réplication. Nous avons choisi 20 sujets pour les deux groupes dans l'échantillon de réplication, mais cela était purement mathématique pour plus de commodité pour accélérer les calculs. Nos résultats sur les mérites relatifs des deux techniques tiendrait même, si le nombre de sujets dans les échantillons de dérivation ont été augmentés.
Deuxièmement, nous avons seulement présenté les plus élémentaires de l'analyse multivariée. Complications considérables avec des techniques empruntées à la littérature sur l'apprentissage machine, des transformations linéaires et non linéaires avant l'APC, et divers autres rides sont réalisables qui pourraient stimuler les performances de généralisation encore plus. Pour simplifier, nous n'avons pas touché à ces possibilités dans cet article.
The authors have nothing to disclose.
The author is grateful for NIH grant support:
NIH/NIBIB 5R01EB006204-03 Multivariate approaches to neuroimaging analysis
NIH/NIA 5R01AG026114-02 Early AD Detection with ASL MRI & Covariance Analysis
ADNI: Imaging data was provided by the Alzheimer’s Disease Neuroimaging Initiative (ADNI) (NIH U01AG024904). Data collection and sharing for this project was funded by the Alzheimer’s Disease Neuroimaging Initiative (ADNI) (National Institutes of Health Grant U01 AG024904). ADNI is funded by the National Institute on Aging, the National Institute of Biomedical Imaging and Bioengineering, and through generous contributions from the following: Abbott, AstraZeneca AB, Bayer Schering Pharma AG, Bristol-Myers Squibb, Eisai Global Clinical Development, Elan Corporation, Genentech, GE Healthcare, GlaxoSmithKline, Innogenetics ,Johnson and Johnson, Eli Lilly and Co., Medpace, Inc., Merck and Co., Inc., Novartis AG, Pfizer Inc, F. Hoffman-La Roche, Schering-Plough, Synarc, Inc., and Wyeth, as well as non-profit partners the Alzheimer’s Association and Alzheimer’s Drug Discovery Foundation, with participation from the U.S. Food and Drug Administration. Private sector contributions to ADNI are facilitated by the Foundation for the National Institutes of Health(http://www.fnih.org). The grantee organization is the Northern California Institute for Research and Education, and the study is coordinated by the Alzheimer’s Disease Cooperative Study at the University of California, San Diego. ADNI data are disseminated by the Laboratory for Neuro Imaging at the University of California, Los Angeles. This research was also supported by NIH grants P30 AG010129, K01 AG030514, and the Dana Foundation.