El presente artículo describe los fundamentos del análisis multivariado y se contrasta con el de uso más común voxel-sabio análisis univariado. Ambos tipos de análisis se aplica a un conjunto de datos clínico-neurociencia. Complementaria medio dividida simulaciones muestran una mejor reproducción de los resultados multivariados en conjuntos de datos independientes.
Técnicas de análisis multivariante de los datos de neuroimagen han recibido recientemente una atención creciente, ya que tienen muchas características atractivas que no puede ser fácilmente realizada por el más comúnmente utilizado univariado, voxel-sabia, técnicas<sup> 1,5,6,7,8,9</sup>. Métodos multivariantes evaluar la correlación / covarianza de la activación de todas las regiones del cerebro, en lugar de proceder sobre una base voxel por voxel. Por lo tanto, sus resultados pueden ser más fácilmente interpretada como una firma de las redes neuronales. Enfoques univariado, por otro lado, no pueden abordar directamente la correlación interregional en el cerebro. Métodos multivariantes también puede resultar en una mayor potencia estadística en comparación con las técnicas univariantes, que se ven obligados a emplear correcciones muy estrictos para voxel-sabia comparaciones múltiples. Además, las técnicas multivariantes también se prestan mucho mejor a la aplicación prospectiva de los resultados del análisis de un conjunto de datos a bases de datos completamente nuevo. Técnicas multivariantes se halla bien situada para proporcionar información acerca de las diferencias de medias y correlaciones con el comportamiento, al igual que los enfoques univariado, con un poder estadístico potencialmente mayor y mejor control de reproducción. En contraste con estas ventajas es la gran barrera de entrada a la utilización de métodos multivariantes, la prevención de una aplicación más amplia en la comunidad. Para el neurocientífico de familiarizarse con las técnicas de análisis multivariante, un estudio inicial del campo podría presentar una desconcertante variedad de enfoques que, a pesar de algoritmos similares, se presentan con diferentes énfasis, por lo general por personas con formación matemática. Creemos que las técnicas de análisis multivariante tienen potencial suficiente para garantizar una mejor difusión. Los investigadores deben ser capaces de emplearlos de una manera informada y accesible. El presente artículo es un intento de una introducción didáctica de técnicas multivariantes para el principiante. Una introducción conceptual se sigue con una aplicación muy sencilla con un conjunto de datos de diagnóstico de la Iniciativa de Alzheimer s Neuroimagen de Enfermedades (ADNI), lo que demuestra claramente el rendimiento superior de la aproximación multivariada.
Esperamos haber dado al espectador una idea de los fundamentos del análisis multivariado, los espectadores interesados se les anima a revisar nuestro sitio web. A pocas opciones para los parámetros en el análisis multivariante que se pueden debatir objeto de considerable debate. Nos salvó la discusión de estas cuestiones en este artículo para evitar la distracción de los temas principales. En primer lugar, se optó por las primeras 6 componentes principales para la construcción de nuestra AD relacionados con patrón de covarianza. Hay razones teóricas para esta elección que no discutimos 4. La elección particular de seis componentes principales, aunque no es esencial para nuestro argumento: uno puede elegir en el rango de 2 a 20 computadoras y todavía obtener un rendimiento superior de la generalización multivariante el marcador en las simulaciones de la muestra dividida. Los resultados son igual de firme con respecto a la elección del número de sujetos en la derivación y las muestras de replicación. Hemos elegido 20 sujetos de ambos grupos en la muestra de la réplica, pero esto fue por pura conveniencia matemática para acelerar los cálculos. Nuestros resultados sobre los méritos relativos de las dos técnicas se mantenga de manera similar, si el número de sujetos en las muestras de derivación se incrementaron.
En segundo lugar, sólo se presenta el tipo más básico de análisis multivariante. Complicación considerable con técnicas tomadas de la literatura de aprendizaje de máquina, transformaciones lineales y no lineales antes de la PCA, y varias otras arrugas son factibles que pudieran mejorar el rendimiento de generalización aún más. Para simplificar, no hemos tocado en estas posibilidades en este artículo.
The authors have nothing to disclose.
The author is grateful for NIH grant support:
NIH/NIBIB 5R01EB006204-03 Multivariate approaches to neuroimaging analysis
NIH/NIA 5R01AG026114-02 Early AD Detection with ASL MRI & Covariance Analysis
ADNI: Imaging data was provided by the Alzheimer’s Disease Neuroimaging Initiative (ADNI) (NIH U01AG024904). Data collection and sharing for this project was funded by the Alzheimer’s Disease Neuroimaging Initiative (ADNI) (National Institutes of Health Grant U01 AG024904). ADNI is funded by the National Institute on Aging, the National Institute of Biomedical Imaging and Bioengineering, and through generous contributions from the following: Abbott, AstraZeneca AB, Bayer Schering Pharma AG, Bristol-Myers Squibb, Eisai Global Clinical Development, Elan Corporation, Genentech, GE Healthcare, GlaxoSmithKline, Innogenetics ,Johnson and Johnson, Eli Lilly and Co., Medpace, Inc., Merck and Co., Inc., Novartis AG, Pfizer Inc, F. Hoffman-La Roche, Schering-Plough, Synarc, Inc., and Wyeth, as well as non-profit partners the Alzheimer’s Association and Alzheimer’s Drug Discovery Foundation, with participation from the U.S. Food and Drug Administration. Private sector contributions to ADNI are facilitated by the Foundation for the National Institutes of Health(http://www.fnih.org). The grantee organization is the Northern California Institute for Research and Education, and the study is coordinated by the Alzheimer’s Disease Cooperative Study at the University of California, San Diego. ADNI data are disseminated by the Laboratory for Neuro Imaging at the University of California, Los Angeles. This research was also supported by NIH grants P30 AG010129, K01 AG030514, and the Dana Foundation.