O presente artigo descreve os conceitos básicos de análise multivariada e contrasta-lo para o mais comumente utilizado a análise baseada em voxel univariada. Ambos os tipos de análise são aplicadas a um conjunto de dados clínico-neurociência. Complementares das metades simulações mostram melhor replicação dos resultados multivariada em conjuntos de dados independentes.
Técnicas de análise multivariada para dados de neuroimagem foram recentemente alvo de atenção crescente, pois têm muitas características atraentes que não pode ser facilmente realizado pelo univariada mais comumente utilizados, baseada em voxel, técnicas<sup> 1,5,6,7,8,9</sup>. Abordagens multivariada avaliar correlação / covariância de ativação em regiões do cérebro, ao invés de prosseguir em uma base voxel-a-voxel. Assim, seus resultados podem ser mais facilmente interpretado como uma assinatura de redes neurais. Abordagens univariada, por outro lado, não pode tratar diretamente de correlação inter-regional no cérebro. Abordagens multivariadas também pode resultar em maior poder estatístico, quando comparado com as técnicas de análise univariada, que são forçados a empregar muito rigorosos para correções baseada em voxel comparações múltiplas. Além disso, técnicas de análise multivariada também se prestam muito melhor aplicação prospectiva dos resultados da análise de um conjunto de dados para conjuntos de dados completamente novo. Técnicas multivariadas são, portanto, bem posicionada para fornecer informações sobre as diferenças médias e correlações com o comportamento, de forma semelhante às abordagens univariada, com potencialmente maior poder estatístico e verifica melhor reprodutibilidade. Em contraste com estas vantagens é a alta barreira de entrada para o uso de abordagens multivariadas, que impeça a aplicação mais difundida na comunidade. Para o neurocientista se familiarizar com técnicas de análise multivariada, um levantamento inicial do campo pode apresentar uma variedade desconcertante de abordagens que, apesar de algoritmos similares, são apresentados com ênfases diferentes, geralmente por pessoas com backgrounds matemática. Acreditamos que as técnicas de análise multivariada têm potencial suficiente para justificar uma melhor divulgação. Pesquisadores devem ser capazes de empregá-los de uma forma informada e acessível. O presente artigo é uma tentativa de uma introdução didática de técnicas de análise multivariada para os novatos. Uma introdução conceitual é seguido com uma aplicação muito simples para um conjunto de dados de diagnóstico de Doença de Alzheimer s Neuroimagem Initiative (ADNI), demonstrando claramente o desempenho superior da abordagem multivariada.
Esperamos ter dado o espectador um sabor das noções básicas de análise multivariada; espectadores interessados são encorajados a verificar o nosso website. A poucas opções para os parâmetros na análise multivariada foram feitas, que pode ser sujeita a debate um debate considerável. Não poupamos a discussão dessas questões neste artigo para evitar a distração das questões mais importantes. Primeiro, nós escolhemos os 6 primeiros componentes principais para construir o nosso padrão de covariância AD-relacionados. Existem razões teóricas para essa escolha que nós não discutimos 4. A escolha particular de seis componentes principais que não é crítico para o nosso argumento: um pode escolher no intervalo de 2-20 PCs e ainda obter um desempenho superior de generalização do marcador multivariada nas simulações divisão da amostra. Os resultados são igualmente robusta em relação à escolha de números de indivíduos em derivação e replicação de amostras. Escolhemos 20 indivíduos de ambos os grupos na amostra de replicação, mas esta era puramente por conveniência matemática para acelerar os cálculos. Nossos resultados sobre os méritos relativos de ambas as técnicas iria realizar da mesma forma se o número de sujeitos na amostra de derivação foram aumentadas.
Em segundo lugar, nós só apresentou o tipo mais básico de análise multivariada. Complicação considerável com técnicas emprestadas da literatura de aprendizagem de máquina, transformações lineares e não-linear antes da PCA, e várias outras rugas são viáveis que poderiam melhorar o desempenho de generalização ainda mais. Para simplificar, não toquei nessas possibilidades neste artigo.
The authors have nothing to disclose.
O autor é grato pelo NIH apoio financeiro:
NIH / NIBIB 5R01EB006204-03 abordagens à análise multivariada de neuroimagem
NIH / NIA Detecção AD-02 5R01AG026114 precoce com ASL MRI e Análise de Covariância
ADNI: dados de imagem foi fornecido por Doença de Alzheimer Neuroimagem Initiative (ADNI) (NIH U01AG024904). Coleta de dados e compartilhamento para este projeto foi financiado pela Neuroimagem da doença de Alzheimer Initiative (ADNI) (National Institutes of Health Grant AG024904 U01). ADNI é financiado pelo Instituto Nacional do Envelhecimento, do Instituto Nacional de Imagem Biomédica e Bioengenharia, e através de generosas contribuições a partir do seguinte: Abbott, AstraZeneca AB, a Bayer Schering Pharma AG, Bristol-Myers Squibb, Eisai Desenvolvimento Clínico Global, Elan Corporation, Genentech, a GE Healthcare, GlaxoSmithKline, Innogenetics, Johnson e Johnson, Eli Lilly and Co., Medpace, Inc., Merck e Co., Inc., Novartis AG, Pfizer Inc, F. Hoffman-La Roche, Schering-Plough, Synarc , Inc., e Wyeth, bem como sem fins lucrativos parceiros a Associação de Alzheimer e da droga de Alzheimer Descoberta Foundation, com a participação da Food and Drug Administration EUA. Contribuições do setor privado para ADNI são facilitados pela Fundação para o National Institutes of Health ( http://www.fnih.org ). A organização beneficiária é a Califórnia do Norte Instituto de Pesquisa e Educação, bem como o estudo é coordenado pelo Estudo da Doença de Alzheimer Cooperativa da Universidade da Califórnia, San Diego. ADNI dados são divulgados pelo Laboratório de Imagem Neuro da Universidade da Califórnia, em Los Angeles. Esta pesquisa também foi apoiado pelo NIH concede P30 AG010129, K01 AG030514, ea Fundação Dana.