Summary

Fluxo de trabalho de espectrometria de massa de imunoprecipitação sem rótulos para perfis de interactom nuclear em larga escala

Published: November 17, 2019
doi:

Summary

Descrito é um fluxo de trabalho proteômico para identificar parceiros de interação proteica de uma fração subcelular nuclear usando enriquecimento de imunoafinidade de uma determinada proteína de interesse e espectrometria de massa sem rótulo. O fluxo de trabalho inclui fracionação subcelular, imunoprecipitação, preparação de amostras auxiliadas por filtro, limpeza off-line, espectrometria de massa e um pipeline de bioinformática a jusante.

Abstract

A espectrometria de massa de purificação de imunoafinidade (IP-MS) emergiu como um método quantitativo robusto de identificação de interações proteína-proteína. Esta publicação apresenta um fluxo de trabalho proteômicos de interação completo projetado para identificar interações proteína-proteína de baixa abundância do núcleo que também podem ser aplicados a outros compartimentos subcelulares. Esse fluxo de trabalho inclui fracionação subcelular, imunoprecipitação, preparação de amostras, limpeza off-line, espectrometria de massa sem rótulo de um único tiro e análise computacional a jusante e visualização de dados. Nosso protocolo é otimizado para a detecção de interações compartimentadas e de baixa abundância que são difíceis de identificar a partir de lysates celulares inteiras (por exemplo, interações do fator de transcrição no núcleo) pela imunoprecipitação de proteínas endógenas compartimentos subcelulares fracionados. O pipeline de preparação de amostras descrito aqui fornece instruções detalhadas para a preparação do extrato nuclear de células HeLa, purificação imunoafinidade de proteína de isca endógena e análise quantitativa de espectrometria de massa. Também discutimos considerações metodológicas para a realização de imunoprecipitação em larga escala em experimentos de perfil de interação baseados em espectrometria de massa e fornecemos diretrizes para avaliar a qualidade dos dados para distinguir a verdadeira proteína positiva interações de interações inespecíficas. Esta abordagem é demonstrada aqui, investigando o interactome nuclear da quinase CMGC, DYRK1A, uma proteína de baixa abundância quinase com interações mal definidas dentro do núcleo.

Introduction

O proteoma humano exibe vasta diversidade estrutural e bioquímica através da formação de complexos multisubunidades estáveis e interações de proteína-proteína transitórias. Assim, a identificação de parceiros de interação para uma proteína de interesse é comumente necessária em investigações para desvendar o mecanismo molecular. Os recentes avanços nos protocolos de purificação de afinidade e o advento da instrumentação de espectrometria de massa de alta resolução de varredura rápida permitiram um mapeamento fácil das paisagens de interação proteica em um único experimento imparcial.

Protocolos de interação proteica geralmente empregam sistemas de expressão ectópica com construções de fusão com marca de afinidade para identificar interações proteicas sem a necessidade de anticorpos de alta qualidade reconhecendo uma proteína de interesse1,2. No entanto, os métodos baseados em etiquetas epitope têm várias desvantagens. Interações físicas com o epítopo podem levar à detecção de proteínas copurificantes inespecíficas3. Além disso, a fusão dessas marcas de epitope para o Terminal N ou C de uma proteína pode bloquear interações proteína-proteína nativas, ou interromper o dobramento de proteínas para promover conformações não fisiológicas4. Além disso, os sistemas de expressão ectópica normalmente superexpressam a proteína da isca em concentrações suprafilógicas, o que pode resultar na identificação de interações proteicas artifreais, particularmente para genes sensíveis à dosagem5. Para contornar estas questões, a proteína da isca endógena pode ser imunoprecipitada juntamente com as proteínas associadas a vítimas interagindo, assumindo a disponibilidade de um anticorpo de alta qualidade que reconhece a proteína nativa.

Desde que aqui é um fluxo de trabalho proteômico de interação para detectar o interactome nuclear de uma proteína endógena usando a proteína CMGC kinase DYRK1A como exemplo. Interrupção do número de cópia DYRK1A, nível de atividade ou expressão pode causar grave deficiência intelectual em seres humanos, e letalidade embrionária em camundongos6,7,8,9. A DYRK1A exibe regulação espaçotemporal dinâmica10,e interações proteicas compartimentadas11,12,exigindo abordagens capazes de detectar parceiros de interação de baixa abundância específicos para diferentes compartimentos subcelulares.

Este protocolo emprega fracionação celular de células hela humanas em frações de citossol e nucleoplasm, imunoprecipitação, preparação de amostras para espectrometria de massa e uma visão geral de um pipeline bioinformatic para avaliar a qualidade dos dados e visualizar resultados, com scripts R fornecidos para análise e visualização (Figura 1). Os pacotes de software Proteomics usados neste fluxo de trabalho estão disponíveis gratuitamente para download ou podem ser acessados através de uma interface web. Para obter informações adicionais sobre software e métodos computacionais, tutoriais e instruções detalhados estão disponíveis nos links fornecidos.

Protocol

NOTA: Todas as composições tampão e misturas de protease são descritas na Tabela 1. 1. Preparação de células NOTA: Um material inicial de 1-10 mg de lysato nuclear por réplica é desejado para esta abordagem de espectrometria de massa de imunoprecipitação (IP-MS). As quantidades celulares serão administradas para 1 mg de imunoprecipitações nucleares em triplicado mais controles triplicados. Se estiver usando uma linha celular aderente, aumente as células para 90% de confluência em pratos de 3 x 15 cm por replicar antes da colheita.NOTA: Recomenda-se realizar um mínimo de três imunoprecipitações de replicação para isca e condições de controle. Este protocolo assumirá o uso de controles “apenas contas”, que controlam interações inespecíficas abundantes com as contas, a partir da seção 4. Outros tipos de controles podem ser úteis. Estes são descritos em profundidade na seção de discussão. Lave placas 2x com soro soro lógico amortecida de fosfato (PBS) e células de trippsina usando 3 mL de 0,25% de trippsina por placa de 15 cm. Desça as células a 1.200 x g por 5 min e decantar a trippsina. Para as células suspensas, cresça a uma escala/densidade semelhante para atingir 70 a 80 mg de proteína total. Células de pelotas a 1.200 x g e 4 °C por 5 min. Decant a mídia com cuidado.NOTA: As pelotas podem ser combinadas durante esta etapa para permitir o processamento eficiente usando o fracionamento subcelular em grande escala descrito na seção 2. Lave a pelota de célula2x com PBS + 5 mM MgCl2 complementada com inibidores da protease (IAs) e inibidores da fosfatase (PhIs) (ver Tabela 1).NOTA: As pelotas de células podem ser congeladas em nitrogênio líquido e armazenadas a -80 °C até ficarem prontas para fracionamento. 2. Preparação do extrato nuclear NOTA: Inibidores de protease e fósforo devem ser adicionados aos buffers de fracionamento dentro de 30 minutos de uso. Se congelado, descongele as pelotas celulares por 15 min em 1x pelota volume de frio Buffer A + PIs / PhIs. Coloque a pelota de célula em um nonut a 4 °C para ajudar na resuspensão durante o descongelamento. Caso contrário, resuspender a pelota celular do passo 1.3 em 1x pelota volume Buffer A + PIs / PhIs. Pelota a 2.000 x g e 4 °C por 10 min. Decant o buffer. Suspenda as células com 5x o volume de células embaladas com Buffer A e incubar no gelo por 20 min. Pelota a 2.000 x g e 4 °C por 10 min. Decant o buffer e resuspender com 2x original embalado volume de células Buffer A + PIs / PhIs e dounce ~ 7x com “A”/ pilão solto. Centrífuga o liceu por 10 min a 2.000 x g e 4 °C. Cuidadosamente pipeta fora do congelamento supernatant e flash com nitrogênio líquido. Guarde o lysate a -80 °C. O supernatant desta etapa é a fração subcelular citossólica.NOTA: A pelota nuclear pode ser conservada durante esta etapa congelando com nitrogênio líquido e armazenando em -80 °C Resuspenda a pelota com volume de pelotas de 0,9 x de Buffer B + IDas/ PhIs e misture em um nutator por 5 min a 4 °C. Para lyse os núcleos, dounce 20x com um pilão mais apertado “B”. Misture o lysate nuclear em um nutator por 30 min em 4 °C para que seja homogêneo. Centrífuga o lysate nuclear por 30 min a 21.000 x g a 4 °C. Pipeta fora do supernatant e salvar como um extrato de proteína nuclear solúvel.NOTA: O tratamento nuclease da pelota nuclear resultante permite a recuperação de uma fração de proteína associada à cromatina. Diálise o extrato nuclear solúvel contra buffer C + IAs por 3 h a 4 °C. Corte um comprimento apropriado de tubos de diálise de largura de 24 mm com um peso molecular de 8 kDa cortado. Pexa um lado da tubulação e carregue nucleoplasm no tubo. Depois de carregar o liceu, aperte a outra extremidade e submerte em um recipiente de vidro limpo contendo Buffer C + PIs. Centrífuga o extrato/nucleoplasm nuclear dilacerado a 21.000 x g a 4 °C por 30 min. Aliquot 3x 20 μL volumes de extrato nuclear para validação de fracionamento por borrão ocidental. O extrato nuclear usado para análise IP-MS pode ser citado e flash congelado em nitrogênio líquido e armazenado a -80 °C, se necessário. 3. Validação de fracionamento subcelular Complete um ensaio proteico para determinar a concentração de proteínas do lysato nuclear. Um ensaio de proteína de ácido bicinchoninic fornece sensibilidade suficiente para a plicação a jusante. Carga 20 μg de ambas as frações citossólicas e nucleares em um gel SDS-PAGE para a análise de borrão ocidental como descrito anteriormente13. Pule as pistas ao carregar para evitar a descaracterização de uma amostra. Sonda a mancha ocidental para p84 (THOC1) como um marcador nuclear, e GAPDH como um marcador citosólico. Determine a extensão do fracionamento pela proporção de marcador citosólico na fração nuclear e vice-versa.NOTA: Os anticorpos para outros marcadores nucleares e citosólicos podem ser usados. 4. Imunoprecipitação de proteína de isca nuclear endógena NOTA: Recomenda-se usar tubos de baixa retenção a partir deste ponto. Isso reduzirá a ligação inespecífica aos tubos durante o manuseio da amostra e evitará perda supérse de amostra. Além disso, certifique-se de que o Grau H2O do LCMS seja usado para preparar buffers para as etapas restantes. Prepare uma mistura de proteína a/g de contas para cada réplica, combinando 12,5 μL de volume de contas para tubos de proteína A e proteína-G em tubos de microcentrífuga. Armazenar os estoques de contas como uma pasta contendo 20% de etanol. Determine a concentração de contas dentro do chorume % (v/v) e pipeta o volume necessário usando uma ponta de pipeta que foi cortada na ponta para garantir que as contas podem digitar a ponta. Lave a proteína A/G mistura de contas 2x com 300 μL de IP Buffer 1. Gire as contas a 1.500 x g a 4 °C por 1 min e tampão decant. Prepare as contas A/G de proteína de anticorpos: Para ligar o anticorpo às contas, adicione 300 μL de IP Buffer 1 e 10 μg do anticorpo desejado. Permita que a mistura de contas/anticorpos aperte em um nutator a 4 °C durante a noite. Para controles somente de contas, não adicione nenhum anticorpo.NOTA: Um total de 10 μg de anticorpos por réplica pode ser usado como ponto de partida, mas a quantidade exata precisará ser otimizada para cada anticorpo individual e escala do lysato usado no experimento Descongele as lisatas nucleares do passo 2.10 em um banho de água e aliquot volumes apropriados em tubos de microcentrífuga de baixa retenção para 1 mg de entrada de proteína por réplica. Gire o lysate a 16.000 x g por 30 min e transfira o supernatant para um tubo novo. Adicione 1 μL de benzonase (250 unidades/μL) por 1 mg do lysate nuclear e da rocha em um nutator em 4 °C para 10-15 min. Prepare contas para a limpeza do lysate. Adicione 12,5 μL de cada proteína A e proteína G contas para 1,5 mL tubos de baixa retenção como na etapa 4.1. Lave 2x com IP Wash Buffer 1 + PIs e decantar o buffer. Adicione 1 mg do lysate nuclear aos grânulos da etapa 4.5. Incubar enquanto balança em um nutator para 1 h a 4 °C. Centrífuga saqueou lysates em 1.500 x g e 4 °C por 1 min. Enquanto as lysates nucleares estão incubando com contas na etapa 4.5.1, lave as contas A/G de proteína de anticorpos 2x com IP Buffer 1 + PIs. Centrífuga a 1.500 x g e 4 °C por 1 min e decantar o buffer. Transfira o lysate nuclear pré-limpo do passo 4.6.1 para as contas A/G de proteína de anticorpos. Incubação enquanto balança em um nutator em 4 °C para 4 h. Centrífuga após a incubação em 1.500 x g e 4 °C por 1 min. Transfira o supernatant em tubos rotulados como o fluxo através de cada réplica. Lave as contas A/G de proteína de anticorpos com 1 mL de IP Buffer 2 + PIs. Centrífuga a 1.500 x g e 4 °C por 1 min, tampão decantar e repetir para um total de 3x. Lave as contas 2x com 1 mL de IP Buffer 1+ PIs centrífuga como na etapa anterior. Certifique-se de que todo o buffer seja removido após a última lavagem. Elute 2x com 20 μL de 0,1 M glicina (pH 2.75) por 30 min cada. Certifique-se de que os tubos estão balançando durante a incubação com o amortecedor de elução. Gire a 750 x g e 4 °C por 1 min e pipeta fora do supernatant após cada incubação de 30 min.NOTA: Enquanto o método de glicina de baixo pH descrito aqui elutes maioria das proteínas isca, algumas interações de anticorpos-antígenos exigem condições tampão mais rigorosas. O congelamento de flash escapa em nitrogênio líquido e armazena a -80 °C. 5. Preparação da amostra NOTA: A insulina cravada nas amostras de elução de imunoprecipitação ajuda na recuperação de proteínas durante a precipitação e processamento de amostras de ácido tricloroacético (TCA), o que é importante para proteínas de isca endógenas de baixa abundância. Descongele os escapa à temperatura ambiente se congelado. Coloque as amostras no gelo e adicione 10 μL de insulina 1,0 mg/mL para cada 100 μL de eluate. Vortex e, em seguida, adicionar imediatamente 10 μL de 1% de sódio desoxicóxia. Vortex a amostra novamente e adicionar 30 μL de 20% TCA seguido por um vórtice final. Incubar as amostras no gelo por 20 min, em seguida, centrífuga em 21.000 x g a 4 °C para 30 min. Aspirar o supernatant e adicionar 0,5 mL de acetona que foi pré-refrigerada a -20 °C. Vortex e, em seguida, girar em 21.000 x g e 4 °C para 30 min. Repita esta etapa. Aspirar o supernatant e ar secar a pelota restante na parte inferior do tubo. Prepare a amostra para espectrometria de massa usando um método modificado de preparação para amostras auxiliadas por filtro (FASP), otimizado para reduzir o manuseio da amostra, conforme descrito abaixo de14. Resuspenda a pelota de proteína do passo 5.1.4 com 30 μL de SDS Alkylation Buffer (ver Tabela 1). Incubar a amostra em um bloco de calor de 95 °C por 5 min. Deixe esfriar à temperatura ambiente por 15 min antes de preceder o próximo passo. Adicione 300 μL da solução ua e 30 μL de 100 mM TCEP para cada amostra. Carregue esta solução em um filtro centrífuga de 30k. Gire o filtro centrífuga a 21.000 x g à temperatura ambiente por 10 min.NOTA: A proteína da isca e seus interainteragires putativos devem ser vinculados ao filtro neste momento. No entanto, o fluxo pode ser mantido, no caso de haver um problema com o filtro. Lave o filtro com 250 μL de UA e centrífuga a 21.000 x g por 10 min. Decantar o fluxo através e repetir para um total de 3x. Lave o filtro com 100 μL de 100 mM Tris pH 8.5 e centrífuga a 21.000 x g por 10 min. Decantar o fluxo através e repetir para um total de 3x. Adicione 3 μL de 1 μg/μL Lys C resuspenso em 0,1 M Tris pH 8.5. Preencha os filtros até a marca de 100 μL e deixe digerir por 1 h a 37 °C enquanto balança em um nonut. Adicionar 1 μL de 1 μg/ μL MS grau trypsin. Misture suavemente e permitir que a trippsina incubar com a amostra durante a noite em 37 °C, enquanto balançando em um nutator. Centrífuga a 21.000 x g para 20 min para elute o peptídeo do filtro.NOTA: Várias rodadas de centrífuga podem ser necessárias para recuperar todos os eluate. Se isso não for feito, há um potencial para perda grave da amostra. Dessalte os peptídeos usando colunas de rotação C18. Siga o protocolo fornecido pelo fabricante. Resuspende o peptídeo liofilizado em 7 μL de 0,1% TFA em 5% de acetônio. Sonicate a amostra de 3 min para garantir que os peptídeos foram resuspensos. Desça a 14.000 x g por 10 min. Transfira o peptídeo resuspendido para um frasco de amostra apropriado para carregar no sistema líquido de cromatografia e espectrometria de massa (LC/MS). 6. Adequação do sistema LC/MS NOTA: Devido à pequena escala e geralmente menor abundância de proteína saqueadas de amostras purificadas por afinidade, é fundamental que a plataforma LC/MS opere com uma sensibilidade máxima e robustez. Adicione 1 mL de lc/ms grau ácido fórmico para 1 L de lc/ ms grau de água para celular fase A, e adicionar 1 ml de lc/ ms grau de ácido fórmico para 1 L de LC / MS grau acetonitrile para móvel fase B. Prepare ou instale uma coluna capilar de 75 μm fundida-sílica repleta de resina C18 de fase invertida de 75 μm, que tem ≥250 mm de comprimento. Os melhores resultados serão tidos com uma injeção direta de amostras na coluna. Purgar o sistema de cromatografia líquida de desempenho ultra (UPLC) com novas fases móveis. Com uma coluna C18 instalada, estabeleça uma taxa de fluxo estável e eletrospray com um emissor adequado (ou seja, 20 μm id x 360 μm od puxado para uma ponta de 10 μm). Mantenha a coluna a 40 a 60 °C. Teste o desempenho geral do sistema LC/MS injetando um padrão complexo de controle de qualidade, como 100 a 200ng de um resumo téptico de lysato de célula inteira HeLa. Elute com um gradiente adequado para uma amostra complexa (ou seja, 2-3 h gradiente tempo de elução). Estabelecer um desempenho do sistema de base do peptídeo e identificações de proteínas.NOTA: Para obter melhores resultados, 3.000 a 5.000 ou mais identificações de proteínas de 20.000 a 35.000 peptídeos únicos proporcionarão um desempenho ideal para amostras experimentais. Para adequação rotineira do sistema LC/MS, injete 100 a 200 fmol ou menos de um único padrão de digerem proteína, como o Bovine Serum Albumin (BSA). Elute com um gradiente curto (ou seja, 20 a 30 min).NOTA: Várias injeções de um resumo de proteínas ajudarão a estabelecer o desempenho do sistema LC/MS de base, e repetir a injeção após cada amostra IP-MS fornecer uma medida do desempenho do sistema durante todo o experimento e permite a detecção de deriva de instrumentos, o que pode influenciar experimentos sem rótulo. Uma linha de base das intensidades de pico individuais selecionadas e formas de pico informará sobre o desempenho de EmS, LC e coluna. Para evitar sobrecarregar a coluna analítica, carregue uma pequena porção (15 a 30% do total) de uma amostra experimental na coluna e separe usando um gradiente adequado para amostras complexas (ou seja, 2 a 3 h). Se o número de identificações de proteínas for insatisfatório, carregue toda a amostra na coluna. Executar um único padrão de digerem proteínas entre amostras para monitorar o desempenho do sistema LC/MS e a ressés da amostra. Vários padrões podem ser necessários para reduzir a ressárea da amostra dependendo das amostras. 7. Processamento de dados Baixe o pacote de software proteômico MaxQuant encontrado na https://www.maxquant.org/.NOTA: Isso será usado para processar o arquivo de dados RAW MS da etapa 6.6 em tabelas de dados de iDs de proteína, nomes de genes e valores quantitativos associados à identificação destes para análise a jusante. Selecione a carga dentro do subcabeçalho de dados de entrada da guia Raw Data. Abra o local do arquivo onde os arquivos brutos do MS são armazenados e selecione arquivos brutos para cada execução de MS/MS. Clique na guia específica do grupo e selecione Digestão. Dentro da lista de enzimas selecione LysC e clique na seta direita para adicionar esta enzima na lista que será usada na pesquisa. Em seguida, selecione instrumento e certifique-se de que o tipo de instrumento correto aparece na lista de drop-down na parte superior da tela. Deixe outros parâmetros de pesquisa específicos do grupo nas configurações padrão. Clique na aba Global Parameters e selecione sequências. Adicione o arquivo FASTA apropriado para a taxonomia que será usada nesta pesquisa. Peptídeos não serão atribuídos corretamente se isso não for feito. Para o proteoma humano, baixe o arquivo FASTA da UniProt em https://www.uniprot.org/help/human_proteome. Dentro da aba Parâmetros Globais, clique na Quantificaçãode Proteínas. Dentro dos Peptídeos para quantificação drop-down menu, selecione Unique + Razor.NOTA: MaxQuant oferece quantidade alternativa de proteínas através de quantificação absoluta baseada em intensidade (iBAQ) e quantidade sem rótulo (LFQ). No entanto, as informações de contagem de peptídeos são suficientes para a análise a jusante neste protocolo15. Na parte inferior esquerda da interface MaxQuant, selecione o número de processadores a serem usados para a pesquisa. Isso afetará diretamente o período de tempo necessário para a corrida, então selecione o maior número possível para isso). Clique Comece na parte inferior esquerda da tela para iniciar a execução. Selecione a guia Performance na parte superior da tela para ver o andamento da pesquisa. Quando a corrida estiver concluída, abra o arquivo proteingroups.txt em Perseus, uma plataforma de computação proteômica ou outro programa de planilha para visualizar os dados16. Use Perseus para remover contaminantes comuns e atinge sequências de proteínas invertidas. Siga a documentação detalhada perseus em http://www.coxdocs.org/doku.php?id=perseus:user:use_cases:interactions.NOTA: Abrir o arquivo proteingroups.txt em software de análise (por exemplo, Excel) corromperá automaticamente certos nomes de genes e proteínas. Analise dados experimentais usando o Repositório de Contaminantes para Purificação de Afinidade (CRAPome). Registre uma conta neste repositório http://crapome.org/ e siga o tutorial conforme necessário17,18. Use o fluxo de trabalho analisar seus dados encontrado na página inicial do CRAPome. Selecione controles externos que correspondam ao sistema de purificação de afinidade usado neste experimento de interação.NOTA: Esses controles podem ser usados para calcular um enriquecimento de alteração de segunda dobra que é útil para detectar contaminantes comuns. Gerar um arquivo de entrada da saída proteingroups.txt de MaxQuant usando Perseus ou uma aplicação de planilha adequada. Detalhes para formatação manual podem ser encontrados em http://crapome.org/?q=fileformatting. Alternativamente, use o script R fornecido “export_CRAPomeSAINT_Input_File.R” para gerar o arquivo de entrada SAINT/CRAPome. Veja README.txt nos arquivos de codificação suplementar. Executar uma análise para determinar o enriquecimento de mudança de dobrae e a probabilidade de SAINT (Análise de Significado do INTeractome) para cada proteína de isca na imunoprecipitação. Certifique-se de que os Controlos de Usuáriossejam selecionados no menu suspenso fc-a, ‘crapome controlos’ ou ‘todos os controles’ são selecionados no FC-B drop-down e probabilidade pontuação é selecionada para gerar probabilidades SAINT. Quando a corrida estiver concluída, veja a saída que está disponível em “Resultados de Análise”, juntamente com uma identificação de trabalho. Baixe a matriz de dados dos “Resultados de Análise” para futuras plotagem e visualização de dados. As proteínas do lote em função do FC-A (IPs vs. controles do usuário) e da probabilidade SAINT seguindo os Scripts R fornecidos em Arquivos de Codificação Suplementar.NOTA: Um conjunto de scripts R é fornecido para a produção de parcelas de FC-A vs. PROBABILIDADE SAINT e iBAQ vs log2 (abundância de proteína), colorida pela faixa de valor p ajustado a partir da análise empírica Bayes das intensidades sem rótulo. Os detalhes da análise estatística diferencial e plotagem são encontrados em README.txt e o script R “main_differential_analysis. R” nos arquivos de codificação suplementar. Avalie onde as proteínas interaginadas conhecidas da proteína da isca são classificadas por FC-A e SAINT. Faça um corte de FC-A > 3,00 e SAINT > 0,7 para experimentos de isca única em triplicado como ponto de partida.NOTA: A seleção de pontos de corte para um interador de “alta confiança” e um interador de “baixa confiança” deve ser informada por informações biológicas. 8. Visualização de dados NOTA: Existem muitos programas que podem visualizar efetivamente os dados proteômicos (por exemplo, R, Perseus, Cytoscape, STRING-DB). Analisar a conectividade entre hits de alta confiança e enriquecimento funcional desses interainteragires pode ser uma estratégia útil para priorizar hits para maior validação e caracterização funcional. Baixe a Cytoscape, uma ferramenta de visualização de rede de código aberto em19de https://cytoscape.org/download.html . Prepare um arquivo de entrada para dados de interação como um arquivo delimitado de guia formatado com três colunas: isca (nó de origem), presa (nó alvo), tipo de interação (tipo de borda). Isso pode ser feito em Perseus ou qualquer programa de planilha de sua escolha. Selecione a Tabela de Importação do ícone de arquivo para o canto superior esquerdo do programa (designado por uma seta para baixo e uma matriz no ícone). Cytoscape irá automatizar os dados de interação em uma rede pronta para formatação e design personalizados. Selecione a guia Style no painel de controle da Cytoscape e clique nas praças da coluna Def para ajustar o atributo para toda a rede. Selecione nós ou bordas específicas na rede e selecione o quadrado dentro da coluna Byp. do menu de estilo para contornar as configurações padrão e ajustar apenas objetos selecionados. Como alternativa, clique no menu suspenso no topo do menu de estilo para ver os formatos de rede pré-definidos.NOTA: Os dados de interação proteína-proteína STRING-db podem ser integrados a esta rede neste momento, seja manualmente através do arquivo de entrada ou através de várias ferramentas de enriquecimento disponíveis como plug-ins em Cytoscape, http://apps.cytoscape.org/20. Um plug-in recomendado do cytoscape para a análise do enriquecimento é encontrado em http://apps.cytoscape.org/apps/cluego21. Para aumentar a confiança no conjunto de dados gerado neste fluxo de trabalho, realize experimentos recíprocos ip-MS ou IP-western que visam proteínas de interesse de presas como isca.

Representative Results

A maior parte da massa proteica identificada num experimento IP-MS consiste em proteínas inespecíficas. Assim, um dos principais desafios de um experimento IP-MS é a interpretação de quais proteínas são interainteragires de alta confiança versus interainteragires inespecíficos. Para demonstrar os parâmetros cruciais utilizados na avaliação da qualidade dos dados, o estudo analisou imunoprecipitações triplicadas de 5 mg de extração nuclear de HeLa utilizando apenas um controle de contas. A primeira verificação interna para garantir que um experimento IP-MS seja confiável é se a proteína da isca classifica como uma das proteínas enriquecidas mais altas identificadas tanto pela mudança de dobrada sobre o controle quanto a probabilidade de SAINT. Neste caso, a isca DYRK1A classificado entre as três principais proteínas enriquecidas sobre o controle (Figura 2A,B). Em um estudo de interactome nuclear da DYRK1A utilizando quatro anticorpos independentes, um corte FC-A de >3.00 e corte de probabilidade SAINT >0.7 forneceu um corte rigoroso para a identificação de ambos os interacultores novos e previamente validados22. Quando aplicado a este experimento, uma separação clara pode ser vista entre os interainteragires de alta confiança e >95% das proteínas copurified identificadas como inespecíficas(Figura 2A,B). Aplicar tanto um enriquecimento de mudança de dobra e limite de probabilidade aumenta a rigor, exigindo um enriquecimento consistentemente elevado de IDs de proteína em réplicas biológicas. Além da pontuação estatística, o fluxo de trabalho de análise crapome também mapeia interações relatadas anteriormente em dados de isca-presa23. Embora esse mapeamento possa ser útil para incocar interações de alta e baixa confiança, as interações relatadas anteriormente podem pontuar mal pelas probabilidades FC-A e SAINT, potencialmente indicando que muitas interações conhecidas de uma determinada isca podem existir apenas em tipos específicos de células, contextos ou organelas. Por exemplo, o conjunto de dados DYRK1A, os valores do interajador do iREF FC-A foram tão baixos quanto 0,45, representando um enriquecimento muito baixo sobre o controle (Figura 2C). Para evitar a inflação de falsos positivos, o limiar estatístico deve ser realizado de uma forma que priorize a rigor sobre a redução de falsos negativos. Note-se que a detecção dessas interações foi independente da abundância de proteínas(Figura 2C). O número absoluto calculado de cada interação iREF nas células HeLa não mostrou correlação com os níveis de detecção de um parceiro de interação pelo IP-MS24. Cytoscape serve como uma ferramenta eficaz para visualizar várias camadas de dados de interação19. No experimento de imunoprecipitação DYRK1A descrito aqui, o uso combinado de FC-A > 3.0 e SAINT > 0,9 reduziu a lista de interainteragires de alta confiança para seis proteínas (Figura 2D). No entanto, ao aplicar um corte FC-A de > 3.0 isoladamente, oito proteínas adicionais foram adicionadas à rede. Esses interainteragem adicionais de proteínatêm alta conectividade com os interainteragires já na rede, sugerindo que eles estão associados em complexos semelhantes ou funções funcionais. Para este fim, evidências do STRING-DB de interações proteína-proteína foram integradas a esta rede como linhas azuistracejadas 20. Enquanto este experimento de isca única, triplicado fornece uma amostra limitada da rede de interação DYRK1A completa, o uso de iscas adicionais, réplicas e integração de grandes conjuntos de dados públicos podem ser usados para expandir a rede de interações de alta confiança. Os cortes estatísticos serão, portanto, específicos para cada experimento individual e precisarão ser avaliados minuciosamente. Figura 1: Fluxo de trabalho proteômico representativo para IP-MS subcelular. As células são cultivadas em frascos de fundo redondo 4 L ou pratos de cultura de tecido de 15 cm e colhidos ao mesmo tempo para fracionamento subcelular. As células são fracionadas em um citosólico, nuclear, e uma pelota nuclear, e imunoprecipitações são feitas a partir de 1-10 mg de lysato nuclear usando um ou vários anticorpos reconhecendo a mesma isca. A preparação de amostras auxiliadas por filtro (FASP) e a limpeza de amostras off-line são realizadas antes da espectrometria de massa de tiro único. Um pipeline computacional a jusante é usado para processar dados em dados de interação interpretáveis. Clique aqui para ver uma versão maior deste número. Figura 2: Dados representativos para um experimento IP-MS de anticorpo único de isca única. (A)FC-A e SAINT probabilidade saída de crapome análise fluxo de trabalho para um experimento ideal usando um único anticorpo para a quinase DYRK1A (n = 3). Os controles somente em contas foram usados para comparação. As linhas sólidas vermelhas representam cortes fixados no FC-A > 3,00 e SAINT > 0,7. (B) A abundância de proteínas MaxQuant estima a saída (iBAQ) contra a proporção de log2 de abundância de proteínas no IP DYRK1A para controlar, colorido pela faixa de valor p ajustado da análise empírica de Bayes das intensidades sem rótulo. C)FC-A e número estimado de proteínas listadas como proteínas interagindo no banco de dados iRef23,24. (D) Visualização da rede Cytoscape dos interainteragires DYRK1A. Nós azuis = FC-A > 3,00, SAINT > 0,7. Nós laranja = FC-A > 3,00. Bordas pretas = proteínas identificadas como interainteragires no experimento IPMS. Borda azul tracejada = interação SAINT entre a proteína presa (confiança > 0,150). Clique aqui para ver uma versão maior deste número. Mistura do inibidor da protease (PI) Reagente Concentração final Metabisulfito de sódio 1 mM Benzamidina 1 mM Dithiothreitol (DTT) Dithiothreitol (DTT) 1 mM Flúor fenilmetanosulfonyl (PMSF) 0,25 mM Mistura inibidora da fosfatase (PhI) Reagente Concentração final Microcystin LR 1 μM Ortovanadate do sódio 0,1 mM Flúor de sódio 5 mM Buffers de fracionamento subcelular: Buffer A pH 7.9 Buffer A pH 7.9 Reagente Concentração final HEPES HEPES 10 mM MgCl2 MgCl2 1,5 mM Kcl 10 mM Buffer B pH 7,9 Reagente Concentração final HEPES HEPES 20 mM MgCl2 MgCl2 1,5 mM Nacl 420 mM Ácido tetraástico etilediamina (EDTA) 0,4 mM Glicerol 25% (v/v) Buffer C pH 7,9 Reagente Concentração final HEPES HEPES 20 mM MgCl2 MgCl2 2 mM Kcl 100 mM Ácido tetraástico etilediamina (EDTA) 0,4 mM Glicerol 20% (v/v) Amortecedores de imunoprecipitação: Tampão IP 1 Reagente Concentração final HEPES HEPES 20 mM Kcl 150 mM Edta 0,1 mM NP-40 NP-40 0,1% (v/v) Glicerol 10% (v/v) Tampão IP 2 Reagente Concentração final HEPES HEPES 20 mM Kcl 500 mM Edta 0,1 mM NP-40 NP-40 0,1% (v/v) Glicerol 10% (v/v) SDS Alkylation Buffer pH 8.5 SDS Alkylation Buffer pH 8.5 Reagente Concentração final Sds 4% (v/v) Cloroátamida 40 mM TCEP TCEP 10 mM Tris 100 mM UA pH 8,5 UA pH 8,5 Reagente Concentração final Uréia 8 M Tris 0,1 m * use HPLC grau H2O Tabela 1: Composições tampão Arquivos de codificação suplementar. Por favor, clique aqui para baixar este arquivo.

Discussion

O fluxo de trabalho proteômico descrito aqui fornece um método eficaz para identificar interainteragidores de proteínas de alta confiança para uma proteína de interesse. Essa abordagem diminui a complexidade da amostra por meio de fração subcelular e se concentra em aumentar os parceiros de interação de identificação por meio da preparação robusta da amostra, da limpeza de amostras off-line e do rigoroso controle de qualidade do sistema LC-MS. A análise de dados a jusante descrita aqui permite uma avaliação estatística simples das proteínas identificadas como copurifying com a isca. No entanto, devido a um elevado número de variáveis experimentais (escala, linha celular, escolha de anticorpos), cada experimento requer diferentes cortes e considerações em relação à visualização e enriquecimento de dados.

A primeira consideração de design em um experimento IP-MS é a seleção de anticorpos que serão usados para copurificação da proteína de interesse, juntamente com seus parceiros interagindo. Embora a disponibilidade de anticorpos comerciais tenha se expandido para cobrir porções maiores do proteoma humano nas últimas décadas, ainda existem muitas proteínas para as quais os reagentes são limitados. Além disso, os anticorpos que foram validados para aplicações tais como a deteção ocidental do borrão podem ser incapazes do enriquecimento seletivo da proteína do alvo em uma experiência do immunoprecipitation. Antes de realizar um experimento proteômico de interação em larga escala, sugere-se para completar um IP a partir de um prato de 10 cm de confluente de 90%, ou número de célula equivalente, e sonda para a proteína alvo de interesse pela mancha ocidental. Se mais de um único anticorpo estiver disponível para imunoprecipitação, também é sugerido para selecionar múltiplos anticorpos reconhecendo epítopos dentro de diferentes porções da proteína. A ligação de um anticorpo a uma proteína de isca pode ocluir a interface de ligação necessária para parceiros de interação putativo. A seleção de um epítopo secundário para a proteína da isca aumentará a cobertura do perfil de interação identificado por um experimento baseado em espectrometria de massa.

Uma segunda consideração principal encontra-se na seleção do controle apropriado para distinguir interações da elevado-confiança das interações low-confidence ou nonspecific daquelas identificadas como copurifying com a isca. O controle mais rigoroso para um experimento IP-MS é completar a imunoprecipitação de uma linha de células CRISPR KO da isca. Tal controle permite a identificação e filtragem de proteínas inespecíficas que se ligam diretamente ao anticorpo, em vez da proteína da isca. Nos casos em que a geração de uma linha de células CRISPR KO de cada proteína isca não é viável, um controle igg-bead do mesmo isótipo do anticorpo isca pode ser usado. Em experimentos que empregam um painel de anticorpos que representam várias espécies, o uso de um controle de contas só pode ser apropriado, mas aumentará a taxa de falsos positivos identificados como interainteragires de alta confiança.

A seleção da linha celular usada em um experimento IP-MS depende de vários fatores-chave. Expressão proteica e localização são em grande parte dependentes do tipo de célula. Enquanto estimativas de expressão de RNA podem ser encontradas para a maioria dos genes em muitas linhas celulares comumente usadas, a expressão de proteína está mal correlacionada com a expressão de RNA e deve ser determinada experimentalmente25. As linhas celulares em que uma proteína de isca é expressa em número de cópia muito baixo devem ser evitadas para contornar problemas associados a aumentos drásticos na escala de cultura celular que podem ser necessários. Note-se, no entanto, que a preparação da amostra pode ser otimizada para a detecção de proteínas de abundância muito baixa. O método de preparação de amostras auxiliado pelo filtro (FASP), embora robusto, pode causar uma perda de mais de 50% do peptídeo em uma amostra. A preparação de amostras aprimorada em fase sólida de um único pote (SP3) é um método eficiente de geração de amostras para análise de espectrometria de massa que minimiza a perda de amostras26. O aumento da recuperação possibilitada pelo método SP3 de preparação de amostras pode ser uma alternativa útil neste fluxo de trabalho para a quantificação de proteínas que se aproximam do limite de detecção.

Este fluxo de trabalho proteômico tem sido aplicado em muitas iscas nucleares, incluindo quinases, ligas de ubiquitina E3 e membros de andaimes de complexos multisubunidades. Assumindo a validação adequada de reagentes de anticorpos, a execução bem-sucedida deste fluxo de trabalho resultará na detecção de parceiros de interação nuclear de proteína de alta confiança para uma proteína de interesse.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabalho foi apoiado por uma concessão do Grand Challenge para W.M.O. do Linda Crnic Institute for Down syndrome e por um acordo de cooperação DARPA 13-34-RTA-FP-007. Gostaríamos de agradecer a Jesse Kurland e Kira Cozzolino por suas contribuições na leitura e comentando sobre o manuscrito.

Materials

0.25% Trypsin, 0.1% EDTA Thermo Fisher Scientific 25200056
1.5 ml low-rention microcentrifuge tubes Fisher Scientific 02-681-320
4-20% Mini PROTEAN TGX Precast Protein Gels Bio-Rad 4561096
acetone (HPLC) Thermo Fisher Scientific A949SK-4
Amicon Ultra 0.5 ml 30k filter column Millipore Sigma UFC503096
Benzamidine Sigma-Aldrich 12072
benzonase Sigma-Aldrich E1014
Chloroacetamide Sigma-Aldrich C0267
Dialysis tubing closure Caroline Biological Supply Company 684239
DTT Sigma-Aldrich 10197777001
EDTA Sigma-Aldrich EDS
GAPDH antibody Santa Cruz Biotechnology Sc-47724
Glycerol Fisher Scientific 887845
Glycine Sigma-Aldrich G8898
HeLa QC tryptic digest Pierce 88329
HEPES Fisher Scientific AAJ1692630
insulin Thermo Fisher Scientific 12585014
iodoacetamide Sigma-Aldrich I1149
KONTES Dounce homogenizer 7 ml VWR KT885300-0007
Large Clearance pestle 7ml VWR KT885301-0007
Lysyl endopeptidase C VWR 125-05061
Magnesium Chloride Sigma-Aldrich 208337
Microcystin enzo life sciences ALX-350-012-C100
Nonidet P 40 Substitute solution Sigma-Aldrich 98379
p84 antibody GeneTex GTX70220
Phosphate Buffered Saline
Pierce BCA Protein Assay Kit Thermo Fisher Scientific 23227
Pierce BSA Protein Digest, MS grade Thermo Fisher Scientific 88341 LCMS QC
Pierce C18 spin columns Thermo Fisher Scientific PI-89873
Pierce Trypsin Protease, MS Grade Thermo Fisher Scientific 90057 For mass spectrometry sample prep
PMSF Sigma-Aldrich P7626
Potassium Chloride Sigma-Aldrich P9541
Protein A Sepharose CL-4B GE Healthcare Bio-Sciences 17-0780-01
Protein G Sepharose 4 Fast Flow GE Healthcare Bio-Sciences 17-0618-01
SDS Sigma-Aldrich L3771
Silica emitter tip Pico TIP FS360-20-10
Small Clearance pestle 7ml VWR KT885302-0007
Sodium Chloride Sigma-Aldrich S3014
Sodium Fluoride Sigma-Aldrich 201154
Sodium metabisulfite Sigma-Aldrich 31448
Sodium orthovanadate Sigma-Aldrich S6508
Spectra/ Por 8 kDa 24 mm dialysis tubing Thomas Scientific 3787K17
TC Dish 150, Standard Sarstedt 83.3903 Tissue culture dish for adherent cells
TCA Sigma-Aldrich T9159
TCEP Thermo Scientific PG82080
TFA Thermo Fisher Scientific 28904
Thermo Scientific Orbitrap Fusion MS Thermo Fisher Scientific
Trizma Base Sigma-Aldrich T6066
Urea Thermo Fisher Scientific 29700
Waters ACQUITY M-Class UPLC Waters
Waters ACQUITY UPLC M-Class Column Reversed-Phase 1.7µm Spherical Hybrid (1.7 µm, 75 µm x 250 mm) Waters 186007484 nanoflow C18 column

References

  1. Varjosalo, M., et al. The protein interaction landscape of the human CMGC kinase group. Cell Reports. 3, 1306-1320 (2013).
  2. Kimple, M. E., Brill, A. L., Pasker, R. L. Overview of Affinity Tags for Protein Purification. Current Protocols in Protein Science. 73, (2013).
  3. Mahmood, N., Xie, J. An endogenous ‘nonspecific’ protein detected by a His-tag antibody is human transcription regulator YY1. Data in Brief. 2, 52 (2015).
  4. Zordan, R. E., Beliveau, B. J., Trow, J. A., Craig, N. L., Cormack, B. P. Avoiding the ends: internal epitope tagging of proteins using transposon Tn7. Genetics. 200, 47-59 (2015).
  5. Gibson, T. J., Seiler, M., Veitia, R. A. The transience of transient overexpression. Nature Methods. 10, 715-721 (2013).
  6. Bronicki, L. M., et al. Ten new cases further delineate the syndromic intellectual disability phenotype caused by mutations in DYRK1A. European Journal of Human Genetics. 23, 1482-1487 (2015).
  7. Antonarakis, S. E. Down syndrome and the complexity of genome dosage imbalance. Nature Reviews Genetics. , (2016).
  8. Dowjat, W. K., et al. Trisomy-driven overexpression of DYRK1A kinase in the brain of subjects with Down syndrome. Neuroscience Letters. 413, 77-81 (2007).
  9. Fotaki, V., et al. Dyrk1A haploinsufficiency affects viability and causes developmental delay and abnormal brain morphology in mice. Molecular and Cellular Biology. 22, 6636-6647 (2002).
  10. Hämmerle, B., Elizalde, C., Tejedor, F. J. The spatio-temporal and subcellular expression of the candidate Down syndrome gene Mnb/Dyrk1A in the developing mouse brain suggests distinct sequential roles in neuronal development. European Journal of Neuroscience. 27, 1061-1074 (2008).
  11. Funakoshi, E., et al. Overexpression of the human MNB/DYRK1A gene induces formation of multinucleate cells through overduplication of the centrosome. BMC Molecular and Cell Biology. 4, 12 (2003).
  12. Yu, D., Cattoglio, C., Xue, Y., Zhou, Q. A complex between DYRK1A and DCAF7 phosphorylates the C-terminal domain of RNA polymerase II to promote myogenesis. Nucleic Acids Research. , 1-14 (2019).
  13. Towbin, H., Staehelin, T., Gordon, J. Electrophoretic transfer of proteins from polyacrylamide gels to nitrocellulose sheets: procedure and some applications. Proceedings of the National Academy of Sciences of the United States of America. 76, 4350-4354 (1979).
  14. Wiśniewski, J. R., Zougman, A., Nagaraj, N., Mann, M. Universal sample preparation method for proteome analysis. Nature Methods. 6, 359-362 (2009).
  15. Tyanova, S., Temu, T., Cox, J. The MaxQuant computational platform for mass spectrometry-based shotgun proteomics. Nature Protocols. 11, 2301-2319 (2016).
  16. Tyanova, S., et al. The Perseus computational platform for comprehensive analysis of (prote)omics data. Nature Methods. 13, 731-740 (2016).
  17. Mellacheruvu, D., et al. The CRAPome: A contaminant repository for affinity purification-mass spectrometry data. Nature Methods. 10, 730-736 (2013).
  18. Choi, H., et al. SAINT: Probabilistic scoring of affinity purificationg-mass spectrometry data. Nature Methods. 8, 70-73 (2011).
  19. Shannon, P., et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks. Genome Research. 13, 2498-2504 (2003).
  20. Szklarczyk, D., et al. The STRING database in 2017: quality-controlled protein-protein association networks, made broadly accessible. Nucleic Acids Research. 45, 362-368 (2017).
  21. Bindea, G., et al. ClueGO: a Cytoscape plug-in to decipher functionally grouped gene ontology and pathway annotation networks. Bioinformatics. 25, 1091-1093 (2009).
  22. Guard, S. E., et al. The nuclear interactome of DYRK1A reveals a functional role in DNA damage repair. Scientific Reports. 9, 6539 (2019).
  23. Razick, S., Magklaras, G., Donaldson, I. M. iRefIndex: A consolidated protein interaction database with provenance. BMC Bioinformatics. 9, 405 (2008).
  24. Kulak, N. A., Pichler, G., Paron, I., Nagaraj, N., Mann, M. Minimal, encapsulated proteomic-sample processing applied to copy-number estimation in eukaryotic cells. Nature Methods. 11, 319-324 (2014).
  25. Liu, Y., Beyer, A., Aebersold, R. On the Dependency of Cellular Protein Levels on mRNA Abundance. Cell. 165, 535-550 (2016).
  26. Hughes, C. S., et al. Ultrasensitive proteome analysis using paramagnetic bead technology. Molecular Systems Biology. 10, 757 (2014).

Play Video

Cite This Article
Guard, S. E., Ebmeier, C. C., Old, W. M. Label-Free Immunoprecipitation Mass Spectrometry Workflow for Large-scale Nuclear Interactome Profiling. J. Vis. Exp. (153), e60432, doi:10.3791/60432 (2019).

View Video