Summary

Explorer l'espace de séquence pour identifier les sites de liaison pour les protéines de liaison de l'ARN réglementaires

Published: August 09, 2019
doi:

Summary

La spécificité de la séquence est essentielle à la régulation des gènes. Les protéines réglementaires qui reconnaissent des séquences spécifiques sont importantes pour la régulation des gènes. Définir des sites de liaison fonctionnels pour de telles protéines est un problème biologique difficile. Une approche itérative pour l’identification d’un site de liaison pour une protéine liant l’ARN est décrite ici et s’applique à toutes les protéines liant l’ARN.

Abstract

La régulation génique joue un rôle important dans toutes les cellules. Des étapes transcriptionnelles, post-transcriptionnelles (ou de traitement de l’ARN), translationnelles et post-traductionnelles sont utilisées pour réguler des gènes spécifiques. Les protéines de liaison à l’acide nucléique spécifiques à la séquence ciblent des séquences spécifiques pour contrôler l’expression des gènes spatiaux ou temporels. Les sites de liaison dans les acides nucléiques sont généralement caractérisés par une analyse mutationnelle. Cependant, de nombreuses protéines d’intérêt n’ont pas de site de liaison connu pour une telle caractérisation. Ici nous décrivons une approche pour identifier les emplacements de liaison précédemment inconnus pour les protéines RNA-contraignantes. Il s’agit d’une sélection itérative et d’amplification des séquences à partir d’un pool de séquences randomisée. Après plusieurs tours de ces étapes-transcription, liaison et amplification- les séquences enrichies sont séquencées pour identifier un site de liaison préféré. Le succès de cette approche est surveillé à l’aide d’essais de liaison in vitro. Par la suite, des essais fonctionnels in vitro et in vivo peuvent être utilisés pour évaluer la pertinence biologique des séquences sélectionnées. Cette approche permet l’identification et la caractérisation d’un site de liaison jusque-là inconnu pour toute protéine liant l’ARN pour laquelle il existe un test visant à séparer les ARN liés aux protéines et non liés.

Introduction

En biologie cellulaire, la régulation des gènes joue un rôle central. À une ou plusieurs étapes le long de la voie d’expression génique, les gènes ont le potentiel d’être régulés. Ces étapes incluent la transcription (initiation, allongement et terminaison) ainsi que l’épissage, la polyadenylation ou la formation de fin de 3′, l’exportation d’ARN, la traduction d’ARNm, et la décomposition/localisation des transcriptions primaires. À ces étapes, les protéines nucléiques liant l’acide modulent la régulation des gènes. L’identification des sites de liaison pour ces protéines est un aspect important de l’étude du contrôle génétique. L’analyse mutationnelle et la comparaison phylogénétique de séquence ont été employées pour découvrir des séquences réglementaires ou des emplacements protéine-contraignants dansles acides nucléiques, tels que des promoteurs, des emplacements d’épissage, des éléments de polyadenylation, et des signaux translationnels 1,, 2 (en) , 3 (en) , 4.

L’épissage pré-ARNm est une étape intégrale lors de l’expression et de la régulation des gènes. La majorité des gènes des mammifères, y compris ceux chez l’homme, ont des introns. Une grande fraction de ces transcriptions est alternativement épissée, produisant l’ARNm multiple et les isoformes de protéine du même gène ou transcription primaire. Ces isoformes ont des rôles spécifiques aux cellules et développementaux dans la biologie cellulaire. Le site d’épissage de 5 pi, le point de branche et le site d’épissage de polypyrimidine/3′ sont des signaux d’épissage critiques qui sont soumis à la réglementation. En régulation négative, un site d’épissage par ailleurs fort est réprimé, tandis que dans une réglementation positive, un site d’épissage par ailleurs faible est activé. Une combinaison de ces événements produit une pléthore d’isoformes fonctionnellement distincts. Les protéines liant l’ARN jouent un rôle clé dans ces événements d’épissage alternatifs.

De nombreuses protéines sont connues dont le site de liaison ou les cibles de l’ARN restent à identifier5,6. Lier les protéines régulatrices à leurs cibles ou séquences biologiques en aval est souvent un processus complexe. Pour ces protéines, l’identification de leur ARN cible ou de leur site de liaison est une étape importante dans la définition de leurs fonctions biologiques. Une fois qu’un site de liaison est identifié, il peut être caractérisé davantage à l’aide d’analyses moléculaires et biochimiques standard.

L’approche décrite ici présente deux avantages. Tout d’abord, il peut identifier un site de liaison jusque-là inconnu pour une protéine d’intérêt. Deuxièmement, un avantage supplémentaire de cette approche est qu’elle permet simultanément la mutagénèse de saturation, qui serait autrement laborieuse pour obtenir des informations comparables sur les exigences de séquence dans le site de liaison. Ainsi, il offre un outil plus rapide, plus facile et moins coûteux pour identifier les sites de liaison des protéines dans l’ARN. À l’origine, cette approche (SELEX ou Systematic Evolution of Ligands par eXponential enrichment) a été utilisée pour caractériser le site de liaison de la polymérase d’ADN bactériophage T4 (protéine du gène 43), qui chevauche le site de liaison ribosome dans son propre ARNm. Le site de liaison contient une séquence de boucle de 8 bases, représentant 65 536 variantes randomisées pour l’analyse7. Deuxièmement, l’approche a également été utilisée indépendamment pour montrer que des sites de liaison spécifiques ou des aptamers pour différents colorants peuvent être sélectionnés à partir d’un pool d’environ 13 séquences8. En fait, cette approche a été largement utilisée dans de nombreux contextes différents pour identifier les aptamers (ARN ou séquences d’ADN) pour lier de nombreux ligands, tels que les protéines, les petites molécules et les cellules, et pour la catalyse9. À titre d’exemple, un aptamer peut faire la distinction entre deux dérivés de la xanthine, la caféine et la théophylline, qui diffèrent par la présence d’un groupe méthyle dans la caféine10. Nous avons largement utilisé cette approche (SELEX ou sélection-amplification itérative) pour étudier comment les protéines liant l’ARN fonctionnent dans l’épissage ou l’épissage du règlement11, qui sera la base de la discussion ci-dessous.

La bibliothèque aléatoire: Nous avons utilisé une bibliothèque aléatoire de 31 nucléotides. La longueur de la bibliothèque aléatoire était vaguement basée sur l’idée que le facteur d’épissage général U2AF65 se lie à une séquence entre la séquence de point de branche et le site d’épissage de 3′. En moyenne, l’espacement entre ces signaux d’épissage chez les métazoaires est de l’ordre de 20 à 40 nucléotides. Une autre protéine Sex-létale a été connu pour se lier à une séquence réglementaire mal caractérisée près du site d’épissage 3′ de son objectif pré-ARNm, transformateur. Ainsi, nous avons choisi une région aléatoire de 31 nucléotides, flanquéde de sites de liaison d’apprêt avec des sites d’enzymes de restriction pour permettre l’amplification de PCR et l’attachement du promoteur de polymère d’ARN T7 pour la transcription in vitro. La taille ou la complexité théorique de la bibliothèque était de 431 ou environ 1018. Nous avons utilisé une petite fraction de cette bibliothèque pour préparer notre pool d’ARN aléatoire (1012-1015) pour les expériences décrites ci-dessous.

Protocol

REMARQUE : La figure 1 fournit un résumé des étapes clés du processus de sélection-amplification itérative (SELEX). 1. Génération d’un modèle de bibliothèque aléatoire Synthétiser l’amorce avant 5′- GTAATACGACTCACTATAGGGTGATCAGATTCTGATCCA-3′ et l’amorce inverse 5′- GCGACGGATCCAAGCTTCA-3′ par synthèse chimique sur un synthétiseur d’ADN.REMARQUE : Les amorces et la bibliothèque aléatoire peuvent être synthétisées commerci…

Representative Results

Les observations suivantes démontrent une sélection-amplification réussie (SELEX). Tout d’abord, nous avons analysé le pool 0 et les séquences sélectionnées pour se lier à la protéine utilisée pour l’approche itératif de sélection-amplification. La figure 2 montre que la protéine de liaison polypyrimidine-tract de mammifères (PTB) montre une liaison à peine détectable à la séquence du pool 0, mais une forte affinité pour le pool de séquenc…

Discussion

Les protéines liant l’acide nucléique sont d’importants régulateurs du développement animal et végétal. Une exigence clé pour la procédure SELEX est le développement d’un analyse qui peut être utilisé pour séparer les fractions d’ARN liées aux protéines et non liées. En principe, cet analyse peut être un jeu in vitro de liaison comme l’analyse de liaison par filtre, l’analyse de changement de mobilité du gel, ou un analyse de liaison de matrice19 pour les protéines recombinantes,…

Disclosures

The authors have nothing to disclose.

Acknowledgements

L’auteur remercie les National Institutes of Health pour le financement passé.

Materials

Gel Electrophoresis equipment Standard Standard
Glass Plates Standard Standard
Nitrocellulose Millipore HAWP
Nitrocellulose Schleicher & Schuell PROTRAN
polyacrylamide gel solutions Standard Standard
Proteinase K NEB P8107S
Recombinant PTB Laboratory Preparation Not applicable
Reverse Transcriptase NEB M0277S
Vacuum manifold Fisher Scientific XX1002500 Millipore 25mm Glass Microanalysis Vacuum Filter
Vacuum manifold Millipore XX2702552 1225 Sampling Vacuum Manifold
X-ray films Standard Standard

References

  1. Pribnow, D. Nucleotide sequence of an RNA polymerase binding site at an early T7 promoter. Proceedings of the National Academy of Sciences of the United States of America. 72 (3), 784-788 (1975).
  2. Breathnach, R., Chambon, P. Organization and expression of eucaryotic split genes coding for proteins. Annual Review of Biochemistry. 50, 349-383 (1981).
  3. Wickens, M., Stephenson, P. Role of the conserved AAUAAA sequence: four AAUAAA point mutants prevent messenger RNA 3′ end formation. Science. 226 (4678), 1045-1051 (1984).
  4. Kozak, M. An analysis of 5′-noncoding sequences from 699 vertebrate messenger RNAs. Nucleic Acids Research. 15 (20), 8125-8148 (1987).
  5. Ray, D., Ha, K. C. H., Nie, K., Zheng, H., Hughes, T. R., Morris, Q. D. RNAcompete methodology and application to determine sequence preferences of unconventional RNA-binding proteins. Methods. 118, 3-15 (2017).
  6. Jolma, A., et al. Multiplexed massively parallel SELEX for characterization of human transcription factor binding specificities. Genome Research. 20 (6), 861-873 (2010).
  7. Tuerk, C., Gold, L. Systematic evolution of ligands by exponential enrichment: RNA ligands to bacteriophage T4 DNA polymerase. Science. 249 (4968), 505-510 (1990).
  8. Ellington, A. D., Szostak, J. W. In vitro selection of RNA molecules that bind specific ligands. Nature. 346 (6287), 818-822 (1990).
  9. Cowperthwaite, M. C., Ellington, A. D. Bioinformatic analysis of the contribution of primer sequences to aptamer structures. Journal of Molecular Evolution. 67 (1), 95-102 (2008).
  10. Jenison, R. D., Gill, S. C., Pardi, A., Polisky, B. High-resolution molecular discrimination by RNA. Science. 263 (5152), 1425-1429 (1994).
  11. Singh, R., Valcarcel, J., Green, M. R. Distinct binding specificities and functions of higher eukaryotic polypyrimidine tract-binding proteins. Science. 268 (5214), 1173-1176 (1995).
  12. Milligan, J. F., Uhlenbeck, O. C. Synthesis of small RNAs using T7 RNA polymerase. Methods in Enzymology. 180, 51-62 (1989).
  13. Sambrook, J., Fritsch, E. F., Maniatis, T. . Molecular Cloning. , (1989).
  14. Sanger, F., Nicklen, S., Coulson, A. R. DNA sequencing with chain-terminating inhibitors. Proceedings of the National Academy of Sciences of the United States of America. 74 (12), 5463-5467 (1977).
  15. Robida, M., Sridharan, V., Morgan, S., Rao, T., Singh, R. Drosophila polypyrimidine tract-binding protein is necessary for spermatid individualization. Proceedings of the National Academy of Sciences of the United States of America. , (2010).
  16. Banerjee, H., Rahn, A., Gawande, B., Guth, S., Valcarcel, J., Singh, R. The conserved RNA recognition motif 3 of U2 snRNA auxiliary factor (U2AF(65)) is essential in vivo but dispensable for activity in vitro. RNA. 10 (65), 240-253 (2004).
  17. Gorlach, M., Burd, C. G., Dreyfuss, G. The determinants of RNA-binding specificity of the heterogeneous nuclear ribonucleoprotein C proteins. J Biol Chem. 269 (37), 23074-23078 (1994).
  18. Valcarcel, J., Singh, R., Zamore, P. D., Green, M. R. The protein Sex-lethal antagonizes the splicing factor U2AF to regulate alternative splicing of transformer pre-mRNA. Nature. 362 (6416), 171-175 (1993).
  19. Wilson, C., Szostak, J. W. Isolation of a fluorophore-specific DNA aptamer with weak redox activity. Chemistry & Biology. 5 (11), 609-617 (1998).
  20. Joyce, G. F. Reflections of a Darwinian Engineer. Journal of Molecular Evolution. 81 (5-6), 146-149 (2015).
  21. McKeague, M., Derosa, M. C. Challenges and opportunities for small molecule aptamer development. Journal of Nucleic Acids. 2012, 748913 (2012).
  22. Lambert, N., Robertson, A., Jangi, M., McGeary, S., Sharp, P. A., Burge, C. B. RNA Bind-n-Seq: quantitative assessment of the sequence and structural binding specificity of RNA binding proteins. Molecular Cell. 54 (5), 887-900 (2014).
  23. Szeto, K., et al. RAPID-SELEX for RNA aptamers. PLoS One. 8 (12), e82667 (2013).
  24. Rohloff, J. C., et al. Nucleic Acid Ligands With Protein-like Side Chains: Modified Aptamers and Their Use as Diagnostic and Therapeutic Agents. Molecular Therapy – Nucleic Acids. 3, e201 (2014).
  25. Gold, L., et al. Aptamer-based multiplexed proteomic technology for biomarker discovery. PLoS One. 5 (12), e15004 (2010).
  26. Zhuo, Z., et al. Recent Advances in SELEX Technology and Aptamer Applications in Biomedicine. International Journal of Molecular Sciences. 18 (10), (2017).
  27. Blind, M., Blank, M. Aptamer Selection Technology and Recent Advances. Molecular Therapy. Nucleic Acids. 4, e223 (2015).
  28. Jijakli, K., et al. The in vitro selection world. Methods. 106, 3-13 (2016).

Play Video

Cite This Article
Singh, R. Exploring Sequence Space to Identify Binding Sites for Regulatory RNA-Binding Proteins. J. Vis. Exp. (150), e59635, doi:10.3791/59635 (2019).

View Video