La spécificité de la séquence est essentielle à la régulation des gènes. Les protéines réglementaires qui reconnaissent des séquences spécifiques sont importantes pour la régulation des gènes. Définir des sites de liaison fonctionnels pour de telles protéines est un problème biologique difficile. Une approche itérative pour l’identification d’un site de liaison pour une protéine liant l’ARN est décrite ici et s’applique à toutes les protéines liant l’ARN.
La régulation génique joue un rôle important dans toutes les cellules. Des étapes transcriptionnelles, post-transcriptionnelles (ou de traitement de l’ARN), translationnelles et post-traductionnelles sont utilisées pour réguler des gènes spécifiques. Les protéines de liaison à l’acide nucléique spécifiques à la séquence ciblent des séquences spécifiques pour contrôler l’expression des gènes spatiaux ou temporels. Les sites de liaison dans les acides nucléiques sont généralement caractérisés par une analyse mutationnelle. Cependant, de nombreuses protéines d’intérêt n’ont pas de site de liaison connu pour une telle caractérisation. Ici nous décrivons une approche pour identifier les emplacements de liaison précédemment inconnus pour les protéines RNA-contraignantes. Il s’agit d’une sélection itérative et d’amplification des séquences à partir d’un pool de séquences randomisée. Après plusieurs tours de ces étapes-transcription, liaison et amplification- les séquences enrichies sont séquencées pour identifier un site de liaison préféré. Le succès de cette approche est surveillé à l’aide d’essais de liaison in vitro. Par la suite, des essais fonctionnels in vitro et in vivo peuvent être utilisés pour évaluer la pertinence biologique des séquences sélectionnées. Cette approche permet l’identification et la caractérisation d’un site de liaison jusque-là inconnu pour toute protéine liant l’ARN pour laquelle il existe un test visant à séparer les ARN liés aux protéines et non liés.
En biologie cellulaire, la régulation des gènes joue un rôle central. À une ou plusieurs étapes le long de la voie d’expression génique, les gènes ont le potentiel d’être régulés. Ces étapes incluent la transcription (initiation, allongement et terminaison) ainsi que l’épissage, la polyadenylation ou la formation de fin de 3′, l’exportation d’ARN, la traduction d’ARNm, et la décomposition/localisation des transcriptions primaires. À ces étapes, les protéines nucléiques liant l’acide modulent la régulation des gènes. L’identification des sites de liaison pour ces protéines est un aspect important de l’étude du contrôle génétique. L’analyse mutationnelle et la comparaison phylogénétique de séquence ont été employées pour découvrir des séquences réglementaires ou des emplacements protéine-contraignants dansles acides nucléiques, tels que des promoteurs, des emplacements d’épissage, des éléments de polyadenylation, et des signaux translationnels 1,, 2 (en) , 3 (en) , 4.
L’épissage pré-ARNm est une étape intégrale lors de l’expression et de la régulation des gènes. La majorité des gènes des mammifères, y compris ceux chez l’homme, ont des introns. Une grande fraction de ces transcriptions est alternativement épissée, produisant l’ARNm multiple et les isoformes de protéine du même gène ou transcription primaire. Ces isoformes ont des rôles spécifiques aux cellules et développementaux dans la biologie cellulaire. Le site d’épissage de 5 pi, le point de branche et le site d’épissage de polypyrimidine/3′ sont des signaux d’épissage critiques qui sont soumis à la réglementation. En régulation négative, un site d’épissage par ailleurs fort est réprimé, tandis que dans une réglementation positive, un site d’épissage par ailleurs faible est activé. Une combinaison de ces événements produit une pléthore d’isoformes fonctionnellement distincts. Les protéines liant l’ARN jouent un rôle clé dans ces événements d’épissage alternatifs.
De nombreuses protéines sont connues dont le site de liaison ou les cibles de l’ARN restent à identifier5,6. Lier les protéines régulatrices à leurs cibles ou séquences biologiques en aval est souvent un processus complexe. Pour ces protéines, l’identification de leur ARN cible ou de leur site de liaison est une étape importante dans la définition de leurs fonctions biologiques. Une fois qu’un site de liaison est identifié, il peut être caractérisé davantage à l’aide d’analyses moléculaires et biochimiques standard.
L’approche décrite ici présente deux avantages. Tout d’abord, il peut identifier un site de liaison jusque-là inconnu pour une protéine d’intérêt. Deuxièmement, un avantage supplémentaire de cette approche est qu’elle permet simultanément la mutagénèse de saturation, qui serait autrement laborieuse pour obtenir des informations comparables sur les exigences de séquence dans le site de liaison. Ainsi, il offre un outil plus rapide, plus facile et moins coûteux pour identifier les sites de liaison des protéines dans l’ARN. À l’origine, cette approche (SELEX ou Systematic Evolution of Ligands par eXponential enrichment) a été utilisée pour caractériser le site de liaison de la polymérase d’ADN bactériophage T4 (protéine du gène 43), qui chevauche le site de liaison ribosome dans son propre ARNm. Le site de liaison contient une séquence de boucle de 8 bases, représentant 65 536 variantes randomisées pour l’analyse7. Deuxièmement, l’approche a également été utilisée indépendamment pour montrer que des sites de liaison spécifiques ou des aptamers pour différents colorants peuvent être sélectionnés à partir d’un pool d’environ 13 séquences8. En fait, cette approche a été largement utilisée dans de nombreux contextes différents pour identifier les aptamers (ARN ou séquences d’ADN) pour lier de nombreux ligands, tels que les protéines, les petites molécules et les cellules, et pour la catalyse9. À titre d’exemple, un aptamer peut faire la distinction entre deux dérivés de la xanthine, la caféine et la théophylline, qui diffèrent par la présence d’un groupe méthyle dans la caféine10. Nous avons largement utilisé cette approche (SELEX ou sélection-amplification itérative) pour étudier comment les protéines liant l’ARN fonctionnent dans l’épissage ou l’épissage du règlement11, qui sera la base de la discussion ci-dessous.
La bibliothèque aléatoire: Nous avons utilisé une bibliothèque aléatoire de 31 nucléotides. La longueur de la bibliothèque aléatoire était vaguement basée sur l’idée que le facteur d’épissage général U2AF65 se lie à une séquence entre la séquence de point de branche et le site d’épissage de 3′. En moyenne, l’espacement entre ces signaux d’épissage chez les métazoaires est de l’ordre de 20 à 40 nucléotides. Une autre protéine Sex-létale a été connu pour se lier à une séquence réglementaire mal caractérisée près du site d’épissage 3′ de son objectif pré-ARNm, transformateur. Ainsi, nous avons choisi une région aléatoire de 31 nucléotides, flanquéde de sites de liaison d’apprêt avec des sites d’enzymes de restriction pour permettre l’amplification de PCR et l’attachement du promoteur de polymère d’ARN T7 pour la transcription in vitro. La taille ou la complexité théorique de la bibliothèque était de 431 ou environ 1018. Nous avons utilisé une petite fraction de cette bibliothèque pour préparer notre pool d’ARN aléatoire (1012-1015) pour les expériences décrites ci-dessous.
Les protéines liant l’acide nucléique sont d’importants régulateurs du développement animal et végétal. Une exigence clé pour la procédure SELEX est le développement d’un analyse qui peut être utilisé pour séparer les fractions d’ARN liées aux protéines et non liées. En principe, cet analyse peut être un jeu in vitro de liaison comme l’analyse de liaison par filtre, l’analyse de changement de mobilité du gel, ou un analyse de liaison de matrice19 pour les protéines recombinantes,…
The authors have nothing to disclose.
L’auteur remercie les National Institutes of Health pour le financement passé.
Gel Electrophoresis equipment | Standard | Standard | |
Glass Plates | Standard | Standard | |
Nitrocellulose | Millipore | HAWP | |
Nitrocellulose | Schleicher & Schuell | PROTRAN | |
polyacrylamide gel solutions | Standard | Standard | |
Proteinase K | NEB | P8107S | |
Recombinant PTB | Laboratory Preparation | Not applicable | |
Reverse Transcriptase | NEB | M0277S | |
Vacuum manifold | Fisher Scientific | XX1002500 | Millipore 25mm Glass Microanalysis Vacuum Filter |
Vacuum manifold | Millipore | XX2702552 | 1225 Sampling Vacuum Manifold |
X-ray films | Standard | Standard |