Les auteurs décrivent un protocole pour identifier des protéines de liaison à l’ARN et de cartographier leurs régions de liaison à l’ARN dans des cellules vivantes psoralen médiée par les UV et spectrométrie de masse.
ARN non codants joue des rôles importants dans plusieurs processus nucléaires, y compris la régulation de l’expression des gènes, structure de la chromatine et la réparation de l’ADN. Dans la plupart des cas, l’action d’ARN non codants est médiée par des protéines dont les fonctions sont à leur tour régies par ces interactions avec les ARN non codants. Conformément à cela, un nombre croissant de protéines impliquées dans des fonctions nucléaires ont été signalé à lier RNA et dans certains cas les régions de liaison à l’ARN de ces protéines ont été cartographiées, souvent par le biais de méthodes laborieux, axée sur le candidat.
Nous rapportons ici un protocole détaillé pour effectuer une identification non biaisée haut-débit, à l’échelle du protéome de leurs régions de liaison à l’ARN et de protéines de liaison à l’ARN. La méthodologie s’appuie sur l’incorporation d’un uridine photoréactive analogique à l’ARN cellulaire, suivi par réticulation UV induite par la protéine-ARN et spectrométrie de masse pour révéler des peptides de RNA-réticulé au sein du protéome. Bien que nous décrivons la procédure pour les cellules souches embryonnaires de souris, le protocole devrait être facilement adapté à une variété de cellules cultivées.
La méthode RBR-ID vise à identifier de nouvelles protéines de liaison à l’ARN (pratiques commerciales restrictives) et de cartographier leurs régions de liaison à l’ARN (IPR) avec une résolution de peptide-niveau pour faciliter la conception des mutants de la liaison à l’ARN et l’enquête de la biologique et biochimique fonctions des interactions de protéine-ARN.
L’ARN est unique parmi les biomolécules car il peut agir comme un messager porteur d’informations génétiques et aussi incorporer des structures tridimensionnelles complexes avec des fonctions biochimiques plus semblables à celles des protéines1,2. Un corps croissant d’évidence suggère que les ARN non codants (ncRNA) joue un rôle important dans divers gènes voies réglementaires et épigénétiques3,4,5 et, en général, ces fonctions de régulation sont véhiculées en concert avec les protéines qui interagir spécifiquement avec un ARN donné. Une importance particulière, un ensemble de protéines qui interagissent a récemment été désigné pour l’ARNnc long intensément étudié (lncRNA) Xist, fournissant de précieuses informations sur la façon dont cette lncRNA intervient dans l’inactivation du chromosome x dans les cellules femelles6,7 ,,8. Notamment, plusieurs de ces protéines interagissant Xist ne contiennent pas de n’importe quel canonique de domaines de liaison à l’ARN9, et leur activité de liaison à l’ARN ne pouvait donc pas être prédite en silico issu de leur séquence primaire seul. Considérant que des milliers de lncRNAs sont exprimés dans une cellule donnée10, il est raisonnable de supposer que bon nombre d’entre eux pourraient agir via des interactions avec encore à découvrir les protéines de liaison à l’ARN (pratiques commerciales restrictives). Une stratégie expérimentale pour identifier ces pratiques commerciales restrictives roman donc grandement faciliterait la tâche de disséquer la fonction biologique de ncRNA.
Les tentatives précédentes pour identifier des pratiques commerciales restrictives empiriquement comptent sur RNA sélection de polyA + couplée à la spectrométrie de masse (MS)11,12,13,14,15. Bien que ces expériences a ajouté beaucoup de protéines à la liste des pratiques commerciales restrictives putatifs, par leur conception, qu’ils pourraient seulement détecter les protéines liés aux transcriptions polyadénylé. Cependant, la plupart des petits ARN et lncRNAs beaucoup ne sont pas polyadénylé. 16 , 17 et leurs protéines interagissants auraient probablement été manqués dans ces expériences. Une étude récente appliquée apprentissage artificiel à des bases de données de protéine-protéine interactome pour identifier les protéines qui co purifié avec de multiples pratiques commerciales restrictives connues et a montré que ces partenaires RBP récurrentes étaient plus susceptibles de posséder des activités de liaison à l’ARN18. Toutefois, cette approche s’appuie sur l’exploitation minière des bases de données existantes grande interaction et peut seulement identifier les protéines qui peuvent être co purifiés dans des conditions non-dénaturisation avec connus aux pratiques commerciales restrictives, ce qui exclut de l’analyse insoluble, intégrée à la membrane et rare protéines.
L’identification d’une protéine comme un bona fide RBP souvent ne cède pas automatiquement les informations sur la fonction biologique ou biochimique de l’interaction de protéine-ARN. Pour remédier à ce point, il est généralement souhaitable d’identifier les domaine et acide aminé résidus protéiques impliqués dans l’interaction afin que des mutants spécifiques peuvent être conçus pour tester la fonction de liaison de RNA dans le contexte de chaque roman RBP19, 20. précédente des efforts déployés par notre groupe et d’autres ont utilisé des fragments de protéines recombinantes et mutants de délétion d’identifier RNA binding régions (IPR)19,20,21,22; Toutefois, ces démarches sont fastidieuses et incompatible avec les analyses de haut débit. Plus récemment, une étude décrit une stratégie expérimentale pour mapper les activités de liaison à l’ARN d’une façon haut-débit à l’aide de la spectrométrie de masse23; Toutefois, cette approche s’est fondée sur une double ARN polyA + sélection et ainsi transportés les mêmes limitations que les approches d’identification RBP décrits ci-dessus.
Nous avons développé une technique, appelée RNA binding région d’identification (IPR-ID), qui exploite la protéine-ARN psoralen et spectrométrie de masse quantitative afin d’identifier des protéines et des régions de protéines interagissent avec l’ARN dans des cellules vivantes sans faire hypothèse sur l’état de polyadénylation RNA, y compris les pratiques commerciales restrictives lié à ARN polyA24. En outre, cette méthode s’appuie exclusivement sur la réticulation et a pas d’exigence sur la solubilité des protéines ou de l’accessibilité et est donc adaptée à la carte des activités de liaison à l’ARN dans les membranes (p. ex. l’enveloppe nucléaire) ou compartiments peu solubles ( par exemple la matrice nucléaire). Nous décrivons les étapes expérimentales pour exécuter RBR-ID pour les noyaux des cellules souches embryonnaires de souris (mESCs) mais avec des modifications mineures ce protocole devrait être adapté à une variété de types de cellules, pourvu qu’ils peuvent intégrer efficacement 4SU de la culture milieu.
Nous décrivons un plan expérimental détaillé pour effectuer RBR-ID dans mESCs et, avec les modifications appropriées, dans n’importe quelle cellule qui peut incorporer 4SU dans l’ARN. Autres types de cellules peuvent exiger l’optimisation de l’approche pour assurer un signal / bruit suffisant. En outre, alors que le protocole décrit ci-après met l’accent sur l’examen des pratiques commerciales restrictives nucléaires, la technologie de RBR-ID devrait être facilement adaptables aux différents compart…
The authors have nothing to disclose.
R.B. a été pris en charge par le programme des boursiers Searle, la W.W. Smith Foundation (C1404) et la marche des dix sous fondation (1-FY-15-344). B.A.G reconnaît l’appui du NIH subventions R01GM110174 et NIH R01AI118891, ainsi que de DOD accorder BC123187P1. R.W.-T. était appuyée par une subvention de formation NIH T32GM008216.
KnockOut DMEM | Fisher Scientific | 10829018 | |
Fetal bovine serum, qualified, US origin | Fisher Scientific | 26140079 | |
L-Glutamine solution 200 mM | Sigma | G7513 | |
Penicillin-Streptomycin solution | Sigma | P0781 | |
MEM Non-essential Amino Acid Solution (100×) | Sigma | M7145 | |
2-Mercaptoethanol | Sigma | M3148 | |
ESGRO Leukemia Inhibitory Factor (LIF) | EMD Millipore | ESG1106 | |
CHIR99021 | Tocris | 4423 | |
PD0325901 | Sigma | PZ0162 | |
Gelatin solution,2% in water | Sigma | G1393 | |
4-thiouridine | Sigma | T4509 | 50 mM stock in water |
Spectrolinker XL-1500 | Fisher Scientific | 11-992-90 | |
Phenylmethanesulfonyl fluoride | Sigma | 78830 | |
IGEPAL CO-630 | Sigma | 542334 | Commercial form of octyl-phenoxy-polyethoxy-ethanol detergent |
Iodoacetamide | Sigma | I6125 | |
Trypsin, sequencing grade | Promega | V5111 | |
Empore solid phase extraction disk | 3M | 66883 | |
OLIGO R3 Reversed – Phase Resin | Fisher Scientific | 1133903 | |
Benzonase | Sigma | E8263 | High purity nuclease |
Sonic Dismembrator Model 100 | Fisher Scientific | discontinued | updated with FB505110 |
HPLC grade acetonitrile | Fisher Chemical | A955-4 | |
HPLC grade water | Fisher Scientific | W6 4 | |
TFA | Fisher Scientific | A11650 | |
Ammonium Bicarbonate | Sigma | A6141 | |
Acetic Acid | Sigma | 49199 | |
Formic Acid | Sigma | F0507 | |
ReproSil-Pur 18-AQ | Dr. Maisch GmbH HPLC | r13.aq.0003 | Packing material for HPLC column |
Capillary for nano columns (75 µm) | Molex | 1068150017 | |
MaxQuant software | Max Planck Institute for Biochemistry | Can perform chromatographic alignment of multiple MS runs |