Summary

Massively Parallel Reporter Assays in kultivierte Säugerzellen

Published: August 17, 2014
doi:

Summary

The genetic reporter assay is a well-established and powerful tool for dissecting the relationship between DNA sequences and their gene regulatory activities. Coupling candidate regulatory elements to reporter genes that carry identifying sequence tags enables massive parallelization of these assays.

Abstract

The genetic reporter assay is a well-established and powerful tool for dissecting the relationship between DNA sequences and their gene regulatory activities. The potential throughput of this assay has, however, been limited by the need to individually clone and assay the activity of each sequence on interest using protein fluorescence or enzymatic activity as a proxy for regulatory activity. Advances in high-throughput DNA synthesis and sequencing technologies have recently made it possible to overcome these limitations by multiplexing the construction and interrogation of large libraries of reporter constructs. This protocol describes implementation of a Massively Parallel Reporter Assay (MPRA) that allows direct comparison of hundreds of thousands of putative regulatory sequences in a single cell culture dish.

Introduction

Massively Parallel Reporter Assays (MPRA) erlauben Multiplex-Messung der Transkriptionsregulationsaktivitäten Tausende bis Hunderttausende von DNA-Sequenzen 1-7. In ihrer allgemeinsten Ausführung wird durch Multiplexen Koppeln jeder Sequenz von Interesse ein synthetisches Reportergen, das eine Identifizierungssequenz Tag stromabwärts eines offenen Leserasters enthält erzielt (ORF Abbildung 1). Nach der Transfektion der RNA-Isolierung und Sequenzierung des Tief 3 'Enden der Reportergen-Transkripten, können die relativen Aktivitäten der gekoppelten Sequenzen aus der relativen Häufigkeit der Ermittlung Variablen abgeleitet werden.

Figur 1
Abbildung 1. Übersicht über MPRA. Eine Bibliothek von MPRA Reporterkonstrukte durch Kopplung mutmaßlichen regulatorischen Sequenzen zu synthetischen gebautReportergene, die aus einem "inerten" ORF bestehen (wie GFP oder Luciferase), gefolgt von einem identifizierenden Sequenz-Tag. Die Bibliothek wird in Massen in eine Population von kultivierten Zellen transfiziert und transkribiert Reporter mRNA wird anschließend zurückgewonnen. Deep sequencing wird verwendet, um die Anzahl der Vorkommen der einzelnen Tag unter den Reporter-mRNAs und den transfizierten Plasmiden zählen. Das Verhältnis der mRNA zählt über Plasmid Zahlen können verwendet werden, um die Aktivität der entsprechenden Regulationssequenz abzuleiten. Angepasst mit Erlaubnis von Melnikow, et al 2.

MPRA kann zu einer breiten Vielzahl von experimentellen Designs angepasst werden, einschließlich 1) umfassende Mutagenese einzelner Gen regulatorische Elemente, 2) Überprüfung auf neue regulatorische Elemente in einem Ort von Interesse, 3) Testen der Wirkung der natürlichen genetischen Variation in einer Menge von putativen Promotoren, Enhancer oder Silencer, und 4) semi-rationale Konstruktion von synthetischen regulatorische Elemente. Libibliotheken von Sequenzvarianten können unter Verwendung einer Vielzahl von Verfahren, einschließlich Oligonukleotid-Synthese von Bibliotheken (OLS) auf programmierbaren Mikroarrays 2,3,6,7, Montage von degenerierten Oligonukleotiden 1,4, kombinatorische Ligations 8 und Fragmentierung der genomischen DNA, 5 erzeugt werden.

Dieses Protokoll beschreibt die Konstruktion einer Bibliothek von Promotorvarianten mit OLS und die pMPRA1 und pMPRAdonor1 Vektoren (Addgene IDs 49349 und 49352 sind; http://www.addgene.org) transiente Transfektion dieser Bibliothek in kultivierte Säugerzellen und die anschließende Quantifizierung der Promotor-Aktivitäten von deep sequencing der ihnen zugeordneten Tags (Tag-Seq). Frühere Versionen von diesem Protokoll wurden in der Forschung in Melnikov et al. Nature Biotechnology 30, 271-277 (2012) und in Kheradpour et al. Genome Research 23, 800-811 (2013) berichtet, verwendet.

Protocol

1. Sequenz Design und Synthese Beginnen MPRA mit dem Design und der Synthese von Sequenzen, die Marktaktivität untersucht werden. Für die Kompatibilität mit dem pMPRA Vektor-Serie, entwerfen jede Sequenz benutzen die folgende Vorlage: 5'-ACTGGCCGCTTCACTG- var -GGTACCTCTAGA- Tag -AGATCGGAAGAGCGTCG-3 ', wo var bezeichnet die Sequenz zu untersuchenden und Tag bedeutet ein oder mehrere Tags identifizieren. Die beiden variablen Regionen (var und Tag) werden durch ein Paar von KpnI (GGTACC) und XbaI (TCTAGA) Restriktionsstellen getrennt, um gerichtete Ligation eines Reportergens Fragment zwischen ihnen zu erleichtern. Zusätzlich werden zwei verschiedene SfiI (GGCCNNNNNGGCC) Seiten durch PCR zugesetzt werden, um gerichtete Ligation in die pMPRA Rückgrat zulassen. Die variablen Regionen dürfen nicht zusätzliche Kopien eines dieser Restriktionsstellen enthalten. Falls erforderlich, eine oder mehrere dieser Restriktionsenzyme ersetzt werden kann, Solange die Ersatz 1) ermöglichen effizientes Schneiden in der Nähe der Enden der DNA-Moleküle, und 2) nicht an anderer Stelle in der Vektorsequenz geschnitten. Siehe Diskussion für weitere Informationen. Rufen Sie die in Tabelle 1 von einem kommerziellen Anbieter aufgelistet erforderlich Primer. MPRA_SfiI_F GCTAAGGGCCTAACTGGCCGCTTCACTG MPRA_SfiI_R GTTTAAGGCCTCCGTGGCCGACGCTCTTC TAGseq_P1 AATGATACGGCGACCACCGAGATCTACACT CTTTCCCTACACGACGCTCTTCCGATCT TAGseq_P2 CAAGCAGAAGACGGCATACGAGAT [index] GT GACTGGAGTTCAGACGTGTGCTCTTCCGATCTCGAGG Tabelle 1. Primer-Sequenzen. [Index] bezeichnet eine 6 bis 8 nt Index Sequenz für Multiplex-Sequenzierung verwendet. Erhalten mindestens 8 TagSeq-P2 Primer mit unterschiedlichen Indizes. Alleder Primer sollten durch HPLC oder PAGE gereinigt werden. Oligonukleotid-Bibliotheken können aus einer kommerziellen Lieferanten oder Kerneinrichtung erhalten werden, oder durch Verwendung eines programmierbaren Microarray-basierte Oligonucleotidsynthesizer wie vom Hersteller beschrieben erzeugt. Resuspendieren der OLS-Produkte in 100 ul TE 0,1 Puffer. Führen Sie die Oligonukleotid-Bibliotheken auf einem 10% TBE-Harnstoff-Denaturierung Polyacrylamid-Gel. Legen Sie ca. 1 pmol pro Bahn und Fleck mit ssDNA empfindlichen Fluoreszenzfarbstoff, um ihre Qualität (2A) zu beurteilen. Wenn eine diskrete Bande, die den Volllängen-Oligonukleotide können visualisiert werden (Abbildung 2A, Bahnen 1 und 2), die Verbrauchs den entsprechenden Acrylamid-Gel Slice und eluieren Oligonukleotide in 100 ul TE 0,1 über Nacht bei Raumtemperatur unter Schütteln. Andernfalls fahren Sie mit der RAW OLS Aufhängung. Verstärken und fügen SfiI Schwänze mit dem Oligonukleotid-Bibliothek mit Hilfe Emulsions-PCR 9 </ sup>. Bis 50 ul PCR-Reaktionsgemischen, wie in Tabelle 2 beschrieben. Dann verbinden sich mit 300 ul Öl und Tensid-Mischung aus der Emulsion und Micellula DNA Purification Kit und Vortex für 5 min bei 4 ° C ist. Reagens 1x Volume (ul) Herculase II Fusion DNA Polymerase 0,5 5x Herculase II Reaktionspuffer 10 dNTP (10 mM jeweils) 1,25 BSA (20 mg / ml) 1,25 Primer MPRA_SfiI_F (25 uM) 0,25 Primer MPRA_SfiI_R (25 uM) 0,25 OLS-Vorlage (1-10 attomol) variiert Nuklease-freies Wasser 50 ve_content "> Tabelle 2. Emulsion PCR-Reaktionsmischung (Wasserphase). Verwenden Sie die Konzentration, die die maximale Ausbeute der Amplifikation Produkte gibt ohne das Auftreten von Artefakten (siehe Abschnitt 1.12). Abgeben der resultierenden Emulsion in PCR-Röhrchen und führen 20 Zyklen PCR (2 min bei 95 ° C, 20 x [20 sec 95 ° C, 20 sec bei 55 ° C, 30 sec bei 72 ° C], 3 min bei 95 ° C). Pool und brechen jede 350 ul Emulsion-PCR-Reaktion durch Zugabe von 1 ml Isobutanol und kurz vortexen und dann reinigen die Verstärkung Produkt mit einem DNA-Aufreinigung Spalte. Führen Sie einen aliquoten auf einem 2% bzw. 4% Agarose-Gel, um artefaktfreie Verstärkung (2B) zu überprüfen. Figur 2: Herstellung von Oligonukleotid-Synthesebibliotheken. A) </sTrong> Drei verschiedene rohe Oligonukleotid-Synthese-Bibliotheken (OLS) auf denaturierenden 10% TBE-Harnstoff-Polyacrylamid-Gelen laufen. Banden, die in voller Länge Oligonukleotide (*) visualisiert und aus Bibliotheken 1 ausgeschnitten werden und 2. Bibliothek 3 enthält Schadstoffe, die mit PAGE Reinigung stören. Wenn dies der Fall ist, fahren Sie mit PCR-Amplifikation. B) Die Produkte von offenen und Emulsions-PCR-Amplifikation der gleichen Oligonukleotid-Bibliothek ausgeführt auf einem Agarosegel. PCR-Amplifikation von komplexen Oligonukleotid-Bibliotheken erstellt häufig chimären Produkte und andere Artefakte, die als höhere und niedrigere Bands auftreten können. Emulsions-PCR können diese Artefakte zu minimieren. 2. Library Construction Vorbereitung eines linearisierten Plasmid-Backbone durch Verdau mit SfiI pMPRA1 Vektor bei 50 ° C für 2 Stunden, auf einem 1% igen Agarosegel aufgetrennt, die Verbrauchs das Rückgrat Band (in diesem Fall 2,5 kb) und reinigt sie mit einem Gel-Reinigung Spin-Säule. Verdauendie Emulsions-PCR-Produkte aus Schritt 1.4 mit SfiI bei 50 ° C für 2 h und Reinigung mittels DNA-Reinigungssäulen. Um die Promotor-Tag-Bibliothek in die linearisierte Vektor-Rückgrat ligieren, bis Reaktionen mit 100 ng des verdauten PCR-Produkt, 50 ng linearisierte Vektor-Rückgrat und T4-DNA-Ligase eingestellt. Inkubieren über Nacht bei 16 ° C und dann bei 65 ° C für 20 min, um die Ligase zu inaktivieren. Transformation von E. coli mit dem Ligationsreaktion. Die Bibliothek Komplexität zu bewahren, wollen mindestens 10x mehr KBE erhalten, als es verschiedene Promotor-Tag-Kombinationen in der Bibliothek ausgelegt. Wenn die Gesamtzahl von Tags ist etwa 100.000, kann die Ziel cfu typischerweise durch Ausführen 6-8 parallelen Umwandlungen pro Bibliothek erreicht werden. Für jede Transformation, kombinieren 50 ul elektro E. coli-Zellen mit 2 ul Ligationsmischung auf Eis. Transformation durch Elektroporation, erholen die Zellen in 800 ul SOCMedium unter Schütteln bei 37 ° C für 1 h und dann kombinieren Zellen aus den parallel Transformationen. Um die Transformationseffizienz zu bewerten, plattenReihenVerdünnungen von einem alinquot der gewonnenen Zellen auf LB-Agarplatten mit 50-100 ug / ml Carbenicillin und Inkubation über Nacht bei 37 ° C aufweist. Schätzung Gesamtkolonie wie beobachtet (cfu) x (Verdünnungsfaktor) × (V – V) / V, wobei V das Gesamtvolumen der gewonnenen Zellen und v das Volumen des Aliquots für die serielle Verdünnungen gemacht. Gleichzeitig Verwenden der Rest der gewonnenen Zellen zur Beimpfung 200 ml LB mit 100 ug / ml Carbenicillin ergänzt. Wachsen Zellen bei 37 ° C über Nacht in einem Schüttelinkubator und dann isolieren die Plasmid-DNA nach Standardverfahren. Digest ein Aliquot der isolierten Plasmid-Bibliothek mit SfiI bei 50 ° C für 2 h und laufen auf einem 1% Agarose-Gel auf die Anwesenheit des Inserts zu bestätigen. Linearisierung der Plasmid-Bibliothek von cUtting zwischen den Promotorvarianten und Tags mit KpnI und XbaI. Um die Verdauung Effizienz zu maximieren, führen Serien Aufschlüsse: Zunächst verdauen mit KpnI bei 37 ° C für 1 h und reinigen mit magnetischen Kügelchen. Zweitens Verdau mit XbaI unter Zusatz von 1 U alkalischer Shrimp-Phosphatase bei 37 ° C für 2 h, Hitze inaktiviert bei 65 ° C für 5 min und dann unter Verwendung von magnetischen Kügelchen zu reinigen. Führen eines Aliquots auf einem 1% Agarose-Gel, um eine vollständige Linearisierung überprüfen. Wenn ungeschnittenen Plasmid sichtbar ist, sollte das linearisierte Fragment gelgereinigt werden. Um eine MPRA Bibliothek geeignet für die Transfektion in Säugerzellen zu erzeugen, ligieren einen ORF mit KpnI / XbaI kompatible Enden in den lineaZwischen Bibliothek. Wenn Sie einen kompatiblen luc2 ORF-Fragment aus pMPRAdonor1 vorzubereiten, zu verdauen, die dieses Plasmid mit KpnI und XbaI bei 37 ° C für 1 h und auf einem 1% Agarose-Gel laufen. Verbrauchsteuern Das ORF-Fragment (1,7 kB in diesem Fall) und zu reinigen mit einer Gelreinigung Spinsäule. Klonen Sie die ORF-Fragment in den lineaZwischen Bibliothek wie in den Schritten 2,3-2,8 beschrieben. Digest eines Aliquots (entsprechend 1-2 ug) des MPRA Bibliothek mit KpnI bei 37 ° C für 1 h und auf einem 1% Agarose-Gel laufen gelassen. Wenn die Bibliothek verdaut wird als Einzelband, Abschnitt 3. vorgehen, wenn zusätzliche Banden beobachtet (in der Regel um Verschleppungen von Zwischen Konstrukte entsprechend), kann die Bibliothek weiter gereinigt wie folgt: Verdauen 3-5 ug des kontaminierten Bibliothek mit KpnI bei 37 ° C für 1 h und auf einem 0,8% Agarose-Gel bei 4 ° C über Nacht ausgeführt. Auszuschneiden die korrekte Bandbibliothek, reinigen die DNA unter Verwendung einer Gel-Reinigung Spin-Säule und führen die Selbstligation unter Verwendung von hoch-konzentrierten T4-DNA-Ligase bei 37 ° C für 1 Stunde. Wiederholen Sie dann die Transformation und letzte Bibliothek DNA-Isolierung, wie in Schritt 2.8 beschrieben. 3. Transfection, Störungs und RNA-Isolierung Für jede unabhängige Transfektion Kultur der erforderlichen Anzahl von Zellen (wie von der MPRA Bibliothek Komplexität bestimmt, siehe Diskussion) in geeigneten Medium. Beispielsweise Kultur HEK293T / 17 Zellen in DMEM, ergänzt mit 10% FBS und L-Glutamin / Penicillin / Streptomycin. Kulturzellen von mindestens zwei unabhängigen Transfektionen für jede Bibliothek und experimentellen Bedingungen. Transfektion der kultivierten Zellen mit Plasmiden MPRA. Die Transfektion Verfahren und Bedingungen müssen für jeden Zelltyp optimiert. Für jede Probe transfiziert sind, behalten ein Aliquot (50-100 ng) der Plasmid-DNA als eine abgestimmte Steuerung. B. Transfektion von 0,5 x 10 7 HEK293T / 17-Zellen gezüchtet, um ~ 50% Konfluenz in einer 10 cm Kulturschale mit 10 ug Plasmid-DNA in 1 ml Opti-MEM I Reduzierte Serummedium unter Verwendung von 30 ul Lipofectamine LTX und 10 ul plus Reagenz. Entfernen Sie die Transfektion Mischung nach 5 Stunden und lassen Sie dasZellen für 24-48 Stunden zu erholen. Optional führen Sie keine Störung erforderlich, um kontextabhängige oder Signal regulatorischen Sequenzen in der Bibliothek ausgelegt aktivieren. Ernte der Zellen und Isolierung von Poly (A) + mRNA mit Standard-Oligo (dT) Cellulose-Säulen oder Kugeln mit Anweisungen des jeweiligen Herstellers. Sicherzustellen, dass die maximale Bindungskapazität der Säulen oder Beads die Gesamtmenge an mRNA aus den geernteten Zellen erwartet überschreiten. Zum Beispiel kann die erwartete Rendite aus dem Abschnitt 3.3 ist etwa 0,5-2,5 ug mRNA. 4. Tag-Seq Verschleppung von Vektor-DNA aus den transfizierten Zelllysaten zu beseitigen, behandeln jeweils 20 ul mRNA-Probe mit 1 ul Turbo DNase (2 U) und 2,3 ul 10x Turbo DNase-Puffer bei 37 ° C für 1 h, fügen Sie 2,4 ul Turbo DNase Inaktivierung Reagenz bei RT für 5 min Mischen, Zentrifugieren bei 10.000 g für 90 sec, und dann wird die Lösung in ein frisches Röhrchen. Überprüfen Reinheit durch eine PCR, wie in Abschnitt 4.6 auf 60-100 ng jedes mRNA Probe beschrieben, und dann läuft die Produkte auf einem Agarose-Gel. Wenn bestimmte Amplikons sind sichtbar (0,25 kb bei Verwendung pMPRA1 mit luc2), Spalte reinigen die mRNA behandelt und wiederholen Sie den DNase-Behandlung. Um Tag-Seq-Sequenzierung Bibliotheken generieren, konvertieren Reporter mRNA in cDNA und fügen Sequenzierung Adapter durch PCR. Einrichtung mRNA / RT-Primer Mischungen, wie in Tabelle 3 beschrieben. Inkubation bei 65 ° C für 5 min auf Eis zu stellen. Parallel dazu richten Sie cDNA-Synthese-Reaktionen, wie in Tabelle 4 beschrieben. Reagens 1x Volume (ul) mRNA Probe (400-700 ng Gesamt) 8 Oligo-0DT (50 uM) 1 dNTP (10 mM jeweils) 1 ove_content "> Tabelle 3. RNA / reverse Transkription Primer-Mix für die cDNA-Synthese. Reagens 1x Volume (ul) 10x Superscript III RT Buffer 2 MgCl 2 (25 mM) 4 DTT (0,1 M) 2 RNaseOut (40 U / ul) 1 Superscript III (200 U / ul) 1 Tabelle 4. cDNA-Synthese Reaktionsmischung. Sanft kombinieren mRNA / RT-Primer vermischt sich mit der cDNA-Synthese Mischungen. Inkubieren bei 50 ° C für 50 min, 85 ° C für 5 min und dann auf Eis. Schließlich Inkubation mit 2 U von Ribonuclease H bei 37 ° C für 20 min. Bis PCR-Reaktionen wie in Tabelle 5 mit 4-6 ul beschriebencDNA Reaktionsmischung oder 50 ng Reporterplasmid als Vorlagen. Dann führen die PCR-Amplifikation (95 ° C für 2 min, 26 x [95 ° C für 30 sec, 55 ° C für 30 sec, 72 ° C für 30 sec], 72 ° C für 3 min). Reagens 1x Volume (ul) 2x PfuUltra II HotStart PCR Master Mix 25 Primer TagSeq_P1 (25 uM) 0,5 Primer TagSeq_P2 (25 uM) 0,5 Vorlage (mRNA, cDNA-Mix oder Plasmid-DNA) variiert Nuklease-freies Wasser 50 Tabelle 5. Tag-Seq PCR-Reaktionsmischung. Führen Sie die PCR-Produkte über ein 2% Agarose-Gel, Verbrauch Bands, die den Tag-Seq Bibliothek Amplikons (0,25 kb bei VerwendungpMPRA1 mit luc2) und reinigen Sie diese mit Gel-Reinigung Spin-Säulen. Pool, denaturieren und Sequenz, die das gereinigte Tag-Seq Amplikons direkt mit einem Illumina-Sequenzierung Instrument. Filter mit geringer Qualität liest, indem alle, dass a) eine oder mehrere Position mit einem Phred Qualitätsfaktor von weniger als 30 innerhalb des sequenzierten Tag oder b) nicht genau einen Tag ausgelegt entsprechen. Zählen Sie die Anzahl der jeweils verbleibenden Tag in jeder Bibliothek erscheint. Normalisieren die Tag zählt, um TPM (Tags pro Million sequenziert Tags) und berechnen dann das Verhältnis der mRNA-Tag zählt über Plasmid-abgeleitete Tag zählt für jedes Paar von Sequenzierungsbibliotheken. Wenn mehrere verschiedene Tags wurden zu jedem Sequenzvariante verknüpft, nutzen ihre mittlere Verhältnisse für Downstream-Analyse.

Representative Results

MPRA ermöglicht hochauflösende, quantitative Zerlegung der Sequenz-Aktivitäts-Beziehungen von transkriptionalen regulatorischen Elemente. Eine erfolgreiche MPRA Experiment ergeben typischerweise hoch reproduzierbare Messungen für die Mehrzahl der Sequenzen in der Bibliothek transfiziert (3A). Wenn schlechte Reproduzierbarkeit beobachtet (3B), ist dies ein Hinweis auf eine zu niedrige Konzentration an Reporter-mRNAs in den gewonnenen RNA-Proben aufgrund entweder 1) geringe absolute Aktivität unter den Sequenzen untersucht, oder 2) geringe Transfektionseffizienz. Figur 4 zeigt ein repräsentatives "Daten-Fußabdruck" 1,2 durch Bestimmung erzeugt ~ 37.000 zufällige Varianten eines 145 bp-Sequenz stromaufwärts des menschlichen IFNB Gens in HEK293-Zellen, die mit oder ohne Einwirkung von Sendai-Virus. Der Promotor TATA-Box und bekannt proximalen Enhancer 10 eindeutig als informationsreichen regi identifiziert werdenons in einem Virus-abhängige Weise. Abbildung 3. Tag-Seq Reproduzierbarkeit. Streudiagramme, die Beispiele von Tag-Seq-Daten aus zwei unabhängigen Transfektionen mit hoher Wiederholungs (A) und niedriger (B) Reproduzierbarkeit. Letztere Plot zeigt viele Ausreißer-Tags mit hoher mRNA zählt in nur einer der zwei Wiederholungen. Solche Artefakte typischerweise an, dass die Konzentrationen der Reporter-mRNAs zu niedrig für die quantitative PCR-Amplifikation entweder durch niedrige absolute Aktivitäten unter den Reporterkonstrukte oder niedrige Transfektionseffizienz. Abbildung 4. Information Footprinting des menschlichen IFNB Transkriptionsstartstelle und proximalen Enhancer. </strOng> Etwa 37.000 zufällige Varianten einer 145 Nukleotid (nt)-Region stromaufwärts des menschlichen Gens wurden unter Verwendung IFNB MPRA in HEK293-Zellen, die mit (A) und ohne (B) Einwirkung von Sendai-Virus untersucht. Die blauen Balken zeigen die gegenseitige Information zwischen dem Ausgang und dem Reporter Nukleotid an jeder Position. Das proximale Enhancer und TATA-Box stehen als Regionen mit hoher Informationsgehalt auf Virusinfektion.

Discussion

MPRA is a flexible and powerful tool for dissection of sequence-activity relationships in gene regulatory elements. The success of MPRA experiments depend on at least three factors: 1) careful design of the sequence library, 2) minimization of artifacts during amplification and cloning, and 3) high transfection efficiency.

The possible lengths of the variable regions in the reporter constructs are largely determined by the synthesis or cloning technology used. Standard OLS is generally limited to about 200 nt, but this protocol is compatible with inserts up to at least 1,000 nt. Note that variable regions that are highly repetitive or contain strong secondary structures may end up underrepresented due to PCR and cloning biases. The length of the tags that identify each of the variable regions should be 10-20 nt and the collection of tags should ideally be designed such there are at least two nucleotide differences between any pair. Tags that contain the seed sequences of known microRNA or other factors that might influence mRNA stability should also be avoided when possible.

A key parameter in the design of MPRA experiments is the total number of distinct reporter constructs to be included in the library (the design complexity, denoted CD). In practice, CD is limited by the number of cultured cells that can be transfected. As a rule of thumb, the total number of transfected cells should be at least 50-100 times greater than CD. For example, if 20 million cells can be transfected with a transfection efficiency of 50%, then CD should be no more than ~200,000. Note that CD is equal to the number of distinct regulatory sequence variants multiplied by the number of distinct tags per sequence. The more distinct tags are linked to each regulatory sequence, the more accurate the estimate of the activity of that sequence can be made (because measurements from distinct tags can be averaged), but the fewer distinct variants can be assayed in one experiment. The optimal choice depends on the experimental design. In a simple “promoter bashing” experiment, where a mathematical model will be fitted to the aggregated measurements, a single tag per variant is usually sufficient. In a screen for single-nucleotide polymorphisms that cause changes in regulatory activities, it may be necessary to use 20 or more tags per allele to obtain statistically robust results, because comparing each pair of alleles requires a separate hypothesis test.

If the sequences to be assayed are not expected to contain transcription start sites, a constant promoter can also be added in the same fragment. For example, pMPRAdonor2 (Addgene ID 49353) includes a minimal TATA-box promoter that is useful when the upstream variable region is expected to have significant enhancer activity, while pMPRAdonor3 (Addgene ID 49354) includes a modified, strong SV40 viral promoter that is useful when the variable region is expected to contain silencer activity or other negative regulatory elements.

Raw OLS products often contain a significant fraction of truncated oligonucleotides. These may interfere with accurate PCR amplification of the designed sequences, particularly when there is significant homology between them. Using PAGE purification to remove truncated synthesis products and emulsion PCR to minimize amplification artifacts are effective techniques for ensuring high library quality. If either step is impractical, it is imperative to minimize the number of PCR cycles used at each amplification step. Selection and expansion of the cloned library in liquid culture is generally sufficient to maintain the design complexity, but if recombination-prone vectors are to be used or significant representation bias is observed, the recovered cells can instead be plated directly onto large LB agar plates, expanded as individual colonies and then scraped off for DNA isolation. It is also important to consider the potential impact of synthesis errors, which are typically found at a rate of 1:100-500 in OLS. Full-length sequencing of the reporter constructs prior to transfection is recommended to identify and correct for such errors.

It is not necessary to introduce reporter constructs into every cell in the transfected culture, but transfection efficiencies below ~50% may lead to poor signal to noise ratios. It is advisable to optimize transfection conditions prior to performing MPRA experiments in a new cell type. When working with hard-to-transfect cell types, MPRA signals can be boosted by pre-selecting transfected cells. The pMPRA vector series includes variants that constitutively express a truncated cell surface marker that can be used to physically enrich for transfected cells prior to RNA isolation (for example, Addgene IDs 49350 and 49351).

Offenlegungen

The authors have nothing to disclose.

Acknowledgements

Diese Arbeit wurde von der National Human Genome Research Institute der National Institutes of Health unter Preis Anzahl R01HG006785 unterstützt.

Materials

Oligonucleotide library synthesis Agilent, CustomArray or other OLS vendors custom If using OLS construction method
pMPRA1 Addgene 49349 MPRA plasmid backbone
pMPRAdonor1 Addgene 49352 luc2 ORF donor plasmid
TE 0.1 Buffer (10 mM Tris-HCl, 0.1 mM EDTA, pH 8.0) Generic n/a OLS buffer
Novex TBE-Urea Gels, 10% Life Technologies EC6875BOX PAGE purification of OLS products
Novex TBA-Urea Sample Buffer Life Technologies LC6876 PAGE purification of OLS products
SYBR Gold Nucleic Acid Gel Stain Life Technologies S-11494 PAGE purification of OLS products
Micellula DNA Emulsion & Purification Kit EURx/CHIMERx 3600-01 Library amplification by emulsion PCR
Herculase II Fusion DNA Polymerase Agilent 600675 Polymerase for emulsion PCR
SfiI New England Biolabs R0123S Library cloning with pMPRA vectors
KpnI-HF New England Biolabs R3142S Library cloning with pMPRA vectors
XbaI New England Biolabs R0145S Library cloning with pMPRA vectors
T4 DNA Ligase (2,000,000 units/ml) New England Biolabs M0202T Library cloning with pMPRA vectors
One Shot TOP10 Electrocomp E. coli Life Technologies C4040-50 Library cloning with pMPRA vectors
LB agar and liquid media with carbenicllin Generic n/a Growth media for cloning
E-Gel EX Gels 1% Life Technologies G4010-01 Library verification and purification
E-Gel EX Gels, 2% Life Technologies G4010-02 Library verification and purification
MinElute Gel Extraction Kit Qiagen 28604 Library and backbone purification
EndoFree Plasmid Maxi Kit Qiagen 12362 Library DNA isolation
Cell culture media n/a n/a Experiment-specific
Transfection reagents n/a n/a Experiment-specific
MicroPoly(A)Purist Kit Life Technologies AM1919 mRNA isolation
TURBO DNA-free Kit Life Technologies AM1907 Plasmid DNA removal
SuperScript III First-Strand Synthesis System Life Technologies 18080-051 cDNA synthesis
PfuUltra II Hotstart PCR Master Mix Agilent 600850 Polymerase for Tag-Seq PCR
Primers (see text) IDT custom PAGE purify Tag-Seq primers

Referenzen

  1. Kinney, J., Murugan, A., Callan, C. G., Cox, E. C. Using deep sequencing to characterize the biophysical mechanism of a transcriptional regulatory sequence. Proceedings of the National Academy of Sciences USA. 107 (20), 9158-9163 (2010).
  2. Melnikov, A., et al. Systematic dissection and optimization of inducible enhancers in human cells using a massively parallel reporter assay. Nature Biotechnology. 30 (3), 271-277 (2012).
  3. Patwardhan, R. P., Lee, C., Litvin, O., Young, D. L., Pe’er, D., Shendure, J. High-resolution analysis of DNA regulatory elements by synthetic saturation mutagenesis. Nature Biotechnology. 27 (12), 1173-1175 (2009).
  4. Patwardhan, R. P., et al. Massively parallel functional dissection of mammalian enhancers in vivo. Nature Biotechnology. 30 (3), 265-270 (2012).
  5. Arnold, C. D., Gerlach, D., Stelzer, C., Boryń, &. #. 3. 2. 1. ;. M., Rath, M., Stark, A. Genome-wide quantitative enhancer activity maps identified by STARR-seq. Science (New York, N. Y.). 339 (6123), 1074-1077 (2013).
  6. Kheradpour, P., et al. Systematic dissection of regulatory motifs in 2000 predicted human enhancers using a massively parallel reporter assay. Genome Research. 23 (5), 800-811 (2013).
  7. White, M. A., Myers, C. A., Corbo, J. C., Cohen, B. A. Massively parallel in vivo enhancer assay reveals that highly local features determine the cis -regulatory function of ChIP-seq peaks. Proceedings of the National Academy of Sciences USA. 110 (29), 11952-11957 (2013).
  8. Mogno, I., Kwasnieski, J. C., Cohen, B. A. Massively parallel synthetic promoter assays reveal the in vivo effects of binding site variants. Genome Research. 23 (11), 1908-1915 (2013).
  9. Schütze, T., et al. A streamlined protocol for emulsion polymerase chain reaction and subsequent purification. Analytical Biochemistry. 410 (1), 155-157 (2011).
  10. Panne, D., Maniatis, T., Harrison, S. C. An atomic model of the interferon-beta enhanceosome. Cell. 129 (6), 1111-1123 (2007).

Play Video

Diesen Artikel zitieren
Melnikov, A., Zhang, X., Rogov, P., Wang, L., Mikkelsen, T. S. Massively Parallel Reporter Assays in Cultured Mammalian Cells. J. Vis. Exp. (90), e51719, doi:10.3791/51719 (2014).

View Video