Tiefe Sequenzierung der Hefe Bevölkerung ausgewählt für positive Hefe 2-Hybrid Interaktionen potenziell liefert eine Fülle von Informationen über interagierenden Partner Proteine. Hier beschreiben wir den Betrieb von bestimmten Bioinformatik und aktualisierte Individualsoftware Sequenzdaten von solchen Bildschirmen zu analysieren.
Wir haben die Hefe 2-Hybrid Assay um gleichzeitig entdecken Sie Dutzende von Transienten und statische Protein-Interaktionen in einem einzigen Bildschirm nutzen Hochdurchsatz-kurze lesenden DNA-Sequenzierung angepasst. Die daraus resultierende Sequenz Datasets können nicht nur verfolgen, welche Gene in einer Population, die bei Auswahl für positive Hefe 2-Hybrid Interaktionen angereichert sind, sondern auch geben detaillierte Informationen über die entsprechenden Subdomains von Proteinen ausreichend für Interaktion. Hier beschreiben wir eine vollständige Suite von Stand-Alone-Softwareprogramme, mit denen nicht-Experten, der Bioinformatik und statistische Schritte zur Verarbeitung und Analyse von DNA-Sequenz Fastq Dateien aus einem Batch Hefe 2-Hybrid Assay durchzuführen. Die Verarbeitungsschritte von dieser Software abgedeckt sind: (1) Mapping und Zählung Sequenz liest entspricht jeder Kandidat Protein kodiert in einer Hefe-2-Hybrid Beute-Bibliothek; (2) eine statistische Analyse-Programm, das die Anreicherung profile bewertet; und 3) Werkzeuge die translationale Rahmen und Position innerhalb der kodierenden Region des jedes angereicherten Plasmid, das die interagierenden interessierenden Proteine kodiert zu prüfen.
Ein Ansatz zur Protein-Interaktionen zu entdecken ist die Hefe 2-Hybrid (Y2H) Assay, welche Heldentaten Hefe-Zellen entwickelt, die wachsen nur, wenn ein Protein des Interesses zu einem Fragment eines interagierenden Partner1bindet. Erkennung von mehreren Y2H Interaktionen kann nun mit Hilfe von massiven parallelen Hochdurchsatz-Sequenzierung erfolgen. Mehrere Formate wurden2,3,4,5 darunter eine, die wir entwickelt, wo die Populationen in Batch unter Bedingungen angebaut werden, die für die Hefe enthalten Plasmide, die produzieren auswählen beschrieben eine positive Y2H Interaktion6. Der Workflow entwickelt, bezeichnet DEEPN (dynamische Bereicherung für Evaluation of Protein Networks), identifiziert differentielle Interactomes aus der gleichen Beute-Bibliotheken, um Proteine zu identifizieren, die mit einem Protein (oder Domäne) Vsinteragieren. ein weiteres Protein oder einer conformationally unterschiedliche mutierten Domäne. Eines der wichtigsten Schritte in diesem Workflow ist ordnungsgemäße Verarbeitung und Analyse der DNA-Sequenzierungsdaten. Einige Erkenntnisse können durch einfach zählen die Anzahl der Lesevorgänge für jedes Gen sowohl vor als auch nach der Auswahl von Y2H-Interaktionen in einer Art und Weise analog zu einem RNA-Seq-Experiment. Jedoch kann viel tiefer gehende Informationen aus dieser Datensätze, einschließlich Informationen über die Subdomain eines bestimmten Proteins, das in der Lage, eine Y2H-Interaktion ist extrahiert werden. Darüber hinaus während der DEEPN Ansatz wertvoll ist, kann viele Wiederholungen der Probe zu analysieren umständlich und teuer werden. Dieses Problem wird mithilfe eines statistischen Modells, das entwickelt wurde speziell für DEEPN Datasets wo ist die Anzahl der Wiederholungen begrenzt6gemildert. Verarbeitung und Analyse der DNA-Sequenzierung Datasets zuverlässige, vollständige, robuste und zugänglich für Ermittler ohne Bioinformatik-Kompetenz machen, entwickelten wir eine Suite von Software-Programmen, die alle Schritte der Analyse zu decken.
Diese Suite von Stand-alone-Software-Programme, die auf Desktopcomputern ausgeführt umfasst MAPster, DEEPN und Stat_Maker. MAPster ist eine grafische Benutzeroberfläche, die ermöglicht, dass jede Fastq-Datei in der Warteschlange für das Mapping, das Genom, die mit dem HISAT2 Programm7, Herstellung einer standard .sam-Datei zur Verwendung in downstream-Anwendungen. DEEPN besteht aus mehreren Modulen. Es ordnet und zählt liest, ähnlich wie eine RNA-Seq Typ Quantifizierung mit Hilfe des Moduls ‘Gene Count’ gen entspricht. Auch die Sequenzen entsprechend der Kreuzung zwischen der Gal4 transkriptionelle Domäne und die Beute Sequenz extrahiert und sammelt die Position dieser Kreuzungen zu deren Prüfung durch vergleichende Tabellen und Grafiken (mit Hilfe des Moduls “Junction_Make”) Das Modul “Blast_Query” ermöglicht einfache Inspektion, Quantifizierung und Vergleich der Kreuzung Gal4 Kreuzung Sequenzen. Stat_Maker wertet die Lesevorgänge pro gen angereicherte Daten statistisch als eine Möglichkeit der Priorisierung wahrscheinlich Y2H-Hits. Hier beschreiben wir, wie diese Software-Programme verwenden und vollständig analysieren die DNA-Sequenz, mit denen Daten aus einem DEEPN Y2H experimentieren. Versionen von DEEPN sind auf PC, Mac und Linux Systeme ausgeführt. Andere Programme, wie das Mapping-Programm MAPster und DEEPN-Statistik-Modul Stat_Maker Vertrauen auf Unterroutinen, die unter Unix laufen und sind nur auf Mac und Linux-Systeme verfügbar.
Die hier beschriebenen Software-Suite erlaubt es, vollständig verarbeiten und analysieren Hochdurchsatz DNA-Sequenzierungsdaten aus einem DEEPN Experiment. Das erste Programm ist MAPster, die die DNA-Sequenz lautet in standard Fastq-Dateien und ordnet ihre Position auf eine Referenz-DNA für downstream-Processing durch eine ganze Reihe von Informatik-Programme einschließlich der DEEPN Software. Das Dienstprogramm der MAPster Schnittstelle und seiner Fähigkeit, mehrere Jobs, Mähdrescher Eingabedateien, die Warteschlan…
The authors have nothing to disclose.
Diese Arbeit wurde vom National Institutes of Health unterstützt: NIH R21 EB021870-01A1 und durch NSF Research Project Grant: 1517110.
Mapster | https://github.com/emptyewer/MAPster/releases | ||
DEEPN software | https://github.com/emptyewer/DEEPN/releases | ||
Statmaker | https://github.com/emptyewer/DEEPN/releases | ||
Minimum computer system | Apple | Mac Intel Core i5 or better | |
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | OS 10.10 or higher | ||
Dell | Intel i5-7400 or better | ||
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | Windows 7 or higher |