Diepe sequentiebepaling van gist bevolking geselecteerd voor positieve gist 2-hybrid interacties mogelijk levert een schat aan informatie over interacterende eiwitten van de partner. Hier beschrijven we de werking van specifieke bioinformatica tools en bijgewerkte software voor het analyseren van de reeks gegevens uit dergelijke schermen op maat.
De gist 2-hybrid bepaling om tegelijkertijd tientallen voorbijgaande en statische eiwitinteractie binnen één scherm met behulp van hoge-doorvoer korte-Lees DNA rangschikkend bloot te leggen, hebben we aangepast. De resulterende reeks datasets kunt bijhouden welke genen in een populatie die tijdens de selectie voor positieve gist 2-hybrid interacties zijn verrijkt, maar ook geven gedetailleerde informatie over de relevante subdomeinen van eiwitten voldoende voor interactie. Hier beschrijven we een volledige suite van zelfstandige softwareprogramma’s waarmee niet-deskundigen om alle de bioinformatica en statistische stappen om te verwerken en analyseren van bestanden met fastq van DNA reeksen van een batch gist 2-hybrid test uitvoeren. De stappen van de verwerking vallende van deze software omvatten: 1) mapping en tellen volgorde leest overeenkomt met elke kandidaat-proteïne gecodeerd binnen een gist 2-hybrid prooi bibliotheek; 2) een statistische analyseprogramma dat resulteert in de profielen van de verrijking; en 3) hulpmiddelen de translationeel frame en positie binnen de codering regio van elke verrijkt plasmide die de interacterende eiwitten van belang codeert te onderzoeken.
Een benadering te ontdekken eiwitinteractie is de gist 2-hybrid (Y2H) test, welke exploits ontworpen gistcellen die groeien alleen wanneer een proteïne van belang aan een fragment van een interactie partner1 bindt. Detectie van meerdere Y2H interacties kan nu worden gedaan met de hulp van massale parallelle high-throughput sequencing. Verschillende formaten zijn beschreven van2,3,4,5 waaronder een die we ontwikkeld waar populaties worden geteeld in batch onder voorwaarden die selecteert voor gist plasmiden die produceren met een positieve Y2H interactie6. De werkstroom we ontwikkeld, genoemd DEEPN (dynamische verrijking voor evaluatie van de netwerken van de proteïne), differentiële interactomes uit de dezelfde prooi bibliotheken te identificeren van de eiwitten die in combinatie met een eiwit (of domein) vsidentificeert. een ander eiwit of een conformationally onderscheiden mutant domein. Een van de belangrijke stappen in deze werkstroom is goede verwerking en analyse van de gegevens van DNA sequencing. Sommige informatie kan worden opgedaan door te gewoon tellen het aantal leest voor elk gen zowel vóór als na de selectie van Y2H interacties op een wijze analoog aan een RNA-seq-experiment. Echter kan veel meer gedetailleerde informatie worden geëxtraheerd uit deze datasets met inbegrip van informatie over het subdomein van een bepaald eiwit dat is geschikt voor het produceren van een Y2H-interactie. Voorts overwegende dat de aanpak van de DEEPN waardevol is, kunnen analyseren van vele monster wordt gerepliceerd omslachtige en dure. Dit probleem is verlicht met behulp van een statistisch model dat werd ontwikkeld speciaal voor DEEPN datasets waar het aantal replicatieonderzoeken is beperkt6. Om verwerking en analyse van DNA sequencing datasets betrouwbare, volledige, robuuste en toegankelijk voor onderzoekers zonder bioinformatics deskundigheid, ontwikkelden we een suite van software programma’s die betrekking hebben op alle stappen van analyse.
Deze suite van stand-alone software programma’s die worden uitgevoerd op desktop computers omvat MAPster, DEEPN en Stat_Maker. MAPster is een grafische gebruikersinterface waarmee dat elk fastq-bestand in de wachtrij voor toewijzing aan het genoom met behulp van de HISAT2 programma7, produceren een standaard .sam bestand voor gebruik in downstream toepassingen. DEEPN heeft verschillende modules. Het wordt toegewezen en telt leest overeenkomt met een bepaald gen vergelijkbaar met een RNA-seq type kwantificering met behulp van de module ‘Gene Count’. Ook extracten van de reeksen overeenkomt met de kruising tussen de Gal4 transcriptionele domein en de volgorde van de prooi en gesorteerd van de positie van deze kruispunten toe hun inspectie door vergelijkende tabellen en grafieken (met behulp van de module ‘Junction_Make’) De module ‘Blast_Query’ laat gemakkelijk inspectie, kwantificatie en vergelijking van de kruising Gal4 junction sequenties. Stat_Maker evalueert de leest per gene verrijking gegevens statistisch gezien als een manier van het prioriteren van waarschijnlijk Y2H hits. Hier beschrijven we hoe deze software programma’s te gebruiken en volledig analyseren de gegevens uit een DEEPN Y2H experimenteren opeenvolging van DNA. Versies van DEEPN worden uitgevoerd op PC, Mac en Linux systemen. Andere programma’s, zoals het programma voor toewijzing MAPster en de DEEPN statistieken module Stat_Maker afhankelijk van subroutines die worden uitgevoerd onder Unix en zijn alleen beschikbaar op Mac en linux systemen.
De hier beschreven softwaresuite maakt het mogelijk om volledig verwerken en analyseren van hoge-doorvoer DNA sequencing gegevens uit een DEEPN experiment. Het eerste programma gebruikt is MAPster, die neemt de DNA volgorde leest in standaard fastq bestanden en kaarten van hun positie op een referentie DNA voor downstream processing door een hele reeks van informatica-programma’s met inbegrip van de DEEPN software. Het nut van de MAPster-interface en haar vermogen om meerdere taken, combineren de input-bestanden van de C…
The authors have nothing to disclose.
Dit werk werd gesteund door de National Institutes of Health: NIH R21 EB021870-01A1 en door NSF onderzoek projectsubsidie: 1517110.
Mapster | https://github.com/emptyewer/MAPster/releases | ||
DEEPN software | https://github.com/emptyewer/DEEPN/releases | ||
Statmaker | https://github.com/emptyewer/DEEPN/releases | ||
Minimum computer system | Apple | Mac Intel Core i5 or better | |
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | OS 10.10 or higher | ||
Dell | Intel i5-7400 or better | ||
– | 4 Gb RAM or better | ||
– | 500 Gb Disk spce or better | ||
– | Windows 7 or higher |