Methode overzicht Naar aanleiding van de sequentie-to-structuur-to-paradigma, de I-TASSER procedure 1-4 voor de structuur en functie van modellen bestaat uit vier opeenvolgende stappen van: (a) template identificatie door LOMETS 5, (b) fragment structuur montage door replica- uitwisseling Monte Carlo simulaties 6, (c) atomair niveau de structuur verfijning met behulp van REMO 7 en FG-MD 8, en (d) structure-based functie interpretaties met behulp van co-factor 9. Sjabloon identificatie: Voor een query-sequentie die door de gebruiker, is de volgorde eerste schroefdraad door middel van een vertegenwoordiger van VOB structuur bibliotheek door een lokaal geïnstalleerde LOMETS meta-threading server. Threading is een sequentie-structuur alignment procedure die wordt gebruikt voor het identificeren van eiwitten die template vergelijkbare structuur hebben of bevatten vergelijkbare structurele motief als de query eiwit. Om de dekking van de homologe templ vergrotenaten detecties, LOMETS combineert meerdere state-of-the-art algoritmen die verschillende threading methodieken. Aangezien verschillende threading-programma's hebben verschillende scoringssystemen en uitlijning gevoeligheden, is de kwaliteit van de gegenereerde threading uitlijningen van elkaar threading programma beoordeeld door genormaliseerde Z-score, die wordt gedefinieerd als: waar de Z-score is de score in standaarddeviatie-eenheden ten opzichte van het statistische gemiddelde van alle uitlijningen gegenereerd door het programma, en Z 0 is een programma-specifiek Z-score cutoff bepaald op basis van grootschalige threading benchmark-tests 5 om een onderscheid te 'goed 'en' slechte 'templates. Een sjabloon met een hoge Z-score betekent dat de top templates een afstemming scoren significant hoger dan de meeste van de andere sjablonen, die meestal betekent dat de uitlijning correspondeert met een goed model te hebben. Als de meeste van de top threading templates hebben high genormaliseerde Z-scores, de nauwkeurigheid van de uiteindelijke I-TASSER model is meestal hoog. Echter, als het eiwit groot is en de dekking van de threading uitlijningen is beperkt tot een klein gebied van de query eiwit, heeft een hoge genormaliseerde Z-score niet per se een hoog model nauwkeurigheid voor de full-length model. Top twee threading alignementen van elk threading programma zijn verzameld en gebruikt voor de volgende stap van structuur montage. Iteratieve structuur van de montage-simulatie: Na de threading procedure, query volgorde is opgesplitst in threading uitgelijnd en niet aangepaste regio's. Continue fragmenten in te rijgen lijn zijn uitgesneden uit sjablonen en direct gebruikt voor de structuur montage, terwijl de niet aangepaste lus regio's zijn gebouwd door ab initio modellering. De structuur assemblage procedure wordt uitgevoerd op een rooster systeem geleid door de replica uitwisseling van Monte Carlo simulaties 6. De I-TASSER krachtveld bestaat uit waterstof-bonding interacties 10, op kennis gebaseerde statistische termen van energie afgeleid van bekende eiwitstructuren in het VOB 11, sequentie-gebaseerde contact voorspellingen van SVMSEQ 12, en ruimtelijke beperkingen verzameld van LOMETS 5 threading templates. De conformationele lokvogels gegenereerd in de lage-temperatuur replica's tijdens de simulaties zijn geclusterd door Spicker 13 tot en met structuren van een lage vrije-energie-staten te identificeren. Cluster hartlijnen van de top clusters worden verkregen door het gemiddelde van de 3D-coördinaten van alle geclusterde structurele lokvogels en gebruikt voor het uiteindelijke model generatie. De simulatie en clustering procedure twee keer herhaald voor het verwijderen van sterische botsingen en verdere verfijning van het globale topologie. Atomaire niveau van modelbouw en verfijning: Het cluster hartlijnen verkregen na Spicker clustering worden verlaagd eiwit modellen (elk residu vertegenwoordigd door haar C α en side-keten centrum van de massa) en have beperkte biologische toepassing. De bouw van de full-atomaire model van het verminderde modellen gebeurt in twee stappen. In de eerste stap wordt REMO 7 gebruikt voor de volledige atomaire modellen te construeren van C-alfa sporen door het optimaliseren van de H-band netwerken. In de tweede stap, REMO full-atomaire-modellen verder worden verfijnd door FG-MD 14, die de ruggengraat torsie hoeken, obligatie lengtes, en de side-keten rotameer oriëntaties verbetert, door moleculaire dynamische simulaties, zoals geleid door de structurele fragmenten doorzocht van de VOB structuren door TM-lijnen. De FG-MD verfijnde modellen worden gebruikt als de uiteindelijke modellen voor tertiaire structuur voorspellingen van I-TASSER. De kwaliteit van de gegenereerde modellen zijn geschat op basis van een vertrouwen score (C-score), die is gedefinieerd op basis van de Z-score van LOMETS threading uitlijningen en de convergentie van de I-TASSER simulaties, wiskundig geformuleerd als: waar <em> M is de veelheid van de structuur eendenkooien in de structurele clusters geïdentificeerd door de Spicker 13, M TOT is het totaal aantal lokvogels voorgelegd aan de clustering; is het gemiddelde RMSD van de geclusterde lokvogels om de cluster zwaartepunten; Norm.Z-Score (i) is het genormaliseerde Z-score (Vgl. 1) van de top threading uitlijning verkregen uit i-threading server in LOMETS 5; N is het aantal servers gebruikt in LOMETS. De C-score heeft een sterke correlatie met de kwaliteit van de I-TASSER modellen. Door het combineren van C-score en eiwit lengte, kan de nauwkeurigheid van de eerste I-TASSER modellen worden geschat met een gemiddelde fout van 0,08 voor de TM-score en 2 A voor de RMSD 15. In het algemeen, modellen met een C-score> – zijn 1,5 zal naar verwachting een juiste plooi te hebben. Hier RMSD en TM-score zijn beide bekende maatregelen van de topologische gelijkenis tussen het model en de natieve structuur. TM-score waardevollees variëren in [0, 1], waarbij een hogere score duidt op een betere structuur overeenkomen met 16,17. Maar voor lagere-ranked modellen (dat wil zeggen 2 e -5 e-modellen), de correlatie van de C-score met TM-score en RMSD is veel zwakker (~ 0.5), en kan niet worden gebruikt voor een betrouwbare schatting van absolute model kwaliteit. Is het eerste model altijd het beste model in I-TASSER simulaties? Het antwoord op deze vraag hangt af van de doelgroep type. Voor een eenvoudige doelwitten, het eerste model is meestal de beste model en de C-score is meestal veel hoger dan de rest van de modellen. Echter, voor harde doelen, waar de draad niet significant template hits, het eerste model is niet per se de beste model en I-TASSER eigenlijk heeft moeite bij het selecteren van de beste template en modellen. Het is daarom aan te raden om alle vijf modellen te analyseren voor harde doelen en hen op basis van de experimentele informatie en de biologische kennis te selecteren. Functie Predictions: In de laatste stap, zijn definitief 3D-modellen gegenereerd op basis van FG-MD gebruikt om drie aspecten van eiwitten functie te voorspellen, te weten: a) Enzyme Commissie (EC) nummers 18 en (b) Gene Ontology (GO) 19 termen en ( c) bindingsplaatsen voor kleine molecule liganden. Voor alle drie aspecten, zijn functionele interpretaties gegenereerd met behulp van co-factor, dat is een nieuwe benadering van eiwit functie op basis van globale en lokale gelijkenis met template eiwitten in het VOB met bekende structuur en functies te voorspellen. Ten eerste is de globale topologie van de voorspelde modellen vergeleken met functionele template libraries met behulp van structurele afstemming programma TM-lijn 20. Vervolgens wordt een reeks van eiwitten het meest lijkt op de doelgroep modellen geselecteerd uit de bibliotheek op basis van hun globale structuur gelijkenis, en een uitgebreide lokale zoekopdracht wordt uitgevoerd om de structuur en sequentie-overeenkomst in de buurt van het actieve / bindingsplaats regio te identificeren. De resulterende globale en lokale gelijkenis scores worden gebruikt om de rangtemplate eiwitten (functionele homologen) en breng de annotatie (EG nummers en Gene Ontology 19 voorwaarden) op basis van de hoogst scorende hits. Evenzo worden ligand bindingsplaats residuen en de ligand binding modus afgeleid op basis van de lokale afstemming van de vraag met bekende ligand bindingsplaats residuen in de hoogst scorende functie templates 9. De kwaliteit van de functie (EG en GO termijn) voorspelling in I-TASSER is geëvalueerd op basis van functionele homologie score (FH-score), die een maat is van de mondiale en lokale overeenkomst tussen de query en de template, en wordt gedefinieerd als: waar C-score is een schatting van de kwaliteit van de voorspelde model als omschreven in Eq. (2), TM-score meet de globale structurele gelijkenis tussen het model en de template eiwitten; RMSD ali is de RMSD tussen het model en de template structuur in de regio structureel lijn van TM-align 20; Cov vertegenwoordigt de dekking van de structurele uitlijning (dwz de verhouding van de structureel gericht residuen gedeeld door de query lengte); ID-ali is de sequentie-identiteit in de TM-align uitlijning. De geschatte vertrouwen score voor EG-nummer voorspellingen bevat ook een term voor het beoordelen van actieve site match (ACM) tussen de query en sjabloon in een bepaalde streek, berekend als: waarbij N t het aantal sjabloon residuen aanwezig binnen de lokale gebied vertegenwoordigt, N ali is het nummer van de aangepaste query-template residu paren, D II is de C α afstand tussen de i-de twee uitgelijnde residuen, d 0 = 3,0 Å is de afstand cutoff, M ii is de BLOSUM scores tussen et paar uitgelijnd residuen. In het algemeen, de Fh-score is in het bereik [0, 5] en ACM score tussen [0, 2], Waarbij hogere scores geeft meer zelfvertrouwen functionele opdrachten. ACM score wordt ook gebruikt voor het evalueren van de lokale structuur en sequentie overeenkomst de buurt van de ligand-bindende sites, die wordt aangeduid als BS-score. 1. Indiening van eiwitsequentie Bezoek de I-TASSER webpagina op http://zhanglab.ccmb.med.umich.edu/I-TASSER om te beginnen met structuur en functie modelleren experiment. Kopieer en plak de aminozuursequentie in de verstrekte formulier of direct te uploaden vanaf uw computer door te klikken op de knop "Bladeren". I-TASSER server accepteert momenteel sequenties met tot 1500 residuen. Eiwitten langer dan 1500 resten zijn meestal multi-domein eiwitten, en worden aanbevolen om te worden opgesplitst in afzonderlijke domeinen voordat zij naar de I-TASSER. Geef uw e-mail adres (verplicht) en een naam voor de job (optioneel). Gebruikers kunnen naar keuze opgeven externe inter-residue contact / afstand beperkingen, add-in een extra sjabloon of template uit te sluiten sommige eiwitten tijdens de structuur modelleren. Meer informatie over het gebruik van deze opties in de "Discussion" sectie. Voor het indienen van de reeks, klik op de "Run I-TASSER" knop. De browser zal worden gericht op een bevestigingspagina met de gebruiker opgegeven informatie, job identificatie (Job ID) nummer en een link naar een webpagina waar de resultaten zullen worden gestort na voltooiing van de baan. Gebruikers kunnen bookmark deze link of noteer de baan identificatienummer voor toekomstig gebruik. 2. Beschikbaarheid van de resultaten Controleer de status van uw ingediende werk door een bezoek aan de I-TASSER wachtrij pagina op http://zhanglab.ccmb.med.umich.edu/I-TASSER/queue.php . Klik op het tabblad Zoeken en gebruik de Job ID-nummer of de query volgorde om uw ingediende zoeken naar een baan. Na de structuur en functie modeling is voltooid, wordt een notificatie e-mail met daarin beeld van de voorspelde structuren en een web-link naar u worden verzonden. Klik op deze link of open de link bookmark bij stap 1.5 te bekijken en te downloaden van de resultaten. 3. Secundaire structuur en oplosmiddel toegankelijkheid voorspellingen Controleer de FASTA geformatteerde zoeksequentie weergegeven op de bovenkant van het resultaat pagina. Als er extra terughoudendheid / template werd opgegeven tijdens de volgorde indiening, een link naar de webpagina weergeven door de gebruiker opgegeven informatie kan ook worden gezien (Figuur 1A). Onderzoek van de secundaire structuur voorspelling weergegeven als: alfa helix (H), beta-streng (S) of spoel (C) en het vertrouwen score van voorspelling (0 = laag, 9 = hoog) voor elk residu. Kijk voor regio met lange stukken van regelmatige secundaire structuur (H of S) voorspellingen, tot de kern-regio schatten in het eiwit. Structurele klasse van eiwitten kunnen ook geanalyseerd worden op basis van de verdeling van secundaire structuren elementen. Alzo, lang regio's van de spoel elementen in het eiwit wijzen gewoonlijk op ongestructureerde / wanordelijke gebieden. Bekijk de voorspelde solvent toegankelijkheid (figuur 1C) om na te gaan begraven en oplosmiddel belichte gebieden in de query. Waarden van de voorspelde solvent toegankelijkheid variëren van 0 (begraven residu) tot 9 (blootgestelde residu). Regio die voornamelijk begraven residuen kunnen worden gebruikt om de kern regio af te bakenen in het eiwit, terwijl de regio's met een oplosmiddel worden blootgesteld en hydrofiele residuen zijn potentiële hydratatie / functionele sites. 4. Tertiaire structuur voorspellingen Scroll naar beneden naar de voorspelde tertiaire structuren van eiwitten query's, weergegeven in een interactief Jmol applet (figuur 2) te bekijken. Klik met de linkermuisknop op de applet om het uiterlijk van de weergegeven structuur te veranderen, zoom in specifieke regio, selecteert u specifieke residu types in de voorspelde model of de berekening van inter-residu afstanden. Analyseer de modellen voor de aanwezigheid van lange ongestructureerde regio's. Deze rREGIO 'S meestal overeen met ongeordende regio's in eiwit of wijzen op een gebrek van de sjabloon uitlijning. Deze regio's hebben over het algemeen een lage modellering nauwkeurigheid en het verwijderen van deze regio's tijdens het modelleren van N & C-terminus regio zal het modelleren nauwkeurigheid te verbeteren. Download het VOB opgemaakte bestanden structuur van het model door te klikken op de "Download Model" links. U kunt deze bestanden in een moleculaire visualisatie software (bijv. pymol, Rasmol enz.) voor verdere analyse van de structurele kenmerken. Analyseer het vertrouwen score (C-score) van de structuur van modellering om de kwaliteit van de voorspelde structuren te schatten. C-score (Vgl. 2) waarden zijn meestal in het bereik [-5, 2], waarin een hogere score wijst op een model van betere kwaliteit. De geschatte TM-score en RMSD van het eerste model is weergegeven als "Geschatte nauwkeurigheid van Model 1". Voor lange eiwitten, is het raadzaam om het model kwaliteit op basis van TM-score te evalueren, zoals TM-score is gevoeliger voor de topologische veranderingen dan RMSD. < li> Klik op "meer informatie over C-score" link naar C-score te analyseren, cluster grootte en de cluster dichtheid van alle modellen. Geschatte TM-score en RMSD zijn alleen gepresenteerd voor de eerste I-TASSER model, omdat de C-score van lager gerangschikt modellen is niet sterk gecorreleerd met TM-score of RMSD. De kwaliteit van lagere-gerangschikte modellen kunnen gedeeltelijk worden beoordeeld op basis van hun cluster dichtheid en cluster grootte ten opzichte van het eerste model, waarin modellen van grotere cluster en een hogere dichtheid zijn gemiddeld dichter bij de natieve structuur. Lage C-score voorspellingen meestal duiden op een lage nauwkeurigheid voorspelling. In de meeste dergelijke gevallen, de query-eiwit ontbreekt een goede template in de bibliotheek en heeft een afmeting buiten het bereik van ab initio modellering (dwz> 120 residuen). In deze gevallen kunnen gebruikers zoeken voor extra ruimtelijke beperkingen en gebruik ze om de I-TASSER modellering (zie Overleg sectie) te verbeteren. Het is ook aangemoedigd om de sequenties te leggen aan onze QUARK server (QUARK / "> http://zhanglab.ccmb.med.umich.edu/QUARK/) voor een zuivere ab initio modellering als het eiwit grootte is onder de 200 residuen. 5. LOMETS doelgroep template uitlijning Scroll naar beneden naar de top tien threading templates van de query eiwit, zoals vastgesteld door LOMETS threading-programma's (Figuur 3) te analyseren. Bekijk de genormaliseerde Z-score (Vgl. 1), te zien in 'Norm. Z-score 'kolom, om de kwaliteit van threading uitlijningen te analyseren. Afstemmingen met een genormaliseerde Z-score> 1 geeft een zelfverzekerd afstemming en waarschijnlijk hebben dezelfde plooi als de query eiwit. Analyseer de sequentie-identiteit in de threading-gebonden regio (kolom 'Iden. 1') en voor de gehele keten (kolom 'Iden. 2') naar de homologie tussen de query en de sjabloon eiwitten te beoordelen. Hoge sequentie-identiteit is een indicator van de evolutionaire verwantschap tussen de query en template eiwitten. Bekijk de threading uitgelijnd residuen weergegeven in gekleurde om visueel te identificeren tegenserved residuen / motieven in de query en het sjabloon eiwitten. Een hogere sequentie-identiteit in te rijgen uitgelijnd regio, in vergelijking met hele keten alignment wijst ook op de aanwezigheid van geconserveerde structurele motief / domains in de query. Beoordelen van de dekking van de threading uitlijning door het bekijken van de 'Cov.' kolom en het controleren van de uitlijning. Als de dekking van de top uitlijningen is laag en beperkt tot slechts een klein deel van de query eiwit of afwezig zijn voor een lange segment van query-sequentie, wordt de query eiwit bevat meestal meer dan een domein en het wordt aanbevolen om de volgorde en het model split de domeinen individueel (figuur 3). Download het VOB geformatteerde sequentie-structuur alignment bestanden door te klikken op de "Download Align" links. Deze uitlijning bestand kan worden geopend in een moleculaire visualisatie-programma opgenomen in de Materialen sectie, en kan ook worden gebruikt voor het toevoegen van extra beperkingen in de structuur modelleren (Stap 1.4). 6.Structurele analogen in het VOB Bekijk de volgende tabel (figuur 4) van het resultaat pagina om de top tien structurele analogen van de eerste voorspelde model, zoals die is bepaald door het structurele afstemming programma TM-lijn 20. Een TM-score> 0,5 geeft aan dat de gedetecteerde analoge en het model een soortgelijke topologie hebben en kan worden gebruikt om de structurele klasse / eiwit familie van de query eiwit 16 vast te stellen, terwijl die met TM-score <0,3 betekent dat een willekeurige structuur gelijkenis. Analyseer de sequentie-identiteit en RMSD in de structureel uitgelijnd regio getoond in 'IDEN een' en 'RMSD een' kolommen aan het behoud van de ruimtelijke motieven in het model en de structurele analoge beoordelen. Inspecteer de gekleurde en uitgelijnd residu paren in de aanpassing aan deze structureel geconserveerde residuen en motieven te identificeren. Klik op het VOB-code vermeld in de kolom 'VOB Hit' om RCSB website te bezoeken en meer te leren over hun structurele classificatie (SCOP, Rk en PFAM) en functionele informatie (EG-nummer, gekoppeld GO voorwaarden en gebonden ligand). 7. Functie voorspellen met behulp van co-factor Scroll naar beneden in het resultaat pagina om functionele interpretaties voor de zoekopdracht eiwitten te analyseren. Eiwit functies worden opgesomd in drie context tabellen, het weergeven van: Enzyme Commissie (EC) cijfers, Gene Ontology (GO) termen, en het ligand bindingsplaatsen. Bekijk de 'TM-score', 'RMSD een', 'IDEN een' en 'Ver.' kolommen in elke tabel de parameters van de globale structuur gelijkenis en het behoud van ruimtelijke patronen tussen model en geïdentificeerd functionele homologen (templates) te analyseren. 8. Enzym Commissie aantal voorspelling Bekijk de top vijf potentiële enzym homologen van query's eiwit getoond in de "voorspelde EG-nummer" table (figuur 5). De betrouwbaarheid van de EG-nummer voorspellen met behulp van deze templates is weergegeven in de kolom "EG-Score '. Op basis van benchmarking analyse 23, functionele overeenkomst (de eerste drie cijfers van het EG-nummer) tussen de query en de template eiwitten betrouwbare wijze kunnen worden geïnterpreteerd met behulp van EG-score> 1,1. Kijk voor consensus van de functie (EG-nummer) bij de templates, die de gelijkaardige vouw (dat wil zeggen TM-score> 0,5) hebben als de query eiwit. Als er meerdere templates hebben dezelfde EG-nummer en EG-score> 1,1, de betrouwbaarheid van de voorspelling is zeer hoog. Echter, als de EG-Score hoog is, maar er is een gebrek aan consensus onder de geïdentificeerde hits, dan is de voorspelling wordt minder betrouwbaar en de gebruikers wordt aangeraden de GO-termijn voorspellingen te raadplegen. Klik op de link die op de EG-nummers aan de ExPASy Enzym-database te bezoeken en de functie analyseren, inclusief de reactie gekatalyseerd, co-factor-eisen en de metabole route, van de template eiwit in detail. 9. Gene Ontology (GO) termijn voorspellingen Bekijk de "voorspelde GO termen" tabel (Figure 6) naar boven tien homologen van query eiwit in het VOB bibliotheek, geannoteerd met Gene Ontology (GO) termen te identificeren. Elk eiwit wordt meestal geassocieerd met meerdere GO termen, beschrijven de moleculaire functies (MF), biologische processen (BP) en cellulaire component (CC). Klik op een term om de Amigo website te bezoeken en de definitie en afstamming te analyseren. Analyseer de Fh-score (Functional homologie score) kolom om de functionele overeenkomst tussen de query en de template eiwitten toegang tot en het betrouwbaarheidsniveau van de overdracht van functionele annotatie van deze eiwitten te schatten. In onze benchmark-studie 23, zou 50% van de inheemse GO voorwaarden correct worden geïdentificeerd vanaf de eerste geïdentificeerde template met behulp van een Fh-score cutoff van 0,8, met een totale nauwkeurigheid van 56%. Bekijk de 'Consensus voorspelling van GO termen "tabel om de samenloop van de functie tussen de sjablonen te analyseren. Deze gemeenschappelijke functies worden gebruikt voor het voorspellen van de GO termen (MF, BP en CC) van de queryeiwit en beoordelen van de betrouwbaarheid (GO-score) van GO termijn voorspellingen. Op basis van de benchmarking-test 23, zijn de beste vals positieve en vals negatieve uitslagen verkregen voor voorspellingen met een GO-score cutoff = 0,5, met afnemende dekking van de voorspelling op diepere niveaus ontologie. 10. Eiwit-ligand bindingsplaats voorspellingen Scroll naar beneden naar de onderkant van de pagina om top tien ligand binding site voorspellingen voor de query-eiwit te bekijken. Voorspelde bindingsplaatsen zijn gerangschikt op basis van het aantal voorspelde ligand conformaties die gemeenschappelijke bindingsplaats delen. De beste geïdentificeerde bindingsplaats is al weergegeven in de Jmol applet. Klik op de radio knoppen om andere voorspellingen te analyseren en de ligand interactie residuen te visualiseren. Analyseer de BS-score kolom om de plaatselijke overeenkomst tussen het model en sjabloon bindingsplaats evalueren. Op basis van de benchmark 9, BS-score> 1.1 geeft een hoge volgorde en structuur similarity de buurt van de voorspelde bindingsplaats in model en bekend bindingsplaats in de sjabloon. Download het VOB bestand geformatteerd structuur van het complex door te klikken op de "Download" link. Gebruikers kunnen deze bestanden in een moleculaire visualisatie-programma en interactief bekijk de voorspelde bindingsplaats en ligand-eiwit interacties op hun lokale computer. 11. Representatieve resultaten Figuur 1 Een uittreksel van de I-TASSER resultaat pagina met (A) FASTA geformatteerd zoeksequentie;. (B) voorspelde secundaire structuur en de bijbehorende zelfvertrouwen scores, en (C) voorspelde solvent toegankelijkheid van de residuen. Geanalyseerd kerngebied en het potentieel hydratatie site in de query worden gemarkeerd in cyaan en rood rechthoeken, respectievelijk. Figuur 2. </strong> Een voorbeeld van I-TASSER resultaat pagina met tertiaire structuur voorspellingen voor de query eiwitten. De voorspelde modellen worden getoond in een interactieve Jmol applet, zodat de gebruiker de weergave van het molecuul te veranderen. De modellen kunnen ook worden gedownload door te klikken op de "Download" links. Het vertrouwen score om de kwaliteit van het model schatting wordt gerapporteerd als C-score. Figuur 3. Een voorbeeld van I-TASSER resultaat pagina met top tien geïdentificeerd threading templates en uitlijning door LOMETS 5 threading-programma's. De kwaliteit van de threading uitlijningen is geëvalueerd op basis van genormaliseerde Z-score (groen gemarkeerd), waar een waarde> 1 geeft een zelfverzekerde lijn. Uitgelijnd residuen in de template die identiek zijn aan de overeenkomstige vraag residuen zijn gemarkeerd in kleur op de aanwezigheid van geconserveerde residu / motief te geven, terwijl een gebrek aan afstemming in de meeste top templates geeft de aanwezigheid van meerdere domeinen in de query eiwit en de niet aangepaste residuen corresponderen met domeinnaam linker regio's. Klik hier om de full-sized versie van figuur 3 te bekijken. Figuur 4. Een voorbeeld van een resultaatpagina, waarbij de top tien geïdentificeerde structurele analogen en structurele uitlijning, geïdentificeerd door TM-align 20 structureel alignment programma. De rangschikking van de analogen die in is gebaseerd op de TM-score (blauw gemarkeerd) van de structurele aanpassing. Een TM-score> 0,5 geeft aan dat de twee vergeleken structuren een soortgelijke topologie hebben, terwijl een TM-score <0,3 betekent dat een overeenkomst tussen twee willekeurige structuren. Structureel lijn residu paren zijn gemarkeerd in kleur op basis van hun amino-acid eigenschap heeft, terwijl de niet aangepaste regio's worden aangeduid met "-".ove.com/files/ftp_upload/3259/3259fig4large.jpg "> Klik hier om de full-sized versie van figuur 4 te bekijken. Figuur 5. Een voorbeeld van I-TASSER resultaat pagina met geïdentificeerd enzym homologen van de query eiwit in het VOB bibliotheek. De betrouwbaarheid van de EG-nummer voorspelling is geanalyseerd op basis van EC-score (groen gemarkeerd), waar EG-score> 1.1 geeft functionele gelijkenis (dezelfde eerste 3 cijfers van het EG-nummer), tussen de query en template eiwit. Figuur 6. Een voorbeeld van I-TASSER resultaat pagina met GO termijn voorspellingen voor de query eiwit. Functionele homologen voor de query eiwit in de Gene Ontology template bibliotheek zijn gerangschikt op basis van hun Fh-score (in oranje rechthoek). Gemeenschappelijke functionele kenmerken van deze top-hits scoren zijn afgeleid te alge at de laatste GO termijn voorspellingen voor de query eiwit. De kwaliteit van de voorspelde GO voorwaarden is geschat op basis van GO-score (aangegeven in groen), waar een GO-score> 0.5 geeft een betrouwbare voorspelling. Klik hier om de full-sized versie van figuur 6 te bekijken. Figuur 7. Een voorbeeld van I-TASSER resultaat pagina met top tien eiwit ligand-bindingsplaats voorspellingen met behulp van de cofactor 9 algoritme. De rangschikking van de voorspelde bindingsplaatsen is gebaseerd op het aantal van de voorspelde ligand conformaties dat gemeenschappelijke binding pocket aandeel in de query. BS-score (rood gemarkeerd) is een maat van de lokale volgorde en structuur overeenkomst tussen de voorspelde en sjabloon bindingsplaats, en is nuttig voor het analyseren van het behoud van de bindingsplaats zakken. les/ftp_upload/3259/3259fig8.jpg "/> Figuur 8. Een voorbeeld van externe dwang bestanden die gebruikt worden om voor het opgeven van residu-residu contact / afstand beperkingen. Figuur 9. Voorbeeld van terughoudendheid bestanden die gebruikt worden voor het specificeren van een template eiwit aan de I-TASSER server. Gebruiker kan de query-template alignment hetzij in (A) FASTA-formaat, of (B) 3D-formaat. Figuur 10. Een voorbeeld bestand dat wordt gebruikt voor de uitsluiting van template tijdens de I-TASSER structuur modelleren procedure. De eerste kolom bevat het VOB ID van het sjabloon eiwitten worden uitgesloten. De tweede kolom wordt gebruikt om de sequentie-identiteit cutoff die voor andere, soortgelijke sjablonen worden gebruikt in de template bibliotheek te geven.