本议定书的目标是制定一个基准不同蛋白质缺乏连贯一致的命名和分类标准的组中。此引用有助于分析和小组讨论作为一个整体,可采用除规定名称。
研究了在不同的实验室使用不同生物体的相关的蛋白可能缺乏统一的制度的命名和分类,制作困难,讨论组作为一个整体并放置到适当的上下文的新序列。发展优先重要序列特征的引用有关的结构和 (或) 活动可用于除规定名称向不同的蛋白质组中添加一些相干。本文使用的半胱氨酸稳定 α 螺旋 (CS-α β) 超家族作为一个例子显示如何在电子表格软件中生成的引用可以澄清现有蛋白超家族成员之间的关系,以及促进新的加法序列。它还演示如何引用可以帮助完善中常用的软件,系统发育分析的有效性的影响生成的序列比对。引用的使用可能会对于蛋白质组包含高度不同的序列,从广泛的类群,具有各种功能,不充分的分子分析捕捉到最有帮助。
蛋白质的名称应该反映是特征及与其他蛋白质的关系。不幸的是,名称通常会发现当时被分配,并且,随着研究的继续,较大范围的理解可能更改。如果蛋白质被独立地识别由多个实验室,变化在命名或被认为是明确分配名称时的特点和充足地不再区分蛋白质的名称,这会导致多个名称从别人。
无脊椎动物防御提供很好的例子,变性的命名和分类。第一次的无脊椎动物防御宗从昆虫,和名称”昆虫防御素”,提出了基于感知的同源性为哺乳动物防御素1,2。长期防御素仍然使用,即使它是现在很清楚那无脊椎动物及哺乳动物防御素不共享一个共同的祖先3,4。根据物种,”防御”无脊椎动物可能有六个或八个半胱氨酸 (即形成三个或四个二硫键) 和各种抗菌活性。防止局势进一步复杂化,具有相同特征的蛋白质称为防御素是不总是”防御,”如最近发现的 cremycins 从秀丽 remanei5。此外,无脊椎动物大防御素是更有可能进化有关脊椎动物 β-防御素比到其他无脊椎动物防御6。尽管这样,研究人员有时依赖名称”防御”确定哪些序列应列入分析时。
结构的研究揭示昆虫防御素与蝎子毒素7,之间的相似性和 CS-α β 折叠随后成立作为昆虫防御8的定义结构特征。这折叠结构蛋白质分类 (SCOP) 数据库中9,目前包括五个家庭定义蝎子毒素样 (CS-α β) 超家族: 昆虫防御素、 短链蝎毒素、 长链蝎毒素,MGD 1 (从软体动物) 和植物防御素。这个家族是最近描述的独联体防御4和蛋白酶基因 3D 数据库10,11超 3.30.30.10 家族的代名词。从繁多的无脊椎动物类群、 植物和真菌显示的名称包含这折叠的蛋白质显然无关的半胱氨酸数量的抗菌活性或键合模式、 进化历史12的研究。
缺乏一致性和明确的标准,使它具有挑战性进行命名和分类在这个家族中的新发现序列。比较此超家族蛋白的主要障碍是半胱氨酸的编号对每个单独序列 (每个序列中的第一个半胱氨酸是 C1),没有办法解释的结构的作用。这意味着只有序列与相同数量的半胱氨酸可以进行比较。还有小序列保守性非半胱氨酸形成 CS-α β 折叠,使线路及系统发育分析困难。通过开发划分结构功能优先级编号系统,可以更轻松地比较和对齐家族序列。保守的特点,以及那些定义分组,可以快速,可视化和新序列可以更轻松地放入适当的上下文。
本文使用一个电子表格软件 (如Excel) 来生成参考编号系统的 CS-α β 超家族。它显示如何这澄清序列之间的比较,并将其应用于新的 CS-α β 序列确定从缓步动物。使用 CS-α β 超家族作为一个例子,是写议定书 》 提供指导,当使用序列的兴趣;然而,它不是要具体到这个家族或富含半胱氨酸序列。此方法可能会最有用的蛋白质,有独立研究在不同类群和 (或) 有小的整体序列同源性,与离散性的特征,不可能很容易识别的分子分析软件组。此方法要求一些先验的决定,有关重要的功能,所以它将有限的公共事业,如果没有重要的特点,确定了。主要的目标是展示如何可以实现一个简单的可视化的序列关系。这然后可以用于通知序列比对和分析,但如果对齐方式和分析的主要目标,条形码方法会有更多的容量,为自动化13个合适的选择。当前方法的线性形式,显示每个肽的特点,所以它不会有助于直接可视化的三维结构。
命名组内的蛋白质标准应该是明确的但事实并非总是如此。在许多实验室使用各种各样的生物,导致在不同系统中的术语,以及不同程度的表征,研究了有 CS-α β 折叠的序列。企图强加一个完全新的命名法是不合理的会导致大量的混乱时以前文献。参考编号系统可以蛋白质名称用于澄清其与家族的特征。
组蛋白的明确标准的命名和分类将不可能受益于生成参考在电子表格中?…
The authors have nothing to disclose.
正在缓步动物抗菌肽的研究得到了校内资金来自美国中西部大学研究办公室和赞助程序 (ORSP)。ORSP 没有任何作用,研究设计、 数据收集、 分析、 解释或手稿的准备。
BLAST webpage | https://blast.ncbi.nlm.nih.gov/Blast.cgi | ||
EditSeq (Lasergene suite) | DNASTAR | https://www.dnastar.com/t-allproducts.aspx | |
Excel 2013 | Microsoft | ||
FigTree | http://tree.bio.ed.ac.uk/software/figtree/ | ||
MEGA | www.megasoftware.net | ||
MrBayes | http://mrbayes.sourceforge.net/ | ||
SCOP database | http://scop.mrc-lmb.cam.ac.uk/scop/ |