Özet

Bio3D-web을 이용한 단백질 염기 서열 구조 역학 관계 조사

Published: July 16, 2017
doi:

Özet

Bio3D-web을 이용한 단백질 서열 – 구조 – 역학 관계에 대한 온라인 조사 프로토콜을 제시한다.

Abstract

우리는 생체 분자 구조 데이터의 상호 작용 분석을위한 Bio3D-web의 사용법을 보여줍니다. Bio3D 웹 응용 프로그램은 다음을 위해 온라인 기능을 제공합니다 : (1) 유사성의 사용자 지정 임계 값에 대한 관련 단백질 구조 세트의 식별. (2) 다중 정렬 및 구조 중첩; (3) 염기 서열 및 구조 보존 분석; (4) 주성분 분석과의 상호 조화도 관계 매핑, (5) 앙상블 일반 모드 해석을 통한 예측 된 내부 역학의 비교. 이 통합 기능은 단백질 패밀리와 슈퍼 패밀리 내에서 서열 – 구조 – 동적 관계를 조사하기위한 완벽한 온라인 워크 플로우를 제공합니다.

Introduction

단백질 데이터 뱅크 (PDB)는 이제 120,000 개가 넘는 단백질 구조를 포함하고 있습니다 – 대부분은 동일한 단백질 군이지만 다른 실험 조건에서 분해됩니다. 이러한 여러 구조는 단백질 형태와 기능의 복잡성을 이해하는 데 매우 귀중한 자료입니다. 예를 들어, 이러한 구조 앙상블의 엄격한 비교는 중요한 분자 메커니즘 1 , 2 , 3을 밝혀 내고 리간드 결합, 효소 촉매 및 이중 분자 인식 4 , 5 , 6 , 7을 포함하는 프로세스에 관련된 구조 동역학에 정보를 제공 할 수 있습니다. 단백질 패밀리의 순서, 구조 및 동역학에 대한 상세한 대규모 분석을 통해 새로운 통찰력을 얻을 수 있습니다. 그러나, 이것은 전형적으로 상당한 생체 수오 머믹 및 컴퓨터 프로그래밍 전문 지식과 함께 연구중인 단백질 시스템에 익숙합니다. 예를 들어, Bio3D, ProDy 및 Maven과 같은 소프트웨어 패키지는 각각 R, Python 및 Matlab에서 프로그래밍이 필요합니다 ( 8 , 9 , 10) . 반대로 구조 유연성 분석을위한 온라인 도구는 일반적으로 개별 구조의 조사에만 국한됩니다 ( 11 , 12) . 이와 관련하여 최근에 개발 된 WebNM @ 서버는 예외로, 일부 미리 정렬 된 사용자 지정 구조 13의 표준 모드 분석 (NMA)에서 얻은 유연성 패턴을 비교할 수 있습니다. 그러나이 서버에는 비교, 정렬 또는 NMA 이상의 추가 분석을위한 구조 식별을위한 자동화 된 절차가 없습니다. 최근의 또 다른 기여는 온라인 PDB 플렉스 데이터베이스입니다.95 % 이상의 서열 동일성을 공유하는 14 PDB 구조 omputed 분석. 그러나 더 다양한 구조 집합에 대한 분석은 현재 사용할 수 없습니다.

우리는 이전에 Bio3D-web을 보았습니다 – 단백질 서열 – 구조 – 동적 관계의 분석을 위해 사용하기 쉬운 웹 응용 프로그램 15 . Bio3D-web은 온라인 상 대형 동종 구조 세트의 확인, 비교 및 ​​상세한 분석을 위해 사용하기 쉬운 통합 기능을 제공하는 데있어 독보적입니다. Bio3D-web을 이용한 단백질 서열 – 구조 – 역학 관계의 온라인 조사를위한 상세한 프로토콜을 제시합니다. Bio3D-web은 그림 1에 나와 있으며 아래에서 자세히 설명하는 5 가지 주요 데이터 분석 단계를 지원하는 다양한 기능을 제공합니다. 이 단계는 쿼리 시퀀스 또는 구조 입력, 여러 수준의 시퀀스 구조 동적 분석, 요약 등의 워크 플로를 구성합니다.보고서 생성. 결과는 일반적으로 사용되는 형식으로 결과 파일을 다운로드하는 것뿐만 아니라 광범위한 브라우저 내 시각화 및 플로팅 장치를 통해 즉시 사용할 수 있습니다. Bio3D-web은 매개 변수 및 방법 선택의 효과를 탐색하기위한 편리한 사용하기 쉬운 인터페이스 외에도 사용자 세션의 전체 사용자 입력 및 그래픽 결과를 PDF, DOC 및 HTML 형식의 공유 가능한 재현 가능한 보고서로 기록합니다. 사용자 세션은 이후에 저장되고 다시로드 될 수 있으며 사용자의 로컬 컴퓨터에서 Bio3D R 패키지에 의해 다운로드되고 완성 된 결과가 해석 될 수 있습니다.

Bio3D 웨브는 생체 분자의 구조, 순서 및 분자 시뮬레이션 데이터 (8), (16)의 분석을 위해 Bio3D R 패키지에 의해 강화된다. 특히, rigid-core 식별을위한 Bio3D 알고리즘 8 , 중첩, 주성분 분석(PCA) 8 및 앙상블 일반 모드 분석 (eNMA) 16 은 애플리케이션의 기초를 형성합니다. 우리는 또한 관련 단백질 구조의 확인을 위해 pHMMER 17 에 의존하는 Bio3D 프로토콜과 다중 서열 정렬을위한 MUSCLE 18 을 활용합니다. 구조 및 서열 주석은 RCSB PDB 19 및 PFAM 데이터베이스 20의 Bio3D 유틸리티를 통해 파생됩니다. Bio3D-web은 온라인 서버에서 실행하거나 R을 실행하는 모든 컴퓨터에 로컬로 설치할 수 있습니다. Bio3D-web은 모든 사용자에게 개방되어 있으며 http : // thegrantlab에서 GPL-3 오픈 소스 라이센스에 따라 무료로 제공됩니다. org / bio3d / webapps

Protocol

참고 : 일반적인 Bio3D-web 세션은 5 단계의 연속 된 종속 단계를 거칩니다 (도식적 표현은 그림 1 참조). 각 단계는 웹 애플리케이션의 연속 탐색 탭, 즉 SEARCH, ALIGN, FIT, PCA 및 eNMA로 구현됩니다. 1. 구조 검색 및 선택 (SEARCH) 입력 구조 아데 닐 레이트 키나아제의 PDB ID (ADK)을 구하는 상기 PDB [http://www.rcsb.org/pdb]를 검색함으로써 예. 대안 적으로, UniProt [http://uniprot.org] 예에서 관심있는 단백질의 아미노산 서열을 얻었다. Adk에 대한 4 자 길이의 PDB ID ( 예 : 1AKE)를 입력하거나 단백질 시퀀스를 '입력 구조 또는 시퀀스'패널의 입력란에 붙여 넣습니다. 히트 선택 첫 번째 패널에서 파란색 "다음"(히트 선택) 버튼을 클릭하거나 간단히 패널로 스크롤합니다 B) "히트 선택"추가 분석을 위해. "포함 된 구조의 총 개수 제한"슬라이더가 컷오프 위에 모든 구조를 포함하도록 최대 값으로 설정되어 있는지 확인하십시오. "포함 BitScore 컷오프 조정"을 낮추어 관련성이 더 높은 히트를 포함 시키거나 제외시킵니다. 선택적 히트 필터링 첫 번째 패널에서 파란색 '다음'(히트 선택) 버튼을 클릭하거나 패널 C) '추가 분석을 위해 관련 구조의 선택적 필터링'으로 스크롤합니다. 테이블의 세부 사항, 예를 들어 PDB 이름, 종 및 바운드 리간드를 검사하여 선택된 히트가 관련 구조를 나타내 었는지 확인하십시오. 필요한 경우 표의 행을 클릭하여 선택한 구조의 하위 집합을 수동으로 수정합니다. 참고 : 파란색으로 강조 표시된 행은 이후 탭에서 추가 분석을 위해 선택된 PDB ID를 나타냅니다. 2. 다중 서열 정렬 분석 (ALIGN) 정렬 탭을 클릭하여 검색 탭에서 선택된 구조의 순서 정렬을 수행하십시오. 정렬 요약 패널 A) "정렬 요약"에서 정렬 요약을 검토하십시오. 관심 영역이 정렬되어 있고 하나 이상의 구조에서 간격으로 가려져 있지 않은지 확인하십시오. 필요한 경우, "Display alignment editing options"를 토글하고 원하지 않는 PDB ID를 제거하십시오 ( 예 : 누락 된 PDB). 서열 정렬 분석 파란색 "Next (분석)"버튼을 클릭하여 수집 된 구조의 시퀀스 기반 클러스터링 분석을 수행하십시오. 플롯 옵션 Dendrogram을 선택하십시오. 클러스터를 K 그룹 슬라이더로 조정하여 구조를 k 그룹으로 분할하십시오. 필요에 따라 더 많은 클러스터링 및 출력 옵션 확인란을 전환하여 클러스터링 방법을 변경하십시오 (선택 사항). </ol> 잔류 물 보존 분석 파란 "다음"(Conservation) 버튼을 클릭하여 열에 따른 잔류 물 보존을 계산하십시오. 정렬 된 구조 세트를 선택하여 각 정렬 위치에서 잔류 물 보존의 플롯을 생성합니다. 패밀리의 대표 멤버를 포함하는 연관된 PFAM 시드 정렬과 관련하여 계산 된 보존을 보여주기 위해 PFAM 시드 정렬과 정렬 된 구조를 선택합니다. 시퀀스 정렬 디스플레이 파란색의 "다음"(정렬) 버튼을 클릭하여 브라우저 내 정렬 시각화 도구로 전체 시퀀스 정렬을 표시합니다. 구조 피팅 및 분석 (FIT) FIT 탭을 입력하여 구조 중첩을 수행하십시오. 구조 중첩 정렬 된 단백질을 시각화하기 위해 "Show PDBs"체크 박스를 토글합니다.n 브라우저의 구조. 육안 검사를 통해 단백질 구조가 해당 지역에 겹쳐져 있는지 확인하십시오. 마우스를 클릭하여 구조 위로 회전하고 스크롤하여 확대 / 축소합니다. "색상 옵션"을 클릭하여 구조물의 색상을 조정하십시오. 색 지정 옵션에는 정렬 위치, 위치 별 구조적 가변성, RMSD 클러스터 그룹, 시퀀스 클러스터 그룹, 정렬 된 영역 및 2 차 구조가 포함됩니다. 특수 분자 뷰어 프로그램에서 시각화를 위해 기존 PDB 파일 또는 단일 PyMOL 세션 파일로 중첩 구조를 다운로드하십시오. 구조 분석 수집 된 PDB 구조의 구조 기반 클러스터링을 수행하려면 파란색 "다음"(분석) 단추를 클릭하십시오. 플롯 옵션 드롭 다운 메뉴에서 RMSD 히트 맵을 토글합니다. 클러스터링 방법 자체를 포함하여 클러스터링 옵션 조정"더 많은 클러스터링 및 출력 옵션"체크 상자를 토글합니다. 참고 : Pairwise RMSD 데이터는 또한 닥 드로, 히스토그램 또는 히트 맵으로 시각화 할 수 있습니다. 잔류 물 변동 파란색 "Next"(RMSF) 버튼을 클릭하면 X 축의 가장자리 영역에 표시된 주요 2 차 구조 요소가있는 각 잔여 물의 ​​구조적 변동성 (RMSF 플롯으로 표시)을 볼 수 있습니다. Show B-factors 체크 박스를 토글하여 RMSF 플롯에 참조 구조의 결정 학적 B 계수를 오버레이합니다. 4. 주성분 분석 (PCA) "PCA"탭을 입력하여 주성분 분석을 수행하십시오. 주요 구성 요소의 시각화 브라우저 내 시각화 도구를 사용하여 PC에서 설명한 동작을 시각화하려면 "PC 궤적 표시"확인란을 선택합니다. "Prin"을 확인하십시오.cipal 구성 요소 1 "은 첫 번째 드롭 다운 메뉴에서 선택됩니다. 다른 PC에서 설명한 동작을 시각화하려면 "Principal Component 선택"드롭 다운 메뉴에서 원하는 PC를 선택하십시오. "색상 옵션"드롭 다운 메뉴에서 궤적의 색상을 변경하십시오. 변위 크기로 색상을 지정하려면 "색상 옵션"에서 "위치 별 가변성"을 선택하십시오. "Principal Component Visualization"패널에서 "Download PDB trajectory"버튼을 클릭하여 PC에서 설명한 동작의 궤도보기를 얻습니다. "Download PyMOL"세션 파일 버튼을 클릭하여 모션을 벡터 필드로 제공하는 PyMOL 세션 파일을 생성하십시오. 순응 분석 파란색의 "다음"(플롯) 버튼을 클릭하여 두 개의 선택된 PC에 개별 구조를 투영합니다. "X 축의 PC"가 1로 설정되고 "PC on Y 축 "을 2로 설정합니다. 구조를 다른 PC에 투영하려면 그에 맞게 PC 번호를 조정하십시오. "PC Subspace로 클러스터"를 선택하여 PC 기반 클러스터링을 통해 플롯의 구조를 채 웁니다. "RMSD"클러스터링으로 색상을 지정하는 "RMSD" 시퀀스 기반 클러스터링으로 색상을 지정할 수 있습니다. 플롯의 각 점을 클릭하여 구조에 라벨을 지정합니다. 또는 플롯 아래에있는 "PCA conformer plot annotation"표에서 하나 이상의 구조를 강조 표시하십시오. 부분 공간 슬라이더에있는 PC를 클러스터링 알고리즘에 대한 더 많거나 적은 PC로 밀어 넣으십시오. 잔류 기여 청색 "다음"(잔여 기고) 버튼을 클릭하여 개별 PC에 대한 잔여 기고 물을 계산하십시오. "주 구성 요소 선택"텍스트 상자에 PC 번호를 포함하여 추가 PC에 대한 기여도를 플롯합니다. 토글 "스프레드 리nes "체크 박스를 선택하면 잔여 물의 ​​기여도를 서로 겹쳐서 표시하지 않습니다. "Multiline plot"체크 상자를 해제하여 잔여 물의 ​​기여도를 별도의 플롯에 표시합니다. "RMSF 표시"를 토글하여 FIT 탭의 RMSF 값을 포함시킵니다. 5. 앙상블 일반 모드 분석 (eNMA) 정상 모드 (NM) 계산을 시작하려면 eNMA 탭을 클릭하십시오. 필터 구조 구조체 포함 / 제외에 대한 "컷오프"를 높이거나 낮추어 구조 수를 조정하십시오. NMA 계산을 시작하려면 녹색 "Run Ensemble NMA"를 클릭하십시오. 일반 모드 시각화 eNMA 탭의 두 번째 패널 (Normal Modes Visualization)으로 스크롤하여 NM을 시각화하십시오. 참고 : 기본적으로 PC-1과 가장 겹치는 (유사성) NM이 시각적으로 표시됩니다ization 창. 다른 NM이나 다른 PDB 구조에 의해 묘사 된 동작을 시각화하려면 "Choose Mode"와 "NMs for structure" 드롭 다운 메뉴에서 원하는 NM과 구조를 선택하십시오. 잔류 물 변동 eNMA 용으로 선택된 구조의 잔류 물에 따른 변동을 계산하려면 파란색 '다음'(변동) 버튼을 클릭하십시오. RMSD 기반 클러스터링을 사용하여 변동 프로필을 색칠하려면 "RMSD 별 클러스터"를 토글합니다. RMSIP 기반 클러스터링을 사용하여 변동 프로필을 색칠하려면 "RMSIP 별 클러스터"를 전환하십시오. 그룹화 된 변동 프로필을 서로 구별하기 위해 "스프레드 라인"체크 상자를 토글합니다. NMA와 PCA 비교 파란색 "Next"(PCA-vs-NMA) 버튼을 클릭하여 개별 NM과 PC 간의 유사성을 계산하십시오. P를 선택하십시오.이 구조의 NM과 PCA 탭에서 계산 된 PC 간의 유사도를 계산하려면 "구조의 NM 비교"드롭 다운 메뉴에서 DB ID를 선택하십시오. 겹침 분석 파란색 "Next"(Overlap analysis) 버튼을 클릭하여 계산 된 NM과 선택된 두 구조 사이의 구조 차이 벡터 사이의 중첩을 계산합니다. "구조의 NM을 비교하십시오"드롭 다운 메뉴에서 "참조"PDB ID를 선택하고 참조 PDB와 쌍으로 비교하기 위해 구조 테이블에서 하나 이상의 PDB ID를 선택하십시오. 클러스터링 분석 쌍방향 NM 유사성 (RMSIP)을 기반으로 구조 클러스터링을 수행하려면 파란색 " 다음"(클러스터링) 단추를 클릭하십시오.

Representative Results

Adenylate kinase (Adk)는 많은 세포 과정에 필수적인 세포질 뉴클레오티드 사이의 평형을 유지하는 기능을하는 유비쿼터스 효소이다. Adk는 ATP에서 AMP로 포스 포릴 기의 가역적 전달을 촉진시킴으로써 작동한다. 이 반응은 잘 연구 된 속도 제한 구조 변화 3 , 21을 동반한다. 여기서 우리는 Bio3D-web을 통해 현재 이용 가능한 모든 Adk 구조를 분석하여 이러한 필수 전환의 상세한 기능과 기계 원리를 밝힙니다. 알려진 Adk 구조의 RCSB PDB 코드를 입력하여 Adk의 Bio3D 웹 분석을 시작할 수 있습니다. 예를 들어, 검색 탭의 패널 A에 PDB ID 1AKE 를 입력하면 추가 분석을 위해 상단 26이 자동으로 선택되는 유사한 구조의 시퀀스가 ​​반환됩니다 (패널 B 참조). 현재 주석패널 C의 ed는 이들 선택된 구조가 모두 대장균 으로부터 유래 된 것으로, 일련의 공간 그룹에서의 x- 선 회절에 의해 해결되었음을 나타낸다; 분해능 범위가 1.63 ~ 2.8Å이며, 다양한 리간드 (리간드, AMP, ADP, MG 및 억제제 AP5를 포함하지 않음)의 범위와 함께 결정화된다. 패널 C에서 "열 표시 / 숨기기"옵션을 클릭하여 추가 주석 세부 정보를 표시 할 수 있습니다. 정렬 탭을 입력하면 다중 서열 정렬이 수행됩니다. 정렬 탭의 첫 번째 패널에는 정렬 행 수 (PDB 구조 수와 동일)와 위치 수 ( 즉, 정렬 열)에 대한 세부 정보를 제공하는 정렬 요약이 표시됩니다. 여기에는 간격 및 틈이없는 열 수의 지정이 포함됩니다. 첫 번째 행의 오른쪽에있는 그림은 서열 정렬의 도식적 인 표현을 제공합니다. 여기 일그레이 영역은 갭이 아닌 위치를 나타내며, 정렬의 흰 영역은 갭에 해당합니다. 서열 보존의 표현은 잘 보존 된 위치를 나타내는 빨간 영역과의 정렬 위에 표시되고, 덜 보 존된 것은 흰색으로 표시됩니다. 이 그림의 시퀀스는 왼쪽에있는 클러스터링 맹점에 의해 제공된 유사성을 기반으로 정렬됩니다. 이 탭의 두 번째 패널은 dendrogram 또는 heat map으로 시각화 할 수있는 pair-wise sequence 유사성을 기반으로 선택된 PDB의 클러스터링을 더욱 용이하게합니다. 기본적으로 클러스터 정렬을 나타내는 덤 드로 그램 (또는 트리 다이어그램)이 표시됩니다. dendrogram의 y 축은 클러스터 간의 거리를 나타냅니다 (서열 동일성 기준). 구조 중첩은 FIT 탭에 들어갈 때 자동으로 수행됩니다. 패널 A에서 상호 작용 적으로 표시되는 중첩 구조, 인디 케이상대적으로 단단한 코어 영역 (잔여 물 1-29, 68-117 및 161-214를 포함, 자세한 내용은 FIT 탭 하단의 '선택 코어 및 RMSD 세부 정보'패널 참조). 두 개의 더 다양한 뉴클레오타이드 결합 영역 (잔기 30-67 및 118-167)도 명확하게 볼 수있다 ( 그림 2 ). RMSD 기반 클러스터링은 이러한 구조를 두 개의 별개의 구조로 그룹화합니다. PCA 탭을 클릭하면 관련된 구조의 결합 된 뉴클레오타이드 종을 효과적으로 차단하는 이들 영역의 변위 ( 그림 2B 및 2C )와 관련하여 구조 간의 관계가보다 명확하게 표시됩니다. 대다수의 구조는 '닫힌'형태 ( 그림 2C의 파란색)에 있으며 결합 된 리간드 또는 억제제와 관련되어 있습니다. 반대로 더 많은 '열린'형태는 뉴클레오타이드 및 억제제가 없다. 이것은Adk 구조와 역학에 대한 광범위한 연구 결과로이 지역의 개방 된 배열이 효율적인 포스 포릴 전달 및 유해 가수 분해 사건의 억제를위한 뉴클레오타이드 결합 및 밀폐 된 형태에 필요하다는 것을 나타낸다. 하나의 PC가이 Adk 구조 세트에서 전체 평균 제곱 변위의 97 %를 캡처하고이 기능적 변위에 대한 개별 잔여 물의 ​​기여와 함께 폐쇄 상태 전환에 대한 명확하고 설득력있는 설명을 제공한다는 사실은 주목할 만합니다 (패널 C의 앱 및 도 2 ). NMA 탭을 방문하고 계산을 위해 고려한 구조의 수를 늘리면 (유사한 구조를 필터링하기위한 컷오프를 줄임으로써) 열린 상태 구조가 닫힌 양식 구조와 비교하여 향상된 로컬 및 전역 역학을 표시합니다 ( 그림 2D 및 응용 프로그램의 패널 C) . PCA 및 NMA 결과 비교개별 구조 (패널 D)는 모든 열린 형태 구조의 첫 번째 모드가 PC1 (평균값 0.37 ± 0.04)과 상대적으로 높은 중첩을 표시 함을 나타냅니다. 대조적으로 닫힌 양식 구조는 더 낮은 값을 표시합니다 (평균 0.30 ± 0.01). 개방형 구조물 (0.62 ± 0.003)의 RMSIP 값은 닫힌 구조물 (0.56 ± 0.008)의 RMSIP 값보다 높습니다. 또한 중첩 분석은 개방 상태의 첫 번째 모드가 개방 및 폐쇄 상태의 차이를 설명하는 구조 변화와 잘 일치 함을 보여줍니다 (패널 E). RMSIP 값에 기반한 클러스터링은 열린 상태 및 닫힌 상태 구조의 일관된 분할을 다시 표시합니다 (패널 F). 집합 적으로이 결과는 Adk에 대한 두 개의 주요 뚜렷한 구조 상태의 존재를 나타낸다. 이들은 서로 다른 flexibi를 나타내는 두 개의 뉴클레오타이드 결합 부위의 집합적인 저주파 변위에 의해 상이하다뉴클레오티드 바인딩에 lities. 그림 1 : PCA 및 NMA 탭의 스크린 샷이있는 Bio3D-web 개요. Bio3D-web은 사용자가 제공 한 단백질 구조 또는 서열을 검색 탭 ( 1 )의 입력으로 사용합니다. 서버는 추가 분석을 위해 선택할 수있는 관련 구조 목록을 제공합니다. ( 2 ) 정렬 탭은 검색 탭에서 선택한 구조의 정렬 및 분석을 제공합니다. ( 3 ) FIT 탭에서 모든 구조가 3D로 겹쳐 표시되고 기존의 쌍 단위 구조 분석 결과와 함께 시각화됩니다. ( 4 ) PCA 탭에서 구조 설정의 주성분 분석을 수행하여 상호 구성자 관계를 특성화합니다. ( 5 ) 각 구조에 대한 정상 모드 분석은 eNMA 탭에서 수행 할 수 있습니다.사용 가능한 구조적 상태에 대한 동적 경향을 탐구합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 그림 2 : 아데 닐 레이트 키나아제의 Bio3D-web 분석 결과. ( A ) 확인 된 불변 코어에 중첩 된 아데 닐 레이트 키나아제의 이용 가능한 PDB 구조. 구조는 FIT 탭에 제공된 RMSD 기반 클러스터링에 따라 색상이 지정됩니다. ( B ) 주요 구성 요소의 시각화는 PCA 탭에서 데이터 세트의 주요 형태 변화를 특성화 할 수 있습니다. 여기서, 제 1 주성분에 대응하는 궤적이 단백질의 대규모 폐쇄 운동을 나타내는 튜브 표현으로 도시된다. ( C ) 구조는 pr 다.conformational variability의 낮은 차원의 표현을 보여주는 conformer plot에서 두 개의 첫 번째 주성분을 입혔다. 각 점 (또는 구조)은 사용자가 지정한 기준에 따라 색상이 지정됩니다.이 경우 PCA 기반 클러스터링 결과입니다. ( D ) eNMA 탭의 일반 모드 분석은 닫힌 양식 (파란색) 구조와 비교하여 개방 상태 (빨간색)의 구조에 대한 향상된 로컬 및 글로벌 역학을 제안합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

Discussion

Bio3D-web은 이용 가능한 결정학 구조에서 단백질의 구조적, 동적 및 기능적 상태를 대화식으로 탐색하고 매핑하는 데 사용할 수 있습니다. 또한 NMA 및 PCA 기반 클러스터링 결과는 주석 및 시퀀스 기반 분석과 함께 앙상블 소분자 도킹 또는 분자 역학 시뮬레이션과 같은 시간 소모적 인 분석을위한 대표적인 구조를 선택하는 데 특히 유용 할 수 있습니다. Bio3D-web은 기술적 인 전문성을 요구하는 수준을 줄임으로써 광범위한 연구원을 대상으로 첨단 구조 생물 정보학 분석을 용이하게합니다. Bio3D-web의 현재 디자인은 완전한 독립형 Bio3D 패키지에서 사용할 수있는 많은 분석 방법을 철저히 포함함으로써 단순함을 강조합니다. 많은 경우에 연구자들은 단백질 가족이나 관심 분야의 슈퍼 패밀리에 대한 일반적인 추세를 이해하기 위해 Bio3D-web을 사용하게 될 것이고, 그러면 더 전문화 된 분석을 할 수있을 것입니다. Bio3D-web은생물 분자 구조 데이터 세트를 신속하게 탐구하고 가설 생성 도구로 사용하도록 고안되었습니다. 재현 가능한 보고서에 예제 3의 Bio3D 코드를 제공하여 사용자가 데이터를 더 자세히 탐색 할 것을 권장합니다.이 코드는 모든 쿼리 세부 정보와 분석 결과도 저장합니다.

위의 대표적인 프로토콜에서 우리는 Ad3k의 기능적 입체 전환의 구조적 특징을 밝히기 위해 Bio3D-web의 능력을 보여줍니다. Bio3D-web의 추가 응용 프로그램에는 사용자 업로드 PDB 구조의 구조 및 동적 분석이 포함됩니다. 예를 들어, 사용자는 분석을 위해 새로운 구조 또는 실제로 단백질 서열을 업로드 할 수 있습니다. 앞에서 언급 한 분석 단계, 특히 eNMA 단계는 기능적 중요성이있는 집단 운동과 함께 단백질 운동의 지역적 및 세계적 경향을 나타낼 수 있습니다. 아포 구조와의 비교는 또한 결합되지 않은 결합 된 구조적 전이의 특성을 나타낼 수있다. 신청의 추가 사례다양한 단백질 계열이 온라인으로 제공됩니다.

모든 단백질이 유연하고 동적 인 실체이지만 모든 단백질이 다양한 상태 ( 예 : 활성 상태 및 비활성 상태)의 범위에서 사용할 수있는 원자 분해 구조를 갖는 것은 아닙니다. 따라서 단백질 구조 공간에 대한 우리의 견해는 제한적이며 따라서 Bio3D-web과 같은 도구에서 얻은 통찰력은 특정 단백질에 대해서도 필수적으로 제한적입니다. 그러나 현재의 기술 진보와 구조 유전체학에 대한 새로운 시도로 여기에 제시된 프로토콜은 중요한 구조 – 기능 관계에 대한 통찰력을 얻는 중요한 경로가 될 것입니다. 특히 먼 거리에서 관련있는 단백질을 분석 할 때 중요한 중요한 단계는 정렬 탭에서 정렬 오류의 잠재적 인 출현입니다. 시퀀스 유사성이 30 % 이하로 떨어지면 정렬 오류가 불가피하게 발생하며 사용자는 이러한 경우 시퀀스 정렬을 두 번 확인하고 수정해야합니다정렬 탭에서 정렬 오류로 인해 FIT 탭에 잘못된 겹쳐진 구조가 생기고 후속 PCA에 가장 적합한 구조 변형이 가려집니다. 또한 사용자는 현재 구현 에서처럼 선택된 PDB 구조에서 누락 된 잔기를 인식해야합니다. PCA는 모든 구조가 상응하는 탄소 원자 원자가 해소 된 단백질 잔여 물에서만 수행 할 수 있습니다. 결과적으로, 선택된 PDB가 단백질의 특정 영역에 대한 미해결 잔기를 갖는다면,이 영역은 PCA에서 생략 될 것이다.

Bio3D-web은 현재 단일 사슬 PDB 구조의 분석에 국한되어 있습니다. 결과적으로, 4 차 수준에서 발생하는 기능적 동작은 현재 프로토콜을 사용하여 탐색 할 수 없습니다. 우리는 현재 Bio3D-web에 이러한 분석을 포함하는 새로운 알고리즘을 개발하고 있지만, 현재의 유일한 옵션은 기존의 Bio3D를 사용하는 것입니다.

Bio3D-web은 유일한 온라인 지원 프로그램입니다.이온은 구조 집합을 쿼리하고 식별하고, 시퀀스 패턴과 구조적 다양성을 해석하고, 구조적 소성의 분석과 예측 모두에서 기계적 정보를 추출 할 수있게 해줍니다. 광범위한 분자 시각화 도구와 온라인 서버를 통해 연구원은 개별 생체 분자 구조를 탐색하고 분석 할 수 있습니다. 그러나 대규모 이기종 단백질 패밀리의 순서, 구조 및 동력을 분석하기위한 기존 도구는 상당한 계산 전문성을 필요로하며 일반적으로 관련 프로그래밍 기술을 가진 사용자 만 액세스 할 수 있습니다. R 8 예를 들어, Bio3D 패키지가 필요 ProDy 파이썬을 필요로하며 Maven은 matlab에 대한 지식 (9), (10)을 필요로한다. 대조적으로 Bio3D-web은 프로그래밍 지식이 필요 없으므로 접근성이 향상되고 고급 비교 시퀀스, 구조 및 다이를 수행하는 데있어 진입 장벽이 줄어 듭니다.namics 분석. 또한 Bio3D-Web 서비스에는 효율적인 분석을 위해 자주 필요한 분자 구조의 준비, 큐 레이션, 주석 및 정리가 포함되어 있습니다. 또한, 현재의 웹 브라우저에서 시작하고 제어 할 수있는 많은 구조를 대규모로 분석 할 수있는 서버 인스턴스를 통해 가능한 계산 리소스에 대한 그러한 분석을 수행하는 것에 대한 제한이 완화됩니다.

Bio3D-web의 공개 개발이 진행 중입니다 (https://bitbucket.org/Grantlab/bio3d 참조). 우리는 새로운 분석 기능을 계속 추가하고 기존 방법을 개선합니다. 향후 개발은 거리 매트릭스 기반 PCA 및 비틀림 PCA, 계통 발생 요소, 앙상블 바인딩 사이트 식별 및 단백질 군에 걸친 동적 네트워크 분석을위한 새로운 접근법을 포함하는보다 광범위한 서열 보존 접근법에 중점을 둘 것입니다. 이 점에서 현재 웹 응용 프로그램은 시작 지점을 나타냅니다.사용자 정의 실험 구조 세트에서 재현 가능하고 공유 가능한 단계를 가능하게함으로써 다른 많은 협업 구조 생물 정보 분석 워크 플로우를 지원합니다. 우리는 또한 PDB 구조의 비대칭 단위로부터 개별 및 다중 사슬에 추가하여 재구성 된 생물학적 단위 좌표 세트에 대한 미래의 지원을 계획한다. 추가 기능으로는 협업 작업 영역의 저장 및로드를 향상시키고 실행 취소 가능성을 높일 수 있습니다.

Bio3D-web은 생체 분자 구조 데이터의 대화 형 분석을위한 온라인 응용 프로그램입니다. Bio3D-web은 모든 현대 웹 브라우저에서 실행되며 다음과 같은 기능을 제공합니다. (1) 사용자가 지정한 유사도 임계 값과 관련된 단백질 구조 세트를 식별합니다. (2) 다중 정렬 및 구조 중첩; (3) 염기 서열 및 구조 보존 분석; (4) 주성분 분석과의 상호 조화도 관계 및 (5) 앙상블을 통한 예측 된 내부 역학의 비교말 모드 분석. 이 통합 기능은 단백질 패밀리와 슈퍼 패밀리 내에서 서열 – 구조 – 동적 관계를 조사하기위한 완벽한 워크 플로우를 제공합니다. Bio3D-web은 매개 변수 및 방법 선택의 효과를 탐구하기위한 편리한 사용하기 쉬운 동적 인터페이스 외에도 사용자 세션의 전체 사용자 입력 및 그래픽 결과를 기록합니다. 이를 통해 사용자는 결과를 만든 분석 단계의 순서를 쉽게 공유하고 재현 할 수 있습니다 .Bio3D-web은 R 언어로 전적으로 구현되며 Bio3D 및 Shiny R 패키지를 기반으로합니다. 온라인 서버에서 실행하거나 R을 실행하는 모든 컴퓨터에 로컬로 설치할 수 있습니다. 여기에는 제약 산업에서 일반적인 우선 순위 구조 데이터 세트에 액세스 할 수있는 사용자 정의 된 다중 사용자 인스턴스를 제공하는 로컬 서버 설치가 포함됩니다. 전체 소스 코드와 광범위한 문서는 http://thegrantlab.org에서 GPL-3 오픈 소스 라이센스로 제공됩니다./ bio3d / webapps

Açıklamalar

The authors have nothing to disclose.

Acknowledgements

Guido Scarabelli 박사와 Hongyang Li는 개발 전반에 걸친 광범위한 테스트와 Bergen 대학 구조 생물 정보학 워크샵 참가자들에게 피드백과 의견을 보내 주셔서 감사합니다.

Materials

Bio3D-web
Web-site http://thegrantlab.org/bio3d-web/
Requirements Web browser

Referanslar

  1. Kornev, A. P., Taylor, S. S. Dynamics-Driven Allostery in Protein Kinases. Trends Biochem. Sci. 40 (11), 628-647 (2015).
  2. Yao, X. -. Q., Grant, B. J. Domain-opening and dynamic coupling in the α-subunit of heterotrimeric G proteins. Biophys. J. 105 (2), L08-L10 (2013).
  3. Henzler-Wildman, K. A., et al. Intrinsic motions along an enzymatic reaction trajectory. Nature. 450 (7171), 838-844 (2007).
  4. Boehr, D., Nussinov, R., Wright, P. The role of dynamic conformational ensembles in biomolecular recognition. Nat. Chem. Biol. 5 (11), 789-796 (2009).
  5. Teilum, K., Olsen, J. G., Kragelund, B. B. Functional aspects of protein flexibility. Cell Mol Life Sci. 66 (14), 2231-2247 (2009).
  6. Henzler-Wildman, K., Kern, D. Dynamic personalities of proteins. Nature. 450 (7172), 964-972 (2007).
  7. Grant, B. J., Gorfe, A. A., McCammon, J. A. Large conformational changes in proteins: signaling and other functions. Curr. Opin. Struct. Biol. 20 (2), 142-147 (2010).
  8. Grant, B. J., Rodrigues, A. P. C., ElSawy, K. M., McCammon, J. A., Caves, L. S. D. Bio3d: an R package for the comparative analysis of protein structures. Biyoinformatik. 22 (21), 2695-2696 (2006).
  9. Bakan, A., Meireles, L. M., Bahar, I. ProDy: protein dynamics inferred from theory and experiments. Biyoinformatik. 27 (11), 1575-1577 (2011).
  10. Zimmermann, M. T., Kloczkowski, A., Jernigan, R. L. MAVENs: motion analysis and visualization of elastic networks and structural ensembles. BMC Bioinformatics. 12 (1), 264 (2011).
  11. Yang, L. -. W., et al. oGNM: online computation of structural dynamics using the Gaussian Network Model. Nucleic Acids Res. 34, 24-31 (2006).
  12. Suhre, K., Sanejouand, Y. -. H. ElNemo: a normal mode web server for protein movement analysis and the generation of templates for molecular replacement. Nucleic Acids Res. 32, W610-W614 (2004).
  13. Tiwari, S. P., et al. WEBnm@ v2.0: Web server and services for comparing protein flexibility. BMC Bioinformatics. 15 (1), 427 (2014).
  14. Hrabe, T., et al. PDBFlex: exploring flexibility in protein structures. Nucleic Acids Res. 44, D423-D428 (2016).
  15. Skjærven, L., Jariwala, S., Yao, X. -. Q., Grant, B. J. Online interactive analysis of protein structure ensembles with Bio3D-web. Biyoinformatik. , (2016).
  16. Skjærven, L., Yao, X., Scarabelli, G., Grant, B. J. Integrating protein structural dynamics and evolutionary analysis with Bio3D. BMC Bioinformatics. 15 (399), 1-11 (2014).
  17. Eddy, S. R. Accelerated Profile HMM Searches. PLoS Comput. Biol. 7 (10), (2011).
  18. Edgar, R. C. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 32 (5), 1792-1797 (2004).
  19. Berman, H. M. The Protein Data Bank. Nucleic Acids Res. 28 (1), 235-242 (2000).
  20. Finn, R. D., et al. Pfam: the protein families database. Nucleic Acids Res. 42, D222-D230 (2014).
  21. Kerns, S. J., et al. The energy landscape of adenylate kinase during catalysis. Nat. Struct. Mol. Biol. 22 (2), 124-131 (2015).

Play Video

Bu Makaleden Alıntı Yapın
Jariwala, S., Skjærven, L., Yao, X., Grant, B. J. Investigating Protein Sequence-structure-dynamics Relationships with Bio3D-web. J. Vis. Exp. (125), e55640, doi:10.3791/55640 (2017).

View Video