Bio3D-web을 이용한 단백질 서열 – 구조 – 역학 관계에 대한 온라인 조사 프로토콜을 제시한다.
우리는 생체 분자 구조 데이터의 상호 작용 분석을위한 Bio3D-web의 사용법을 보여줍니다. Bio3D 웹 응용 프로그램은 다음을 위해 온라인 기능을 제공합니다 : (1) 유사성의 사용자 지정 임계 값에 대한 관련 단백질 구조 세트의 식별. (2) 다중 정렬 및 구조 중첩; (3) 염기 서열 및 구조 보존 분석; (4) 주성분 분석과의 상호 조화도 관계 매핑, (5) 앙상블 일반 모드 해석을 통한 예측 된 내부 역학의 비교. 이 통합 기능은 단백질 패밀리와 슈퍼 패밀리 내에서 서열 – 구조 – 동적 관계를 조사하기위한 완벽한 온라인 워크 플로우를 제공합니다.
단백질 데이터 뱅크 (PDB)는 이제 120,000 개가 넘는 단백질 구조를 포함하고 있습니다 – 대부분은 동일한 단백질 군이지만 다른 실험 조건에서 분해됩니다. 이러한 여러 구조는 단백질 형태와 기능의 복잡성을 이해하는 데 매우 귀중한 자료입니다. 예를 들어, 이러한 구조 앙상블의 엄격한 비교는 중요한 분자 메커니즘 1 , 2 , 3을 밝혀 내고 리간드 결합, 효소 촉매 및 이중 분자 인식 4 , 5 , 6 , 7을 포함하는 프로세스에 관련된 구조 동역학에 정보를 제공 할 수 있습니다. 단백질 패밀리의 순서, 구조 및 동역학에 대한 상세한 대규모 분석을 통해 새로운 통찰력을 얻을 수 있습니다. 그러나, 이것은 전형적으로 상당한 생체 수오 머믹 및 컴퓨터 프로그래밍 전문 지식과 함께 연구중인 단백질 시스템에 익숙합니다. 예를 들어, Bio3D, ProDy 및 Maven과 같은 소프트웨어 패키지는 각각 R, Python 및 Matlab에서 프로그래밍이 필요합니다 ( 8 , 9 , 10) . 반대로 구조 유연성 분석을위한 온라인 도구는 일반적으로 개별 구조의 조사에만 국한됩니다 ( 11 , 12) . 이와 관련하여 최근에 개발 된 WebNM @ 서버는 예외로, 일부 미리 정렬 된 사용자 지정 구조 13의 표준 모드 분석 (NMA)에서 얻은 유연성 패턴을 비교할 수 있습니다. 그러나이 서버에는 비교, 정렬 또는 NMA 이상의 추가 분석을위한 구조 식별을위한 자동화 된 절차가 없습니다. 최근의 또 다른 기여는 온라인 PDB 플렉스 데이터베이스입니다.95 % 이상의 서열 동일성을 공유하는 14 PDB 구조 omputed 분석. 그러나 더 다양한 구조 집합에 대한 분석은 현재 사용할 수 없습니다.
우리는 이전에 Bio3D-web을 보았습니다 – 단백질 서열 – 구조 – 동적 관계의 분석을 위해 사용하기 쉬운 웹 응용 프로그램 15 . Bio3D-web은 온라인 상 대형 동종 구조 세트의 확인, 비교 및 상세한 분석을 위해 사용하기 쉬운 통합 기능을 제공하는 데있어 독보적입니다. Bio3D-web을 이용한 단백질 서열 – 구조 – 역학 관계의 온라인 조사를위한 상세한 프로토콜을 제시합니다. Bio3D-web은 그림 1에 나와 있으며 아래에서 자세히 설명하는 5 가지 주요 데이터 분석 단계를 지원하는 다양한 기능을 제공합니다. 이 단계는 쿼리 시퀀스 또는 구조 입력, 여러 수준의 시퀀스 구조 동적 분석, 요약 등의 워크 플로를 구성합니다.보고서 생성. 결과는 일반적으로 사용되는 형식으로 결과 파일을 다운로드하는 것뿐만 아니라 광범위한 브라우저 내 시각화 및 플로팅 장치를 통해 즉시 사용할 수 있습니다. Bio3D-web은 매개 변수 및 방법 선택의 효과를 탐색하기위한 편리한 사용하기 쉬운 인터페이스 외에도 사용자 세션의 전체 사용자 입력 및 그래픽 결과를 PDF, DOC 및 HTML 형식의 공유 가능한 재현 가능한 보고서로 기록합니다. 사용자 세션은 이후에 저장되고 다시로드 될 수 있으며 사용자의 로컬 컴퓨터에서 Bio3D R 패키지에 의해 다운로드되고 완성 된 결과가 해석 될 수 있습니다.
Bio3D 웨브는 생체 분자의 구조, 순서 및 분자 시뮬레이션 데이터 (8), (16)의 분석을 위해 Bio3D R 패키지에 의해 강화된다. 특히, rigid-core 식별을위한 Bio3D 알고리즘 8 , 중첩, 주성분 분석(PCA) 8 및 앙상블 일반 모드 분석 (eNMA) 16 은 애플리케이션의 기초를 형성합니다. 우리는 또한 관련 단백질 구조의 확인을 위해 pHMMER 17 에 의존하는 Bio3D 프로토콜과 다중 서열 정렬을위한 MUSCLE 18 을 활용합니다. 구조 및 서열 주석은 RCSB PDB 19 및 PFAM 데이터베이스 20의 Bio3D 유틸리티를 통해 파생됩니다. Bio3D-web은 온라인 서버에서 실행하거나 R을 실행하는 모든 컴퓨터에 로컬로 설치할 수 있습니다. Bio3D-web은 모든 사용자에게 개방되어 있으며 http : // thegrantlab에서 GPL-3 오픈 소스 라이센스에 따라 무료로 제공됩니다. org / bio3d / webapps
Bio3D-web은 이용 가능한 결정학 구조에서 단백질의 구조적, 동적 및 기능적 상태를 대화식으로 탐색하고 매핑하는 데 사용할 수 있습니다. 또한 NMA 및 PCA 기반 클러스터링 결과는 주석 및 시퀀스 기반 분석과 함께 앙상블 소분자 도킹 또는 분자 역학 시뮬레이션과 같은 시간 소모적 인 분석을위한 대표적인 구조를 선택하는 데 특히 유용 할 수 있습니다. Bio3D-web은 기술적 인 전문성을 요구하는 수준을 줄임으로써 광범위한 연구원을 대상으로 첨단 구조 생물 정보학 분석을 용이하게합니다. Bio3D-web의 현재 디자인은 완전한 독립형 Bio3D 패키지에서 사용할 수있는 많은 분석 방법을 철저히 포함함으로써 단순함을 강조합니다. 많은 경우에 연구자들은 단백질 가족이나 관심 분야의 슈퍼 패밀리에 대한 일반적인 추세를 이해하기 위해 Bio3D-web을 사용하게 될 것이고, 그러면 더 전문화 된 분석을 할 수있을 것입니다. Bio3D-web은생물 분자 구조 데이터 세트를 신속하게 탐구하고 가설 생성 도구로 사용하도록 고안되었습니다. 재현 가능한 보고서에 예제 3의 Bio3D 코드를 제공하여 사용자가 데이터를 더 자세히 탐색 할 것을 권장합니다.이 코드는 모든 쿼리 세부 정보와 분석 결과도 저장합니다.
위의 대표적인 프로토콜에서 우리는 Ad3k의 기능적 입체 전환의 구조적 특징을 밝히기 위해 Bio3D-web의 능력을 보여줍니다. Bio3D-web의 추가 응용 프로그램에는 사용자 업로드 PDB 구조의 구조 및 동적 분석이 포함됩니다. 예를 들어, 사용자는 분석을 위해 새로운 구조 또는 실제로 단백질 서열을 업로드 할 수 있습니다. 앞에서 언급 한 분석 단계, 특히 eNMA 단계는 기능적 중요성이있는 집단 운동과 함께 단백질 운동의 지역적 및 세계적 경향을 나타낼 수 있습니다. 아포 구조와의 비교는 또한 결합되지 않은 결합 된 구조적 전이의 특성을 나타낼 수있다. 신청의 추가 사례다양한 단백질 계열이 온라인으로 제공됩니다.
모든 단백질이 유연하고 동적 인 실체이지만 모든 단백질이 다양한 상태 ( 예 : 활성 상태 및 비활성 상태)의 범위에서 사용할 수있는 원자 분해 구조를 갖는 것은 아닙니다. 따라서 단백질 구조 공간에 대한 우리의 견해는 제한적이며 따라서 Bio3D-web과 같은 도구에서 얻은 통찰력은 특정 단백질에 대해서도 필수적으로 제한적입니다. 그러나 현재의 기술 진보와 구조 유전체학에 대한 새로운 시도로 여기에 제시된 프로토콜은 중요한 구조 – 기능 관계에 대한 통찰력을 얻는 중요한 경로가 될 것입니다. 특히 먼 거리에서 관련있는 단백질을 분석 할 때 중요한 중요한 단계는 정렬 탭에서 정렬 오류의 잠재적 인 출현입니다. 시퀀스 유사성이 30 % 이하로 떨어지면 정렬 오류가 불가피하게 발생하며 사용자는 이러한 경우 시퀀스 정렬을 두 번 확인하고 수정해야합니다정렬 탭에서 정렬 오류로 인해 FIT 탭에 잘못된 겹쳐진 구조가 생기고 후속 PCA에 가장 적합한 구조 변형이 가려집니다. 또한 사용자는 현재 구현 에서처럼 선택된 PDB 구조에서 누락 된 잔기를 인식해야합니다. PCA는 모든 구조가 상응하는 탄소 원자 원자가 해소 된 단백질 잔여 물에서만 수행 할 수 있습니다. 결과적으로, 선택된 PDB가 단백질의 특정 영역에 대한 미해결 잔기를 갖는다면,이 영역은 PCA에서 생략 될 것이다.
Bio3D-web은 현재 단일 사슬 PDB 구조의 분석에 국한되어 있습니다. 결과적으로, 4 차 수준에서 발생하는 기능적 동작은 현재 프로토콜을 사용하여 탐색 할 수 없습니다. 우리는 현재 Bio3D-web에 이러한 분석을 포함하는 새로운 알고리즘을 개발하고 있지만, 현재의 유일한 옵션은 기존의 Bio3D를 사용하는 것입니다.
Bio3D-web은 유일한 온라인 지원 프로그램입니다.이온은 구조 집합을 쿼리하고 식별하고, 시퀀스 패턴과 구조적 다양성을 해석하고, 구조적 소성의 분석과 예측 모두에서 기계적 정보를 추출 할 수있게 해줍니다. 광범위한 분자 시각화 도구와 온라인 서버를 통해 연구원은 개별 생체 분자 구조를 탐색하고 분석 할 수 있습니다. 그러나 대규모 이기종 단백질 패밀리의 순서, 구조 및 동력을 분석하기위한 기존 도구는 상당한 계산 전문성을 필요로하며 일반적으로 관련 프로그래밍 기술을 가진 사용자 만 액세스 할 수 있습니다. R 8 예를 들어, Bio3D 패키지가 필요 ProDy 파이썬을 필요로하며 Maven은 matlab에 대한 지식 (9), (10)을 필요로한다. 대조적으로 Bio3D-web은 프로그래밍 지식이 필요 없으므로 접근성이 향상되고 고급 비교 시퀀스, 구조 및 다이를 수행하는 데있어 진입 장벽이 줄어 듭니다.namics 분석. 또한 Bio3D-Web 서비스에는 효율적인 분석을 위해 자주 필요한 분자 구조의 준비, 큐 레이션, 주석 및 정리가 포함되어 있습니다. 또한, 현재의 웹 브라우저에서 시작하고 제어 할 수있는 많은 구조를 대규모로 분석 할 수있는 서버 인스턴스를 통해 가능한 계산 리소스에 대한 그러한 분석을 수행하는 것에 대한 제한이 완화됩니다.
Bio3D-web의 공개 개발이 진행 중입니다 (https://bitbucket.org/Grantlab/bio3d 참조). 우리는 새로운 분석 기능을 계속 추가하고 기존 방법을 개선합니다. 향후 개발은 거리 매트릭스 기반 PCA 및 비틀림 PCA, 계통 발생 요소, 앙상블 바인딩 사이트 식별 및 단백질 군에 걸친 동적 네트워크 분석을위한 새로운 접근법을 포함하는보다 광범위한 서열 보존 접근법에 중점을 둘 것입니다. 이 점에서 현재 웹 응용 프로그램은 시작 지점을 나타냅니다.사용자 정의 실험 구조 세트에서 재현 가능하고 공유 가능한 단계를 가능하게함으로써 다른 많은 협업 구조 생물 정보 분석 워크 플로우를 지원합니다. 우리는 또한 PDB 구조의 비대칭 단위로부터 개별 및 다중 사슬에 추가하여 재구성 된 생물학적 단위 좌표 세트에 대한 미래의 지원을 계획한다. 추가 기능으로는 협업 작업 영역의 저장 및로드를 향상시키고 실행 취소 가능성을 높일 수 있습니다.
Bio3D-web은 생체 분자 구조 데이터의 대화 형 분석을위한 온라인 응용 프로그램입니다. Bio3D-web은 모든 현대 웹 브라우저에서 실행되며 다음과 같은 기능을 제공합니다. (1) 사용자가 지정한 유사도 임계 값과 관련된 단백질 구조 세트를 식별합니다. (2) 다중 정렬 및 구조 중첩; (3) 염기 서열 및 구조 보존 분석; (4) 주성분 분석과의 상호 조화도 관계 및 (5) 앙상블을 통한 예측 된 내부 역학의 비교말 모드 분석. 이 통합 기능은 단백질 패밀리와 슈퍼 패밀리 내에서 서열 – 구조 – 동적 관계를 조사하기위한 완벽한 워크 플로우를 제공합니다. Bio3D-web은 매개 변수 및 방법 선택의 효과를 탐구하기위한 편리한 사용하기 쉬운 동적 인터페이스 외에도 사용자 세션의 전체 사용자 입력 및 그래픽 결과를 기록합니다. 이를 통해 사용자는 결과를 만든 분석 단계의 순서를 쉽게 공유하고 재현 할 수 있습니다 .Bio3D-web은 R 언어로 전적으로 구현되며 Bio3D 및 Shiny R 패키지를 기반으로합니다. 온라인 서버에서 실행하거나 R을 실행하는 모든 컴퓨터에 로컬로 설치할 수 있습니다. 여기에는 제약 산업에서 일반적인 우선 순위 구조 데이터 세트에 액세스 할 수있는 사용자 정의 된 다중 사용자 인스턴스를 제공하는 로컬 서버 설치가 포함됩니다. 전체 소스 코드와 광범위한 문서는 http://thegrantlab.org에서 GPL-3 오픈 소스 라이센스로 제공됩니다./ bio3d / webapps
The authors have nothing to disclose.
Guido Scarabelli 박사와 Hongyang Li는 개발 전반에 걸친 광범위한 테스트와 Bergen 대학 구조 생물 정보학 워크샵 참가자들에게 피드백과 의견을 보내 주셔서 감사합니다.
Bio3D-web | |||
Web-site | http://thegrantlab.org/bio3d-web/ | ||
Requirements | Web browser |