표적 가교 질량 분광법은 최대 세 가지 다른 수집 프로토콜을 사용하여 획득한 질량 분광법 데이터를 사용하여 사차 단백질 구조 모델을 생성합니다. Cheetah-MS 웹 서버에서 간소화된 워크플로로 실행되면 결과가 Jupyter 노트북에 보고됩니다. 여기서는 Jupyter 노트북을 보다 심층적인 분석을 위해 확장할 수 있는 방법에 대한 기술적 측면을 보여 줍니다.
단백질-단백질 상호작용은 연구하기가 어려울 수 있지만 생물학적 시스템이 어떻게 기능하는지에 대한 통찰력을 제공할 수 있습니다. 사차 단백질 구조 모델링과 화학적 가교 질량 분광법을 결합한 방법인 표적 가교 질량 분광법(TX-MS)은 복잡하고 분별되지 않은 샘플에서 얻은 데이터를 사용하여 고정밀 구조 모델을 생성합니다. 이것은 관심있는 단백질이 더 이상 대량으로 정제 될 필요가 없기 때문에 단백질 복합체 구조 분석의 주요 장애물 중 하나를 제거합니다. Cheetah-MS 웹 서버는 단순화 된 버전의 프로토콜을보다 커뮤니티에서 쉽게 액세스 할 수 있도록 개발되었습니다. 탠덤 MS/MS 데이터를 고려하여 Cheetah-MS는 가장 중요한 분석 결과를 요약한 그래픽 보고서인 Jupyter 노트북을 생성합니다. Jupyter 노트북을 확장하면 더 심층적인 통찰력을 얻을 수 있고 모델 및 이를 지원하는 질량 분석기 데이터를 더 잘 이해할 수 있습니다. 여기에 제시된 기술 프로토콜은 가장 일반적인 확장 기능 중 일부를 보여 주며 얻을 수있는 정보를 설명합니다. 여기에는 탠덤 MS/MS 수집 데이터 및 보고된 사차 모델에 대한 검출된 XL의 전반적인 영향을 분석하는 데 도움이 되는 블록이 포함되어 있습니다. 이러한 분석의 결과는 NGLView를 사용하여 노트북에 내장 된 구조 모델에 적용 할 수 있습니다.
단백질-단백질 상호작용은 생물학적 시스템의 구조와 기능을 뒷받침한다. 단백질의 사차 구조에 접근 할 수 있으면 둘 이상의 단백질이 어떻게 상호 작용하여 고차 구조를 형성하는지에 대한 통찰력을 제공 할 수 있습니다. 불행히도, 사차 구조를 얻는 것은 여전히 어렵습니다. 이는 하나 이상의 폴리펩티드를 함유하는 비교적 적은 수의 단백질 데이터뱅크(PDB) 엔트리1에 반영된다. 단백질-단백질 상호작용은 X선 결정학, NMR 및 cryo-EM과 같은 기술로 연구될 수 있지만, 방법이 적용될 수 있는 조건 하에서 충분한 양의 정제된 단백질을 얻는 것은 시간이 많이 소요될 수 있다.
화학 가교 질량 분광법은 질량 분광법을 사용하여 임의로 복잡한 샘플에 대한 데이터를 획득 할 수 있으므로 샘플 준비에 대한 제한이 적고 단백질 – 단백질 상호 작용에 대한 실험 데이터를 얻기 위해 개발되었습니다 2,3,4,5,6,7,8,9 . 그러나, 데이터 분석 및 비교적 적은 수의 가교결합된 펩티드의 조합적 특성은 분석 전에 샘플이 분획될 것을 요구한다. 이러한 단점을 해결하기 위해 우리는 전산 모델링과 화학적 가교 질량 분석법10을 결합한 TX-MS를 개발했습니다. TX-MS는 임의로 복잡한 샘플에 사용될 수 있으며 이전 방법(10)에 비해 훨씬 더 민감하다. 이는 각 MS 스펙트럼을 독립적으로 해석하는 대신 주어진 단백질-단백질 상호작용과 관련된 모든 데이터를 세트로서 스코어링함으로써 이를 달성한다. TX-MS는 또한 고분해능 MS1 (hrMS1), 데이터 의존 획득 (DDA) 및 데이터 독립적 인 획득 (DIA)의 최대 세 가지 MS 수집 프로토콜을 사용하여 여러 관찰을 결합하여 가교 된 펩타이드를 식별 할 수있는 기회를 제공합니다. TX-MS 계산 워크플로는 여러 가지 이유로 복잡합니다. 첫째, 단백질 구조 모델(14,15)을 생성하기 위해 다수의 MS 분석 소프트웨어 프로그램(11,12,13)에 의존한다. 둘째, 데이터의 양이 상당 할 수 있습니다. 셋째, 모델링 단계는 상당한 양의 컴퓨터 처리 능력을 소비할 수 있다.
결과적으로, TX-MS는 컴퓨터 클라우드 또는 클러스터와 같은 대규모 계산 인프라에서 실행되는 Cheetah-MS 웹 서버(16)를 통해 자동화되고 단순화된 계산 워크플로우로서 가장 잘 사용된다. 결과의 해석을 용이하게하기 위해, 우리는 인터랙티브 Jupyter 노트북17을 제작했습니다. 여기서는 Jupyter Notebook 보고서를 확장하여 주어진 결과에 대한 보다 심층적인 분석을 산출하는 방법을 보여 줍니다.
현대의 계산 워크플로는 종종 복잡하며, 다양한 공급업체의 여러 도구, 복잡한 상호 종속성, 높은 데이터 볼륨 및 다각적인 결과를 제공합니다. 결과적으로, 결과를 얻기 위해 필요한 모든 단계를 정확하게 문서화하는 것이 점점 더 어려워지고 있으며, 주어진 결과를 재현하는 것이 어려워지고 있습니다. 여기서는 일반 보고서를 생성하는 자동화된 워크플로의 자동화와 용이성을 결합한 일반적인 전략과 재현 가능한 방식으로 보고서를 사용자 지정할 수 있는 유연성을 보여 줍니다.
프로토콜이 작동하려면 세 가지 요구 사항을 충족해야합니다 : 첫째, 분석을 위해 선택된 단백질은 화학 가교 실험이 질량 분광계에 의해 검출 될 수있을 정도로 충분히 높은 농도로 가교 된 종을 생산할 수있는 방식으로 상호 작용해야합니다. 다른 질량 분광계는 서로 다른 수준의 검출을 가지며 가교 시약의 선택뿐만 아니라 획득 프로토콜에 달려 있습니다. TX-MS 프로토콜의 현재 버전은 리신-라이신 호모바이능성 가교 시약인 DSS만을 허용한다. 그럼에도 불구하고 이러한 제한은 주로 기계 학습 단계를 다른 시약에 맞게 조정해야 할 가능성 때문입니다. 이 제한은 두 가지 이상의 가교 시약이 고려 될 수 있기 때문에 Cheetah-MS 웹 서버에서 개선되었지만 세 가지 모두 절단 할 수없는 시약입니다. 둘째, 두 단백질은 실험적으로 결정된 구조를 갖거나 비교 모델링 기술 또는 de novo 기술을 사용하여 모델링되어야 합니다. 모든 단백질이 모델링 될 수있는 것은 아니지만, PDB에서 실험 구조의 개선 된 소프트웨어와 일정한 증착의 조합은 모델링 될 수있는 단백질의 수를 확장시킵니다. 셋째, 상호작용하는 단백질은 TX-MS 및 치타-MS에 의해 사용되는 도킹 알고리즘이 스코어링을 가능하게 하는 적절한 품질의 사차 구조를 생성할 수 있도록 그들의 결합 및 비결합 상태에서 충분히 유사하게 유지되어야 한다. 허용 가능한 품질은 시스템 의존도가 높기 때문에 이러한 요구 사항은 상대적으로 모호하며, 알려진 구조의 작은 단백질은 일반적으로 알려지지 않은 구조의 큰 단백질보다 비교하기가 쉽습니다.
음성 결과의 경우, 먼저 TX-MS가 동일한 폴리펩티드 사슬의 일부인 잔기 사이의 인트라 링크, 가교 결합을 발견하였음을 확인한다. 아무 것도 발견되지 않으면 가장 가능성있는 설명은 샘플 준비 또는 데이터 수집에 문제가 있다는 것입니다. 여러 거리 제약조건이 모델을 지원하지 않는 경우, 모델을 육안으로 검사하여 형태가 가교된 잔기에 의해 지지되는지 확인하십시오. 적어도 하나의 교차 링크를 방해하지 않고 인터랙터 중 하나를 피벗하는 확실한 방법은 없습니다. 주어진 가교 시약에 대해 허용된 거리보다 긴 가교결합이 있는 경우, 가교 데이터를 통합함으로써 인터랙터의 모델링을 개선하려고 노력한다.
선택한 소프트웨어의 감도가 TX-MS의 감도와 비교할 수 있는 경우 대체 소프트웨어 응용 프로그램을 사용하여 동등한 결과를 얻을 수 있습니다. 예를 들어, RosettaDock, HADDOCK 등의 온라인 버전이 있습니다. 또한 xQuest/xProphet5,6, plink7 및 SIM-XL 26을 통해 화학적 가교 데이터를 분석할 수도있습니다.
우리는 TX-MS 및 Cheetah-MS를 새로운 프로젝트27,28,29에 지속적으로 적용함으로써 이러한 접근 방식으로 생성 된 보고서를 개선하여 보고서를 더 크게 만들지 않고도 결과를보다 자세히 분석 할 수 있습니다.
The authors have nothing to disclose.
이 작품은 Knut and Alice Wallenberg 재단 (보조금 번호 2016.0023)과 스위스 국립 과학 재단 (보조금 번호. P2ZHP3_191289). 또한 취리히 대학교 S3IT의 컴퓨팅 인프라와 기술 지원에 감사드립니다.
Two Protein DataBank files of the proteins of interest. | N/A | N/A | Example files available on txms.org and zenodo.org, DOI 10.5281/zenodo.3361621 |
An mzML data file acquired on a sample where the proteins of interest were crosslinked. | N/A | N/A | Example files available on txms.org or zenodo.org, DOI 10.5281/zenodo.3361621 |