이 논문은 소프트웨어 스위트 인 SPHIRE를 사용하여 저온 EM 이미지를 처리하기위한 프로토콜을 제시합니다. 현재의 프로토콜은 원 자면 해상도를 목표로하는 거의 모든 단일 파티클 EM 프로젝트에 적용될 수 있습니다.
SPHIRE (고해상도 전자 현미경 용 스파크)는 단일 입자 전자 극저온 현미경 (cryo-EM) 데이터의 반자동 처리를위한 새로운 오픈 소스, 사용자 친화적 인 소프트웨어 모음입니다. 여기에 제시된 프로토콜은 단일 입자 구조 결정 파이프 라인의 모든 단계를 안내하여 Cryo-EM 현미경 사진 영화에서 시작하는 원자 가까이의 해상도 구조를 얻는 방법을 자세히 설명합니다. 이 단계는 새로운 SPHIRE 그래픽 사용자 인터페이스에서 제어되며 사용자 개입을 최소화해야합니다. 이 프로토콜을 사용하여 Photorhabdus luminescens의 Tc 독소 복합체 인 3.5Å 구조의 TcdA1이 9500 개의 단일 입자에서만 추출되었습니다. 이 간소화 된 접근 방식은 원시 상태에서 정제 된 거대 분자 복합체의 무소음 및 비 편향 원자 모델을 얻기 위해 광범위한 처리 경험과 선험적 인 구조 정보없이 초보자를 도울 것입니다.
직접 전자 검출기 기술의 개발 후, 단일 입자 Cryo-EM의 현저한 진보는 현재 구조 생물학을 변형시키고 있습니다 1 . X 선 결정학에 비해이 기술은 결정질을 필요로하지 않고 단백질 물질을 소량 만 필요로하는 동시에 샘플의 순도에 대한 제한이 거의 없으며 근원 분해능에서 구조를 결정할 수 있습니다. 중요하게, 다른 조성 또는 상태를 이제 계산으로 분리 할 수 있고, 다른 형태의 구조 결정을 전례없는 수준에서 수행 할 수있다. 최근에 도전 분자의 밀도지도는 de novo 모델 구축을 가능하게하여 해상도에 따라 생성 될 수 있으므로 동작 모드 2 , 3 , 4 , 5 에 대한 깊은 이해가 가능합니다.
3DEM (3D Electron Microscopy) 커뮤니티 (https://en.wikibooks.org/wiki/Software_Tools_For_Molecular_Microscopy)에서 다양한 이미지 처리 소프트웨어 패키지를 사용할 수 있으며 대부분 개발 중입니다. EMAN2 6 , IMAGIC 7 , FREALIGN 8 , RELION 9 , SPIDER 10 및 SPARX 11을 비롯한 다양한 소프트웨어 패키지를 사용하여 다양한 분자량 및 대칭성을 나타내는 단백질에 대한 근원 분해능이 달성되었습니다. 각 패키지는 다른 수준의 사용자 전문 지식을 필요로하며 사용자 지침, 자동화 및 확장 성의 다른 수준을 제공합니다. 또한, 일부 프로그램은 이미지 분석의 모든 단계를 용이하게하기위한 완벽한 환경을 제공하지만 다른 프로그램은 알려진 작업에서 시작하는 정렬 매개 변수의 세분화와 같은 특정 작업을 최적화하도록 설계되었습니다추론 구조. 보다 최근에는 APPION 12 및 SCIPION 13 을 포함하여 위에 나열된 여러 소프트웨어 패키지의 접근 방식과 프로토콜을 통합하는 단일 처리 파이프 라인을 제공하는 여러 플랫폼이 개발되었습니다.
Cryo-EM의 현재 개발에 기여하기 위해 SPARX는 SPHIRE (고해상도 전자 현미경 검사용 SPARX)라고하는 단일 입자 분석을위한 새로운 독립형 및 완벽한 플랫폼으로 재 개발되었습니다. 현장의 새로운 연구자를위한 기술의 접근성을 높이고 현대의 완전 자동화 된 고급 전자 현미경으로 대량 생산 된 데이터에 대처하기 위해 처리 파이프 라인을 사용하기 쉽도록 다시 디자인하고 단순화했습니다 그래픽 사용자 인터페이스 (GUI) 및 워크 플로우의 주요 단계 자동화. 더욱이, 새로운 알고리즘이 추가되어 신속하고 재현성 있고 자동화 된 구조 결정을 cr요 – EM 이미지. 또한 정제 및 이질성 분석 과정에서 발생하는 공통적 인 인공물을 피하기 위해 재현성에 의한 검증이 도입되었습니다.
이 프로그램은 광범위하게 수정되었지만 직접적인 오픈 소스 코드, 현대적인 객체 지향 디자인 및 모든 기본 기능을위한 Python 인터페이스와 같은 핵심 기능이 유지되었습니다. 따라서 블랙 박스 프로그램으로 변경되지 않아 사용자가 Python 코드를 연구하고 쉽게 수정할 수 있고, 추가 응용 프로그램을 만들거나 전체 워크 플로우를 수정할 수 있습니다. 이것은 비표준 Cryo-EM 프로젝트에 특히 유용합니다.
여기서는 SPHIRE의 GUI를 사용하여 cryo-EM 이미지에서 근사 해상 밀도 맵을 얻기위한 프로토콜을 제시합니다. 그것은 원시 Cryo-EM 직접 탐지기 영화에서 밀도 맵을 생성하는 데 필요한 모든 단계를 상세히 설명하며 특정 거대 분자 유형에만 국한되지 않습니다. 이 프로토콜은 주로 newc워크 플로우를 통해 현장에서의 정보를 제공하고 처리의 중요한 단계는 물론 함정과 장애물에 대한 중요한 정보를 제공합니다. 더 많은 고급 기능과 SPHIRE의 이론적 배경은 다른 곳에서 설명 될 것이다.
단일 입자 Cryo-EM은 최근 몇 년 동안 급속한 발전을 보였으며 중요한 생물학적 중요성을 지닌 고분자 복합체의 수많은 원자 분해 구조를 전달했습니다 25 . 현재 필드에 들어가고있는 많은 초보 사용자를 지원하기 위해 단일 입자 이미지 분석 플랫폼 SPHIRE 를 개발했으며 영화 정렬, 입자 선택, CTF 추정, 초기 모델을 포함한 전체 워크 플로우에 대한 워크 플로우 프로토콜을 제시합니다 계산, 2D 및 3D 이질 분석, 고해상도 3D 세분화 및 로컬 해상도 추정 및 필터링.
여기에 설명 된 프로토콜은 관심 단백질의 cryo-EM 현미경 사진과 SPHIRE의 독립 실행 형 GUI가 제공하는 전산 도구를 사용하여 3D 구조 결정에 대한 간단한 안내서로 제공됩니다.
워크 플로의 주요 특징은의 절차는 재현성에 의한 검증 개념에 의존하고 매개 변수 조정을 필요로하지 않기 때문에 단 한 번만 실행해야합니다. 이 자동 검증 메커니즘은 다른 소프트웨어 패키지보다 SPHIRE의 주된 이점입니다. 왜냐하면 결과는 객관적이며 재현성이 있으며, 가장 중요한 것은 수용 가능한 계산 비용으로 얻을 수 있기 때문입니다. 이 파이프 라인은 숙련 된 사용자가 자신의 방법으로 더욱 독립적 인 검증 및 평가를 수행 할 수 있도록 풍부한 진단 정보를 제공합니다. 그럼에도 불구하고, 구조 생물학 및 전자 현미경 검사에서 적어도 원소 이론적 배경을 가진 초보 사용자는 자체 데이터 및 자동화 된 검증 절차를 사용하여 근사 해상 구조를 얻을 수 있어야합니다.
그러나 원 자성 해상도 구조를 얻는 것이 항상 쉬운 것은 아니며 그 결과는 샘플 및 입력 데이터의 품질에 따라 크게 달라질 것입니다에이. 여기에 제시된 절차에서는 고품질의 정렬되지 않은 원시 EM 영화를 사용할 수 있으며 평균은 명확하게 식별 할 수있는 균질하고 무작위로 배향 된 단일 입자를 나타냅니다. 일반적으로 분자의 대칭성, 크기 또는 전반적인 형상에 대한 제한은 없지만, 저 분자량은 특히 단백질이 특징이없는 구형을 가졌을 때 제한 요인이 될 수 있습니다. 대개 높은 포인트 – 그룹 대칭을 갖는 더 크고 잘 정렬 된 입자의 분석은 덜 까다 롭습니다. 따라서, 초보자 사용자는 잘 특성화 된 Cryo-EM 데이터 세트를 사용하여 먼저이 프로토콜을 실행하는 것이 좋습니다. SPHIRE 자습서 데이터 (http : /sphire.mpg.de) 또는 원시 동영상이있는 EMPIAR 제출 데이터 세트 (https://www.ebi.ac.uk/pdbe/emdb/empiar/) 중 하나가 좋은 출발점입니다 .
자체 데이터를 처리 할 때 일부 데이터 세트 또는 일부 이미지가 특정 품질을 충족시키지 못할 가능성이 매우 높습니다.기준. 이러한 맥락에서 워크 플로우의 주요 단계에 대해 프로그램이 수행하는 자동화 된 안정성 및 재현성 검사 외에도 사용자가 프로토콜의 특정 "검사 점"에서 결과를 시각적으로 검사하는 것이 좋습니다. 특히 최종 재구성 만족스럽지 않다.
첫 번째 육안 검사는 영화 정렬 ( 프로토콜 단계 2 ) 및 CTF 추정 ( 프로토콜 단계 3 ) 후에 현미경 수준에서 수행 할 수 있습니다. 결과로 얻은 동작 보정 된 평균은 분명히 식별 가능하고 잘 분리 된 단일 입자를 보여야하며, 그 파워 스펙트럼은 분명하게 식별 가능하고 등방성 인 Thon 링을 보여야합니다. 가시적 인 공간 주파수는 대부분의 경우 구조가 원칙적으로 궁극적으로 결정될 수있는 가장 높은 해상도를 정의합니다. 충분한 품질과 그 파워 스펙트럼의 모션 보정 된 평균의 예는 섹션 #SPHIRE의 Drift 및 CTF 평가 GUI 도구 (http://sphire.mpg.de/wiki/doku.php)를 사용하여 최종 결과에 부정적인 영향을 줄 수있는 이상치 이미지를 제거 할 수 있습니다.
입자 선별과 관련하여 SPHIRE 파이프 라인에서 중요한 단계는 ISAC ( 프로토콜 단계 5.2) 를 사용하는 2D 분류입니다. 여기서 사용자는 프로그램에 의해 자동으로 식별 된 재현 가능한 2D 클래스 평균이 각도 공간을 준 균일하게 커버하기에 충분한 방향 범위를 채택하도록 제어해야합니다. 클래스 평균의 품질이 만족스럽지 않은 경우 (시끄러운 및 / 또는 흐릿한 이미지) 및 / 또는 재현 가능한 클래스 평균 수가 매우 낮은 경우 자동 피킹 품질을 개선하고 데이터 세트 이미징 또는 샘플 준비를 최적화하십시오. 대부분의 경우 좋은 2D 클래스 평균을 산출하지 못하는 데이터 세트로부터 신뢰할 수있는 재구성을 계산할 수 없습니다. 고품질 2D 클래스 평균의 예분노는 "대표 결과"섹션에 나와 있습니다.
자동화 된 방식으로 RVIPER를 사용하여 신뢰할 수있는 초기 3D 모델을 얻으려면 최소 100 개의 클래스 평균이 필요합니다 ( 프로토콜 단계 6.1 ). 이 단계에서 사용자는 가장 높은 품질의 평균을 선택하고 가능한 한 많은 입자의 방향을 포함시켜야합니다. 초기 모델의 품질은 이후의 고해상도 3D 개선의 성공에 중요합니다.
다른 소프트웨어 패키지에서는 "나쁜"입자를 제거하기 위해 3D 분류가 수행되기도합니다 8 , 9 . 그러나 SPHIRE에서 이러한 입자의 대부분은 ISAC을 사용하는 2D 분류 중에 이미 자동으로 제거됩니다. 따라서 재구성 및 3D 변동성 분석이 데이터 집합의 이질성을 나타내는 경우에만 3D 정렬의 계산 집약적 단계를 수행하는 것이 좋습니다.
가장 중요한 점은 사용자는 항상 조심스럽게 결과 3D 볼륨을주의 깊게 검사해야하며 ( 프로토콜 단계 9.3 ) 각 밀도의 기능이 공칭 해상도와 잘 일치하는지 확인해야합니다. <9Å의 분해능에서 α- 나선에 해당하는 막대 모양의 밀도가 보입니다. <4.5Å의 해상도에서 베타 시트의 가닥에 해당하는 밀도는 일반적으로 잘 분리되며 부피가 큰 아미노산이 보입니다. 고해상도 맵 (<3Å)은 명확한 식별이 가능한 사이드 체인을 보여야하므로 정확한 원자 모델을 구축 할 수 있습니다.
SPHIRE의 자동화 된 재현성 테스트와 최소한의 육안 검사 덕분에 현재의 프로토콜은 일반적으로 모든 유형의 단일 입자 cryo-EM 프로젝트에 적용 가능하다는 것을 입증 한 결과입니다. 각 처리 단계의 대표 결과는 다음과 같은 TcdA1 독소의 재구성을 위해 나타납니다.Photorhabdus luminescens 21 은 원자 분해능에 가까운 것으로 알려져있다. 비슷한 품질의 밀도 맵을 사용하여 신개념 또는 실제 공간의 정제뿐만 아니라 새로운 백본 추적을 통해 신뢰할 수있는 원자 모델을 구성 할 수 있으므로 복잡한 분자 메커니즘을 이해할 수있는 견고한 구조 프레임 워크를 제공합니다.
접근 코드 :
EM 구조 및 처리되지 않은 영화에 대한 좌표는 전자 현미경 데이터 뱅크 및 전자 현미경 파일럿 이미지 아카이브에 각각 EMD-3645 및 EMPIAR-10089로 기탁되었습니다.
The authors have nothing to disclose.
우리는 TcdA1 현미경 사진을 제공 한 D. Roderer에게 감사드립니다. EMAN2 인프라를 지속적으로 지원해 준 Steve Ludtke에게 감사드립니다. 이 작업은 막스 플랑크 협회 (SR)와 유럽 연합 (EU)의 일곱 번째 프레임 워크 프로그램 (FP7 / 2007-2013) (부여 번호 615984) (SR에)에 의거 한 유럽 기금과 국립 연구소 건강 R01 GM60635에서 PAP).
SPHIRE | Max Planck Institute of Molecular Physiology- Dortmund and Houston Medical School, Houston, Texas | http://sphire.mpg.de | |
UCSF Chimera | University of California, San Francisco | http://www.cgl.ucsf.edu/chimera/ | |
Unblur | Janelia Farm Research Campus, Ashburn | http://grigoriefflab.janelia.org/unblur | |
Coot | MRC Laboratory of Molecular Biology, Cambridge | http://www2.mrc-lmb.cam.ac.uk/personal/pemsley/coot/ | |
EMAN2 | Baylor College of Medicine, Houston | http://blake.bcm.edu/emanwiki/EMAN2 | |
Computing Cluster with 1824 cores | Max Planck Institute of Molecular Physiology | Linux Cluster with 76 nodes, each with 2 Processors Xeon E5-2670v3 12C 2.30 GHz and 128 Gb RAM | |
TITAN KRIOS electron microscope | FEI | 300 kV, Cs correction, XFEG | |
Falcon II direct electron detector | FEI | ||
EPU (automated data acquisition software) | FEI | https://www.fei.com/software/epu/ |