극저온 전자 현미경 검사법의 단일 입자 분석은 고해상도에서 생물학적 앙상블의 구조를 결정하는 데 사용되는 주요 기술 중 하나입니다. Scipion은 현미경에 의해 획득된 정보를 처리하고 생물학적 표본의 3D 재구성을 달성하기 위해 전체 파이프라인을 만드는 도구를 제공합니다.
극저온 전자 현미경 검사는 거의 원자 분해능에서 거대 분자의 구조적 정보를 밝히기 위한 생물학적 연구에서 가장 중요한 도구 중 하나가 되었습니다. 단일 입자 분석에서, 유리화 된 샘플은 전자 빔에 의해 심화되고 현미경 기둥의 끝에 검출기는 그 샘플의 영화를 생성한다. 이 영화에는 임의 방향으로 동일한 파티클의 수천 개의 이미지가 포함되어 있습니다. 데이터는 최종 3D 재구성 볼륨을 얻기 위해 여러 단계로 이미지 처리 워크플로우를 거쳐야 합니다. 이미지 처리 워크플로우의 목표는 연구 중인 시편을 재구성할 수 있는 획득 매개 변수를 식별하는 것입니다. Scipion은 통합 프레임워크에서 여러 이미지 처리 패키지를 사용하여 이 워크플로우를 만드는 모든 도구를 제공하여 결과의 추적성을 제공합니다. 이 문서에서Scipion의 전체 이미지 처리 워크플로우가 실제 테스트 사례에서 나오는 데이터와 함께 제시되고 논의되어 현미경에서 얻은 영화에서 고해상도 최종 3D 재구성으로 이동하는 데 필요한 모든 세부 정보를 제공합니다. 또한, 결합 방법을 허용하는 합의 도구를 사용하고 워크플로의 모든 단계에서 결과를 확인하여 얻은 결과의 정확성을 향상시키는 힘에 대해 논의합니다.
극저온 전자 현미경 검사법(cryo-EM)에서, 유리화 된 냉동 수화 표본의 단일 입자 분석 (SPA)은 분자 상호 작용및 생물학적 앙상블의 기능을 이해할 수 있기 때문에 생물학적 거대 분자에 대한 이미징의 가장 널리 사용되고 성공적인 변형 중 하나입니다1. 이것은 “해상도 혁명”2 를 초래하고 거의 원자 해상도를 가진 생물학 3D 구조물의 성공적인 결정을 허용한 이 화상 진찰 기술의 최근 어드밴스 덕분에 입니다. 현재 SPA 극저온EM에서 달성한 가장 높은 해상도는 아포페리틴3 (EMDB 입력: 11668)의 경우 1.15Å였습니다. 이러한 기술적 진보는 샘플 제제4, 이미지 수집5 및 이미지 처리 방법의 개선을 포함한다6. 이 문서는 이 마지막 점에 중점을 두습니다.
간단히, 영상 처리 방법의 목표는 현미경의 이미징 과정을 반전시키고 연구 하에 생물학적 표본의 3D 구조를 복구하기 위해 모든 획득 파라미터를 식별하는 것이다. 이들 파라미터는 카메라의 게인, 빔 유도 운동, 현미경의 수차(주로 디포커스), 각 입자의 3D 각도 방향 및 번역, 및 형태 적 변화를 갖는 시편이 있는 경우 의 형성 상태입니다. 그러나, 파라미터의 수는 매우 높고 극저온-EM은 방사선 손상을 피하기 위해 저용량 이미지를 사용하여 획득된 이미지의 신호 대 잡음 비율(SNR)을 현저히 감소시킨다. 따라서 문제를 명백히 해결할 수 없으며 계산할 모든 매개 변수는 추정일 수 있습니다. 이미지 처리 워크플로우를 따라 올바른 매개 변수를 식별하고 나머지 매개 변수를 제거하여 고해상도 3D 재구성을 마지막으로 얻어야 합니다.
현미경에 의해 생성된 데이터는 프레임으로 수집됩니다. 단순화, 프레임은 전자 계수 검출기를 사용할 때마다 이미지의 특정 위치(픽셀)에 도착한 전자의 수를 포함합니다. 특정 시야에서 여러 프레임이 수집되고 이를 영화라고 합니다. 낮은 전자 용량은 샘플을 파괴 할 수있는 방사선 손상을 방지하기 위해 사용되기 때문에, SNR은 매우 낮으며 동일한 영화에 대응하는 프레임은 샘플에 대한 구조적 정보를 밝히는 이미지를 얻기 위해 평균될 필요가있다. 그러나, 단순한 평균뿐만 아니라, 시료는 보상이 필요한 빔 유도 운동으로 인해 이미징 시간 동안 교대 및 기타 종류의 움직임을 겪을 수 있다. 시프트 보정 및 평균 프레임은 현미경 그래프에서 발생합니다.
일단 현미경이 얻어지면, 우리는 주파수의 함수로 현미경의 대조에 있는 변경을 나타내는 대조 전송 기능 (CTF)에게 불린 그들 각각에 대한 현미경에 의해 소개된 수차를 추정할 필요가 있습니다. 그런 다음 파티클을 선택하고 추출할 수 있으며, 이는 입자 따기라고 합니다. 모든 입자는 연구 중인 표본의 복사본을 하나만 포함하는 작은 이미지여야 합니다. 입자 따기 알고리즘의 세 제품군이 있습니다: 1) 입자의 모양의 일부 기본 매개 변수를 사용하여 전체 현미경 사진 세트(예: 파티클 크기), 2) 파티클이 사용자 또는 미리 학습된 집합에서 어떻게 보이는지 배우는 것, 그리고 3) 이미지 템플릿을 사용하는 알고리즘이 있습니다. 각 패밀리에는 나중에 표시되는 속성이 다릅니다.
마이크로그래프에서 발견되는 추출된 입자 세트는 2D 분류 공정에 사용되며, 1) 순수한 노이즈 이미지, 겹치는 입자 또는 기타 아티팩트를 포함하는 하위 집합을 폐기하여 입자 세트를 청소하고, 2) 각 클래스를 나타내는 평균 입자는 3D 초기 부피를 계산하기 위해 초기 정보로 사용될 수 있다.
3D 초기 볼륨 계산은 다음 중요한 단계입니다. 3D 구조를 획득하는 문제는 다차원 솔루션 환경에서 최적화 문제로 볼 수 있으며, 여기서 글로벌 최소값은 원래 구조를 나타내는 최고의 3D 볼륨이지만, 최적이 아닌 솔루션을 나타내는 여러 로컬 미니마를 찾을 수 있으며, 갇히기 매우 쉬운 곳. 초기 볼륨은 검색 프로세스의 시작점을 나타내므로 초기 볼륨 추정이 좋지 않으므로 전역 최소값을 찾을 수 없습니다. 초기 부피에서 3D 분류 단계는 다른 형성 상태를 발견하고 입자 세트를 다시 청소하는 데 도움이 됩니다. 목표는 입자의 구조적으로 균일한 인구를 얻는 것입니다. 그 후, 3D 정제 단계는 가능한 최고의 3D 볼륨을 얻기 위해 모든 입자에 대한 각 및 번역 매개 변수를 정제담당합니다.
마지막으로, 마지막 단계에서, 얻은 3D 재건은 선명하고 연마될 수 있다. 선명하게 하는 공정은 재구성된 부피의 높은 주파수를 증폭시키는 과정이며, 연마는 입자 수준에서 CTF 또는 빔 유도 이동 보정으로서 일부 파라미터를 더욱 정제하는 단계이다. 또한 일부 유효성 검사 프로시저는 워크플로가 끝날 때 달성된 해상도를 더 잘 이해하는 데 사용될 수 있습니다.
이러한 모든 단계 후, 추적 및 도킹 프로세스7 은 원자 모델을 구축하거나 기존 모델을 피팅하여 얻어진 3D 재건에 생물학적 의미를 부여하는 데 도움이 될 것입니다. 고해상도가 달성되면 이러한 프로세스는 생물학적 구조의 위치를 알려줍니다.
Scipion8을 사용하면 가장 관련성이 뛰어난 이미지 프로세싱 패키지를 통합방식으로 결합한 전체 워크플로우를 만들 수 있습니다. Xmipp9, Relion10, CryoSPARC11, Eman12, Spider13, Cryolo14, Ctffind15, CCP416, Phenix17 및 더 많은 패키지가 시피온에 포함될 수 있습니다. 또한 통합, 상호 운용성, 추적성 및 재현성을 이점하는 데 필요한 모든 도구를 통합하여 전체 이미지 처리 워크플로우8을 완전히 추적합니다8.
Scipion이 사용할 수 있는 가장 강력한 도구 중 하나는 컨센서스로, 이는 보다 정확한 출력을 생성하기 위해 다른 방법으로 전달되는 정보의 조합을 만드는 처리의 한 단계에서 여러 가지 방법과 비교하여 얻은 결과를 비교하는 것을 의미합니다. 이렇게 하면 성능을 향상시키고 예상 매개 변수에서 달성된 품질을 개선하는 데 도움이 될 수 있습니다. 컨센서스 메서드를 사용하지 않고도 더 간단한 워크플로를 빌드할 수 있습니다. 그러나 이 도구의 힘을 보았습니다22,25 이 원고에 제시된 워크플로우는 여러 단계에서 사용할 것입니다.
이전 단락에 요약된 모든 단계는 다음 섹션에서 자세히 설명하고 Scipion을 사용하여 전체 워크플로에서 결합됩니다. 또한, 생성된 출력에서 더 높은 합의를 달성하기 위해 컨센서스 도구를 사용하는 방식이 표시됩니다. 이를 위해 플라스모듐 팔시파룸 80S 리보솜의 예제 데이터 집합이 선택되었습니다(EMPIAR 항목: 10028, EMDB 항목: 2660). 데이터 세트는 FEI FALCON II 카메라로 FEI POLARA 300에서 촬영한 1.34Å 크기의 16프레임 크기 4096×4096 픽셀의 600개 영화에 의해 형성되며 EMDB에서 보고된 해상도는 3.2Å18 입니다.
현재, 저온-EM은 생물학적 샘플의 3D 구조를 드러내는 핵심 도구입니다. 현미경으로 좋은 데이터를 수집하면 사용 가능한 처리 도구를 사용하면 연구 하에 거대 분자의 3D 재구성을 얻을 수 있습니다. Cryo-EM 데이터 처리는 거대 분자의 기능 적 행동을 이해하는 열쇠이며 약물 발견에서도 중요한 거의 원자 해상도를 달성 할 수 있습니다.
Scipion은 통합 방식으로 가장 관련성이 뛰어난 이미지 처리 패키지를 결합한 전체 워크플로우를 만들 수 있는 소프트웨어로 전체 이미지 처리 워크플로우의 추적성과 재현성을 지원합니다. Scipion은 처리를 수행하는 매우 완벽한 도구 세트를 제공합니다. 그러나 고해상도 재구성을 얻는 것은 획득한 데이터의 품질과 이러한 데이터가 처리되는 방식에 완전히 달려 있습니다.
고해상도 3D 재구성을 위해 첫 번째 요구 사항은 구조적 정보를 고해상도로 보존하는 현미경으로부터 좋은 영화를 얻는 것입니다. 그렇지 않은 경우 워크플로는 데이터에서 고화질 정보를 추출할 수 없습니다. 그런 다음 성공적인 처리 워크플로우가 구조에 실제로 해당하는 입자를 추출하고 3D 공간에서 이러한 파티클의 방향을 찾을 수 있어야 합니다. 워크플로의 단계가 실패하면 재구성된 볼륨의 품질이 저하됩니다. Scipion은 모든 처리 단계에서 다른 패키지를 사용할 수 있으므로 데이터를 처리하는 가장 적절한 방법을 찾는 데 도움이 됩니다. 또한 다양한 방법의 예상 출력에서 합의를 찾아 정확도를 높이는 컨센서스 도구를 사용할 수 있는 패키지가 많기 때문에 사용할 수 있습니다. 또한 대표 결과 섹션에서 여러 유효성 검사 도구와 워크플로의 모든 단계에서 정확하고 부정확한 결과를 식별하고 잠재적인 문제를 감지하는 방법 및 이를 해결하는 방법에 대해 자세히 설명했습니다. 프로토콜을 따라 프로토콜이 제대로 실행중인지 아닌지 깨닫는 데 도움이 되는 몇 가지 검사점이 있습니다. 가장 관련성이 높은 것 중 일부는 피킹, 2D 분류, 초기 볼륨 추정 및 3D 정렬입니다. 입력을 확인하거나, 다른 방법으로 단계를 반복하거나, 컨센서스를 사용하면 사용자가 문제가 나타날 때 솔루션을 찾는 데 사용할 수 있는 옵션입니다.
Cryo-EM 필드의 패키지 통합에 대한 이전의 접근 방식과 관련하여 Appion31 은 다른 소프트웨어 패키지를 실제 통합할 수 있는 유일한 방법이다. 그러나, Appion은 단단히 레기논32, 전자 현미경에서 이미지의 자동화 된 수집을위한 시스템과 연결되어 있습니다. Scipion의 주요 차이점은 데이터 모델과 스토리지가 덜 결합된다는 것입니다. 이러한 방식으로 Scipion에서 새 프로토콜을 만들려면 파이썬 스크립트만 개발해야 합니다. 그러나 Appion에서 개발자는 스크립트를 작성하고 기본 데이터베이스를 변경해야 합니다. 요약하자면, Scipion은 유지 보수 및 확장성을 단순화하기 위해 개발되었습니다.
우리는이 원고에 Plasmodium falciparum 80S 리보솜의 실제 사례 데이터 세트를 사용하여 Cryo-EM 처리를위한 완전한 워크 플로우를 제시했습니다 (EMPIAR 항목 : 10028, EMDB 항목 : 2660). 여기서 다루어지고 논의된 단계는 영화 정렬, CTF 추정, 입자 따기, 2D 분류, 초기 지도 추정, 3D 분류, 3D 정제, 평가 및 사후 처리로 요약할 수 있습니다. 다른 패키지가 사용되었으며 이러한 여러 단계에서 합의 도구가 적용되었습니다. 최종 3D 재구성 볼륨은 3Å의 해상도를 달성했으며, 처리 후 부피에서 일부 보조 구조는 알파 헬릭과 같이 구별될 수 있으며, 이는 원자가 공간에서 배열되는 방식을 설명하는 데 도움이 됩니다.
이 원고에 제시된 워크플로우는 Scipion을 사용하여 다양한 Cryo-EM 패키지를 간단하고 통합적인 방식으로 결합하여 처리를 단순화하고 동시에 보다 신뢰할 수 있는 결과를 얻을 수 있는 방법을 보여줍니다.
미래에새로운 방법과 패키지의 개발은 성장을 계속하고 쉽게 그들 모두를 통합하는 Scipion 같은 소프트웨어는 연구원에 대한 더 중요 할 것이다. 합의 접근법은 다른 기초가 있는 많은 방법이 제공될 때, Cryo-EM의 재건 과정에 관련된 모든 매개 변수에 대한 보다 정확한 추정을 얻는 데 도움이 될 때 더욱 관련성이 높을 것입니다. 추적 및 재현성은 연구 프로세스의 핵심이며 완전한 워크플로우 실행을 위한 공통프레임워크를 가지고 있기 때문에 Scipion을 통해 쉽게 달성할 수 있습니다.
The authors have nothing to disclose.
저자는 에서 경제적 지원을 인정하고 싶습니다: 보조금을 통해 과학 혁신의 스페인 부: PID2019-104757RB-I00/AEI/10.13039/501100011033, 그랜트를 통해 “코무니다드 Autónoma 드 마드리드” 그랜트를 통해: S2017/BMD-3817, 인스티투토 드 살루드 카를로스 III, PT17/0009/0010 (ISCIII-SGEFI/ERDF), 유럽 연합(EU) 및 호라이즌 2020 보조금: 교육 – ULTRA (INFRADEV-03-2016-2017, 제안: 731005), EOSC 생활 (INFRAOSC-0418, 2418 824087), iNEXT – 디스커버리 (제안 : 871037), 및 HighResCells (ERC – 2018 – SyG, 제안 : 810057). 이러한 결과를 낳은 프로젝트는 “라 카이사”재단 (ID 100010434)의 펠로우십의 지원을 받았다. 펠로우십 코드는 LCF/BQ/DI18/11660021. 이 프로젝트는 마리 Skłodowska-Curie 보조금 계약 No. 713673 따라 유럽 연합의 호라이즌 2020 연구 및 혁신 프로그램에서 자금을 받았습니다. 저자는 랜드마크 ESFRI 프로젝트인 지도의 지원과 자원의 사용을 인정합니다.