IDBac는 박테리아 식민지에서 긁어낸 세포 물질에 수집된 손상되지 않은 단백질과 특수 대사 산물 스펙트럼의 데이터를 통합하는 오픈 소스 질량 분석 기반 생물 정보학 파이프라인입니다. 이 파이프라인을 통해 연구원들은 수백 에서 수천 개의 세균 식민지를 분류학 그룹으로 신속하게 구성하고 전문 대사 산물 생산을 기반으로 이를 더욱 차별화 할 수 있습니다.
영양한 분한에서 자라는 세균 성 콜로니의 세균 생리와 특수 대사 산물 생산 사이의 관계를 시각화하기 위해, 우리는 IDBac – 저비용 및 고처리량 매트릭스 염착 지원 레이저 탈착 /이온화를 개발했습니다. 비행 시간 질량 분석법 (MALDI-TOF MS) 생물 정보학 파이프 라인. IDBac 소프트웨어는 비 전문가를 위해 설계, 자유롭게 사용할 수 있으며, 세균 식민지의 몇 ~ 수천을 분석 할 수있다. 여기에서는 MALDI-TOF MS 분석, MS 기기 작동 및 IDBac의 데이터 처리 및 시각화를 위한 세균 식민지 제조 절차를 제시합니다. 특히, 우리는 단백질 MS 지문에 근거를 둔 dendrograms로 박테리아를 클러스터하는 방법을 사용자에게 지시하고 전문화한 대사 산물 데이터에서 대사 산물 협회 네트워크 (MAN)를 대화식으로 만듭니다.
세균 기능을 연구하는 연구원에 대한 주요 장벽은 미생물의 분류학적 정체성과 특수 대사 산물을 생산하는 능력을 신속하고 동시에 평가하는 능력입니다. 이것은 환경에서 격리된 박테리아의 대다수에 있는 세균성 생리와 전문화한 대사 산물 생산 사이 관계를 이해에 있는 중요한 어드밴스를 방지했습니다. 단백질 지문을 사용하여 박테리아를 그룹화하고 식별하는 MS기반 방법이 잘 설명되어 있지만 1, 2,3,4,이러한 연구는 일반적으로 소집단 분리군에서 수행되어 왔으며, 종별 방식으로. 중요한 것은, 환경에 있는 미생물 기능의 주요 동인인 전문화한 대사산물 생산에 대한 정보는, 이 연구 결과에 통합되지 않은 남아 있습니다. Silva 등 5는 최근 MALDI-TOF MS의 미사용과 현재의 생물정보학 병목 현상을 완화하기 위한 소프트웨어의 부족을 분석하는 포괄적인 역사를 제공했습니다. 이러한 단점을 해결하기 위해 MALDI-TOF MS 6의 선형 및 반사 모드 모두를 통합하는 생물 정보학파이프라인인 IDBac을 만들었습니다. 이를 통해 사용자는 단백질과 특수 대사 산물 MS 지문에 따라 세균 분리를 신속하게 시각화하고 차별화 할 수 있습니다.
IDBac은 비용 효율적이고 처리량이 높으며 평신도 사용자를 위해 설계되었습니다. 자유롭게 사용할 수 있으며(chasemc.github.io/IDBac) MALDI-TOF 질량 분석기만 이에 액세스해야 합니다(전문 대사 산물 분석에는 반사 모드가 필요합니다). 샘플 전제제는 간단한 “확장된 직접전달” 방법 7,8및 데이터가 단일 MALDI 표적 스팟에서 연속적인 선형 및 반사론 획득으로 수집됩니다. IDBac를 사용하면 샘플 준비, 데이터 수집 및 데이터 시각화를 포함하여 4 시간 이내에 수백 개의 식민지의 가설 생리 및 전문 대사 산물 생산을 분석 할 수 있습니다. 이것은 박테리아를 식별하는 전통적인 방법 (예 : 유전자 염기서열 분석) 및 대사 출력분석 (액체 크로마토그래피 질량 분광법 [LCMS] 및 유사한 크로마토그래피 방법)에 비해 상당한 시간과 비용 이점을 제시합니다.
선형 모드 분석에서 얻은 데이터를 사용하여 IDBac은 계층적 클러스터링을 사용하여 단백질 스펙트럼의 관련성을 나타냅니다. 스펙트럼은 대부분 이온화된 리보좀 단백질을 나타내기 때문에, 샘플에 존재하는 계통학적 다양성의 표현을 제공한다. 또한 IDBac은 리플렉트론 모드 데이터를 통합하여 대사산물 협회 네트워크(MAN)와 같은 특수 대사 산물 지문을 표시합니다. MAN은 박테리아 분리물 간의 공유 및 고유 대사 산물 생산을 쉽게 시각화 할 수있는 이분형 네트워크입니다. IDBac 플랫폼을 통해 연구원은 단백질 및 특수 대사 산물 데이터를 나란히 분석할 수 있지만 하나의 데이터 유형만 획득하는 경우에도 개별적으로 분석할 수 있습니다. 중요한 것은 IDBac은 브루커 및 샤먼 계측기뿐만 아니라 txt, 탭, csv, mzXML 및 mzML의 원시 데이터를 처리합니다. 따라서 데이터 집합의 수동 변환 및 서식 지정이 필요하지 않으며 사용자 오류 또는 MS 데이터의 잘못된 취급 의 위험이 크게 줄어듭니다.
IDBac 프로토콜은 단일 연구원에 의해 4시간 동안 최대 384개의 세균 분리물의 박테리아 단백질 및 특수 대사산물 데이터 수집 및 분석을 자세히 설명합니다. IDBac을 사용하면 박테리아 분리물에서 DNA를 추출하거나 액체 발효 국물에서 특수 대사 산물 추출물을 생성하고 크로마토그래피 방법을 사용하여 분석 할 필요가 없습니다. 대신, 단백질 및 전문화한 대사 산물 데이터는 단순히 MALDI 표적 격판덮개에 세균성 식민지에서 직접 퍼지는 물자를 통해 집합됩니다. 이것은 크게 16S rRNA 유전자 염기서열 분석 및 LCMS 9와같은 대체 기술과 관련되었던 시간 및 비용을 감소시킵니다.
MALDI 플레이트에 매트릭스 블랭크 및 교정 스팟을 추가하는 것이 중요하며 재현성과 통계적 신뢰도를 보장하기 위해 적절한 수의 복제본을 사용하는 것이 좋습니다. 복제 수에 따라 실험에 따라 다릅니다. 예를 들어 사용자가 수천 개의 식민지를 환경 다양성 플레이트 모음에서 차별화하려는 경우 더 적은 수의 복제가 필요할 수 있습니다(우리 실험실은 식민지당 세 개의 기술 복제본을 수집합니다). 또는 사용자가 특정 세균 성 taxa에서 균주의 사용자 지정 데이터베이스를 만들어 알려지지 않은 분리물의 하위 종 분류를 신속하게 결정하려는 경우 더 많은 복제가 적절합니다 (우리 실험실은 1 인당 8 개의 생물학적 복제본을 수집합니다. 변형)을 제공합니다.
IDBac는 가학적인 분류학적 정보와 특수 대사 산물 생산을 기반으로 고도로 관련된 세균 분리를 빠르게 차별화하는 도구입니다. 핵 자기 공명 분광법에 의한 심층적인 유전 분석, 대사 산물 생산 및 기능을 수반하는 연구, 또는 특수 대사 산물 구조의 특성화와 같은 직교 방법의 전구체 역할을 할 수 있습니다. LC-MS/MS.
특수 대사 산물 생산 (IDBac MAN)은 세균 성장 조건에 매우 민감하며, 특히 다른 매체를 사용하여 방법의 잠재적 한계입니다. 그러나 이러한 특성은 IDBac이 다양한 성장 조건 하에서 특수 대사 산물 생산의 차이를 보여주는 MA를 쉽게 생성 할 수 있기 때문에 사용자에 의해 악용 될 수 있습니다. 전문화한 대사산물 지문은 성장 조건에 따라 다를 수 있지만, 우리는 이전에 단백질 지문이 이러한 변수에 걸쳐 상대적으로 안정적으로 유지된다는 것을 보여주었습니다 (Clark et al.6참조). 환경 다양성 판을 다룰 때, 우리는 이웃 세균 크로스 토크에서 가능한 기여를 줄이기 위해 분석 하기 전에 세균 격리를 정화 하는 것이 좋습니다.
마지막으로, 단백질 MS 지문의 검색 가능한 공개 데이터베이스의 부족은 알려지지 않은 환경 박테리아를 분류하는이 방법의 사용에 큰 단점이다. 이를 염두에 두고 IDBac을 만들었으며, 데이터를 커뮤니티에서 허용하는 오픈 소스 형식(mzML)10,11,12로 자동 변환하고 검색, 공유 및 생성이 가능하도록 소프트웨어를 설계했습니다. 사용자 지정 데이터베이스. 우리는 큰 공공 데이터베이스를 만드는 과정에 (>10,000 완전히 특성화 균주), 종 수준에 일부 격리의 분류를 허용합니다, 가능한 경우 GenBank 가입 번호에 대한 링크를 포함.
IDBac은 오픈 소스이며 누구나 데이터 분석 및 시각화 요구 사항을 사용자 정의할 수 있는 코드를 사용할 수 있습니다. 우리는 사용자가 지원및 실험 목표를 설계하는 데 도움이문학의 광범위한 몸을 참조하는 것이 좋습니다 (Sauer 외 7, 실바 외 5). 우리는 에서 토론을위한 포럼을 개최 : https://groups.google.com/forum/#!forum/idbac 및 에서 소프트웨어와 문제를보고하는 수단 : https://github.com/chasemc/IDBacApp/issues.
The authors have nothing to disclose.
이 작품은 일반 의료 과학 그랜트 R01 GM125943, 내셔널 지오그래픽 그랜트 CP-044R-17의 국립 연구소에 의해 지원되었다; 아이슬란드 연구 기금 교부금 152336-051; 일리노이 대학교 시카고 스타트업 펀드. 또한, 우리는 다음과 같은 기여자에게 감사드립니다: MALDI-TOF MS 단백질 획득 매개 변수에 대한 도움을 받은 아만다 불먼 박사; 테리 무어 박사와 아툴 자인 박사는 알파-시아노-4-하이드록시나믹 산 매트릭스(CHCA)를 재결정화했습니다.
Acetonitrile | Fisher | 60-002-65 | LC-MS Ultra CHROMASOLV |
Autoflex Speed LEF MALDI-TOF instrument | Bruker Daltonics | ||
Bruker Daltonics Bacterial test standard | Fisher | NC0884024 | Bruker Daltonics 8604530 |
Bruker Peptide Calibration standard | Fisher | NC9846988 | Bruker Daltonics 8206195 |
Formic Acid | Fisher Chemical | A117-50 | 99.5+%, Optima LC/MS Grade |
MALDI-TOF target Plate | Bruker Daltonics | ||
Methanol | Fisher Chemical | A456-500 | Optima LC/MS Grade |
Toothpicks | any is ok | ||
Trifluoroacetic acid | Fisher | AC293810010 | 99.5%, for biochemistry, ACROS Organics |
Water | VWR | 7732-18-5 | LC-MS |
α-Cyano-4-hydroxycinnamic acid | Sigma | 28166-41-8 | (C2020-25G) ≥98% (TLC), powder |