Summary

IR-TEx: 말라리아 벡터 아노펠레스 감비아를 위해 설계된 빅 데이터 전사학을 위한 오픈 소스 데이터 통합 도구

Published: January 15, 2020
doi:

Summary

IR-TEx는 아노펠레스 감비아종에서 살충제 저항 성 전사 프로파일을 탐구한다. 여기에 는 응용 프로그램 사용, 여러 전사 데이터 집합을 탐색하기 위한 수정 및 프레임워크를 사용하여 모든 플랫폼에서 생성된 모든 유기체의 전사 데이터 수집을 위한 대화형 데이터베이스를 빌드하기 위한 전체 지침이 제공됩니다.

Abstract

IR-TEx는 Anopheles 감비아 모기의 살충제 저항 표현형과 관련된 전사체의 발현(기능 할당뿐만 아니라)을 탐색할 수 있는 Shiny(R 패키지)로 작성된 응용 프로그램입니다. 응용 프로그램은 온라인으로 사용하거나 다운로드하고 누구나 로컬로 사용할 수 있습니다. 로컬 응용 프로그램을 수정하여 여러 -omics 플랫폼에서 생성된 새로운 살충제 저항 데이터 세트를 추가할 수 있습니다. 이 가이드에서는 새 데이터 집합을 추가하고 누락된 데이터를 처리하는 방법을 보여 줍니다. 또한 IR-TEx는 모든 실험 데이터에서 데이터 집합을 사용하기 위해 완전하고 쉽게 코딩할 수 있으므로 많은 연구자에게 귀중한 리소스가 됩니다. 이 프로토콜은 예를 들어 미세소말 글루타티온 트랜스퍼라제, GSTMS1을사용하여 새로운 살충제 저항 후보를 식별하는 IR-TEx의 유용성을 예시로 설명한다. 이 성적 증명서는 코트 디부아르와 부르키나 파소에서 여러 pyrethroid 저항하는 인구에서 upregulated. 공동 상관 된 전사체의 식별은이 유전자의 가증한 역할에 대한 추가 통찰력을 제공합니다.

Introduction

마이크로어레이 플랫폼과 RNAeq 기술을 통해 동시에 많은 수의 전사체의 발현을 측정하는 능력은 모델 및 비모델 유기체 모두에서 특정 표현형과 성적증명서 발현을 연결하는 방대한 데이터 세트를 생성하게 되었습니다. 이러한 데이터 집합은 연구원에게 매우 풍부한 리소스이며, 빅 데이터 통합 접근 방식에서 관련 집합을 결합하여 그 힘을 높일 수 있습니다. 그러나, 이 방법론은 특정 생물 정보학 기술을 가진 사람들로 제한됩니다. 여기에 설명된 프로그램은 IR-TEx(이전에 Ingham et al.1에의해 출판됨)로, 샤이니2라는 R 패키지로 작성되었으며 생물정보학 교육을 거의 받지 않은 사용자가 이러한 데이터 집합을 비교적 쉽게 통합하고 심문할 수 있도록 합니다.

IR-TEx, http://www.lstmed.ac.uk/projects/IR-TEx발견, Anopheles 감비아에서살충제 저항과 관련 된 성적 증명서를 탐구 하기 위해 작성 되었습니다., 주요 아프리카 말라리아 벡터1. 말라리아는 플라스모듐 종에 기인한 기생질병, 여성 Anopheles 모기의 바이트를 통해 인간 사이에서 전달됩니다. 살충제를 가진 모기 벡터를 표적으로 하는 것은 아프리카에 있는 말라리아 관련 이환율 및 사망을 방지하는 가장 효과적인 수단일 것이 입증되었습니다. 도구의 확장 (즉, 오래 지속되는 살충망 그물) 또한 2000 년 이후 말라리아 케이스의 극적인 감소에 중추적 인되었습니다3. 사용 가능한 살충제의 매우 제한된 수로, 모기에 강한 진화 압력이 있다, 저항은 지금 아프리카 말라리아 벡터에 널리 퍼져4.

추가적으로, 표적 사이트 돌연변이5 및 살충제6의신진 대사정리는저항의 1 차적인 연구된 기계장치남아 있습니다, 그러나 그밖 강력한 저항하는 기계장치는 지금 나오고 있습니다1. 이러한 새로운 메커니즘의 대부분은 이전에 살충제 저항과 연관되지 않았지만 IR-TEx 앱을 사용하여 여러 내성 집단에 걸쳐 유전자 발현의 일반적인 패턴을 검색하고 이어서 유전체학 접근법1에의해 기능적으로 검증되어 검출되었다.

여기에 설명된 단계별 접근 방식은 웹에서와 로컬로 설치될 때 IR-TEx를 사용하는 단계별 접근 방식입니다. 이 프로토콜은 새로운 살충제 저항 데이터 세트를 기존 패키지에 통합하는 방법을 설명하고 누락된 데이터로 작동하는 방법을 설명합니다. 마지막으로, 살충제 저항과 관련이없는 다른 -omics 데이터 세트와 함께이 소프트웨어를 사용하는 방법을 설명하여 다양한 -omics 접근 방식의 데이터를 결합하는 동시에 누락 된 값및 정규화로 작동하여 데이터가 비교될 수 있도록합니다.

Protocol

1. IR-TEx 웹 응용 프로그램 사용 웹 브라우저에서 응용 프로그램 실행 http://www.lstmed.ac.uk/projects/IR-TEx있는 페이지 하단의 링크를 따라 IR-TEx 웹 응용 프로그램을 엽니다. 웹 페이지가 초기화되면 페이지 상단의 응용 프로그램 단추를 클릭하여 응용 프로그램 및 관련 출력을 표시합니다. 다음과 같은 조건이 있는 성적증명서 ID 상자에서 AGAP008212-RA(CYP6M2)의 기본 항목과 관련된 각 출력을 읽으십시오: (i) 피레스로이드 살충제에 노출되거나 (ii) 살충제 클래스에 노출되지 않은 coluzzii 데이터 세트, 및 관련 성적증명서 |r의 상관관계가 있는 관련 성적증명서 >0.98. 관심 있는 성적증명서의 표현 탐구 관심 있는 성적증명서를 선택하려면 성적증명서 ID를 성적증명서 상자에 입력하고, 이소폼에 따라 성적증명서가 -RX로 끝난다는 것을 기억한다. (i) 국가에 대한 관련 상자를 선택하여 심문할 데이터 집합을 선택합니다. (ii) 노출 상태, (iii) 관심 종; (iv) 관심 있는 살충제 클래스는 이러한 기준이 포함된 데이터 집합을 생성하도록 보장하면서 (Ingham 등1의보충 표 1 참조).참고: (iii) 사용자가 관심 있는 An. 감비아 종 복합체의 구성원을 지칭한다. 현재, 데이터는 An. coluzzii 및 An. 아라비엔시스에사용할 수 있습니다. 선택 메뉴 하단의 업데이트 보기를 클릭하거나 절대 상관 값을 무시하고 반환을누릅니다(현재). 응용 프로그램에서 업데이트할 시간을 지정합니다. 첫 번째 그래프를 읽으십시오:1.2단계에서 선택된 기준을 충족하는 각 데이터 세트에 걸쳐 관심 있는 성적표의 내성 모집단과 실험실에 취약한 모기 집단 간의 로그 2 배변화(그림 1)를읽습니다. 모든 데이터 집합의 세부 사항은 Ingham 등 에서 찾을 수있습니다. 그래프 아래의 정보를 읽으십시오: 수정된 p-값(Q) 외에 각 관련 데이터 집합에 대한 내성 모기와 취약한 모기 간의 배 변화. 각 행은 마이크로어레이의 개별 프로브를 나타냅니다. 그래픽 표시 방법론은 이전에1. 관심 있는 성적증명서가 중요한 실험의 수와 1.2단계에서 선택된 기준과 일치하는 총 실험 수로서 아래 의 추가 표를 읽는다. 탭 분리 형식으로 데이터를 다운로드하려면 두 표 아래의 다운로드 단추를 클릭합니다. 이를 통해 사용자는 Excel과 같은 프로그램을 사용하여 보다 쉽게 데이터를 탐색할 수 있습니다. 맵을 다음과 같이 해석합니다: 각 포인트는 관심 있는 성적증명서가 다르게 표현되는 각 데이터 집합에서 내성 모기의 대략적인 수집 사이트를 나타냅니다. 색상은 앱에 설명된 신호등 시스템을따릅니다(그림 2). 1.2.5 및 1.2.8 단계의 경우 마우스 오른쪽 단추로 클릭하고 이미지 저장을 클릭하고 적절한 폴더를 선택하여 그래픽 출력을 저장합니다.참고: 응용 프로그램에서 출력 오류가 있는 경우 입력된 조건과 일치하는 데이터 집합이 없을 수 있습니다. 이 경우 잉햄 외 1의 보충 표1을 확인하십시오. 관심 있는 성적증명서의 가해 기능/경로 식별 여러 데이터 세트에 걸쳐 전사체의 발현 패턴의 상관관계(최소r2 값 입력)는 전사체 기능을 예측하고 잠재적으로 동일한 경로에서 코테게팅된 전사체를 해명하는 데 사용될 수 있다. 잉햄 외1에서 의 예에서 를 사용하여 (AGAP001076-RA; CYP4G16)위의 섹션에서 1.2.1-1.2 단계를 수행하여 최대 전력을 위한 모든 데이터 집합을 선택합니다. 보기 업데이트를클릭하기 전에 절대 상관 값 슬라이더를 0.85로 이동하고 보기 업데이트를 클릭하거나 반환을누릅니다. 상관 관계 표(맨 아래 표)를 검사하여 현재 표시되고 입력된 성적증명서와 상호 연관된 여러 성적증명서(|r| = 0.85)를 찾습니다. 절대 상관 값 슬라이더를 조작하고 가장 맨 아래 그래프와 표의 변경 사항을 관찰합니다. 1.3.2단계의 출력은 변경되지 않습니다. 그림 3(|r| > 0.9, |r | > 0.8)에 표시된 것처럼 상관 관계 값의 엄격성을 낮추면 더 많은 성적표가 표시되지만 더 많은 노이즈가 발생합니다. (단계 1.2.6에 설명된 매개 변수 이외에) 각 성적표에 대한 상관 값을 포함하는 그래픽 출력 아래의 표를 읽는다. 탭으로 구분된 형식으로 데이터를 다운로드하려면 다운로드 단추를 클릭합니다. 기능 보강 분석은 DAVID 분석을 사용하여 다운로드한 성적증명서 ID 목록에서 수행될 수있다 8. DAVID 웹 사이트에서 (https://david.ncifcrf.gov/발견), 기능 분석을 선택합니다. 전체 유전자 목록을 붙여 넣기, 유전자 ID를 사용 하 여 [-RX 없이 식별자, 체계적인 ID의 오른쪽에 열을 삽입 하 여 엑셀에서 수행할 수 있는 =LEFT (X1,10), 어디 X1은 체계적인 ID 셀]. 식별자를 VectorBase_ID 및 유전자 목록으로 선택하고 목록 제출을클릭합니다. 기능 별표 클러스터링 단추를 클릭하여 이 상관 관계 네트워크에서 발견된 보강에 대한 개요를 생성하여 잠재적인 함수를 성적표에 할당할 수 있습니다. 다른 범주를 살펴보고 각 범주에 대한 + 버튼을 클릭하고 이후 차트를클릭하여 심층적 인 보강을 살펴보십시오. 2. IR-TEx 로컬 다운로드 및 구현 IR-TEx 다운로드 및 실행 http://github.com/LSTMScientificComputing/IR-TEx있는 링크로 이동합니다. 및 복제를 클릭하거나 다운로드 | Zip 을 다운로드합니다. 선택한 폴더로 직접 이동하여 해당 폴더의 파일 압축을 해제합니다. http://cran.r-project.org/mirrors.html있는 링크에서 해당 운영 체제에 대한 최신 버전의 R 소프트웨어를 다운로드합니다. 프로그램을 설치합니다. 다운로드 하고 http://www.rstudio.com/products/rstudio/download/에있는 링크에서 적절한 운영 체제에 대한 다시 최신 R Studio 소프트웨어를 설치합니다. 일단 설치, 오픈 R 스튜디오 | 추가 코딩 파일 1 및 IR-TEx에 대 한 시스템을 설정 하는 각 줄을 실행 합니다. 모든 패키지가 성공적으로 설치되고 필요에 따라 업데이트되면 File |으로 이동하십시오. 열기, IR-TEx.R,강조 표시를 찾아 서 엽니다. 이제 R Studio의위쪽 창에 표시됩니다. 앱을 실행하려면 창 오른쪽 상단에 있는 앱 실행 버튼을 누르면 앱이 로드되는 두 번째 창이 나타납니다. 로딩이 완료되면 전체 기능을 보려면 로드된 창의 오른쪽 상단에 있는 브라우저에서 열기를 클릭합니다. IR-TEx에 저항 데이터 세트 추가(Anopheles 감비아 15k 애질런트 어레이를 사용하여 생성) 동일한 마이크로어레이 플랫폼(A-MEXP-2196)에서 생성된 새 분석 데이터 집합을 사용 가능한 데이터 집합에 추가하려면 앱을 다운로드하고 섹션 2.1에서 다운로드한 압축 해제된 폴더를 찾습니다. A-MEXP-2196 1에서limma 분석의 출력을 나타내는 추가 파일 1을엽니다. A1 열에서 Excel을 사용하여 Fold_Change쓰고 H2에서는 B2가 로그 폴드 변경인 =2^B2를씁니다. A열 전체에 이 것을 적용하여 원시 접기 변경을 생성합니다. 추가 파일 1 정렬 열 A가 ID이고, 열 B는 열 H(A 열, 강조 표시 열 B, 오른쪽 클릭 및 붙여넣기 값)에서 배가 변경되고 C열은 조정된 p 값입니다. 다른 모든 열을 삭제하고 탭 으로 구분된 파일로 저장합니다. 추가 코딩 파일 2를 열고 2.2.3 단계에서 생성된 탭 구분 시트를 사용하여 실행합니다.NEWFILE_FC = c(‘국가’, ‘노출 상태’, ‘종’, ‘살충제’)NEWFILE_Q = c(‘국가’, ‘노출 상태’, ‘종’, ‘살충제’)참고: 새 데이터 집합의 정보를 반영하도록 단일 따옴표 내의 필드를 변경해야 합니다. 노출 상태는 살충제 노출 (노출 / 노출되지 않은)에 따라 샘플을 수집했는지 여부를 말합니다. 살충제: ‘노출되지 않은’ 경우 ‘없음’을 사용하십시오. Fold_Changes.txt를 참조하십시오. 다른 샘플의 메타데이터에 대한 것입니다. 맞춤법이 일치하는지 확인합니다. geography.txt를열고 마지막 점유 행으로 스크롤한 다음 아래를 선택합니다. 데이터 집합 의 이름을 입력한 다음 열 1의 Q 및 NEWFILE_Q, 열 2의 샘플 수집 사이트의 위도 및 열 3의 경도를 입력합니다. 변경 내용을 저장합니다. 데이터 집합에서 선택할 수 없는 새로운 항목(즉, 감비아)이 사용되는 경우(Ingham 등 보충 표 11참조) 코드에 추가해야 합니다. 이렇게 하려면 RStudio에서 IR-TEx.R을 열고 RStudio에서 표시한 대로 26줄을 찾으면 다음이 시작되어야 합니다.’사이드 바 패널 (…’.참고: 진행되는 각 행은 2.2.5단계에서 Fold_Changes.txt의 데이터 집합 이름 아래의 행에 입력된 메타데이터의 항목과 관련이 있습니다. 신규 메타데이터를 추가하려면 선택한 메타데이터 줄의 끝으로 스크롤하여 ‘selected=’라는 용어를 찾습니다. 이 다음에 쉼표와 닫힌 대괄호가 있어야 합니다. 이 때 닫힌 대괄호 내의 커서를 클릭합니다. 마지막 아포스트로피를 입력한 다음 아포스트로피를 입력한 다음 새 메타데이터(예: ‘감비아’)를 입력하고 변경 내용을 저장합니다. 예제는 아래를 참조하십시오.확인란그룹입력(‘국가입력’, ‘관련 국가 선택’, c(‘부르키나파소’, ‘코트디부아르’, ‘카메룬’, ‘적도 기니’, ‘잠비아’, ‘탄자니아’,’수단’,’우간다’,’토고’, ‘감비아’),선택=c(‘부르키나 파소’, ‘코트 디부아르’,’카메룬’, ‘적도 기니’, ‘잠비아’,’탄자니아’,’수단’,’우간다’,’토고’)) 앱을 실행합니다. 새 메타데이터 항목은 관련 제목 아래에 선택되지 않은 체크박스로 표시되어야 합니다. 사용자가 선택하기를 원하는 경우 아래와 같이 선택된 =c(…)에 따라 추가해야 합니다.확인란그룹입력(‘국가입력’, ‘관련 국가 선택’, c(‘부르키나파소’, ‘코트디부아르’, ‘카메룬’, ‘적도 기니’, ‘잠비아’, ‘탄자니아’,’수단’,’우간다’,’토고’, ‘감비아’),선택=c(‘부르키나 파소’, ‘코트 디부아르’,’카메룬’,’적도 기니’, ‘잠비아’,’탄자니아’,’수단’,’우간다’,’토고’, ‘감비아’) A-MEXP-2196에서 수행되지 않은 저항 데이터 집합을 추가하려면 섹션 3을 참조하십시오. 3. 다른 데이터 집합과 함께 사용하기 위해 IR-TEx 수정 여러 -omics 플랫폼에서 사용하고 누락된 데이터로 진행 데이터 집합에서 “0”으로 진행하려면 데이터 집합 원본에서 “0”의 특정 의미를 참조하십시오. “0”은 (보수적으로) “NA”로 대체하는 것이 좋습니다. 원시 접기 변화(B/A)와 마찬가지로”0″은 실험 조건 B에서 감지되지 않은 신호를 나타냅니다. 실험 조건 A가 실질적인 발현을 나타내는 경우, 사용자는 작은 배 변화 값을 적용할 수 있다. 추가 파일 2.txt열기, 우이헬지 외9에서적응 RNAeq 파일 . 이 파일은 새 데이터의 기반이 되어야 하는 템플릿을 나타냅니다: 열 A = 식별자, 열 B = 원시 접기 변경 및 열 C = 조정된 p-값. 이 파일을 사용하여 아래 단계를 실행합니다. R 코드를 실행하여 식별자를 플랫폼 간에 단일 탭 으로 구분된 파일로 일치시키고 데이터를 구성하고 정규화합니다(추가코딩 파일 2). 지침은 파일 내에 포함되어 있습니다. 모든 FILEPATH는 MacOS의 경우 “/” 또는 Windows의 “//”로 구분됩니다(“\”에서 변경). 보충 코딩 파일 2의 끝에서 생성된 파일을 3.1.5 단계에서 사용할 수 있는 위치로 출력합니다. 추가 코딩 파일 2는 새 Fold_Changes.txt 파일을 출력합니다. 원본 파일을 백업합니다. 추가 코딩 파일 3에포함된 코드를 실행합니다. FILEPATH로지정된 폴더에서 FC_distribPlot.png라는 출력 파일을 찾습니다. 로그2 배 변경 분포를 확인하여 데이터 집합 전체에서 로그2 배 변경 분포가 거의 동일한지 확인합니다. 추가 파일을 편집하고 새로운 Fold_Changes.txt의호환성을 보장하기 위해 단계 2.2.6의 지침을 따르십시오. 완전히 새로운 데이터 집합에서 사용할 IR-TEx 수정 RStudio에서 IR-TEx.R을 열고 다음을 시작으로 라인(23-34)을 찾습니다.’탭 패널(‘그리고 에서 종료 :제출 버튼(“보기 업데이트”, 아이콘(“새로 고침”))), 아래 줄에 있는 AGAP008212-RA를 새 데이터에 대한 관심 있는 성적표로 변경합니다.텍스트 입력(‘텍스트 입력’, ‘성적 증명서 ID’, 값=’AGAP008212-RA’), 다음의 네 가지 옵션을 찾습니다.확인란그룹입력(이러한 옵션은 사용자가 새 데이터를 필터링하려는 중요한 메타데이터를 나타내도록 수정할 수 있습니다. 각 인스턴스에서 사용자는 관련 국가 선택을변경해야 합니다. 노출 상태를 선택합니다. 관련 종을 선택합니다. 및 데이터를 대표하는 살충제 클래스를 선택 (즉, 조직 유형을 선택; 선택 섹스; 나이 브래킷을 선택합니다. 질병 상태를 선택합니다). 데이터 집합및 입력과 연관된 메타데이터를 식별하여 첫 번째 c()직후기존 옵션을 대체합니다. 각 인스턴스에서 옵션은 음성 표시 내에 포함되고 쉼표로 다음 선택 항목과 분리됩니다. 최종 선택 후 대괄호를 닫아야 합니다. 질병 상태 선택에 대한 예는 다음과 같은 경우입니다.c(‘감염’, ‘감염되지 않은’, ‘알 수 없음’) 앱을 열 때 선택할 메타데이터 중 하나를 선택합니다. 선택한 후 옵션을 수정하여 변경할 수 있습니다=c(). 질병 상태 선택에 대한 예는 다음과 같은 경우입니다.선택=c(‘감염’, ‘감염되지 않은’)이렇게 하면 앱이 초기 로드시 이러한 기준과 일치하는 데이터 집합만 선택하도록 지시합니다. 새 데이터 테이블을 만들려면 Fold_Changes.txt에 있는 레이아웃과 섹션 2의 지침을 따릅니다. 3.2.4 단계에서 설명된 각각의 변경 내용에 따라 메타데이터를 코드에 기록한 것과 정확히 동일하게 변경합니다(R은 대/소문자를 구분함). 해독 컬럼내로, 입력 된 유전자 이름, 및 전사체 유형 컬럼에서, 각 전사체에 대한 유전자 설명을 입력한다. 새 데이터 집합을 추가할 때 섹션 3.2를 따릅니다. 매핑이 실험 요구 사항과 관련이 없는 경우 다음 코드 줄을 찾아 앞에 ‘#’을 배치합니다.라인 49-51:br(),br()스피너(플롯출력(“지리”))를 사용함)텍스트 출력(‘Geography_legend’),493호선 시작:출력$지리 및 lt;- 렌더플롯({602 엔딩 줄:출력 $Geography_legend <- 렌더텍스트({붙여 넣기(“중요한 성적증명서 만”, as.expression(“<=”),”0.05): FC > 5 = 빨간색, FC > 1 = 호박색, FC < 1 = 녹색", 9월=""})

Representative Results

IR-TEx에 포함된 Fold_Changes.txt 파일을 사용하여, 우리는 코트 디부아르와 부르키나 파소에서 영향을 받기 쉬운 컨트롤에 저항하는 Anopheles coluzzii 및 Anopheles 감비아 데이터 세트에서 현저하게 다르게 표현된 성적증명서를 비교했습니다. 이렇게 하면 관심 있는 18개의 성적증명서(표 1;이 검색은 Excel, R 또는 기타 프로그램을 사용하여 수행할 수 있음). 이들 중 2개는, ATPase(AGAP006879) 및 α-결정린(AGAP007160)이 이전에 보고되었으며, 전자는 피레스로이드 저항에 상당한 영향을 미친다1. 이들 2개의 전사체 이외에, 2개의 해독 전사체, GSTMS1(FC μ = 1.95 및 1.85) 및 UGT306A2(FC μ = 2.29 및 2.28)가 존재하였다. 이들 전사체 중 2개의 qPCR검증(GSTMS1,해독 전사체; 및 AGAP009110-RA, β-1,3-글루칸 결합 도메인을 포함하는 미지의, 모기 특이적 전사체)을 앞서설명한바와 같이 수행하였다. 분석은 추가 파일 3에 기술된 프라이머 세트를 사용하여 수행되고 이 전사체가 실험실에 취약한 N’Gousso에 비해 코트 디부아르 (Tiassalé)와 부르키나 파소 (Banfora)에서 다른 다중 저항 인구에서 현저하게 upregulated 것을 보여주었습니다(그림 4A). 두 전사체가 각 내성 집단에서 상당한 업레테인을 보였기 때문에, RNAi-유도 녹다운은 LSTM 실험실 티아살레 식민지로부터모기에 대해 수행되었다. 이 식민지는 코트 디부아르에서 유래하고 앞에서설명한대로 공중 보건에 사용되는 살충제의 모든 주요 클래스에 저항1,10. GSTMS1의 발현의 감쇠는 GFP 주입 대조군과 비교하여 델타메트린 노출 후 사망률에서 현저한 증가(p=0.021)를 초래하였으며, 피레스로이드 저항성에서 이 전사체의 중요성을 입증하였다(도4B). 반대로, AGAP009110-RA 녹다운은 노출 후 사망률에서 유의한 변화(p=0.082)를 초래하지않았다(그림 4B). GSTMS1은 미세한 GST이며 A. 감비아 모기11에서발견되는 세 가지 중 하나입니다. GST의 엡실론 및 델타 클래스의 구성원은 이전에 살충제 해독 에 연루되었지만12,13,14,이것은 피레스로이드 저항성에서 미세 소체 GSTs의 역할에 대한 우리의 지식에 대한 첫 번째 증거이다15. Anopheles gambiae sl 모기에 있는 이 전사체의 putative 기능을 탐구하기 위하여는, IR-TEx에 있는 표현 그리고 상관관계 확인되었습니다. GSTMS1은 비오코 섬을 제외한 21개의 데이터 세트 중 20개에서 현저히 과발현되었습니다. 각 위치에서, 과발현은 영향을 받기 쉬운 인구에 비해 5배 미만이었다(도5). 소소말 GST가 잠재적 살충제 해독제로서 크게 무시되었기 때문에, 살충제저항성 15에서그들의 역할에 대해서는 거의 알려져 있지 않습니다. 다른 전사체의 공동 상관 관계를 탐구함으로써, putative 함수는 동일한 경로에 공동 규제 또는 참여의 가정을 통해 해명 될 수있다. 상관 네트워크의 전력을 최대화하기 위해 IR-TEx에 있는 모든 마이크로어레이 데이터 집합이 선택되었으며 | r | >0.75가 선택되었습니다. 표 2는 IR-TEx의 출력을 보여줍니다. 이러한 전사체는 DAVID의 기능적 타인 도구8에서옥시오레두타제 활성 및 포도당/탄수화물 대사가 풍부하다. 포도당-6-인산탈수소효소 및 시타티온 감마리아제 모두 포유류 세포16,17에서 글루타티온의 수준을 유지하고 따라서 글루타티온-S-트랜스퍼라제인 GSTMS1과직접 연결한다. 카살라제는 피레스로이드 노출의 부산물인 반응성 산소 종 손상으로부터 세포를 보호하는 빠르게 작용하는 산화 스트레스 응답자입니다. 발라시클로비르 하이드로라제는 포유류세포(18)에서해독에 역할을 할 수 있는 하이드로라제이다. CYP4H17은 또한 상관 네트워크에 존재한다. 시토크롬 p450s는 피레스로이드 살충제의 직접적인 대사제이며, 이러한 고장 제품은 GST에 의해 더 대사될 수 있습니다. 마지막으로, CYP4H17은 A. funestus19에서피레스로이드 저항에 연루되었습니다. 종합하면, 이러한 데이터는 xenobiotic 해독에 GSTMS1에 대한 역할을 강력하게 지원합니다. 그림 1: 모든 데이터 집합에서 AGAP002865-RA의2배 변경. x축은 상이한 데이터 세트를 상세히 설명하며, 이는 이전간행물1의 보충 표 1에서 찾을 수 있고, y축은 관심 있는 성적표에서 로그2 배 변화를 나타낸다. 밝은 회색 점선은 유의에 대한 대략적인 임계값을 나타내며 여기서는 1.2의 배 변경으로 이동합니다. 점선 검은 선은 1의 배 변화를 나타냅니다 (즉, 저항하는 모집단과 취약한 모집단 간의 발현 차이 없음). 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 도 2: 내성 집단에서 AGAP002865-RA의 유의한 차동 발현을 나타내는 마이크로어레이의 분포. 신호등 시스템에서 배 변화(녹색 배 변화 1, 빨간색 배 변화 및 >5)가 표시됩니다. 유의한 데이터 집합(p ≤ 0.05)의 차동 식만 표시됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 그림 3: AGAP001076-RA(CYP4G16)의 상관 네트워크. 쌍별 상관 관계는 31개의 마이크로어레이 데이터 집합에 걸쳐 모든 전사체에서 계산되며 사용자 정의 컷오프가 적용됩니다. 여기에 표시된 것은(A)| | | > 0.9 및(B)| | | > 0.8. 그래프에 표시된 모든 성적증명서는 이 기준을 충족하고 AGAP001076-RA의 표현 변경 사항을 따릅니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 도 4: GSTMS1 및 AGAP009110-RA의 감쇠 시 mRNA 발현 및 표현형. (A)GSTMS1 및 AGAP009110-RA의 mRNA 발현은 각각 코트디부아르및 부르키나파소로부터의 2개의 다중 내성 An. coluzzii 집단에서이다. 수준은 실험실에 영향을 받기 쉬운 An. coluzzii N’Gousso와 비교되었습니다. ANOVA가 사후 Dunnett의 테스트를 통해 계산한 유의 수준입니다. (B)RNAi-GFP 주입 대조군과 비교하여 두 전사체의 감쇠. GSTMS1 감쇠는 델타메트린 노출 후 사망률의 현저한 증가를 나타낸다(ANOVA에 의해 사후 투키 시험을 통해 계산; *p ≤ 0.05, **p ≤ 0.01). 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 그림 5: 아노펠레스 감비아 및 아노펠레스 coluzzii 인구에서 GSTMS1의 표현. 사용 가능한 마이크로어레이 데이터 세트에서 GSTMS1의 현저히 차등 식을 보여주는 맵입니다. GSTMS1은 21개의 마이크로어레이 데이터 세트 중 20개에서 현저하게 차등하는 것으로 나타났습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오. 성적 증명서 ID 설명 부르키나파소 코트 디부아르 AGAP006879-RA 아파스 ()에이파스 (것)와 27.94 43.05 AGAP007160-RB a-크리스탈린 11.49 10.58 AGAP007160-RC a-크리스탈린 11.14 10.38 AGAP007160-RA a-크리스탈린 9.78 9.84 AGAP009110-RA 알려지지 않은 9.26 5.96 AGAP007780-RA NADH 탈수소 효소 10.49 3.77 AGAP006383-RA 올리고사카릴트랜스퍼라제 복합소단위 베타 3.69 5.57 AGAP007249-RB 플라이틴 (것)과 함께 4.61 3.86 AGAP003357-RA RAG1 활성화 단백질 1-유사 단백질 4.31 4.05 AGAP007249-RA 플라이틴 (것)과 함께 4.48 3.46 AGAP001998-RA mRpS10 3.46 2.85 AGAP007589-RA UGT306A2 2.29 2.28 AGAP000165-RA GSTMS1 1.95 1.85 AGAP002101-RA 이솔루실-tRNA 합성 0.57 0.59 AGAP002969-RA 아스파라기닐-tRNA 합성 0.45 0.45 AGAP004199-RA 솔루트 캐리어 패밀리 5 (나트륨 결합 모노카박스일레이트 수송기), 회원 8 0.35 0.48 AGAP004684-RA rRNA 처리 단백질 CGR1 0.36 0.22 AGAP006414-RA Cht8 0.024 0.36 표 1: 부르키나파소와 코트 디부아르 인구에 걸쳐 동일한 배 변화 방향에서 성적증명서가 현저하게 차감됩니다. 성적 증명서 ID, 유전자 설명, An. coluzzii 및 An. gambiae 인구를 나타내는 두 나라에서 각 데이터 집합에 대 한 평균 배 변화. 상관 관계 체계적인 이름 성적 증명서 유형 1 AGAP000165-RA GSTMS1 0.82 AGAP004904-RA 카알라제 0.76 AGAP007243-RA 26S 프로테아제 규제 하위 장치 8 0.79 AGAP008358-RA CYP4H17 0.76 AGAP009436-RA 발라시클로비르 하이드로라제 0.75 AGAP010739-RA 포도당-6-인산염 1-탈수소효소 0.85 아가프01172-RA 시스타티오닌 감마-리아제 0.76 AGAP012678-RA 포도당-6-인산염 1-탈수소효소 표 2: GSTMS1과상호 연관된 성적증명서. 이 표는 IR-TEx에서 GSTMS1에 대한 상관 관계 네트워크의 출력을 나타냅니다.| 의 >0.75. 이 표는 각 상호 상관성 전사체에 대한 스피어맨의 상관관계, 전사체 ID 및 유전자 설명을 보여줍니다. 추가 파일 1: Limma에서 분석된 A-MEXP-2196 어레이의 출력 파일입니다. 이 파일은 ArrayExpress (E-MTAB-4043) 및 다른 이전 간행물1에서자세히 설명된 GFP 제어 어레이에 비해 Met 녹다운에서 비롯됩니다. 열은 AGAP 식별자(SystematicName), 로그 폴드 변경(logFC), 로그 표현값(AveExpr), t-통계(t), 수정되지 않은 p-값(P.Value), 조정된 p-값(adj)을 나타냅니다. P.Val) 및 B 통계 (B)20. 이 파일의 목적을 위해, 모기는 코트 디부아르에서 Anopheles coluzzi이며, 수집 위도와 경도 -5.4 및 6.0, 각각, 살충제에 노출되지 않습니다. 이 파일을 보려면 여기를 클릭하십시오 (다운로드 오른쪽 버튼을 클릭하십시오). 추가 파일 2: RNAseq 실험에서 출력 파일입니다. 50% 살림에 노출될 때 Anopheles 모기의 전사체에 있는 변경을 기술하는 Uyhelji 외9에서 취한 RNAseq 분석. 이 파일은 발행물의 표 S2에서 적응하고 AGAP 식별자(SystematicID), 원시 폴드 변경(Fold_Change), 및 조정된 p-값(q_value)을 포함한다. 이 파일을 보려면 여기를 클릭하십시오 (다운로드 오른쪽 버튼을 클릭하십시오). 추가 파일 3: 대표 결과에 대한 입문서 목록입니다. AGAP 식별자, 유전자 이름, dsRNA 포워드, dsRNA 역, qPCR 포워드, 및 qPCR 역프라이머 세트각 전사체에 대한 설정. 이 파일을 보려면 여기를 클릭하십시오 (다운로드 오른쪽 버튼을 클릭하십시오). 추가 코딩 파일 1. 이 파일을 보려면 여기를 클릭하십시오 (다운로드 오른쪽 버튼을 클릭하십시오). 추가 코딩 파일 2. 이 파일을 보려면 여기를 클릭하십시오 (다운로드 오른쪽 버튼을 클릭하십시오). 추가 코딩 파일 3. 이 파일을 보려면 여기를 클릭하십시오 (다운로드 오른쪽 버튼을 클릭하십시오).

Discussion

빅 데이터 전사체는 각 실험 조건에 대해 차별화된 수천 개의 성적증명서 목록을 생성합니다. 이 실험의 다수는 관련 유기체 및 표현형에 수행되고 거의 독점적으로 독립적인 실험으로 분석됩니다. 이러한 풍부한 데이터 소스를 전체적으로 조사하고 이론적 가정 없이 데이터를 활용하면 1) 새로운 후보 녹취록의 식별로 이어질 것이며 2) 생체내에서검증하기에 너무 많은 정보가 있기 때문에 단순히 귀중한 데이터의 폐기를 방지할 수 있다.

IR-TEx는 여러 데이터 집합을 쉽게 검사하고, 데이터 집합의 변경 내용을 시각화하고, 관련 정보를 다운로드할 수 있는 제한된 생물정보학 배경을 사용자에게 제공합니다1. IR-TEx는 각 검색에서 두 개 이상의 자막 검색을 지원하지 않지만 사용자는 Excel, R 또는 기타 적절한 프로그램을 사용하여 관련 Fold_Changes.txt 파일을 검사할 수 있습니다. IR-TEx의 추가 유틸리티는 상관 관계 네트워크의 사용에서 유래 성적 증명서 기능을 예측, 알 수없는 기능을 가진 가상의 단백질 또는 성적 증명서의 입력 및 농축을 검색하는 다운 스트림 소프트웨어의 사용1.

이 프로토콜에서 설명한 예제에서는 IR-TEx가 원래 기능에 따라 사용됩니다. 여기서, 살충제 저항과 관련된 전사체의 탐색을 허용하고 매핑 그래픽을 통해 과다 및 언더 표현의 분포를 시각화할 수 있다. 관심 있는 전사체는 주어진 전사체의 과다 또는 과식이 관찰된 표현형1(예를 들어, 살충제 저항)에 기여하는지 여부를 결정하기 위해 생체 내에서 검증된다. 이전에 보고된1과같이 데이터 집합이 가설 중심의 접근 방식으로 국가별 관심 있는 성적표를 식별하는 데 사용될 수 있음을 여기에서 입증되었습니다. IR-TEx는 1) 전사체의 발현을 탐구하고 2) 각-omics 데이터 세트에 포함된 모든 전사체에 쌍상관 네트워크를 적용하여 전사체의 기능을 맥락화하는데 사용될 수 있다. 여기서, GSTMS1은 해독에 연루된 다수의 다른 전사체와 상호 상관되는 것으로 나타났다. 이 데이터는 (살충제 노출 후에 사망률에 있는 중요한 증가를 초래한 전사체의 녹다운과 더불어) xenobiotic 정리에 있는 이 전사체의 중요성을 보여줍니다.

IR-TEx는 웹에서 살충제 저항 관련 성적 증명서를 탐색하거나 로컬 응용 프로그램을 사용하기위한 귀중한 자원을 나타냅니다. 이 프로토콜은 완전히 새로운 데이터뿐만 아니라 다른 -omics 플랫폼에 대한 IR-TEx를 수정하는 방법을 보여줍니다. 이 가이드에서는 IR-TEx를 사용하여 여러 -omics 플랫폼 및 데이터 집합의 데이터를 누락된 데이터와 통합하는 방법과 IR-TEx를 단순히 다시 코딩하는 방법을 설명하므로 전사데이터 집합을 연구하는 모든 사람에게 유용합니다.

Divulgazioni

The authors have nothing to disclose.

Acknowledgements

이 작품은 V.I.에 MRC 기술 개발 펠로우십에 의해 투자되었다 (MR / R024839/1) 및 로얄 소사이어티 도전 그랜트 (CH160059) H.R.

Materials

Laptop with browser Any
R Program The R Project for Statistical Computing https://www.r-project.org/
R Studio R Studio https://www.rstudio.com/

Riferimenti

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9 (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. . shiny: Web Application Framework for R. , (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526 (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32 (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25 (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41 (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4 (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8 (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25 (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18 (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4 (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14 (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15 (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274 (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5 (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270 (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7 (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3 (1), 3 (2004).

Play Video

Citazione di questo articolo
Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

View Video