Summary

IR-TEx: Инструмент интеграции данных с открытым исходным кодом для транскриптомики больших данных, предназначенный для гамбии переносчика малярии Anopheles

Published: January 15, 2020
doi:

Summary

IR-TEx исследует инсектицидной устойчивости связанных транскрипционных профилей в видов Anopheles gambiae. Здесь приведены полные инструкции по использованию приложения, модификации для изучения нескольких транскриптомических наборов данных, а также использование платформы для создания интерактивной базы данных для коллекций транскриптомических данных из любого организма, генерируемых на любой платформе.

Abstract

IR-TEx это приложение, написанное в Shiny (пакет R), которое позволяет исследовать выражение (а также назначение функций) стенограммы, выражение которых связано с фенотипами устойчивости к инсектицидам у комаров Anopheles gambiae. Приложение может быть использовано в Интернете или загружены и использованы локально кем-либо. Локальное приложение может быть изменено для добавления новых наборов данных устойчивости к инсектицидам, генерируемых с нескольких платформ. В этом руководстве показано, как добавлять новые наборы данных и обрабатывать недостающие данные. Кроме того, IR-TEx можно полностью и легко перекодировать для использования в наборах данных из любых экспериментальных данных, что делает его ценным ресурсом для многих исследователей. Протокол иллюстрирует полезность IR-TEx в выявлении новых кандидатов на устойчивость к инсектицидам с использованием микросомальной глутатионной трансферазы, GSTMS1, в качестве примера. Эта стенограмма регулируется в нескольких пылетроидных устойчивых популяций из Кот-д’Ивуара и Буркина-Фасо. Идентификация связанных между собой стенограмм обеспечивает дальнейшее понимание преоснательных ролей этого гена.

Introduction

Способность измерять экспрессию большого количества транскриптов одновременно с помощью платформ microarray и технологии RNAseq привела к генерации обширных наборов данных, связывающих выражение транскрипта с определенным фенотипом как в модели, так и в немодельных организмах. Эти наборы данных являются чрезвычайно богатым ресурсом для исследователей, мощность которых может быть увеличена за счет объединения соответствующих наборов в подходе интеграции больших данных. Однако эта методология ограничивается теми, кто имеет особые навыки биоинформатики. Описана здесь программа, IR-TEx (ранее опубликованные Ingham et al.1), которая написана в пакете R под названием Shiny2 и позволяет пользователям с небольшим обучением биоинформатики интегрировать и допрашивать эти наборы данных с относительной легкостью.

IR-TEx, найденный в http://www.lstmed.ac.uk/projects/IR-TEx, был написан для изучения стенограммы, связанные с устойчивостью к инсектицидам в Anopheles gambiae, основной африканский вектор малярии1. Малярия является паразитарным заболеванием, вызванным видами плазмодия, передаваемым между людьми через укусы самок комаров Anopheles. Нацеливание переносчика комаров с помощью инсектицидов оказалось наиболее эффективным средством предотвращения заболеваемости и смертности, связанной с малярией, в Африке. Расширение масштабов инструментов (т.е. длительных инсектицидных сеток) также сыграло решающую роль в резком сокращении числа случаев заболевания малярией с 2000 года3. С очень ограниченным числом инсектицидов доступны, существует сильное эволюционное давление на комаров, и устойчивость в настоящее время широко распространена в африканских переносчиков малярии4.

Кроме того, целевыемутации 5 и метаболическое оформление инсектицидов6,7 остаются первичными изученными механизмами резистентности, но другие сильно устойчивые механизмы в настоящее время появляются1. Многие из этих новых механизмов ранее не были связаны с устойчивостью к инсектицидам, но были обнаружены в ходе поиска общих моделей экспрессии генов в нескольких устойчивых популяциях с помощью приложения IR-TEx и впоследствии функционально проверены подходами к геномике1.

Описано здесь пошаговым подходом к использованию ИК-TEx, как в Интернете, так и при локальном установлении. Протокол описывает, как новые наборы данных устойчивости к инсектицидам могут быть интегрированы в существующий пакет, и объясняет, как работать с отсутствующими данными. Наконец, он описывает, как использовать это программное обеспечение с другими наборами данных- omics, которые не связаны с устойчивостью к инсектицидам, тем самым комбинируя данные из различных подходов- omics, а также работает с недостающими значениями и нормализацией, так что данные сопоставимы.

Protocol

1. Использование веб-приложения IR-TEx Запуск приложения в веб-браузере Откройте веб-приложение IR-TEx, перейдя по ссылке в нижней части страницы, найденной в http://www.lstmed.ac.uk/projects/IR-TEx. После того, как веб-страница инициализировалась, нажмите кнопку приложения в верхней части страницы, которая будет отображать приложение и связанные с ним выходы. Прочитайте каждый выход, связанный с записью по умолчанию AGAP008212-RA (CYP6M2) в окне идентификатора стенограммы со следующими условиями: An. coluzzii наборы данных, которые (i) подвергаются воздействию пиретроидных инсектицидов или (ii) не подвергаются воздействию какого-либо класса инсектицидов, и связанные с ними транскрипты с корреляцией r 0,98. Изучение выражения стенограммы интереса Чтобы выбрать стенограмму интереса, ввейте идентификатор транскрипта в поле идентификатора транскрипта, вспоминая что транскрипты кончатки кончаттируют в -RX зависящ на изоформе интереса. Выберите наборы данных для допроса, пометив соответствующие ящики для i) стран; ii) статус экспозиции, (iii) виды, представляющие интерес; и (iv) Инсектицид класса интересов, все при обеспечении того, чтобы эти критерии привести к йgt;1 включены набор данных (см. Дополнительная таблица 1 в Ingham и др.1).ПРИМЕЧАНИЕ: (iii) относится к члену видового комплекса An. gambiae, который интересует пользователя. В настоящее время имеются данные по An. coluzzii и An. arabiensis. Нажмите Просмотр обновления в нижней части меню выбора или нажмите Return,игнорируя Абсолютное значение корреляции (на данный момент). Дайте приложению время на обновление. Прочитайте первый график как: журнал2 раза изменения между устойчивостью населения и лабораторно-восприимчивых комаров населения стенограммы интерес через каждый набор данных, который отвечает критериям, выбранным в шаге 1.2 (Рисунок 1). Подробную информацию обо всех наборах данных можно найти в Ingham et al.1. Читайте информацию под графиком, как: складизменения изменения между устойчивыми и восприимчивыми комарами для каждого соответствующего набора данных, в дополнение к исправленным р-значениям . Каждая строка представляет отдельные зонды на микроарле. Методология графического отображения была сообщена ранее1. Прочитайте дополнительную таблицу ниже, как количество экспериментов, в которых стенограмма интереса является значительным, а также общее количество экспериментов, соответствующих критериям, выбранным в шаге 1.2. Чтобы загрузить данные в отдельном формате вкладки, нажмите кнопку Загрузка под двумя таблицами. Это позволяет пользователю изучить данные более простым способом с помощью такой программы, как Excel. Интерпретируйте карту следующим образом: каждая точка представляет собой примерные места сбора устойчивых комаров в каждом наборе данных, в которых транскрипт интереса выражается по-разному. Цвета следуют светофора системы, которая объясняется в приложении (Рисунок 2). Для шагов 1.2.5 и 1.2.8 сохраните графические выходы путем нажатия правого нажатия, нажатия кнопки «Сохранить изображение» как…, и выбрав соответствующую папку.ПРИМЕЧАНИЕ: В случае ошибки вывода в приложении, вполне вероятно, что никакие наборы данных не соответствуют вводимым критериям. Проверьте дополнительную таблицу 1 в Ingham et al.1, если это происходит. Определение преопределяемых функций/путей транскрипта интереса Корреляции (минимум r2 значение ввода) выражения моделей транскриптов через несколько наборов данных могут быть использованы для прогнозирования функции транскрипта и потенциально прояснить скотрелы ежей путь. На примере ingham et al.1 (AGAP001076-RA; CYP4G16), выполните шаги 1.2.1-1.2.2 в разделе выше, выбрав все наборы данных для максимальной мощности. Перед нажатием на обновление View,переместите ползунок Абсолютной корреляции до 0,85 и нажмите “Обновление” или нажмите “Возвращение”. Изучите таблицу корреляции (нижняя таблица), чтобы найти несколько стенограмм, которые теперь отображаются и коррелируются (ЗРЗ – 0,85) с входной транскриптом. Манипулируйте ползунок Абсолютной корреляции и наблюдайте за любыми изменениями в самом нижнем графике и таблице; выходы со ступени 1.3.2 останутся неизменными. Как показано на рисунке 3 (зря) 0,9, »r» (r) 0.8), снижение строгости корреляционного значения покажет больше стенограмм, но введет больше шума. Прочитайте таблицу ниже графического вывода, который (в дополнение к параметрам, описанным в шаге 1.2.6) содержит значение корреляции для каждой стенограммы. Чтобы загрузить данные в формате, разделенном на вкладке, нажмите кнопку Скачать. Функциональный анализ обогащения может быть выполнен в загружаемом списке идентификатора транскрипта с помощью анализа DAVID8. После того, как на сайте DAVID (находится в https://david.ncifcrf.gov/), выберите функциональный анализ. Вставьте полный список генов, используя генные идентификаторы (идентификатор без -RX, который может быть сделано в Excel, вставив столбец справа от системного идентификатора и набрав “LEFT(X1,10), где X1 является системной ячейкой ID”. Выберите идентификатор в виде VectorBase_ID и списка генов и нажмите Список отправки. Нажмите кнопку кластеризации функциональной аннотации, чтобы получить обзор обогащения, найденных в этой корреляционной сети, что позволяет назначить потенциальную функцию стенограмме. Исследуйте углубленное обогащение, просматривая различные категории и нажав кнопки q для каждого и впоследствии нажав диаграмму. 2. Загрузка и внедрение ИК-TEx локально Загрузка и запуск IR-TEx Перейти к ссылке, найденной в http://github.com/LSTMScientificComputing/IR-TEx; и нажмите Клон или скачать Скачать цип. Прямо к папке выбора и расстегнуть файл в этой папке. Скачать последнюю версию программного обеспечения R для соответствующей операционной системы из ссылки, найденной на http://cran.r-project.org/mirrors.html. Установите программу. Скачать и установить последнее программное обеспечение R Studio, опять же для соответствующей операционной системы по ссылке, найденной на http://www.rstudio.com/products/rstudio/download/. После установки, открыть R Studio Дополнительное кодирование файла 1 и запустить каждую строку, чтобы настроить систему для IR-TEx. После того, как все пакеты будут успешно установлены и обновлены по мере необходимости, перейдите в файл Открыть, найти IR-TEx.R, выделить, и открыть. Теперь это должно быть видно в верхнем окне R Studio. Чтобы запустить приложение, нажмите кнопку Run App в правом верхнем правом окне, и появится второе окно, в котором приложение будет загружаться. После завершения загрузки для полной функциональности нажмите Open в браузере, расположенном в правом верхнем ряде загруженного окна. Добавление наборов данных сопротивления в IR-TEx (генерируется с помощью Anopheles gambiae 15k Agilent array) Чтобы добавить новый анализируемый набор данных, созданный на той же платформе microarray (A-MEXP-2196) в доступный набор данных, загрузите приложение и найдите распавленную папку, загруженную в разделе 2.1. Открыть Дополнительный файл 1, который представляет собой выход из анализа лиммы на A-MEXP-2196 1. Используя Excel, в столбце H1, напишите Fold_Change,а в H2, напишите 2’B2, в котором B2 является изменением складки журнала. Примените это по всей колонке H для получения сырых изменений складок. Упорядочить дополнительный файл 1 таким образом, что столбец A является идентификатором, столбец B представляет собой изменение складской системы из столбца H (копия столбца H, выделение столбца B, затем правого щелчка и значения вставки) и столбец C является скорректированным значением p. Удалите все другие столбцы и сохраните в виде файла, деленое вкладку. Открыть дополнительный файл кодирования 2 и запустить с использованием вкладки-разграничения листа производится в шаге 2.2.3.NEWFILE_FC с (‘COUNTRY’,’EXPOSURE STATUS’,’SPECIES’,’INSECTICIDE’)NEWFILE_Q с (‘COUNTRY’,’EXPOSURE STATUS’,’SPECIES’,’INSECTICIDE’)ПРИМЕЧАНИЕ: Поля в пределах одной кавычки должны быть изменены, чтобы отразить информацию из нового набора данных. Статус воздействия относится к тому, были ли взяты образцы после воздействия инсектицидов (разоблачены/неэкспонированные). Инсектицид: если “неэкспонированных”, использовать “нет”. Смотрите Fold_Changes.txt. для метаданных из других образцов. Убедитесь, что правописание согласовано. Откройте geography.txt,прокрутите до окончательного занятого ряда, и выберите ниже. Введите имя набора данных, за которым следуют q и NEWFILE_Q в колонке 1, широта места сбора образцов в столбце 2 и долгота в колонке 3. Сохранить изменения. Если используются какие-либо новые записи (т.е. Гамбия), которые не доступны для выбора в наборе данных (см. Ingham et al. Дополнительная таблица1),они должны быть добавлены в код. Для этого откройте IR-TEx.R в RStudio и найдите строку 26, как указано RStudio, после чего должно начаться следующее:’sidebarPanel (….’.ПРИМЕЧАНИЕ: Каждая строка продолжения относится к элементу метаданных, вводимых в строки под именем набора данных в Fold_Changes.txt в шаге 2.2.5. Чтобы добавить новые метаданные, прокрутите в конец строки выбранных метаданных и найдите термин «выбранный». Сразу же после этого должна быть запятая и закрытая скобка; в этот момент щелкните курсором в закрытой скобке. После финального апострофа введите запятую, за которой следует апостроф, за которым следуют новые метаданные (например, Гамбия) и сохраните изменения. Ниже приведенпримеры.checkboxGroupInput (‘СтранаInput’,’Выбрать соответствующие страны’, c (‘Буркина-Фасо’,’Cote D’Ivoire’,’Камерун’, ‘Экваториальная Гвинея’,’Замбия’,’Танзания’,’Судан’,’Уганда’,’Того’, ‘Гамбия’,выбранный (‘Буркина-Фасо’,’Cote D’Ivoire’,’Камерун’,’Экваториальная Гвинея’,’Замбия’,’Танзания’,’Судан’,’Уганда’,’Того’)) Выполнить приложение. Новая запись метаданных должна отображаться как невыбранный тик-поле под соответствующим заголовком. Если пользователь хочет, чтобы он был выбран, он должен быть добавлен после выбранного c (…, как показано ниже:checkboxGroupInput (‘СтранаInput’,’Выбрать соответствующие страны’, c (‘Буркина-Фасо’,’Cote D’Ivoire’,’Камерун’, ‘Экваториальная Гвинея’,’Замбия’,’Танзания’,’Судан’,’Уганда’,’Того’, ‘Гамбия’,выбранный (‘Буркина-Фасо’,’Cote D’Ivoire’,’Камерун’,’Экваториальная Гвинея’,’Замбия’, ‘Танзания’,’Судан’,’Уганда’,’Того’, ‘Гамбия’)) Для добавления наборов данных сопротивления, не выполненных на A-MEXP-2196, см. 3. Изменение IR-TEx для использования с различными наборами данных Использование на нескольких платформах -omics и продолжение работы с недостающими данными Чтобы продолжить с “0” в наборах данных: обратитесь к источнику набора данных для конкретного значения “0”. Рекомендуется, чтобы “0” (консервативно) замененна на “NA”. Как и при исходных изменениях складок (B/A), “0” указывает на необнаруженный сигнал в экспериментальном состоянии В. В случае, если экспериментальное состояние A обладает существенным выражением, пользователь может применить небольшое значение изменения складки. Открыть Дополнительный файл 2.txt, ФАЙЛ RNAseq адаптированы из Uyhelji и др.9. Этот файл представляет собой шаблон, в котором должны базироваться новые данные: идентификатор столбца A, столбец B и изменение исходного склада, а столбец C – скорректированное значение p. Используйте этот файл для выполнения ниже шагов. Запустите R-код для сопоставления идентификаторов в один файл разграничения вкладок на разных платформах, а затем организуйте и нормализуйте данные(Дополнительный файл кодирования 2). Инструкции содержатся в файле. Любой FILEPATH будет отделен “/” для MacOS или “//” для Windows (изменяйте их от “к”, как они будут отображаться). Вывод файла, произведенного в конце дополнительного файла кодирования 2, в место выбора в шаге 3.1.5. Дополнительный файл кодирования 2 выводит новый файл Fold_Changes.txt. Резервное копирование исходного файла. Выполните код, содержащийся в дополнительном файле кодирования 3. Найдите выводной файл, названный FC_distribPlot.png, в папке, указанной как FILEPATH. Проверьте распределение изменений2 раз, чтобы убедиться, что распределения изменений изменения2 раз в журнале почти идентичны в наборах данных. Следуйте инструкциям от шага 2.2.6 для отправления дополнительных файлов и обеспечения совместимости нового Fold_Changes.txt. Изменение IR-TEx для использования с совершенно новыми наборами данных Откройте IR-TEx.R в RStudio и найдите линии (23-34), начиная с:’tabPanel(‘и заканчивается в:представитьButton (“Обновление Вид”, значок (“обновить”))), Измените AGAP008212-RA, найденный в нижестрок, на стенограмму интереса к новым данным.textInput (‘textInput’,’Transcript ID’,value’aGAP008212-RA’), Найдите четыре варианта, начиная с:флажокGroupInput (Эти параметры могут быть изменены, чтобы представлять важные метаданные, которые пользователь хочет фильтровать новые данные. В каждом случае пользователь должен изменить выбранные соответствующие страны; Выберите статус экспозиции; Выберите соответствующие виды; и выберите класс инсектицидов, чтобы быть репрезентативным для данных (т.е. Выберите тип ткани; Выберите Секс; Выберите возрастную кронштейн; Выберите Состояние болезни). Определите метаданные, связанные с набором данных и входными данными, чтобы заменить существующие параметры сразу после первого c(‘. В каждом случае параметры будут содержаться в речевых знаках и отделены от следующего выбора запятой. После окончательного отбора кронштейн должен быть закрыт. Примером для Выбора статуса заболевания является:c(‘Зараженный’, ‘Неинфицированный’, ‘Неизвестный’) Выберите, какие из этих метаданных будут выбраны при открытии приложения. Они могут быть изменены путем изменения параметров после выбранного q(‘. Примером для Выбора статуса заболевания является:выбранный c (‘Зараженный’, ‘Неинфицированный’)Это поручит приложению выбрать только наборы данных, соответствующие этим критериям при первоначальной загрузке. Чтобы создать новую таблицу данных, следуйте макету, собравшемся в Fold_Changes.txt, и инструкциям в разделе 2. Измените метаданные на каждое соответствующее изменение, изложенное в шаге 3.2.4, точно так же, как записано в коде (R является чувствительным к случаю). В столбец детоксикации, имена генов ввода, и в колонке типа транскрипта, описания гена ввода для каждого транскрипта. Следуйте разделу 3.2 при добавлении новых наборов данных. Если отображение не имеет отношения к экспериментальным требованиям, найдите следующие строки кода и поместите ” перед:Линии 49-51:br(),br(),сSpinner (сюжетOutput (“География”)),textOutput (‘Geography_legend’),Линии 493, начиная:выходная $География (lt;- renderPlot)На строку 602 окончание:вывод$Geography_legend lt;- renderText (яп.вставить (“Значительные Стенограммы только (p”, as.expression (“lt;”)”0,05): FC sgt; 5 – Красный, FC})

Representative Results

Используя файл Fold_Changes.txt, включенный в IR-TEx, мы сравнили стенограммы, которые были значительно дифференцированы в устойчивых anopheles coluzzii и Anopheles gambiae datasets, с восприимчивыми элементами контроля из Кот-д’Ивуара и Буркина-Фасо. Это дало 18 стенограмм, представляющих интерес(таблица 1; этот поиск может быть выполнен с помощью Excel, R или других программ). Два из них, ATPase (AGAP006879) и з-кристаллина (AGAP0007160), были ранее зарегистрированы, причем первый оказывает значительное влияние на устойчивость к пиретроидной1. В дополнение к этим двум стенограммам присутствовали две стенограммы детоксикации: GSTMS1 (FC No 1,95 и 1,85) и UGT306A2 (FC No 2.29 и 2.28). qPCR проверки двух из этих стенограмм(GSTMS1, детоксикации стенограммы; и AGAP009110-RA, неизвестный, комаров конкретных стенограммы, содержащие no-1,3-глюкан связывания домена) были выполнены, как ранее описано1. Анализ был проведен с использованием грунтовых наборов, описанных в Дополнительном файле 3, и показал, что эти стенограммы были значительно upregulated в многостойкой популяции из Кот-д’Ивуара (Тиассале) и еще один из Буркина-Фасо (Банфора), по сравнению с лабораторной восприимчивой Н’Гуссо (Рисунок 4А). Как оба стенограммы показали значительное upregulation в каждой из устойчивых популяций, РНК-индуцированных нокдаун был выполнен на комаров из лаборатории LSTM Tiassal колонии. Эта колония происходит из Кот-д’Ивуара и устойчива ко всем основным классам инсектицидов, используемых в общественном здравоохранении, как ранее описано1,10. Затухание экспрессии GSTMS1 привело к значительному увеличению (р 0,021) в смертности после воздействия дельтаметрина по сравнению с GFP-впрыскиваемых элементов управления, демонстрируя важность этой стенограммы в пылетроидной устойчивости (Рисунок 4B). И наоборот, aGAP0009110-RA нокдаун привел о каких-либо значительных (р 0,082) изменения в смертности после воздействия(рисунок 4B). GSTMS1 является микросомальным GST и является одним из трех найденных у комаров A. gambiae 11. Хотя члены эпсилон и дельта классов GSTs ранее были вовлечены в детоксикации инсектицидов12,13,14, это первое доказательство нашей знании о роли микросомальных GSTs в пиретроидной резистентности15. Для изучения преосвящееся функции этой стенограммы в Anopheles gambiae sl комаров, выражение и корреляция в IR-TEx были определены. GSTMS1 был значительно перевыражен в 20 из 21 набора данных, доступных для этих видов, за исключением острова Биоко. В каждом месте, переэкспрессия была менее чем в пять раз по сравнению с восприимчивыми населения(рисунок 5). Как микросомальные GSTs в значительной степени игнорируются в качестве потенциальных детоксификаторов инсектицидов, мало что известно об их роли в резистентности к инсектицидам15. Изучая со-корреляцию других стенограмм, предполагаемая функция может быть выяснена через предположение о корегулировании или участии в тех же путях. Для максимизации мощности в сети корреляции были выбраны все наборы данных microarray, присутствующие в IR-TEx, и из 0,75 был выбран. В таблице 2 показан выход из ИК-TEx. Эти транскрипты обогащены активностью оксиоредуктаза и метаболизмом глюкозы/углеводов в функциональном инструменте аннотации DAVID8. Как глюкоза-6-фосфат дегидрогеназы и цитатион гамма-ляза поддерживать уровень глутатиона в клетках млекопитающих16,17 и, таким образом, связь непосредственно с GSTMS1, глутатион-S-трансфераз. Каталаза является быстродействующим окислительным стрессом, который защищает клетки от реактивного повреждения видов кислорода, побочным продуктом воздействия пиретроида. Валацикловир гидролаза является гидролаза, которые могут играть роль в детоксикации в клетках млекопитающих18. CYP4H17 также присутствует в корреляционной сети. Цитохром p450s являются прямыми метаболизаторами пиретроидных инсектицидов, и эти продукты распада могут быть дополнительно метаболизируется ГСТ. Наконец, CYP4H17 был замешан в противохром сопротивлении в A. funestus19. В совокупности эти данные убедительно поддерживают роль GSTMS1 в ксенобиотической детоксикации. Рисунок 1: Изменение2 раз в журнале AGAP002865-RA во всех наборах данных. X-оси детали различных наборов данных, информация для которых может быть найдена в дополнительной таблице 1 в предыдущей публикации1, и y-оси показывает журнал2 раза изменения в стенограмме интерес. Светло-серые пунктирные линии указывают на приблизительные пороги значимости, принятые здесь, чтобы быть раз изменения зл;0,8 или раз изменения в размере 1,2. Пунктирная черная линия указывает на изменение складки 1 (т.е. отсутствие разницы в выражении между устойчивыми и восприимчивыми популяциями). Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры. Рисунок 2: Распределение микроаррей, показывающих значительное дифференциальное выражение AGAP0002865-RA в устойчивых популяциях. Изменения сложить представлены в системе светофора: зеленый раз изменения злт;1, оранжевый раз изменения йgt;1, и красный раз изменения в размере йgt;5. Отображаются только наборы данных со значительным (p 0.05) дифференциальным выражением. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры. Рисунок 3: Корреляционные сети AGAP001076-RA(CYP4G16). Корреляции парной раобласти вычисляются во всех транскриптах в 31 наборе данных microarray, при этом применяется определенное пользователем отсечение. Показано здесь (A) (gt; 0.9 и (B) 0,8. Все транскрипты, отображаемые на графике, соответствуют этому критерию и следуют изменениям экспрессии AGAP001076-RA. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры. Рисунок 4: выражение мРНК и фенотип при ослаблении GSTMS1 и AGAP009110-RA. (A)выражение мРНК GSTMS1 и AGAP009110-RA в двух многостойких популяциях Ан. колужи из Кот-д’Ивуара и Буркина-Фасо, соответственно. Уровни сравнивались с лабораторно-восприимчивым Ан. coluzzii N’Gousso. Уровни значимости, рассчитанные ANOVA с тестом Даннетта после специального. (B) РНК-индуцированной затухание обеих стенограмм по сравнению с GFP-впрыскиваемых элементов управления. Затухание GSTMS1 показывает значительное увеличение смертности после воздействия дельтаметрин (рассчитанный ANOVA с пост-хо-хо-тюки тест; » p 0.05, p 0.01). Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры. Рисунок 5: Выражение GSTMS1 в популяциях Anopheles gambiae и Anopheles coluzzii. Карта, показывающая значительно дифференциальное выражение GSTMS1 в доступных наборах данных microarray. Было установлено, что GSTMS1 значительно отличается в 20 из 21 набора данных микроэлементов. Пожалуйста, нажмите здесь, чтобы просмотреть большую версию этой цифры. Идентификатор стенограммы Описание Буркина-Фасо Кот-д’Ивуар AGAP006879-RA ATPase 27.94 43.05 AGAP007160-RB а-кристаллина 11.49 10.58 AGAP007160-RC а-кристаллина 11.14 10.38 AGAP007160-RA а-кристаллина 9.78 9.84 AGAP009110-RA Неизвестный 9.26 5.96 AGAP007780-RA Дегидрогеназы NADH 10.49 3.77 AGAP006383-RA oligoscharyltransferase комплекс субунит бета 3.69 5.57 AGAP007249-RB Полет 4.61 3.86 AGAP003357-РА RAG1-активирует белок 1-подобный белок 4.31 4.05 AGAP007249-RA Полет 4.48 3.46 AGAP001998-RA mRpS10 3.46 2.85 AGAP007589-РА UGT306A2 2.29 2.28 AGAP000165-РА GSTMS1 1.95 1.85 AGAP002101-РА синтетаза изолейуци-ТРНА 0.57 0.59 AGAP002969-RA синтетаза аспарагинил-ТРНА 0.45 0.45 AGAP004199-РА безрастворительный перевозчик семьи 5 (натрий-связанных монокарбоксилат транспортер), член 8 0.35 0.48 AGAP004684-RA rRNA-обработка белка CGR1 0.36 0.22 AGAP006414-RA Cht8 0.024 0.36 Таблица 1: Стенограммы значительно дифференцированы в одном и том же направлении изменения складок среди населения Буркина-Фасо и Кот-д’Ивуара. Идентификатор транскрипта, описание гена и среднее изменение складки для каждого набора данных из двух стран, представляющих популяции An. coluzzii и An. gambiae. Корреляции Систематическое название Тип транскрипта 1 AGAP000165-РА GSTMS1 0.82 AGAP004904-RA Каталазы 0.76 AGAP007243-RA 26S протеаза нормативного подразделения 8 0.79 AGAP008358-РА CYP4H17 0.76 AGAP009436-RA Валацикловир гидролаза 0.75 AGAP010739-RA Глюкоза-6-фосфат 1-дегидрогеназа 0.85 AGAP011172-РА цистатионин гамма-лиаз 0.76 AGAP012678-RA Глюкоза-6-фосфат 1-дегидрогеназа Таблица 2: Стенограммы, сосвязанные с GSTMS1. В таблице показан выход корреляционной сети для GSTMS1 на IR-TEx с помощью «r» от 0,75. Таблица показывает корреляцию Спирмана, идентификатор транскрипта и описание гена для каждого со-коррелирует стенограмма. Дополнительный файл 1: Выходный файл из массива A-MEXP-2196, проанализированный на лимме. Файл происходит от нокдауна Met по сравнению с массивом управления GFP, описанным более подробно в ArrayExpress (E-MTAB-4043) и другой предыдущей публикации1. Столбцы представляют идентификатор AGAP (SystematicName), изменение сгиба журналов (logFC), значения выражения журнала (AveExpr), t-statistic (t), неисправленное значение p (P.Value), скорректированное значение (adj. P.Val) и B статистика (B)20. Для целей этого файла комары являются Anopheles coluzzi из Кот-д’Ивуара и не подвержены воздействию инсектицидов, с широтой сбора и долготой -5,4 и 6,0, соответственно. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать). Дополнительный файл 2: Выходный файл из эксперимента RNAseq. Анализ RNAseq, взятый из Uyhelji et al.9, описывающий изменения в транскриптоме комаров Anopheles при воздействии 50% сосудисти. Этот файл адаптирован из таблицы S2 публикации и включает в себя идентификатор AGAP (SystematicID), изменение исходного склада (Fold_Change) и скорректированное значение p-value (q_value). Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать). Дополнительный файл 3: Список праймеров для репрезентативных результатов. Идентификатор AGAP, имя гена, dsRNA вперед, dsRNA обратный, qPCR вперед, и qPCR обратный грунтовки наборы для каждого транскрипта. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать). Дополнительное кодирование файла 1. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать). Дополнительное кодирование файла 2. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать). Дополнительное кодирование файла 3. Пожалуйста, нажмите здесь, чтобы просмотреть этот файл (Право нажмите, чтобы скачать).

Discussion

Транскриптомика больших данных создает списки тысяч стенограмм, которые дифферезационно выражены для каждого экспериментального состояния. Многие из этих экспериментов проводятся на родственных организмах и фенотипах и почти исключительно анализируются как независимые эксперименты. Использование этих богатых источников данных путем изучения данных целостно и без теоретических предположений приведет к идентификации новых стенограмм кандидатов и 2) предотвратить отбрасывание ценных данных просто потому, что есть слишком много информации для проверки в vivo1.

IR-TEx предоставляет пользователям ограниченный фон биоинформатики с возможностью легко изучить несколько наборов данных, визуализировать изменения в наборах данных и загрузить связанную информацию1. Хотя IR-TEx не поддерживает поиск более одной стенограммы в каждом поиске, пользователи могут изучить связанные файлы Fold_Changes.txt просто с помощью Excel, R или других соответствующих программ. Дальнейшая полезность IR-TEx проистекает из использования корреляционных сетей для прогнозирования функции транскрипта, ввода гипотетических белков или транскриптов с неизвестными функциями и использования программного обеспечения ниже по течению для поиска обогащений1.

В примере, показанном в этом протоколе, ИК-TEx используется в соответствии с его первоначальной функцией. Здесь она позволяет исследовать транскрипты, связанные с устойчивостью к инсектицидам, и визуализировать распределение чрезмерной и недостаточной экспрессии с помощью картографической графики. Стенограммы интереса проверяются in vivo, чтобы определить, способствует ли чрезмерное или недостаточное выражение данных стенограмм в наблюдаемом фенотипе1 (например, резистентность к инсектицидам). Здесь было продемонстрировано, как сообщалось ранее1, что набор данных может быть использован в подходе, ориентированном на гипотезу, для выявления стенограмм, представляющих интерес, на страновой основе. IR-TEx затем может быть использован для 1) изучить выражение стенограммы и 2) контекстуализировать функцию стенограммы, применяя парную корреляционную сеть во всех транскриптах, содержащихся в каждом наборе данных – omics. Здесь было показано, что GSTMS1 со-коррелирует с рядом других стенограмм, причастных к детоксикации. Эти данные (наряду с нокдауном стенограммы, что привело к значительному увеличению смертности после воздействия инсектицидов) демонстрирует важность этой стенограммы в ксенобиотик испуг.

IR-TEx представляет собой ценный ресурс для изучения инсектицидных транскриптов, связанных с устойчивостью к интернету или с использованием местных приложений. Этот протокол демонстрирует, как модифицировать IR-TEx для различных платформ, а также совершенно новых данных. Руководство иллюстрирует, как использовать IR-TEx для интеграции данных из нескольких платформ и наборов данных с недостающими данными, а также как перекодировать IR-TEx просто так полезно для тех, кто изучает транскриптомические наборы данных.

Disclosures

The authors have nothing to disclose.

Acknowledgements

Эта работа была профинансирована MRC Навыки развития стипендий V.I. (MR/R024839/1) и Королевского общества Вызовы Грант (CH160059) в H.R.

Materials

Laptop with browser Any
R Program The R Project for Statistical Computing https://www.r-project.org/
R Studio R Studio https://www.rstudio.com/

References

  1. Ingham, V. A., Wagstaff, S., Ranson, H. Transcriptomic meta-signatures identified in Anopheles gambiae populations reveal previously undetected insecticide resistance mechanisms. Nature Communications. 9 (1), 5282 (2018).
  2. Chang, W., Cheng, J., Allaire, J., Xie, Y., McPherson, J. . shiny: Web Application Framework for R. , (2017).
  3. Bhatt, S., et al. The effect of malaria control on Plasmodium falciparum in Africa between 2000 and 2015. Nature. 526 (7572), 207-211 (2015).
  4. Ranson, H., Lissenden, N. Insecticide Resistance in African Anopheles Mosquitoes: A Worsening Situation that Needs Urgent Action to Maintain Malaria Control. Trends in Parasitology. 32 (3), 187-196 (2016).
  5. Donnelly, M. J., et al. Does kdr genotype predict insecticide-resistance phenotype in mosquitoes. Trends in Parasitology. 25 (5), 213-219 (2009).
  6. Stevenson, B. J., et al. Cytochrome P450 6M2 from the malaria vector Anopheles gambiae metabolizes pyrethroids: Sequential metabolism of deltamethrin revealed. Insect Biochemistry and Molecular Biology. 41 (7), 492-502 (2011).
  7. Müller, P., et al. Field-Caught Permethrin-Resistant Anopheles gambiae Overexpress CYP6P3, a P450 That Metabolises Pyrethroids. PLoS Genetics. 4 (11), 1000286 (2008).
  8. Huang, D., et al. The DAVID Gene Functional Classification Tool: a novel biological module-centric algorithm to functionally analyze large gene lists. Genome Biology. 8 (9), 183 (2007).
  9. Uyhelji, H. A., Cheng, C., Besansky, N. J. Transcriptomic differences between euryhaline and stenohaline malaria vector sibling species in response to salinity stress. Molecular Ecology. 25 (10), 2210-2225 (2016).
  10. Edi, C. V., Benjamin, K. G., Jones, C. M., Weetman, D., Ranson, H. Multiple-Insecticide Resistance in Anopheles gambiae Mosquitoes, Southern Côte d’Ivoire. Emerging Infectious Diseases. 18 (9), 1508-1511 (2012).
  11. Ding, Y., Ortelli, F., Rossiter, L., Hemingway, J., Ranson, H. The Anopheles gambiae glutathione transferase supergene family: annotation, phylogeny and expression profiles. BMC Genomics. 4 (1), 1-16 (2003).
  12. Enayati, A. A., Ranson, H., Hemingway, J. Insect glutathione transferases and insecticide resistance. Insect Molecular Biology. 14 (1), 3-8 (2005).
  13. Ranson, H., et al. Identification of a novel class of insect glutathione S-transferases involved in resistance to DDT in the malaria vector Anopheles gambiae. The Biochemical Journal. 359, 295-304 (2001).
  14. Riveron, J. M., et al. A single mutation in the GSTe2 gene allows tracking of metabolically based insecticide resistance in a major malaria vector. Genome Biology. 15 (2), 27 (2014).
  15. Pavlidi, N., Vontas, J., Van Leeuwen, T. The role of glutathione S-transferases (GSTs) in insecticide resistance in crop pests and disease vectors. Current Opinion in Insect Science. 27, 97-102 (2018).
  16. Salvemini, F., et al. Enhanced glutathione levels and oxidoresistance mediated by increased glucose-6-phosphate dehydrogenase expression. Journal of Biological Chemistry. 274 (5), 2750-2757 (1999).
  17. Deplancke, B., Gaskins, H. R. Redox control of the transsulfuration and glutathione biosynthesis pathways. Current Opinion in Clinical Nutrition & Metabolic Care. 5 (1), (2002).
  18. Puente, X. S., López-Otn, C. Cloning and expression analysis of a novel human serine hydrolase with sequence similarity to prokaryotic enzymes involved in the degradation of aromatic compounds. Journal of Biological Chemistry. 270 (21), 12926-12932 (1995).
  19. Riveron, J. M., et al. Genome-wide transcription and functional analyses reveal heterogeneous molecular mechanisms driving pyrethroids resistance in the major malaria vector Anopheles funestus across Africa. G3: Genes, Genomes, Genetics. 7 (6), 1819-1832 (2017).
  20. Smyth, G. K. Linear models and empirical bayes methods for assessing differential expression in microarray experiments. Statistical Applications in Genetics and Molecular Biology. 3 (1), 3 (2004).

Play Video

Cite This Article
Ingham, V. A., Bennett, A., Peng, D., Wagstaff, S. C., Ranson, H. IR-TEx: An Open Source Data Integration Tool for Big Data Transcriptomics Designed for the Malaria Vector Anopheles gambiae. J. Vis. Exp. (155), e60721, doi:10.3791/60721 (2020).

View Video