IR-TEx explore les profils transcriptionnels liés à la résistance aux insecticides chez l’espèce Anopheles gambiae. Fourni ici sont des instructions complètes pour l’utilisation de l’application, des modifications pour explorer plusieurs ensembles de données transcriptomiques, et en utilisant le cadre pour construire une base de données interactive pour les collections de données transcriptomiques de n’importe quel organisme, généré dans n’importe quelle plate-forme.
IR-TEx est une application écrite dans Shiny (un paquet R) qui permet d’explorer l’expression des transcriptions (ainsi que d’attribuer des fonctions) dont l’expression est associée à des phénotypes de résistance aux insecticides chez les moustiques Anopheles gambiae. L’application peut être utilisée en ligne ou téléchargée et utilisée localement par n’importe qui. L’application locale peut être modifiée pour ajouter de nouveaux ensembles de données de résistance aux insecticides générés à partir de plusieurs plates-formes-omics. Ce guide montre comment ajouter de nouveaux jeux de données et gérer les données manquantes. En outre, IR-TEx peut être complètement et facilement recodé pour utiliser des ensembles de données d’omics à partir de toutes les données expérimentales, ce qui en fait une ressource précieuse pour de nombreux chercheurs. Le protocole illustre l’utilité de l’IR-TEx dans l’identification de nouveaux candidats à la résistance aux insecticides en utilisant le transfert microsomique du glutathion, GSTMS1, à titre d’exemple. Cette transcription est régulée dans de multiples populations résistantes aux pyréthrinoïdes de Côte d’Ivoire et du Burkina Faso. L’identification des transcriptions cocorridées fournit un aperçu plus approfondi des rôles putatifs de ce gène.
La capacité de mesurer l’expression d’un grand nombre de transcriptions simultanément à l’aide de plates-formes de microréseaux et de la technologie RNAseq a permis de générer de vastes ensembles de données associant l’expression de la transcription à un phénotype particulier dans les organismes modèles et non modèles. Ces jeux de données sont une ressource extrêmement riche pour les chercheurs, dont la puissance peut être augmentée en combinant les ensembles pertinents dans une approche d’intégration de Big Data. Cependant, cette méthodologie est limitée à ceux qui ont des compétences particulières en bioinformatique. Décrit ici est un programme, IR-TEx (précédemment publié par Ingham et al.1) qui est écrit dans un paquet R appelé Shiny2 et permet aux utilisateurs avec peu de formation en bioinformatique d’intégrer et d’interroger ces ensembles de données avec une relative facilité.
IR-TEx, trouvé à http://www.lstmed.ac.uk/projects/IR-TEx, a été écrit pour explorer les transcriptions associées à la résistance aux insecticides dans Anopheles gambiae, le principal vecteur africain du paludisme1. Le paludisme est une maladie parasitaire causée par les espèces de Plasmodium, transmise entre les humains par les piqûres de moustiques anophèles femelles. Cibler le moustique vecteur avec des insecticides s’est avéré être le moyen le plus efficace de prévenir la morbidité et la mortalité liées au paludisme en Afrique. La mise à l’échelle des outils (c’est-à-d. les moustiquaires insecticides de longue durée) a également joué un rôle crucial dans la réduction spectaculaire des cas de paludisme depuis 20003. Avec un nombre très limité d’insecticides disponibles, il y a une forte pression évolutive sur les moustiques, et la résistance est maintenant répandue dans les vecteurs de paludisme africains4.
En outre, les mutations du site cible5 et le dégagement métabolique des insecticides6,7 restent les principaux mécanismes étudiés de résistance, mais d’autres mécanismes résistants puissants sont en train d’émerger1. Bon nombre de ces nouveaux mécanismes n’ont pas été associés auparavant à la résistance aux insecticides, mais ont été détectés en recherchant des modèles communs d’expression génique dans de multiples populations résistantes à l’aide de l’application IR-TEx et par la suite validées fonctionnellement par des approches génomiques1.
Décrit ici est une approche étape par étape à l’aide ir-TEx, à la fois sur le web et lorsqu’il est installé localement. Le protocole décrit comment de nouveaux ensembles de données sur la résistance aux insecticides peuvent être intégrés dans le paquet existant et explique comment fonctionner avec les données manquantes. Enfin, il décrit comment utiliser ce logiciel avec d’autres jeux de données -omics qui ne sont pas liés à la résistance aux insecticides, combinant ainsi des données provenant d’approches différentes -omics tout en fonctionnant avec des valeurs manquantes et la normalisation de sorte que les données sont comparables.
La transcriptomique des données volumineuses produit des listes de milliers de transcriptions qui sont exprimées différemment pour chaque condition expérimentale. Bon nombre de ces expériences sont réalisées sur des organismes et des phénotypes apparentés et sont presque exclusivement analysées sous forme d’expériences indépendantes. L’utilisation de ces sources de données riches en examinant les données de manière holistique et sans hypothèses théoriques 1) conduira à l’identification de nouvelles transcriptions des candidats et 2) empêchera l’abandon de données précieuses simplement parce qu’il y a trop d’informations à valider in vivo1.
IR-TEx offre aux utilisateurs un bagage bioinformatique limité avec la possibilité d’examiner facilement plusieurs jeux de données, de visualiser les changements dans les jeux de données et de télécharger les informations associées1. Bien qu’IR-TEx ne prend pas en charge la recherche de plus d’une transcription dans chaque recherche, les utilisateurs peuvent examiner les fichiers associés Fold_Changes.txt simplement en utilisant Excel, R, ou d’autres programmes appropriés. L’utilité de l’IR-TEx découle de l’utilisation de réseaux de corrélation pour prédire la fonction de transcription, l’entrée de protéines hypothétiques ou de transcriptions ayant des fonctions inconnues et l’utilisation de logiciels en aval pour rechercher des enrichissements1.
Dans l’exemple démontré dans ce protocole, IR-TEx est utilisé en fonction de sa fonction d’origine. Ici, il permet d’explorer les transcriptions associées à la résistance aux insecticides et la visualisation de la distribution de la surexpression et de la sous-expression à travers des graphiques cartographiques. Les transcriptions d’intérêt sont validées in vivo pour déterminer si la surexpression ou la sous-expression des transcriptions données contribue à un phénotype1 observé (p. ex., résistance aux insecticides). Il a été démontré ici, comme indiqué précédemment1, qu’un ensemble de données peut être utilisé dans une approche fondée sur des hypothèses pour identifier les transcriptions d’intérêt sur une base spécifique à chaque pays. IR-TEx peut ensuite être utilisé pour 1) explorer l’expression de la transcription et 2) contextualiser la fonction de la transcription en appliquant un réseau de corrélation en deux sens pour toutes les transcriptions contenues dans chaque jeu de données -omics. En l’espèce, il a été démontré que gstMS1 était en corrélation avec un certain nombre d’autres transcriptions impliquées dans la désintoxication. Ces données (ainsi que le renversement de la transcription qui a eu comme conséquence une augmentation significative de la mortalité après exposition d’insecticide) démontrent l’importance de cette transcription dans le dégagement xénobiotique.
IR-TEx représente une ressource précieuse pour explorer les transcriptions liées à la résistance aux insecticides sur le Web ou à l’aide d’applications locales. Ce protocole montre comment modifier IR-TEx pour différentes plates-formes-omics ainsi que des données complètement nouvelles. Le guide illustre comment utiliser IR-TEx pour intégrer les données de plusieurs plates-formes et jeux de données avec des données manquantes ainsi que la façon de recoder IR-TEx simplement afin qu’il soit utile pour toute personne faisant des recherches sur les ensembles de données transcriptomiques.
The authors have nothing to disclose.
Ce travail a été financé par une bourse de perfectionnement des compétences du CRM à V.I. (MR/R024839/1) et par la Royal Society Challenge Grant (CH160059) à H.R.
Laptop with browser | Any | – | – |
R Program | The R Project for Statistical Computing | – | https://www.r-project.org/ |
R Studio | R Studio | – | https://www.rstudio.com/ |