Ir-TEx explora perfis transcricionais relacionados à resistência inseticida na espécie Anopheles gambiae. Estão aqui instruções completas para o uso do aplicativo, modificações para explorar vários conjuntos de dados transcriptômicos e usar a estrutura para criar um banco de dados interativo para coletas de dados transcritas de qualquer organismo, gerados em qualquer plataforma.
Ir-TEx é uma aplicação escrita em Shiny (um pacote R) que permite a exploração da expressão de (bem como atribuir funções para) transcrições cuja expressão está associada com fenótipos de resistência a inseticidas em mosquitos Anopheles gambiae. O aplicativo pode ser usado on-line ou baixado e usado localmente por qualquer pessoa. A aplicação local pode ser modificada para adicionar novos conjuntos de dados de resistência a inseticidas gerados a partir de várias plataformas de omics. Este guia demonstra como adicionar novos conjuntos de dados e lidar com dados em falta. Além disso, o IR-TEx pode ser recodificado de forma completa e fácil para conjuntos de dados de uso-ômicos de quaisquer dados experimentais, tornando-o um recurso valioso para muitos pesquisadores. O protocolo ilustra a utilidade do IR-TEx na identificação de novos candidatos à resistência ao inseticida usando a transferência de glutationa microsômica, GSTMS1,como exemplo. Esta transcrição é regulada em várias populações resistentes a piretróides da Costa do Marfim e Burkina Faso. A identificação de transcrições co-correlacionadas fornece uma introspecção mais adicional nos papéis putativos deste gene.
A capacidade de medir a expressão de um grande número de transcrições simultaneamente através de plataformas de microarray e tecnologia RNAseq resultou na geração de vastos conjuntos de dados associando a expressão de transcrição com um fenótipo específico em organismos modelo e não modelo. Esses conjuntos de dados são um recurso extremamente rico para os pesquisadores, o poder do que pode ser aumentado combinando conjuntos relevantes em uma abordagem de integração de big data. No entanto, esta metodologia é limitada àqueles com habilidades particulares de bioinformática. Descrito aqui é um programa, IR-TEx (publicado anteriormente pela Ingham et al.1)que está escrito em um pacote R chamado Shiny2 e permite que os usuários com pouco treinamento de bioinformática para integrar e interrogar esses conjuntos de dados com relativa facilidade.
IR-TEx, encontrado em http://www.lstmed.ac.uk/projects/IR-TEx, foi escrito para explorar transcrições associadas com a resistência inseticida em Anopheles gambiae, o principal vetor de malária Africano1. A malária é uma doença parasitária causada por espécies de Plasmodium, transmitida s seres humanos através das picadas de mosquitos anopheles fêmeas. A segmentação do vetor de mosquitos com inseticidas provou ser o meio mais eficaz de prevenir a morbidade e mortalidade relacionadas à malária na África. A ampliação de ferramentas (ou seja, redes inseticidas de longa duração) também tem sido fundamental nas reduções drásticas nos casos de malária desde 20003. Com um número muito limitado de inseticidas disponíveis, há uma forte pressão evolutiva sobre os mosquitos, e a resistência agora é generalizada nos vetores africanos da malária4.
Além disso, as mutações do local alvo5 e a liberação metabólica de inseticidas6,7 continuam a ser os principais mecanismos estudados de resistência, mas outros mecanismos potentes resistentes estão emergindoagora 1. Muitos desses novos mecanismos não foram previamente associados à resistência aos inseticidas, mas foram detectados pela busca de padrões comuns de expressão gênica em várias populações resistentes usando o aplicativo IR-TEx e posteriormente validados funcionalmente por abordagens genômicas1.
Descrito aqui é uma abordagem passo a passo para o uso de IR-TEx, tanto na web e quando instalado localmente. O protocolo descreve como novos conjuntos de dados de resistência a inseticidas podem ser integrados no pacote existente e explica como operar com dados em falta. Finalmente, ele descreve como usar esse software com outros conjuntos de dados -ômicos que não estão relacionados à resistência aos inseticidas, combinando assim dados de diferentes abordagens -ômicos, ao mesmo tempo em que operam com valores ausentes e normalização para que os dados sejam comparáveis.
A transcriptômica de Big Data produz listas de milhares de transcrições que são expressas diferencialmente para cada condição experimental. Muitos desses experimentos são realizados em organismos e fenótipos relacionados e são quase exclusivamente analisados como experimentos independentes. A utilização dessas ricas fontes de dados examinando os dados de forma holística e sem suposições teóricas 1) leva à identificação de novas transcrições de candidatos e 2) impede o descarte de dados valiosos simplesmente porque há muita informação para validar in vivo1.
O IR-TEx fornece aos usuários um fundo de bioinformática limitado com a capacidade de examinar facilmente vários conjuntos de dados, visualizar alterações nos conjuntos de dados e baixar as informações associadas1. Embora o IR-TEx não suporte a pesquisa de mais de uma transcrição em cada pesquisa, os usuários podem examinar os arquivos Fold_Changes.txt associados simplesmente usando Excel, R ou outros programas apropriados. Uma utilidade mais adicional de IR-TEx provem do uso de redes da correlação para prever a função do transcript, entrada de proteínas hipotéticas ou transcrições com funções desconhecidas e uso do software downstream para procurarar por enriquecimentos1.
No exemplo demonstrado neste protocolo, o IR-TEx é usado de acordo com sua função original. Aqui, ele permite a exploração de transcrições associadas à resistência aos inseticidas e visualização da distribuição de excesso e sub-expressão através de gráficos de mapeamento. Transcrições de interesse são validadas in vivo para determinar se o excesso ou sub-expressão de transcrições dadas contribui para um fenótipo observado1 (por exemplo, resistência inseticida). Foi demonstrado aqui, como relatado anteriormente1, que um conjunto de dados pode ser usado em uma abordagem orientada por hipóteses para identificar transcrições de interesse em uma base específica do país. O IR-TEx pode então ser usado para 1) explorar a expressão da transcrição e 2) contextualizar a função da transcrição aplicando uma rede de correlação de pares em todas as transcrições contidas em cada conjunto de dados -omics. Aqui, o GSTMS1 mostrou-se co-correlacionado com uma série de outras transcrições implicadas na desintoxicação. Esses dados (juntamente com o knockdown da transcrição que resultou em um aumento significativo na mortalidade após a exposição ao inseticida) demonstram a importância dessa transcrição na liberação xenobiótica.
O IR-TEx representa um recurso valioso para explorar transcrições relacionadas à resistência a inseticidas na web ou usar aplicativos locais. Este protocolo demonstra como modificar o IR-TEx para diferentes plataformas de omics, bem como dados completamente novos. O guia ilustra como usar o IR-TEx para integrar dados de várias plataformas e conjuntos de dados de omics com dados em falta, bem como como recodificar o IR-TEx simplesmente para que seja útil para qualquer pessoa que pesquise conjuntos de dados transcritímicos.
The authors have nothing to disclose.
Este trabalho foi financiado por uma Bolsa de Desenvolvimento de Competências do MRC para v.I. (MR/R024839/1) e Royal Society Challenge Grant (CH160059) para H.R.
Laptop with browser | Any | – | – |
R Program | The R Project for Statistical Computing | – | https://www.r-project.org/ |
R Studio | R Studio | – | https://www.rstudio.com/ |