IR-TEx explora perfiles transcripcionales relacionados con la resistencia a insecticidas en la especie Anopheles gambiae. Aquí se proporcionan instrucciones completas para el uso de la aplicación, modificaciones para explorar varios conjuntos de datos transcriptomáticos y el uso del marco para crear una base de datos interactiva para colecciones de datos transcriptomicos de cualquier organismo, generados en cualquier plataforma.
IR-TEx es una aplicación escrita en Shiny (un paquete R) que permite explorar la expresión de (así como asignar funciones a) transcripciones cuya expresión está asociada con fenotipos de resistencia a insecticidas en mosquitos Anopheles gambiae. La aplicación puede ser utilizado en línea o descargado y utilizado localmente por cualquier persona. La aplicación local se puede modificar para agregar nuevos conjuntos de datos de resistencia a insecticidas generados a partir de varias plataformas -omics. Esta guía muestra cómo agregar nuevos conjuntos de datos y controlar los datos que faltan. Además, IR-TEx se puede recodificar completa y fácilmente para utilizar conjuntos de datos omics a partir de cualquier dato experimental, lo que lo convierte en un recurso valioso para muchos investigadores. El protocolo ilustra la utilidad de IR-TEx para identificar nuevos candidatos a la resistencia a los insecticidas utilizando la transferencia de glutatión microsómico, GSTMS1, como ejemplo. Esta transcripción está regulada en múltiples poblaciones resistentes a los piretroides de Costa de Marfil y Burkina Faso. La identificación de transcripciones cocorrelacionadas proporciona más información sobre las funciones putativas de este gen.
La capacidad de medir la expresión de un gran número de transcripciones simultáneamente a través de plataformas de microarray y tecnología RNAseq ha dado lugar a la generación de vastos conjuntos de datos que asocian la expresión de transcripción con un fenotipo particular tanto en organismos modelo como no modelo. Estos conjuntos de datos son un recurso extremadamente rico para los investigadores, cuyo poder se puede aumentar combinando conjuntos relevantes en un enfoque de integración de big data. Sin embargo, esta metodología se limita a aquellos con habilidades bioinformáticas particulares. Aquí se describe un programa, IR-TEx (publicado anteriormente por Ingham et al.1) que está escrito en un paquete R llamado Shiny2 y permite a los usuarios con poca formación bioinformática integrar e interrogar estos conjuntos de datos con relativa facilidad.
IR-TEx, encontrado en http://www.lstmed.ac.uk/projects/IR-TEx, fue escrito para explorar transcripciones asociadas con la resistencia a los insecticidas en Anopheles gambiae, el principal vector de malaria africano1. La malaria es una enfermedad parasitaria causada por especies de Plasmodium, transmitida entre humanos a través de las picaduras de mosquitos hembra Anopheles. La orientación al mosquito vector con insecticidas ha demostrado ser el medio más eficaz para prevenir la morbilidad y mortalidad relacionadas con el paludismo en Africa. La ampliación de las herramientas (es decir, mosquiteros insecticidas de larga duración) también ha sido fundamental en las drásticas reducciones de los casos de paludismo desde 20003. Con un número muy limitado de insecticidas disponibles, existe una fuerte presión evolutiva sobre los mosquitos, y la resistencia está ahora generalizada en los vectores de malaria africanos4.
Además, las mutaciones en el sitio objetivo5 y el aclaramiento metabólico de insecticidas6,7 siguen siendo los principales mecanismos estudiados de resistencia, pero ahora están surgiendo otros mecanismos resistentes potentes1. Muchos de estos nuevos mecanismos no se han asociado previamente con la resistencia a los insecticidas, pero se han detectado mediante la búsqueda de patrones comunes de expresión génica en múltiples poblaciones resistentes utilizando la aplicación IR-TEx y posteriormente validados funcionalmente por los enfoques genómicos1.
Aquí se describe un enfoque paso a paso para usar IR-TEx, tanto en la web como cuando se instala localmente. El protocolo describe cómo se pueden integrar nuevos conjuntos de datos de resistencia a insecticidas en el paquete existente y se explica cómo operar con los datos que faltan. Por último, describe cómo utilizar este software con otros conjuntos de datos -omics que no están relacionados con la resistencia a los insecticidas, combinando así datos de diferentes enfoques -omics mientras que también opera con valores que faltan y normalización para que los datos sean comparables.
La transcriptomica de Big Data produce listas de miles de transcripciones que se expresan diferencialmente para cada condición experimental. Muchos de estos experimentos se realizan en organismos y fenotipos relacionados y se analizan casi exclusivamente como experimentos independientes. El uso de estas fuentes de datos enriquecidas examinando los datos de forma integral y sin suposiciones teóricas 1) conducirá a la identificación de nuevas transcripciones candidatas y 2) evitará el descarte de datos valiosos simplemente porque hay demasiada información para validar in vivo1.
IR-TEx proporciona a los usuarios un fondo bioinformático limitado con la capacidad de examinar fácilmente varios conjuntos de datos, visualizar cambios en los conjuntos de datos y descargar la información asociada1. Aunque IR-TEx no admite la búsqueda de más de una transcripción en cada búsqueda, los usuarios pueden examinar los archivos Fold_Changes.txt asociados simplemente mediante Excel, R u otros programas apropiados. Otra utilidad de IR-TEx se deriva del uso de redes de correlación para predecir la función de transcripción, la entrada de proteínas hipotéticas o transcripciones con funciones desconocidas y el uso de software posterior para buscar enriquecimientos1.
En el ejemplo deeste se muestra en este protocolo, IR-TEx se utiliza según su función original. Aquí, permite la exploración de transcripciones asociadas con la resistencia a los insecticidas y la visualización de la distribución de la sobreexpresión y subexpresión a través de gráficos cartográficos. Las transcripciones de interés se validan in vivo para determinar si la expresión excesiva o subexpresación de determinadas transcripciones contribuye a unfenotipo 1 observado (por ejemplo, resistencia a los insecticidas). Aquí se demostró, como se informó anteriormente1, que un conjunto de datos se puede utilizar en un enfoque basado en hipótesis para identificar transcripciones de interés sobre una base específica de cada país. IR-TEx se puede utilizar para 1) explorar la expresión de la transcripción y 2) contextualizar la función de la transcripción aplicando una red de correlación por pares entre todas las transcripciones contenidas en cada conjunto de datos -omics. Aquí, se demostró que GSTMS1 estaba cocorrelación con una serie de otras transcripciones implicadas en la desintoxicación. Estos datos (junto con el derribo de la transcripción que resultó en un aumento significativo de la mortalidad después de la exposición a insecticidas) demuestran la importancia de esta transcripción en el aclaramiento xenobiótico.
IR-TEx representa un recurso valioso para explorar transcripciones relacionadas con la resistencia a insecticidas en la web o para utilizar aplicaciones locales. Este protocolo demuestra cómo modificar IR-TEx para diferentes plataformas -omics, así como datos completamente nuevos. La guía ilustra cómo utilizar IR-TEx para integrar datos de múltiples plataformas y conjuntos de datos -omics con datos que faltan, así como cómo recodificar IR-TEx simplemente para que sea útil para cualquier persona que investigue conjuntos de datos transcriptomicos.
The authors have nothing to disclose.
Este trabajo fue financiado por una beca MRC Skills Development Fellowship a V.I. (MR/R024839/1) y Royal Society Challenge Grant (CH160059) a H.R.
Laptop with browser | Any | – | – |
R Program | The R Project for Statistical Computing | – | https://www.r-project.org/ |
R Studio | R Studio | – | https://www.rstudio.com/ |