Presentamos un protocolo detallado de reparación de la biblioteca de ARN pequeño con menos sesgo que los métodos estándar y una mayor sensibilidad para los ARN de 2′-O-metil. Este protocolo se puede seguir utilizando reactivos caseros para ahorrar costos o usar kits para mayor comodidad.
El estudio de los ARN pequeños (ARN) mediante la secuenciación de próxima generación (NGS) se ve cuestionado por problemas de sesgo durante la preparación de la biblioteca. Varios tipos de ARNS, como los microARN vegetales (miRNAs) llevan una modificación de 2′-O-metil (2′-OMe) en su nucleótido terminal de 3′. Esta modificación añade otra dificultad, ya que inhibe la ligadura del adaptador de 3′. Anteriormente demostramos que las versiones modificadas del protocolo ‘TruSeq (TS)’ tienen menos sesgo y una mejor detección de ARN 2′-OMe. Aquí describimos en detalle el protocolo ‘TS5’, que mostró el mejor rendimiento general. TS5 se puede seguir utilizando reactivos caseros o reactivos del kit TS, con el mismo rendimiento.
Pequeños ARN (ARN) participan en el control de una diversidad de procesos biológicos1. Los ARNm reguladores eucariotas suelen tener entre 20 y 30 nt de tamaño; los tres tipos principales son los microARN (miRNA), los ARN que interactúan con piwi (piRNA) y los ARN pequeños que interfieren (siRNA). Los niveles de expresión de miRNA aberrante se han implicado en una variedad de enfermedades2. Esto subraya la importancia de los miRNA en la salud y las enfermedades y el requisito de herramientas de investigación precisas y cuantitativas para detectar los ARNNa en general.
La secuenciación de próxima generación (NGS) es un método ampliamente utilizado para estudiar los ARN. Las principales ventajas de NGS en comparación con otros enfoques, como las técnicas cuantitativas de PCR o microarray (qPCR), son que no necesita conocimiento a priori de las secuencias de ARN y, por lo tanto, puede utilizarse para descubrir nuevos ARN, y además sufre menos de señal de fondo y efectos de saturación. Además, puede detectar diferencias de nucleótidos individuales y tiene un mayor rendimiento que los microarrays. Sin embargo, NGS también tiene algunos inconvenientes; el costo de una ejecución de secuenciación sigue siendo relativamente alto y el proceso de varios pasos necesario para convertir una muestra en una biblioteca para la secuenciación puede introducir sesgos. En un proceso típico de preparación de la biblioteca de ARNS, un adaptador de 3′ se liga primero al ARNS (a menudo purificado en gel del ARN total) utilizando una versión truncada de la ligada de ARN 2 (RNL2) y un adaptador de 3′ preadenilado(Figura 1) en ausencia de ATP. Esto aumenta la eficiencia de la ligadura del adaptador de ARN sRNA y reduce la formación de reacciones secundarias como la circularización del ARNS o la concatemerización. Posteriormente, un adaptador de 5′ es ligado por la ligada de ARN 1 (RNL1), seguido de transcripción inversa (RT) y amplificación pcR. Todos estos pasos pueden introducir sesgo3,4. Por consiguiente, es posible que los números de lectura no reflejen los niveles reales de expresión de ARNS reales que conducen a patrones de expresión artificiales dependientes del método. Los ARNEspecíficos específicos pueden estar sobrerrepresentados o subrepresentados en una biblioteca, y los ARNs fuertemente subrepresentados pueden escapar a la detección. La situación es particularmente complicada con miRNAs vegetales, siRNAs en insectos y plantas, y piRNAs en insectos, nematodos y mamíferos, en los que el nucleótido terminal de 3′ tiene una modificación de 2′-O-metil (2′-OMe)1. Esta modificación inhibe fuertemente la ligadura del adaptadorde 3′,haciendo que la preparación de la biblioteca para estos tipos de ARN sea una tarea difícil.
Trabajos anteriores demostraron que la ligadura del adaptador introduce un sesgo grave, debido a los efectos de secuencia/estructura de ARN6,7,8,9,10,11. Los pasos aguas abajo de la ligadura del adaptador, como la transcripción inversa y la PCR, no contribuyen significativamente al sesgo6,11,12. Es probable que el sesgo de ligadura se deba al hecho de que las moléculas adaptadoras con una secuencia determinada interactuarán con moléculas de ARNS en la mezcla de reacción para formar pliegues, que pueden conducir a configuraciones favorables o desfavorables para la ligadura(Figura 2). Los datos de Sorefan et al7 sugieren que RNL1 prefiere un solo contexto trenzado, mientras que RNL2 prefiere una doble hebra para la ligadura. El hecho de que las estructuras de plegado conjunto del adaptador/sRNA estén determinadas por las secuencias específicas de adaptador y sRNA explica por qué el ARNS específico está sobrerrepresentado o subrepresentado con un conjunto de adaptadores determinado. También es importante tener en cuenta que dentro de una serie de bibliotecas de SRNA que se van a comparar, se deben utilizar las mismas secuencias de adaptador. De hecho, se ha observado anteriormente que el cambio de adaptadores mediante la introducción de diferentes secuencias de códigos de barras altera los perfiles de miRNA en las bibliotecas de secuenciación9,13.
La aleatorización de secuencias de adaptadores cerca de la unión de ligación probablemente reduce estos sesgos. Sorefan y sus colegas7 utilizaron adaptadores con 4 nucleótidos aleatorios en sus extremidades, designaron adaptadores de “alta definición” (HD) y demostraron que el uso de estos adaptadores conduce a bibliotecas que reflejan mejor los verdaderos niveles de expresión de ARNS. Trabajos más recientes confirmaron estas observaciones y revelaron que la región aleatorizada no necesita ser adyacente a la unión de ligación11. Este novedoso tipo de adaptadores se llamaba “MidRand” adaptadores. Juntos, estos resultados demuestran que el diseño mejorado del adaptador puede reducir el sesgo.
En lugar de modificar los adaptadores, el sesgo se puede suprimir mediante la optimización de las condiciones de reacción. Se ha demostrado que el polietilenglicol (PEG), un agente de aglomeración macromolecular conocido por aumentar la eficiencia de la ligadura14,reduce significativamente el sesgo15,16. Sobre la base de estos resultados, varios kits de “bajo sesgo” aparecieron en el mercado. Estos incluyen kits que utilizan PEG en las reacciones de ligadura, ya sea en combinación con adaptadores clásicos o adaptadores HD. Otros kits evitan la ligadura por completo, y utilizar 3′ poliadenilación y cambio de plantilla para 3′ y 5′ adición de adaptador, respectivamente12. En otra estrategia, la ligadura del adaptador de 3′ es seguida por un paso de circularización, omitiendo así 5′ ligadura del adaptador17.
En un estudio anterior, buscamos un protocolo de preparación de la biblioteca de ARNS con los niveles más bajos posibles de sesgo y la mejor detección de los ARN 2′-OMe12. Probamos algunos de los kits de “sesgo bajo” antes mencionados, que tenían una mejor detección de los ARN 2′-OMe que el protocolo estándar (TS). Sorprendentemente, sin embargo, tras la modificación (el uso de adaptadores aleatorios, PEG en las reacciones de ligación y la eliminación del exceso de adaptador de 3′ por purificación) este último superó a los otros protocolos para la detección de RNA 2′-OMe. Aquí, describimos en detalle un protocolo basado en el protocolo TS, ‘TS5′, que tenía la mejor detección general de 2’-OMe RNAs. El protocolo se puede seguir utilizando reactivos del kit TS y un reactivo del kit ‘Nf’ o, para ahorrar dinero, utilizando reactivos caseros, con el mismo rendimiento. También proporcionamos un protocolo detallado para la purificación de ARN SRNA a partir del ARN total y la preparación del adaptador preadenilado de 3′.
La preparación de la biblioteca de ARN pequeño sigue siendo difícil debido al sesgo, introducido principalmente durante los pasos de ligadura del adaptador. Los ARN con una modificación de 2′-OMe en sus 3′ extremos como miRNAs vegetales, piRNA en insectos, nematodos y mamíferos, y pequeños ARN que interfieren (siRNA) en insectos y plantas son particularmente difíciles de estudiar porque la modificación 2′-OMe inhibe la ligadura adaptadora de 3′. En la literatura se han propuesto una serie de soluciones para mejor…
The authors have nothing to disclose.
Este trabajo fue apoyado por el Centro Nacional de Investigaciones Científicas (CNRS), la Comisión Francesa de Energías Alternativas y Energía Atómica (CEA) y la Universidad de París-Sud. Toda la preparación de la biblioteca, la secuenciación de Illumina y los análisis bioinformáticos para este estudio se realizaron en las instalaciones de secuenciación de próxima generación (NGS) de I2BC. Los miembros de las instalaciones de I2BC NGS son reconocidos por la lectura crítica del manuscrito y sugerencias útiles.
2100 Bioanalyzer Instrument | Agilent | G2939BA | |
Acid-Phenol:Chloroform, pH 4.5 (with IAA, 125:24:1) | ThermoFisher | AM9720 | |
Adenosine 5'-Triphosphate (ATP) | Nex England Biolabs | P0756S | |
Agencourt AMPure XP beads | Beckman Coulter | A63880 | |
Bioanalyzer High Sensitivity DNA Kit | Agilent | 5067-4626 | |
Bioanalyzer Small RNA Kit | Agilent | 5067-1548 | |
Corning Costar Spin-X centrifuge tube filters | Sigma Aldrich | CLS8162-96EA | |
Dark Reader transilluminator | various suppiers | ||
HotStart PCR Kit, with dNTPs | Kapa Biosystems | KK2501 | |
NEXTflex small RNA-seq V3 kit | BIOO Scientific | NOVA-5132-05 | optional |
Novex TBE gels 6% | ThermoFisher | EC6265BOX | |
Novex TBE Urea gels 15% | ThermoFisher | EC6885BOX | |
QIAquick Nucleotide Removal Kit | Qiagen | 28304 | |
Qubit 4 Quantitation Starter Kit | ThermoFisher | Q33227 | |
Qubit ssDNA Assay Kit | ThermoFisher | Q10212 | |
RNA Gel Loading Dye (2X) | ThermoFisher | R0641 | |
RNA Gel Loading Dye (2X) | ThermoFisher | R0641 | |
RNase Inhibitor, Murine | Nex England Biolabs | M0314S | |
SuperScript IV Reverse Transcriptase | ThermoFisher | 18090200 | |
SYBR Gold Nucleic Acid Gel Stain | ThermoFisher | S11494 | |
T4 RNA Ligase 1 (ssRNA Ligase) | Nex England Biolabs | M0204S | |
T4 RNA Ligase 2, truncated | Nex England Biolabs | M0242S | |
TrackIt 50 bp DNA ladder | ThermoFisher | 10488043 | |
TruSeq Small RNA Library Prep Kit | Illumina | RS-200-0012/24/36/48 | optional |
UltraPure Glycogen | ThermoFisher | 10814010 | |
XCell SureLock Mini-Cell | ThermoFisher | EI0001 | |
XCell SureLock Mini-Cell | ThermoFisher | EI0001 | |
ZR small RNA ladder | Zymo Research | R1090 | |
the last two numbers correspond to the set of indexes |