Этот метод описывает шаги по улучшению качества и количества последовательности данных, которые могут быть получены из формалина фиксированной парафин-встроенных (FFPE) РНК образцов. Мы описываем методологию для более точной оценки качества образцов FFPE-РНК, подготовки библиотек секвенирования и анализа данных из образцов FFPE-РНК.
Анализ экспрессии генов с помощью секвенирования РНК (РНК-сек) позволяет получить уникальную информацию о клинических образцах, которые потенциально могут привести к механистическое понимание основы различных заболеваний, а также механизмов резистентности и/или восприимчивости. Тем не менее, ткани FFPE, которые представляют собой наиболее распространенный метод сохранения морфологии тканей в клинических образцах, не являются лучшими источниками для анализа экспрессии генов. РНК, полученная из таких образцов, часто деградирует, фрагментируется и химически модифицируется, что приводит к неоптимальному секвенированию библиотек. В свою очередь, они генерируют данные о низкой последовательности качества, которые могут быть ненадежными для анализа экспрессии генов и обнаружения мутаций. Для того чтобы максимально получить максимальную отдачу от образцов FFPE и получить наилучшие данные из образцов низкого качества, важно принять определенные меры предосторожности при планировании экспериментального проектирования, подготовке библиотек секвенирования и при анализе данных. Это включает в себя использование соответствующих метрик для точного контроля качества выборки (КК), определение лучших методов для различных шагов во время генерации библиотеки последовательности, и тщательной библиотеки КК. Кроме того, применение правильных программных средств и параметров для анализа последовательности данных имеет решающее значение для выявления артефактов в данных RNA-seq, фильтрации загрязнения и низкого качества считывания, оценки единообразия генного покрытия и измерения воспроизводимости профилей экспрессии генов среди биологических репликаций. Эти шаги могут обеспечить высокую точность и воспроизводимость для профилирования очень неоднородных образцов РНК. Здесь мы описываем различные шаги для образца КК, подготовки библиотеки и КК, секвенирования и анализа данных, которые могут помочь увеличить объем полезных данных, полученных из низкокачественной РНК, таких как полученные из тканей FFPE-РНК.
Использование подходов к секвенированию следующего поколения позволило нам получить большой объем информации из различных типов образцов. Однако старые и плохо сохранившиеся образцы остаются неработоспособными для широко используемых методов генерации данных о последовательности и часто требуют внесения изменений в устоявшиеся протоколы. Ткани FFPE представляют собой такой тип образца, который был широко использован для клинических образцов1,,2,,3. В то время как сохранение FFPE поддерживает морфологию тканей, нуклеиновые кислоты в тканях FFPE обычно обладают широким спектром повреждений и деградации, что затрудняет получение геномной информации, которая может привести к важным представлениям о молекулярных механизмах, лежащих в основе различных расстройств.
Данные экспрессии генов, генерируемые секвенированием РНК, часто играют важную роль в изучении механизмов болезни и резистентности и дополняют анализ мутаций ДНК. Тем не менее, РНК более восприимчива к деградации, что делает его более сложным для получения точных данных экспрессии генов из тканей FFPE. Кроме того, поскольку широкая доступность и доступность секвенирования относительно недавняя, старые образцы часто не хранились в условиях, необходимых для сохранения целостности РНК. Некоторые из вопросов для образцов FFPE включают деградацию РНК из-за встраивания в парафина, химическая модификация РНК, приводящая к фрагментации или огнеупорности к ферментативным процессам, необходимым для секвенирования, и потеря поли-хвостов, ограничение применимости олиго-дТ в качестве грунтовки для обратной транскриптазы4. Еще одной проблемой является обработка/хранение образцов FFPE в неоптимальных условиях, что может привести к дальнейшей деградации молекул лабиля, таких как РНК в тканях5. Это особенно актуально для старых образцов, которые, возможно, были собраны в то время, когда анализ экспрессии генов путем секвенирования РНК не ожидался для образцов. Все это приводит к снижению качества и количества извлеченной РНК, доступных для генерации полезных данных последовательности. Низкая вероятность успеха, в сочетании с высокой стоимостью секвенирования, отговорила многих исследователей от попыток генерировать и анализировать данные экспрессии генов из потенциально полезных образцов FFPE. Некоторые исследования в последние годы продемонстрировали удобство использования тканей FFPE9для анализа экспрессии генов2,,6,,77,9,хотя и для меньшего количества и/ или более поздних образцов.
В качестве технико-экономического обоснования, мы использовали РНК, извлеченные из образцов ткани опухоли FFPE из трех остаточных хранилищ ткани от наблюдения, эпидемиологии и конечных результатов (SEER) раковых регистров для секвенирования РНК и анализа экспрессиигенов 10. Закупленные в клинических патологических лабораториях, ткани FFPE из высококачественных серозных аденокарциномы яичников хранились от 7-32 лет в различных условиях до извлечения РНК. Поскольку в большинстве случаев эти блоки хранились в разных местах в течение многих лет, не ожидая какого-либо чувствительного генетического анализа в будущем, не было принято большого вуза для сохранения нуклеиновой кислоты. Таким образом, большинство образцов продемонстрировали низкое качество РНК, при этом большая доля образцов была загрязнена бактериями. Тем не менее, мы смогли выполнить генную количественную оценку, измерить единообразие и непрерывность генного покрытия, а также выполнить анализ корреляции Пирсона среди биологических репликантов для измерения воспроизводимости. Основываясь на наборе ключевой панели генов подписи, мы сравнили образцы в нашем исследовании с данными Атлас агеногов рака (TCGA) и подтвердили, что примерно 60% образцов имели сопоставимые профили экспрессии генов11. Основываясь на корреляции между различными результатами КК и метаданными выборки, мы определили ключевые метрики КК, которые имеют хорошее прогностическое значение для определения образцов, которые с большей вероятностью генерируют пригодные для использования данные последовательности11.
Здесь мы описываем методологию, используемую для оценки качества FFPE-РНК, генерацию библиотек секвенирования, начиная с извлеченных образцов РНК, и биоинформатический анализ данных секвенирования.
Описанный здесь метод определяет основные шаги, необходимые для получения хороших данных о последовательности из образцов FFPE-РНК. Основными моментами, которые следует учитывать с помощью этого метода, являются: (1) Обеспечить, чтобы РНК сохранилась как можно лучше после извлечения путе…
The authors have nothing to disclose.
Мы благодарны доктору Даниэль Кэррик (Отдел по борьбе с раком и наук о народонаселении, Национальный институт рака) за постоянную помощь, особенно за инициирование этого исследования, предоставляя нам образцы, и за полезные предложения во время анализа данных. Мы искренне благодарим всех членов CCR секвенирования фонда в Фредерик Ской Национальной лаборатории онкологических исследований за их помощь во время подготовки образцов и последовательности, особенно Бренда Хо за помощь в образце КК, Оксана Герман для библиотеки КК, Татьяна Смирнова для запуска секвенсоров. Мы также хотели бы поблагодарить Цай-вэй Шэня и Эшли Уолтон из Sequencing Facility Bioinformatics Group за помощь в анализе данных и внедрении трубопровода РНК-сек. Мы также благодарим CCBR и NCBR за помощь в разработке анализа RNaseq и разработке передового опыта.
2100 Bioanalyzer | Agilent | G2939BA | |
Agilent DNA 7500 Kit | Agilent | 5067-1506 | |
Agilent High Sensitivity DNA Kit | Agilent | 5067-4626 | |
Agilent RNA 6000 Nano Kit | Agilent | 5067-1511 | |
AllPrep DNA/RNA FFPE Kit | Qiagen | 80234 | |
CFX96 Touch System | Bio-Rad | 1855195 | |
Library Quantification kit v2-Illumina | KapaBiosystems | KK4824 | |
NEBNext Ultra II Directional RNA Library Prep Kit for Illumina | New England Biolabs | E7765S | https://www.neb.com/protocols/2017/02/07/protocol-for-use-with-ffpe-rna-nebnext-rrna-depletion-kit |
NEBNext rRNA Depletion Kit (Human/Mouse/Rat) | New England Biolabs | E6310L | |
NextSeq 500 Sequencing System | Illumina | SY-415-1001 | NextSeq 500 System guide: https://support.illumina.com/content/dam/illumina-support/documents/documentation/system_documentation/nextseq/nextseq-500-system-guide-15046563-06.pdf |
NextSeq PhiX Control Kit | Illumina | FC-110-3002 | |
NSQ 500/550 Hi Output KT v2.5 (150 CYS) | Illumina | 20024907 | |
10X Genomics Magnetic Separator | 10X Genomics | 120250 | |
Rotator Multimixer | VWR | 13916-822 | |
C1000 Touch Thermal Cycler | Bio-Rad | 1851197 | |
Sequencing reagent kit | Illumina | 20024907 | |
Flow cell package | Illumina | 20024907 | |
Buffer cartridge and the reagent cartridge | Illumina | 20024907 | |
Sodium hydroxide solution (0.2N) | Millipore Sigma | SX0607D-6 | |
TRIS-HCL Buffer 1.0M, pH 7.0 | Fisher Scientific | 50-151-871 |