Лонг чтения последовательности значительно облегчить Ассамблее сложные геномы и характеристика структурных изменения. Мы описываем метод для создания ультра-длинные последовательности на основе Нанопор виртуализации платформ. Этот подход принимает оптимизированный экстракции ДНК, а затем изменение библиотеки препаратов для создания сотен kilobase читает с умеренной покрытие из клеток человека.
Третьего поколения, что сингл молекула ДНК последовательности технологии предлагают значительно больше читать длина, которая может содействовать Ассамблея сложных геномов и анализ сложных структурных вариантов. Нанопор платформах выполняют одной молекулы последовательности непосредственно измеряя текущие изменения, при посредничестве ДНК проход через поры и может генерировать сотни читает kilobase (КБ) с минимальными затратами капитала. Эта платформа была принята многими исследователями для различных приложений. Достижения длины последовательности чтения является наиболее важным фактором использовать значение Нанопор виртуализации платформ. Для создания ультра-длинный читает, особое внимание требуется избежать поломки ДНК и повышение эффективности для создания производственной последовательности шаблоны. Здесь мы предоставляем подробный протокол долговечный секвенирования ДНК, включая экстракции ДНК высокой молекулярной массой (HMW) из свежих или замороженных клеток, Библиотека строительство механической резки или Транспозаза фрагментации и виртуализации на устройстве Нанопор. От 20-25 мкг HMW ДНК метод можно добиться N50, читать длиной 50-70 КБ с механической резки и N50 90-100 КБ читать длина с Транспозаза при посредничестве фрагментации. Протокол может применяться к ДНК, извлеченные из клеток млекопитающих для выполнения всего генома для выявления структурных вариантов и геном Ассамблеи. Дополнительные усовершенствования на экстракции ДНК и ферментативных реакций будет далее увеличить длину чтения и расширять его полезности.
За последнее десятилетие массивно параллельной и высокоточные второго поколения высокопроизводительного секвенирования технологии заставили взрыв биомедицинских открытий и технологических инноваций в1,2,3. Несмотря на технический прогресс короткие чтение данных, генерируемых второго поколения платформы являются неэффективными в урегулировании сложных регионах геномной и ограничены в обнаружении геномной структурных вариантов (СВС), которые играют важную роль в человека Эволюция и болезней4,5. Кроме того короткий чтение данных не удается разрешить повторные изменения и непригодны для взыскательных гаплотип поэтапного генетических вариантов6.
Недавний прогресс в одной молекулы последовательности предлагает значительно больше читать длина, которая может облегчить обнаружение полный спектр СВС7,8,9, и предлагает точные и полные собрания комплекса микробов и млекопитающих геномов6,10. Нанопор платформа выполняет секвенирование одной молекулы, непосредственно измерения текущих изменений при посредничестве ДНК прохода через поры11,12,13. В отличие от любых существующих химия секвенирования ДНК, Нанопор последовательности может генерировать Лонг (десятки тысяч kilobases) читает в режиме реального времени, не полагаясь на кинетику полимеразы или искусственные амплификации ДНК образца. Таким образом Нанопор Лонг чтения последовательности (РНБ seq) имеет большие перспективы для создания ультра-чтения длинных далеко за 100 КБ, что значительно ускорит геномных и биомедицинских анализов14, особенно в низкой сложности или повторить богатые регионы в геномах15.
Уникальная особенность Нанопор последовательности является его способность генерировать длинный читает без ограничения теоретическая длина. Таким образом чтение длина зависит от физической длина ДНК, которая напрямую зависит от качества шаблон целостности и последовательности ДНК. Кроме того в зависимости от степени манипуляции и количество шагов, например дозирования сил и условий извлечения, качество ДНК является крайне непостоянны. Таким образом это является сложной задачей для одного, чтобы принести долго читает, просто применив стандартные протоколы извлечения дна и производителя предоставленного библиотеки строительных методов. С этой целью мы разработали надежный метод для создания ультра-долгий читать (сотни kilobases) последовательности данных, начиная от заготовленных клеток окатышей. Мы приняли несколько улучшений в процедуре подготовки ДНК добычи и библиотека. Мы рационализированы протокол для исключения ненужных процедур, которые вызывают деградации ДНК и убытки. Этот протокол состоит из высокой молекулярной массой (HMW) экстракции ДНК, ультра-длинный строительство библиотеки ДНК и последовательности на платформе Нанопор. Для хорошо подготовленных молекулярный биолог обычно занимает 6 h от заготовки до завершения извлечения HMW ДНК, 90 мин или 8 h для строительства библиотеки в зависимости от метода сдвига и еще 48 h для секвенирования ДНК клетки. Использование протокола позволит геномики сообщество для улучшения нашего понимания сложности генома и получить новое понимание изменения генома в заболеваниях человека.
В принципе секвенирование Нанопор способен генерировать 100 КБ до megabase читает в длину11,12,13. Четыре основных фактора влияют на производительность последовательности выполнения и качества данных: 1) числа активных поры и деятельность поры; 2) мотор белок, который контролирует скорость ДНК, проходя через Нанопор; 3) ДНК шаблон (длина, чистоту, качество, массовые); 4) последовательности адаптер лигирование эффективность, которая определяет полезной ДНК из образца ввода. Первые два фактора зависят от версии потока ячейки и комплект последовательности, представленной изготовителем. Вторая два фактора являются важнейшие шаги в настоящем Протоколе (экстракции ДНК HMW, стрижка и маточных труб).
Этот протокол требует терпения и практики. Для ультра-долгий библиотеки ДНК6важно качество HMW ДНК. Протокол начинается с клетки, собранные с высокой жизнеспособности (> 85% жизнеспособных клеток предпочитали), ограничивая деградации ДНК от мертвых клеток. Следует избегать любых суровых процесс, который может ввести повреждений ДНК (например, сильное беспокойство, пожимая, вихря, несколько дозирования, неоднократные замораживания и оттаивания). В разработке протокола мы опускаем, дозирование в весь процесс экстракции ДНК. Широкое отверстие советы должны быть использованы когда закупорить необходим после механической резки во время строительства библиотеки и последовательности. Как Нанопоры чувствительны к химия в камеру буфера12, должна существовать как несколько остаточных загрязнителей (например, моющие средства, ПАВ, фенол, этанол, белки РНК, и т.д.) как можно скорее в ДНК. Учитывая длину и урожайности метод экстракции фенольных показывает лучшие и наиболее воспроизводимые результаты, по сравнению с несколькими различных извлечения методы испытания пока.
Несмотря на способность производить Лонг чтения последовательности, этот протокол по-прежнему остаются некоторые ограничения. Во-первых этот протокол был оптимизирован на основе Нанопор последовательности устройства, имеющиеся на момент публикации; Таким образом он ограничивается выборочной основе Нанопор последовательности химии и может быть неоптимальной, когда выступал в других типов устройств Лонг чтения последовательности. Во-вторых результат сильно зависит от качества ДНК, извлеченные из исходного материала (ткани или клетки). Чтение длина будет снижена, если начальный ДНК уже деградированных или повреждены. В-третьих хотя несколько КК шаги включены в протокол для проверки качества ДНК, окончательный выход и длина гласит могут быть затронуты в ячейку потока и поры деятельность, которая может быть переменной на этой ранней стадии Нанопор виртуализации платформы развития.
Протокол, в описанный здесь использует образцы линии клетки человека подвеска для экстракции ДНК. Мы оптимизировали проходящей раз в иглу, стрижка, соотношение HMW ДНК Транспозаза и перевязка времени для получения результатов, описанных. Протокол может быть расширен четырьмя способами. Во-первых пользователи могут начать с других культивируемых клеток млекопитающих и различное количество клеток, тканей, клинические образцы или других организмов. Потребуется дальнейшая оптимизация на время инкубации лизиса, том реакции и центрифугирования. Во-вторых это трудно предсказать размер целевого для ультра-долгий чтения последовательности. Если чтение длина короче, чем ожидалось, пользователи могут настроить проходящей раз в механический метод, основанный на стрижки или изменить отношение HMW ДНК в Транспозаза в методе Транспозаза на основе фрагментации. Длиннее время привязки и элюции во время очистки шаги полезны, потому что HMW ДНК вязкие. В-третьих с различными Нанопор последовательности устройств, один можно настроить количество и объем ДНК, чтобы соответствовать критериям программы sequencer. В-четвертых будет виртуализированных только ДНК, лигируют последовательности адаптерам. Для дальнейшего повышения эффективности перевязки, одно может попытаться Титруйте адаптер и лигаза концентрации. Изменение лигирование время и молекулярных скоплению агентов, таких как PEG18 может применяться в будущем. Ультра-длинный протокол секвенирования ДНК в сочетании с ТРИФОСФАТЫ19,20 может предложить эффективный инструмент для обогащения последовательности целевого объекта.
The authors have nothing to disclose.
Авторы благодарят Y. Чжу за ее замечания по рукописи. Исследования, сообщили в настоящем издании частично поддерживается национального института рака национальных институтов здоровья под награду номер P30CA034196. Содержание является исключительно ответственности авторов и не обязательно отражают официальную точку зрения национальных институтов здоровья.
Reagents | |||
Absolute ethanol | Sigma-Aldrich | E7023 | |
Agencourt AMPure XPbeads | Beckman | A63881 | magnetic beads for cleanup |
BD conventional needles | Becton Dickinson | 305136 | 27G, for mechanical shearing |
BD Luer-Lok syringe | Becton Dickinson | 309628 | for mechanical shearing |
Blunt/TA Ligase Master Mix | NEB | M0367S | |
Countess Cell Counting Chamber Slides | Invitrogen | C10228 | for cell counting |
EDTA | Invitrogen | AM9261 | pH 8.0, 0.5 M, 500 mL |
Flow Cell | Oxford Nanopore Technologies | FLO-MIN106 | R9.4.1 |
HG00773 cells | Coriell Institute | HG00733 | cells used in this protocol |
Ligation Sequencing Kit 1D | Oxford Nanopore Technologies | SQK-LSK108 | nanopore ligation kit |
MaXtract High Density tubes | Qiagen | 129073 | gel tubes |
NEBNext FFPE DNA Repair Mix | NEB | M6630S | |
NEBNext Ultra II End Repair/dA-Tailing Module | NEB | M7546S | |
Nuclease-free water | Invitrogen | AM9937 | |
Phosphate-Buffered Saline, PBS | Gibco | 70011044 | 10X, pH 7.4 |
Phenol:chloroform:IAA | Invitrogen | AM9730 | |
Proteinase K | Qiagen | 19131 | 20 mg/mL |
Qubit dsDNA BR Assay Kit | Invitrogen | Q32850 | fluorometer assays for DNA quantification |
Rapid Sequencing Kit | Oxford Nanopore Technologies | SQK-RAD004 | nanopore transposase kit |
RNase A | Qiagen | 19101 | 100 mg/mL |
SDS | Invitrogen | AM9822 | 10% (wt/vol) |
Sodium chloride solution | Invitrogen | AM9759 | 5.0 M |
TE buffer | Invitrogen | AM9849 | pH 8.0 |
Tris | Invitrogen | AM9856 | pH 8.0, 1 M |
Triton X-100 solution | Sigma-Aldrich | 93443 | ~10% |
Name | Company | Catalog Number | Comments |
Equipment | |||
Bio-Rad C1000 Thermal Cycler | Bio-Rad | 1851196EDU | |
Centrifuge 5810R | Eppendorf | 22628180 | |
Countess II FL Automated Cell Counter | Life Technologies | AMQAF1000 | for cell counting |
DynaMag-2 Magnet | Life Technologies | 12321D | magnetic rack |
Eppendorf ThermoMixer | Eppendorf | 5382000023 | for incubation |
Freezer | LabRepCo | LHP-5-UFMB | |
GridION | Oxford Nanopore Technologies | GridION X5 | nanopore device used in this protocol |
HulaMixer Sample Mixer | Thermo Fisher Scientific | 15920D | rotator mixer |
MicroCentrifuge | Benchmark Scientific | C1012 | |
NanoDrop ND-1000 Spectrophotometer | Thermo Fisher Scientific | ND-1000 | for UV reading |
Pippin Pulse | Sage Science | PPI0200 | pulsed-field gel electrophoresis instrument |
Qubit 3.0 Fluorometer | Invitrogen | Q33216 | fluorometer |
Refrigerator | LabRepCo | LABHP-5-URBSS | |
Vortex-Genie 2 | Scientific Industries | SI-A236 | |
Water bath | VWR | 89501-464 |