Этот протокол представляет собой подход к отпечаткам пальцев и исследованию многомерных данных, собранных с помощью комплексной двумерной газовой хроматографии в сочетании с масс-спектрометрией. Специальные алгоритмы распознавания образов (сопоставление шаблонов) применяются для изучения химической информации, зашифрованной в летучей фракции оливкового масла экстра-класса (т.е. волатиломе).
Обработка и оценка данных являются критическими этапами комплексной двумерной газовой хроматографии (GCxGC), особенно в сочетании с масс-спектрометрией. Богатая информация, зашифрованная в данных, может быть очень ценной, но труднодоступной для эффективного доступа. Плотность и сложность данных могут привести к длительному времени разработки и потребовать трудоемких, зависящих от аналитиков процедур. Таким образом, эффективные, но доступные инструменты обработки данных являются ключом к распространению и принятию этого передового многомерного метода в лабораториях для ежедневного использования. Протокол анализа данных, представленный в этой работе, использует хроматографическую дактилоскопию и сопоставление шаблонов для достижения цели высокоавтоматизированной деконструкции сложных двумерных хроматограмм в отдельные химические признаки для расширенного распознавания информативных паттернов в отдельных хроматограммах и в наборах хроматограмм. Протокол обеспечивает высокую согласованность и надежность при незначительном вмешательстве. В то же время аналитический надзор возможен в различных условиях и функциях ограничений, которые могут быть настроены для обеспечения гибкости и способности адаптироваться к различным потребностям и целям. Здесь показано, что сопоставление шаблонов является мощным подходом к исследованию оливкового масла экстра-вирджин. Перекрестное выравнивание пиков выполняется не только для известных мишеней, но и для нецелевых соединений, что значительно увеличивает характеризацию мощности для широкого спектра применений. Приведены примеры, подтверждающие эффективность классификации и сравнения хроматографических паттернов из выборочных наборов, проанализированных в аналогичных условиях.
Комплексная двумерная газовая хроматография в сочетании с масс-спектрометрическим детектированием времени пролета (GC×GC-TOF MS) на сегодняшний день является наиболее информативным аналитическим подходом для химической характеристики сложных образцов1,2,3,4,5. В GC×GC колонны последовательно соединяются и сопряжены модулятором (например, термо- или клапанным фокусировальным интерфейсом), который улавливает элюющие компоненты из колонны первого измерения(1D) перед их повторным впрыском в столбец второго измерения(2D). Эта операция выполняется в течение фиксированного периода времени модуляции(PM),обычно в диапазоне от 0,5 до 8 с. С помощью тепловой модуляции процесс включает крио-улавливание и фокусировку элюируемой полосы с некоторыми преимуществами для общей мощности разделения.
Хотя GC×GC является методом двумерного разделения, процесс создает последовательные значения данных. Детекторный аналого-цифровой (A/D) преобразователь получает выход хроматографического сигнала на определенной частоте. Затем данные хранятся в определенных проприетарных форматах, которые содержат не только оцифрованные данные, но и связанные метаданные (информацию о данных). Аналого-цифровой преобразователь, используемый в системах GC×GC, помогает отображать интенсивность хроматографического сигнала в цифровом числе (DN) в качестве функции времени в двух аналитических измерениях. Одноканальные детекторы (например, пламенно-ионизационный детектор (FID), детектор захвата электронов (ECD), детектор хемилюминесценции серы (SCD) и т. Д.) Производят одиночные значения за время отбора проб, тогда как многоканальные детекторы (например, масс-спектрометрический детектор (MS)) производят несколько значений (как правило, в спектральном диапазоне) за время отбора проб во время аналитического запуска.
Для визуализации 2-Dданных разработка начинается с растеризации значений данных одного периода модуляции (или цикла) в виде столбца пикселей (элементов изображения, соответствующих событиям детектора). Вдоль ординаты (ось Y, снизу вверх) визуализируется время разделения 2D. Пиксельные столбцы последовательно обрабатываются таким образом, что абсцисса (осьX, слева направо) сообщает о времени разделения 1 D. Это упорядочение представляет данные 2D в правосторонней декартовой системе координат с порядковым номером удержания 1D в качестве первого индекса в массиве.
Обработка данных 2D хроматограмм дает доступ к более высокому уровню информации, чем необработанные данные, что позволяет обнаруживать пики 2D, идентифицировать пики, извлекать данные ответа для количественного анализа и перекрестного сравнительного анализа.
Пиковые паттерны 2D можно рассматривать как уникальный отпечаток образца, а обнаруженные соединения — как мелочные признаки для эффективного перекрестного сравнительного анализа. Этот подход, известный как шаблонная дактилоскопия6,7,был вдохновлен биометрической дактилоскопией6. Автоматические биометрические системы проверки отпечатков пальцев, по сути, опираются на уникальные характеристики кончиков пальцев: бифуркации и окончания хребтов, локализованные и извлеченные из чернильного оттиска или подробных изображений. Эти характеристики, называемые особенностями minutiae, затем перекрестно сопоставляются с доступными сохраненными шаблонами8,9.
Как упоминалось выше, каждая схема разделения GC×GC состоит из 2D пиков, рационально распределенных по двумерной плоскости. Каждый пик соответствует одному анализируемым, имеет свой информативный потенциал и может рассматриваться как единый признак для сравнительного анализа паттернов.
Здесь мы представляем эффективный подход к химической дактилоскопии GC×GC-TOF MS с тандемной ионизацией. Цель состоит в том, чтобы всесторонне и количественно каталогизировать признаки из набора хроматограмм.
По сравнению с существующим коммерческим программным обеспечением или встроенными процедурами10, 11,которые используют подход пиковых функций, дактилоскопия наоснове шаблонов характеризуется высокой специфичностью, эффективностью и ограниченным вычислительным временем. Кроме того, он обладает внутренней гибкостью, которая позволяет перекрестно выравливание минутных особенностей (т.е. пиков 2D) между сильно смещенными хроматограммами, приобретенными различными приборами или в долгосрочных исследованиях12,13,14.
Основные операции предлагаемого метода кратко описаны, чтобы направить читателя к хорошему пониманию сложности 2-Dшаблона и информационной мощи. Затем, исследуя матрицу выходных данных прибора, выполняется химическая идентификация и известные целевые аналиты, расположенные над двумерным пространством. Затем шаблон целевых пиков строится и применяется к серии хроматограмм, полученных в рамках одной аналитической партии. Метаданные, связанные со временем удержания, спектральными сигнатурами и ответами (абсолютными и относительными), извлекаются из перевыровненных шаблонов целевых пиков и принимаются для выявления композиционных различий в наборе выборок.
В качестве дополнительного, уникального этапа процесса на предварительно целевых хроматограммах также выполняется комбинированная нецелевая и таргетная (UT) дактилоскопия, чтобы расширить потенциал отпечатков пальцев как на известные, так и на неизвестные аналиты. Процесс создает шаблон UT для действительно всестороннего сравнительного анализа, который может быть в значительной степени автоматизирован.
В качестве заключительного этапа способ выполняет перекрестное выравнивание признаков в двух параллельных сигналах детектора, полученных с высокими и низкими энергиями ионизации электронов (70 и 12 эВ).
Протокол является достаточно гибким в поддержке анализа одной хроматограммы или набора хроматограмм и с переменной хроматографией и / или несколькими детекторами. Здесь протокол демонстрируется с коммерчески доступным пакетом программного обеспечения GC×GC (см. Таблицу материалов),объединенным с библиотекой MS и поисковым программным обеспечением (см. Таблицу материалов). Некоторые из необходимых инструментов доступны в другом программном обеспечении, и подобные инструменты могут быть реализованы независимо от описаний в литературе Рейхенбаха и его коллег15,16,17,18,19. Исходные данные для демонстрации получены из исследования оливкового масла экстра-вирджин (EVO), проведенного в лаборатории авторов14. В частности, летучая фракция (т.е. волатиломе) итальянских масел EVO отбирается методом твердофазной микроэкстракции (HS-SPME) и анализируется GC×GC-TOF MS для захвата диагностических отпечатков пальцев для качества и сенсорной квалификации образцов. Подробная информация о пробах, условиях отбора проб и аналитической настройке приведена в Таблице материалов.
Шаги 1–6 описывают предварительную обработку хроматограмм. Шаги 7–9 описывают обработку и анализ отдельных хроматограмм. Шаги 10–12 описывают создание и сопоставление шаблонов, которые являются основой для анализа перекрестной выборки. Шаги 13–16 описывают применение протокола к набору хроматограмм, а шаги 14–16 для анализа UT.
Визуализация данных GC×GC-TOF MS является фундаментальным шагом для правильного понимания результатов, достигнутых с помощью комплексных двумерных разделений. Графики изображений с настраиваемой окраской позволяют аналитикам оценить различия в отклике детектора и, следовательно, дифференциальное распределение компонентов образца. Такой визуальный подход полностью меняет взгляд аналитиков на интерпретацию и разработку хроматограмм. Этот первый шаг, однажды понятый и уверенно используемый хроматографами, открывает новую перспективу в дальнейшей обработке.
Другим фундаментальным аспектом обработки данных является доступность полной матрицы данных (т.е. спектральных данных и ответов MS) для всех точек выборки, каждая из которых соответствует одному событию детектора. В этом отношении 2D достигает пика интеграции, так что совокупность событий детектора, соответствующих одному анализируемым данным, представляет собой критический шаг. В текущем протоколе обнаружение пиков 2D основано на алгоритме18 водосбора с некоторыми адаптациями, включенными для улучшения чувствительности обнаружения в случае частичного совместного элюирования соединений. Чтобы сделать этот процесс более конкретным, необходимо провести деконволюцию и принять более сложные процедуры. Это возможно путем выполнения обнаружения ионного пика для данных MS; алгоритм обрабатывает массив данных и изолирует отклик от отдельных аналитов на основе спектральных профилей19,31.
Важный, но критический этап протокола и любого процесса интерпретации данных GC×GC-MS связан с идентификацией аналитов. Эта процедура, предложенная в шагах 8 и 9, при отсутствии подтверждающего анализа с аутентичными стандартами, должна быть тщательно проведена аналитиком. Автоматизированные действия доступны в любом коммерческом программном обеспечении; они включают оценку сходства спектральных сигнатур MS по отношению к собранным эталонным спектрам (т.е. спектральным библиотекам) и оценку соотношений характеристик между ионами квалификатора/квантора. Однако для устранения неоднозначности идентификации изомеров необходимы дополнительные подтверждающие критерии. В протоколе предлагается принять линейные индексы удержания для определения приоритетности списка кандидатов; ограничение здесь относится к доступности данных хранения и их согласованности.
Основной характеристикой, которая делает этот подход уникальным, является сопоставление шаблонов12,13,15,29. Сопоставление шаблонов позволяет распознавать 2-Dобразы очень эффективным, специфическим и интуитивно понятным способом. Он может быть установлен с точки зрения чувствительности и специфичности путем применения настраиваемых пороговых значений и/или функций ограничений, в то время как аналитик может контролировать процедуру, активно взаимодействуя с параметрами функции преобразования. Особенность этого процесса заключается в возможности перекрестного выравнивания целевой и нецелевой информации о пиках между образцами однородной партии, а также между образцами, полученными в одинаковых номинальных условиях, несмотря на средне- и сильное смещение. Преимущества этой операции связаны с возможностью сохранения всех идентификаций целевых аналитов, что является трудоемкой задачей для аналитика, и всех метаданных, сохраненных для целевых и нецелевые пики из предыдущих сессий разработки.
Сопоставление шаблонов также очень эффективно с точки зрения вычислительного времени; Файлы данных MS с низким разрешением состоят примерно из 1–2 Гб упакованных данных, в то время как анализ MS с высоким разрешением может достигать 10–15 Гб за один аналитический запуск. Сопоставление шаблонов не обрабатывает полную матрицу данных каждый раз, но сначала выполняет выравнивание времени хранения между хроматограммами с использованием пиков шаблона, затем обрабатывает пики кандидатов в окне поиска для их соответствия по времени хранения со ссылкой в шаблоне. В случае сильного перекоса, наиболее сложной ситуации, глобальные полиномиальные преобразования второго порядка работали лучше, чем локальные методы, при одновременном сокращении вычислительноговремени 13.
Для того, чтобы метод GC×GC широко распространился за пределы научных кругов и исследовательских лабораторий, инструменты обработки данных должны облегчать основные операции по визуализации и проверке хроматограмм; идентификация аналитов должна дать возможность принятия стандартизированных алгоритмов и процедур (например, алгоритм поиска NIST и калибровка IT); и межскладовой анализ должен быть интуитивно понятным, эффективным и подкрепляться интерактивными инструментами. Предлагаемый подход удовлетворяет эти потребности, предлагая расширенные варианты и инструменты для решения сложных ситуаций, таких как совместное элюирование аналитов, калибровка нескольких аналитов, анализ группового типа и параллельное выравнивание обнаружения.
Справочная литература хорошо охватывает многие возможные сценарии, в которых GC×GC и, в более общем плане, комплексная двумерная хроматография предлагают уникальные решения и надежные результаты, которые не могут быть достигнуты с помощью 1D-хроматографии в однократном анализе. 5,32,33 Хотя GC×GC является самым мощным инструментом, который увеличивает способность и чувствительность разделения, всегда существуют ограничения на мощность разделения, чувствительность и другие системные возможности. По мере приближения к этим системным ограничениям анализ данных становится все более сложным. Поэтому исследования и разработки должны продолжать совершенствовать аналитические инструменты, имеющиеся в нашем распоряжении.
The authors have nothing to disclose.
Исследование было поддержано Progetto Ager − Fondazioni in rete per la ricerca agroalimentare. Аббревиатура проекта Violin – Валоризация итальянских оливковых продуктов с помощью инновационных аналитических инструментов (https://olivoeolio.progettoager.it/index.php/i-progetti-olio-e-olivo/violin-valorization-of-italian-olive-products-through-innovative-analytical-tools/violin-il-progetto). Программное обеспечение GC Image доступно для бесплатной пробной версии для читателей, которые хотят продемонстрировать и протестировать протокол.
1D SolGel-Wax column (100% polyethylene glycol; 30 m × 0.25 mm dc × 0.25 μm df). Carrier gas helium at a constant nominal flow of 1.3 mL/min. | Trajan SGE Analytical Science, Ringwood, Australia | PN 054796 | Carrier gas helium at a constant nominal flow of 1.3 mL/min. Oven temperature programming set as follows: 40°C (2 min) to 240°C (10 min) at 3.5°C/min. |
2D OV1701 column (86% polydimethylsiloxane, 7% phenyl, 7% cyanopropyl; 1 m × 0.1 mm dc × 0.10 μm df) from . | Mega, Legnano, Milan, Italy | PN MEGA-1701 | |
Automated system for sample preparation: SPR Autosampler for GC | SepSolve-Analytical, Llantrisant, UK | ||
Extra Virgin Olive oils: Sicily and Tuscany, Italy | Project VIOLIN (Ager – Fondazioni in rete per la ricerca agroalimentare) | Samples (n=10) were collected during the production year 2018 within the "Violin" project sampling campaign. Oils were submitted to HS-SPME to sample volatiles according to a reference protocol validated in a previous study of Stilo et al.14 | |
Gas chromatograph: Model 7890B GC | Agilent Technologies Wilmington DE, USA | ||
GC Image GC×GC edition V 2.9 | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Image processing software | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Mass spectrometer: BenchTOF-Select | Markes International Llantrisant, UK | ||
Methyl-2-octynoate (CAS 111-12-6) | Merck-Millipore/Supelco | PN: 68982 | |
Modulator controller: Optimode v2.0 | SRA Intruments, Cernusco sul Naviglio, Milan, Italy | ||
Modulator: KT 2004 loop type | Zoex Corporation Houston, TX, USA | ||
MS library and search software: NIST Library V 2017, Software V 2.3 | National Institute of Standards and Technology (NIST), Gaithersburg MD | https://www.nist.gov/srd/nist-standard-reference-database-1a-v17 | |
n-alkanes C8-C40 for retention indexing | Merck-Millipore/Supelco | PN: 40147-U | |
n-hexane (CAS 110-54-3) gas chromatography MS SupraSolv | Merck-Millipore/Supelco | PN: 100795 | |
Solid Phase Microextraction fiber | Merck-Millipore/Supelco | PN 57914-U | |
α- /β-thujone (CAS 546-80-5) | Merck-Millipore/Sigma Aldrich | PN: 04314 |