Este protocolo apresenta uma abordagem para impressão digital e explorar dados multidimensionais coletados por cromatografia abrangente de gás bidimensional acoplado à espectrometria de massa. Algoritmos dedicados de reconhecimento de padrões (correspondência de modelos) são aplicados para explorar as informações químicas criptografadas na fração volátil de azeite extravirgem (ou seja, volatilome).
O processamento e a avaliação dos dados são etapas críticas da cromatografia abrangente do gás bidimensional (GCxGC), particularmente quando acopladas à espectrometria de massa. As informações ricas criptografadas nos dados podem ser altamente valiosas, mas difíceis de acessar eficientemente. A densidade e a complexidade dos dados podem levar a longos tempos de elaboração e exigem procedimentos laboriosos e dependentes de analistas. Ferramentas eficazes e acessíveis de processamento de dados, portanto, são fundamentais para permitir a disseminação e aceitação dessa técnica multidimensional avançada em laboratórios para uso diário. O protocolo de análise de dados apresentado neste trabalho utiliza impressão digital cromatográfica e correspondência de modelos para alcançar o objetivo de desconstrução altamente automatizada de cromatatogramas bidimensionais complexos em características químicas individuais para reconhecimento avançado de padrões informativos dentro de cromatógrafos individuais e em conjuntos de cromatógrafos. O protocolo oferece alta consistência e confiabilidade com pouca intervenção. Ao mesmo tempo, a supervisão dos analistas é possível em uma variedade de configurações e funções de restrição que podem ser personalizadas para fornecer flexibilidade e capacidade de se adaptar a diferentes necessidades e objetivos. A correspondência de modelos é mostrada aqui como uma abordagem poderosa para explorar volatilome de azeite extravirgem. O alinhamento cruzado de picos é realizado não apenas para alvos conhecidos, mas também para compostos não direcionados, o que aumenta significativamente o poder de caracterização para uma ampla gama de aplicações. Exemplos são apresentados para evidenciar o desempenho para a classificação e comparação de padrões cromatográficos a partir de conjuntos amostrais analisados em condições semelhantes.
A cromatografia abrangente do gás bidimensional combinada com a detecção espectrométrica de massa de tempo de voo (GC×GC-TOF MS) é hoje a abordagem analítica mais informativa para a caracterização química de amostras complexas1,2,3,4,5. Em GC×GC, as colunas são conectadas serialmente e interfacedas por um modulador (por exemplo, uma interface de foco térmica ou baseada em válvula) que prende componentes de eluição da coluna primeira dimensão(1D) antes de sua reinjeção na coluna segunda dimensão(2D). Esta operação é feita dentro de um período de tempo de modulação fixa(PM),geralmente variando entre 0,5-8 s. Pela modulação térmica, o processo inclui crio-trapping e foco da banda de eluição com alguns benefícios para o poder de separação global.
Embora o GC×GC seja uma técnica de separação bidimensional, o processo produz valores de dados sequenciais. O conversor detector analógico-digital (A/D) obtém a saída de sinal cromatográfico em uma determinada frequência. Em seguida, os dados são armazenados em formatos proprietários específicos que não só contêm os dados digitalizados, mas também metadados relacionados (informações sobre os dados). O conversor A/D empregado em sistemas GC×GC ajuda no mapeamento da intensidade do sinal cromatográfico para um número digital (DN) em função do tempo nas duas dimensões analíticas. Detectores de canal único (por exemplo, detector de ionização de chamas (FID), detector de captura de elétrons (ECD), detector de quimiominascência de enxofre (SCD), etc.) produzem valores únicos por tempo de amostragem, enquanto detectores multicanais (por exemplo, detector espectrométrico de massa (MS)) produzem múltiplos valores (tipicamente, ao longo de uma faixa espectral) por tempo de amostragem ao longo da execução analítica.
Para visualizar dados 2D, a elaboração começa com a rasterização de um único período de modulação (ou ciclo) valores de dados como uma coluna de pixels (elementos de imagem correspondentes a eventos do detector). Ao longo da ordinação (eixo Y, de baixo para cima) o tempo de separação 2Dé visualizado. As colunas pixel são processadas sequencialmente para que a abscissa (eixo X, da esquerda para a direita) reporte tempo de separação 1D. Esta ordem apresenta os dados 2D em um sistema de coordenadas cartesiano destro, com o ordinal de retenção 1D como o primeiro índice na matriz.
O processamento de dados de cromatografias 2D dá acesso a um nível mais alto de informação do que os dados brutos, permitindo detecção de picos em 2D,identificação de pico, extração de dados de resposta para análise quantitativa e análises intercompativas.
Os padrões de pico 2D podem ser tratados como a impressão digital única da amostra e compostos detectados como características de minúcias para uma análise transversal eficaz. Esta abordagem, conhecida como impressão digital baseada em modelo6,7, foi inspirada na impressão digital biométrica6. Os sistemas automáticos de verificação de impressões digitais biométricas, na verdade, contam com características únicas da ponta dos dedos: bifurcações e terminações de cume, localizadas e extraídas de impressões com tinta ou imagens detalhadas. Essas características, denominadas características minúcias, são então combinadas com os modelos armazenados disponíveis8,9.
Como mencionado acima, cada padrão de separação GC×GC é composto de picos 2D racionalmente distribuídos sobre um plano bidimensional. Cada pico corresponde a um único analito, tem seu potencial informativo, e pode ser tratado como uma única característica para análise de padrões comparativos.
Aqui, apresentamos uma abordagem eficaz para impressão digital química pela GC×GC-TOF MS com ionização tandem. O objetivo é catalogar de forma abrangente e quantitativa os recursos de um conjunto de cromatogramas.
Em comparação com o software comercial existente ou rotinas internas10,11 que empregam uma abordagem de pico de recursos, a impressão digital baseada em modelo é caracterizada por alta especificidade, eficiência e tempo computacional limitado. Além disso, possui uma flexibilidade intrínseca que permite o alinhamento transversal das características da minúcia (ou seja, picos 2D) entre cromatógramas severamente desalinhados como os adquiridos por diferentes instrumentações ou em estudos de longo prazo12,13,14.
As operações básicas do método proposto são descritas brevemente para orientar o leitor a uma boa compreensão da complexidade do padrão 2De do poder da informação. Em seguida, explorando a matriz de dados de saída do instrumento, a identificação química é realizada e conhecidos analitos direcionados localizados sobre o espaço bidimensional. O modelo de picos direcionados é então construído e aplicado a uma série de cromatógrafos adquiridos dentro do mesmo lote analítico. Metadados relacionados aos tempos de retenção, assinaturas espectrais e respostas (absolutas e relativas) são extraídos de padrões relin alinhados de picos direcionados e adotados para revelar diferenças composicionais no conjunto amostral.
Como uma etapa adicional e única do processo, uma impressão digital combinada não direcionada e direcionada (UT) também é realizada em cromatógrafos pré-direcionados para estender o potencial de impressão digital a analitos conhecidos e desconhecidos. O processo produz um modelo UT para uma análise comparativa verdadeiramente abrangente que pode ser amplamente automatizada.
Como etapa final, o método realiza o cross-alignment de características em dois sinais de detector paralelo produzidos com energias de ionização eletrônica alta e baixa (70 e 12 eV).
O protocolo é bastante flexível em análises de suporte de um único cromatograma ou um conjunto de cromatgramas e com cromatografia variável e/ou detectores múltiplos. Aqui, o protocolo é demonstrado com um conjunto de software GC×GC (ver Tabela de materiais)combinado a uma biblioteca e software de pesquisa de MS (ver Tabela de Materiais). Algumas das ferramentas necessárias estão disponíveis em outros softwares e ferramentas similares poderiam ser implementadas independentemente a partir de descrições na literatura por Reichenbach e colegas de trabalho15,16,17,18,19. Os dados brutos para a demonstração são derivados de um estudo sobre óleo extravirgem de oliva (EVO) realizado no laboratório dos autores14. Em particular, a fração volátil (ou seja, volatilome) dos óleos evo italianos é amostrada por microextração de fase sólida do headspace (HS-SPME) e analisada por GC×GC-TOF MS para capturar impressões digitais diagnósticas para qualidade e qualificação sensorial das amostras. Detalhes sobre amostras, condições de amostragem e configuração analítica são fornecidos na Tabela de Materiais.
As etapas 1-6 descrevem o pré-processamento dos cromatógrafos. As etapas 7-9 descrevem o processamento e a análise de cromatogramas individuais. As etapas 10-12 descrevem a criação e correspondência do modelo, que são a base para a análise entre amostras. As etapas 13-16 descrevem a aplicação do protocolo em um conjunto de cromatógrafos, com etapas 14-16 para análise ut.
A visualização dos dados gc×GC-TOF MS é um passo fundamental para uma compreensão adequada dos resultados alcançados por separações bidimensionais abrangentes. Gráficos de imagem com coloração personalizada permitem aos analistas apreciar diferenças de resposta ao detector e, assim, a distribuição diferencial dos componentes amostrais. Essa abordagem visual muda completamente a perspectiva dos analistas sobre a interpretação e elaboração de cromatogramas. Este primeiro passo, uma vez compreendido e usado com confiança pelos cromatógrafos, abre uma nova perspectiva no processamento posterior.
Outro aspecto fundamental do processamento de dados é a acessibilidade à matriz completa de dados (ou seja, dados e respostas espectrais de MS) para todos os pontos amostrais, cada um dos quais corresponde a um único evento detector. Neste sentido, 2D picos de integração, de modo que a coleta de eventos detectores correspondentes a um único analito representam um passo crítico. No protocolo atual, a detecção de picos 2D é baseada no algoritmo da bacia hidrográfica18 com algumas adaptações incluídas para melhorar a sensibilidade de detecção em caso de compostos de co-eluição parcial. Para tornar esse processo mais específico, deve-se fazer a desconvolução e procedimentos mais sofisticados adotados. Isso é possível realizando uma detecção de pico de íons para dados de MS; o algoritmo processa o conjunto de dados e isola a resposta de analitos únicos com base nos perfis espectrais19,31.
Um passo importante, porém crítico, do protocolo, e de qualquer processo de interpretação de dados GC×GC-MS, diz respeito à identificação de analitos. Este procedimento, proposto nas etapas 8 e 9, na ausência de uma análise confirmatória com padrões autênticos, deve ser cuidadosamente conduzido pelo analista. Ações automatizadas estão disponíveis em qualquer software comercial; incluem avaliação de similaridade de assinatura espectral de MS em relação ao espectro de referência coletado (ou seja, bibliotecas espectrais) e avaliação de razões características entre íons qualificados/quantificadores. No entanto, são necessários critérios confirmatórios adicionais para desambiguar a identificação de isômeros. O protocolo propõe a adoção de índices de retenção linear para priorizar a lista de candidatos; o limite aqui diz respeito à disponibilidade de dados de retenção e sua consistência.
A principal característica que torna essa abordagem única é o modelo correspondente12,13,15,29. A correspondência de modelos permite o reconhecimento de padrão 2Dde forma muito eficaz, específica e intuitiva. Pode ser definido, em termos de sensibilidade e especificidade, aplicando valores de limiar personalizados e/ou funções de restrição, enquanto o analista pode supervisionar o procedimento interagindo ativamente com parâmetros de função de transformação. A peculiaridade desse processo baseia-se na possibilidade de cruzar informações de picos direcionados e não direcionados entre amostras de um lote uniforme, mas também entre amostras adquiridas com as mesmas condições nominais, apesar do desalinhamento médio-grave. As vantagens desta operação dizem respeito à possibilidade de preservar todas as identificações de analitos direcionados, que é uma tarefa demorada para o analista, e todos os metadados salvos para picos direcionados e não segmentados de sessões de elaboração anteriores.
A correspondência de modelos também é muito eficaz em termos de tempo computacional; Os arquivos de dados MS de baixa resolução consistem em cerca de 1-2 Gb de dados embalados, enquanto as análises de MS de alta resolução podem chegar a 10-15 Gb por execução analítica única. A correspondência de modelos não processa a matriz de dados completa todas as vezes, mas, a princípio, realiza o alinhamento do tempo de retenção entre os cromatógrafos usando picos de modelo, então, processa picos de candidatos dentro da janela de pesquisa para sua correspondência de semelhança com referência no modelo. Em caso de grave desalinhamento, a situação mais desafiadora, as transformações polinomiais globais de segunda ordem tiveram um desempenho melhor do que os métodos locais, reduzindo o tempo computacional13.
Para que a técnica GC×GC se espalhe amplamente além da academia e dos laboratórios de pesquisa, as ferramentas de processamento de dados devem facilitar operações básicas para visualização e inspeção de cromatógrafos; a identificação de analitos deve oferecer a possibilidade de adotar algoritmos e procedimentos padronizados (por exemplo, algoritmo de pesquisa NIST e calibração IT); e a análise interativo deve ser intuitiva, eficaz e suportada por ferramentas interativas. A abordagem proposta aborda essas necessidades ao mesmo tempo em que oferece opções e ferramentas avançadas para lidar com situações complexas, como co-elução de analitos, calibração de vários analitos, análise do tipo de grupo e alinhamento paralelo de detecção.
O poço de literatura referenciada abrange muitos cenários possíveis onde o GC×GC e, mais geralmente, a cromatografia bidimensional abrangente, oferecem soluções únicas e resultados confiáveis que não podem ser alcançados pela cromatografia 1D na análise de execução única. 5,32,33 Embora o GC×GC seja a ferramenta mais poderosa que aumenta a capacidade de separação e sensibilidade, há sempre limitações ao poder de separação, sensibilidade e outras capacidades sistêmicas. À medida que esses limites sistêmicos são abordados, a análise dos dados torna-se progressivamente mais difícil. Portanto, a pesquisa e o desenvolvimento devem continuar a melhorar as ferramentas analíticas à nossa disposição.
The authors have nothing to disclose.
A pesquisa foi apoiada por Progetto Ager − Fondazioni em rete per la ricerca agroalimentare. Projeto acrônimo Violino – Valorização de produtos de oliva italianos através de ferramentas analíticas inovadoras (https://olivoeolio.progettoager.it/index.php/i-progetti-olio-e-olivo/violin-valorization-of-italian-olive-products-through-innovative-analytical-tools/violin-il-progetto). O software GC Image está disponível para uma avaliação gratuita para leitores que desejam demonstrar e testar o protocolo.
1D SolGel-Wax column (100% polyethylene glycol; 30 m × 0.25 mm dc × 0.25 μm df). Carrier gas helium at a constant nominal flow of 1.3 mL/min. | Trajan SGE Analytical Science, Ringwood, Australia | PN 054796 | Carrier gas helium at a constant nominal flow of 1.3 mL/min. Oven temperature programming set as follows: 40°C (2 min) to 240°C (10 min) at 3.5°C/min. |
2D OV1701 column (86% polydimethylsiloxane, 7% phenyl, 7% cyanopropyl; 1 m × 0.1 mm dc × 0.10 μm df) from . | Mega, Legnano, Milan, Italy | PN MEGA-1701 | |
Automated system for sample preparation: SPR Autosampler for GC | SepSolve-Analytical, Llantrisant, UK | ||
Extra Virgin Olive oils: Sicily and Tuscany, Italy | Project VIOLIN (Ager – Fondazioni in rete per la ricerca agroalimentare) | Samples (n=10) were collected during the production year 2018 within the "Violin" project sampling campaign. Oils were submitted to HS-SPME to sample volatiles according to a reference protocol validated in a previous study of Stilo et al.14 | |
Gas chromatograph: Model 7890B GC | Agilent Technologies Wilmington DE, USA | ||
GC Image GC×GC edition V 2.9 | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Image processing software | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Mass spectrometer: BenchTOF-Select | Markes International Llantrisant, UK | ||
Methyl-2-octynoate (CAS 111-12-6) | Merck-Millipore/Supelco | PN: 68982 | |
Modulator controller: Optimode v2.0 | SRA Intruments, Cernusco sul Naviglio, Milan, Italy | ||
Modulator: KT 2004 loop type | Zoex Corporation Houston, TX, USA | ||
MS library and search software: NIST Library V 2017, Software V 2.3 | National Institute of Standards and Technology (NIST), Gaithersburg MD | https://www.nist.gov/srd/nist-standard-reference-database-1a-v17 | |
n-alkanes C8-C40 for retention indexing | Merck-Millipore/Supelco | PN: 40147-U | |
n-hexane (CAS 110-54-3) gas chromatography MS SupraSolv | Merck-Millipore/Supelco | PN: 100795 | |
Solid Phase Microextraction fiber | Merck-Millipore/Supelco | PN 57914-U | |
α- /β-thujone (CAS 546-80-5) | Merck-Millipore/Sigma Aldrich | PN: 04314 |