Questo protocollo presenta un approccio alle impronte digitali ed esplora i dati multidimensionali raccolti dalla gascromatografia bidimensionale completa accoppiata alla spettrometria di massa. Algoritmi di riconoscimento dei modelli dedicati (corrispondenza dei modelli) vengono applicati per esplorare le informazioni chimiche crittografate nella frazione volatile dell’olio extravergine di oliva (cioè volatilome).
L’elaborazione e la valutazione dei dati sono fasi critiche della gascromatografia bidimensionale completa (GCxGC), in particolare se accoppiate alla spettrometria di massa. Le informazioni dettagliate crittografate nei dati possono essere molto preziose ma di difficile accesso in modo efficiente. La densità e la complessità dei dati possono portare a lunghi tempi di elaborazione e richiedere procedure laboriose e dipendenti dagli analisti. Strumenti efficaci ma accessibili per l’elaborazione dei dati sono quindi fondamentali per consentire la diffusione e l’accettazione di questa tecnica multidimensionale avanzata nei laboratori per l’uso quotidiano. Il protocollo di analisi dei dati presentato in questo lavoro utilizza il rilevamento cromatografico delle impronte digitali e la corrispondenza dei modelli per raggiungere l’obiettivo di decostruzione altamente automatizzata di cromatogrammi bidimensionali complessi in singole caratteristiche chimiche per il riconoscimento avanzato di modelli informativi all’interno di singoli cromatogrammi e attraverso insiemi di cromatogrammi. Il protocollo offre elevata coerenza e affidabilità con poco intervento. Allo stesso tempo, la supervisione degli analisti è possibile in una varietà di impostazioni e funzioni di vincolo che possono essere personalizzate per fornire flessibilità e capacità di adattarsi alle diverse esigenze e obiettivi. La corrispondenza dei modelli è mostrata qui come un potente approccio per esplorare l’olio extravergine di oliva volatilome. Il cross-alignment dei picchi viene eseguito non solo per obiettivi noti, ma anche per composti non bersaglio, il che aumenta significativamente la potenza di caratterizzazione per una vasta gamma di applicazioni. Esempi sono presentati per la prova delle prestazioni per la classificazione e il confronto di modelli cromatografici da set di campioni analizzati in condizioni simili.
La gascromatografia bidimensionale completa combinata con il rilevamento spettrometrico di massa a tempo di volo (GC×GC-TOF MS) è oggi l’approccio analitico più informativo per la caratterizzazionechimica di campioni complessi 1,2,3,4,5. In GC×GC, le colonne sono collegate in serie e interfacciate da un modulatore (ad esempio, un’interfaccia di messa a fuoco termica o basata su valvole) che intrappola i componenti di eluizione dalla prima colonna di dimensione(1D) prima della loro reiezione nella colonna della seconda dimensione(2D). Questa operazione viene eseguita entro un periodo di tempo di modulazione fisso (PM), generalmente compreso tra 0,5 e 8 s. Con la modulazione termica, il processo include la crio-intrappolamento e la messa a fuoco della banda di eluizione con alcuni vantaggi per la potenza di separazione complessiva.
Sebbene GC×GC sia una tecnica di separazione bidimensionale, il processo produce valori di dati sequenziali. Il convertitore analogico-digitale (A/D) del rivelatore ottiene l’uscita del segnale cromatografico ad una certa frequenza. Quindi, i dati vengono memorizzati in specifici formati proprietari che non solo contengono i dati digitalizzati ma anche i metadati correlati (informazioni sui dati). Il convertitore A/D impiegato nei sistemi GC×GC aiuta a mappare l’intensità del segnale cromatografico a un numero digitale (DN) in funzione del tempo nelle due dimensioni analitiche. I rivelatori a canale singolo (ad esempio, rivelatore di ionizzazione di fiamma (FID), rivelatore di cattura elettronica (ECD), rivelatore di chemiluminescenza dello zolfo (SCD), ecc.) producono valori singoli per tempo di campionamento, mentre i rivelatori multicanale (ad esempio, rivelatore spettrometrico di massa (MS)) producono valori multipli (tipicamente, su un intervallo spettrale) per tempo di campionamento lungo la corsa analitica.
Per visualizzare i dati 2D,l’elaborazione inizia con la rasterizzazione di un singolo periodo di modulazione (o ciclo) dei valori di dati come colonna di pixel (elementi immagine corrispondenti agli eventi del rivelatore). Lungo l’ordinata (asse Y, dal basso verso l’alto) viene visualizzato il tempo di separazione 2D. Le colonne pixel vengono elaborate in sequenza in modo che l’ascissa (asse X, da sinistra a destra) rapporti 1 tempodi separazione D. Questo ordinamento presenta i dati 2Din un sistema di coordinate cartesiano destrorso, con l’ordinale diconservazione 1 D come primo indice nell’array.
L’elaborazione dei dati dei cromatogrammi 2Dconsente di accedere a un livello di informazioni più elevato rispetto ai dati grezzi, consentendo il rilevamento dei picchi 2D,l’identificazione dei picchi, l’estrazione dei dati di risposta per l’analisi quantitativa e l’analisi comparativa incrociata.
I modelli di picco 2Dpossono essere trattati come l’impronta digitale unica del campione e i composti rilevati come caratteristiche minuzie per un’efficace analisi comparativa incrociata. Questo approccio, noto come fingerprinting basato su modelli6,7,è stato ispirato dal rilevamento biometrico delle improntedigitali 6. I sistemi automatici di verifica biometrica delle impronte digitali, infatti, si basano su caratteristiche uniche della punta delle dita: biforcazioni e finali di cresta, localizzate ed estratte da impressioni inchiostrate o immagini dettagliate. Queste caratteristiche, denominate funzionalità delle minuzie, vengono quindi abbinate ai modelli memorizzatidisponibili 8,9.
Come accennato in precedenza, ogni modello di × GC×GC è composto da picchi 2D distribuiti razionalmente su un piano bidimensionale. Ogni picco corrisponde a un singolo alyte, ha il suo potenziale informativo e può essere trattato come una singola caratteristica per l’analisi comparativa dei modelli.
Qui presentiamo un approccio efficace per il rilevamento delle impronte digitali chimiche da parte di GC×GC-TOF MS con ionizzazione tandem. L’obiettivo è catalogare in modo completo e quantitativo le funzionalità da un set di cromatogrammi.
Rispetto al software commerciale esistente o alle routine internamente10,11 cheutilizzano un approccio basato sulle funzionalità di picco, il fingerprinting basato su modelli è caratterizzato da un’elevata specificità, efficienza e tempo computazionale limitato. Inoltre, ha una flessibilità intrinseca che consente il cross-alignment delle caratteristiche di minuzia (cioè picchi 2D) tra cromatogrammi gravemente disallineati come quelli acquisiti da diversa strumentazione o in studi a lungo termine12,13,14.
Le operazioni di base del metodo proposto sono descritte brevemente per guidare il lettore verso una buona comprensione della complessità e del potere informativodel modello 2D. Quindi, esplorando la matrice di dati di uscita dello strumento, viene eseguita l’identificazione chimica e vengono conosciuti gli aliti mirati situati nello spazio bidimensionale. Il modello di picchi mirati viene quindi costruito e applicato a una serie di cromatogrammi acquisiti all’interno dello stesso lotto analitico. I metadati relativi ai tempi di conservazione, alle firme spettrali e alle risposte (assoluti e relativi) vengono estratti da modelli di picchi mirati ri-allineati e adottati per rivelare differenze compositive nel set di campioni.
Come ulteriore fase unica del processo, un rilevamento combinato delle impronte digitali non mirato e mirato (UT) viene eseguito anche su cromatogrammi pre-mirati per estendere il potenziale di rilevamento delle impronte digitali ad aaliti noti e sconosciuti. Il processo produce un modello UT per un’analisi comparativa davvero completa che può essere ampiamente automatizzata.
Come fase finale, il metodo esegue il cross-alignment delle caratteristiche in due segnali rivelatori paralleli prodotti con alte e basse energie di ionizzazione elettronica (70 e 12 eV).
Il protocollo è abbastanza flessibile nel supportare le analisi di un singolo cromatogramma o di un insieme di cromatogrammi e con cromatografia variabile e /o rivelatori multipli. Qui, il protocollo viene dimostrato con una suite software GC×GC disponibile in commercio (vedere Tabella dei materiali) combinata con una libreria MS e un software di ricerca (vedere Table of Materials). Alcuni degli strumenti necessari sono disponibili in altri software e strumenti simili potrebbero essere implementati indipendentemente dalle descrizioni in letteratura di Reichenbach e colleghi15,16,17,18,19. I dati grezzi per la dimostrazione derivano da uno studio di ricerca sull’olio extravergine di oliva (EVO) condotto nel laboratorio degli autori14. In particolare, la frazione volatile (cioè volatilome) degli oli EVO italiani viene campiozzata per microesezione in fase solida headspace (HS-SPME) e analizzata da GC×GC-TOF MS per acquisire impronte diagnostiche per la qualità e la qualificazione sensoriale dei campioni. I dettagli sui campioni, le condizioni di campionamento e l’insieme analitico sono forniti nella tabella dei materiali.
I passaggi da 1 a 6 descrivono la pre-elaborazione dei cromatogrammi. I passaggi da 7 a 9 descrivono l’elaborazione e l’analisi dei singoli cromatogrammi. I passaggi da 10 a 12 descrivono la creazione e la corrispondenza dei modelli, che sono la base per l’analisi tra campioni. I passaggi da 13 a 16 descrivono l’applicazione del protocollo su un insieme di cromatogrammi, con i passaggi da 14 a 16 per l’analisi UT.
La visualizzazione dei dati GC×GC-TOF MS è un passaggio fondamentale per un’adeguata comprensione dei risultati ottenuti da separazioni bidimensionali complete. I grafici di immagini con colorazione personalizzata consentono agli analisti di apprezzare le differenze di risposta del rivelatore e quindi la distribuzione differenziale dei componenti del campione. Questo approccio visivo cambia completamente la prospettiva degli analisti sull’interpretazione e l’elaborazione dei cromatogrammi. Questo primo passo, una volta compreso e utilizzato con sicurezza dai cromatografi, apre una nuova prospettiva nell’ulteriore elaborazione.
Un altro aspetto fondamentale dell’elaborazione dei dati è l’accessibilità alla matrice di dati completa (cioè dati spettrali MS e risposte) per tutti i punti campione, ognuno dei quali corrisponde a un singolo evento rivelatore. A questo proposito, 2D raggiunge il picco di integrazione, in modo che la raccolta di eventi rivelatori corrispondenti a un singolo alita rappresenti un passo critico. Nel protocollo attuale, il rilevamento dei picchi 2Dsi basa sull’algoritmospartiacque 18 con alcuni adattamenti inclusi per migliorare la sensibilità di rilevamento in caso di composti co-eluizzanti parziali. Per rendere questo processo più specifico, è necessario effettuare la deconvoluzione e adottare procedure più sofisticate. Ciò è possibile eseguendo un rilevamento del picco ionici per i dati MS; l’algoritmo elabora la matrice di dati e isola la risposta da singoli aliti in base ai profilispettrali 19,31.
Un passaggio importante ma critico del protocollo e di qualsiasi processo di interpretazione dei dati GC×GC-MS, riguarda l’identificazione degli aaliti. Questa procedura, proposta nelle fasi 8 e 9, in assenza di un’analisi di conferma con standard autentici, deve essere condotta con attenzione dall’analista. Le azioni automatizzate sono disponibili in qualsiasi software commerciale; includono la valutazione della somiglianza della firma spettrale MS rispetto agli spettri di riferimento raccolti (cioè le librerie spettrali) e la valutazione dei rapporti caratteristici tra gli ioni qualificatore/quantificatore. Tuttavia, sono necessari ulteriori criteri di conferma per disambiguare l’identificazione degli isomeri. Il protocollo propone l’adozione di indici di conservazione lineare per dare priorità all’elenco dei candidati; il limite qui riguarda la disponibilità dei dati di conservazione e la loro coerenza.
La caratteristica principale che rende unico questo approccio è la corrispondenza deimodelli 12,13,15,29. La corrispondenza dei modelli consente il riconoscimento del modello 2Din modo molto efficace, specifico e intuitivo. Può essere impostato, in termini di sensibilità e specificità, applicando valori soglia personalizzati e/o funzioni di vincolo mentre l’analista può supervisionare la procedura interagendo attivamente con i parametri della funzione di trasformazione. La particolarità di questo processo si basa sulla possibilità di incrociare le informazioni sui picchi mirati e non mirati tra campioni di un lotto uniforme ma anche tra campioni acquisiti con le stesse condizioni nominali nonostante il disallineamento medio-grave. I vantaggi di questa operazione riguardano la possibilità di preservare tutte le identificazioni degli aaliti mirati, che è un’attività dispendiosa in termini di tempo per l’analista, e tutti i metadati salvati per picchi mirati e non mirati dalle sessioni di elaborazione precedenti.
La corrispondenza dei modelli è anche molto efficace in termini di tempo computazionale; I file di dati MS a bassa risoluzione sono costituiti da circa 1-2 Gb di dati imballati, mentre le analisi MS ad alta risoluzione possono raggiungere i 10-15 Gb per singola esecuzione analitica. La corrispondenza dei modelli non elabora ogni volta la matrice di dati completa, ma, all’inizio, esegue l’allineamento del tempo di conservazione tra i cromatogrammi utilizzando i picchi dei modelli, quindi elabora i picchi dei candidati all’interno della finestra di ricerca per la corrispondenza di somiglianza con il riferimento nel modello. In caso di grave disallineamento, la situazione più impegnativa, le trasformazioni polinomiali globali di secondo ordine hanno funzionato meglio dei metodi locali riducendo al contempo il tempo computazionale13.
Affinché la tecnica GC×GC si diffonda ampiamente oltre il mondo accademico e i laboratori di ricerca, gli strumenti di elaborazione dei dati devono facilitare le operazioni di base per la visualizzazione e l’ispezione dei cromatogrammi; l’identificazione degli aaliti dovrebbe offrire la possibilità di adottare algoritmi e procedure standardizzati (ad esempio, algoritmo di ricerca NIST e calibrazione IT); e l’analisi comparativa dovrebbe essere intuitiva, efficace e supportata da strumenti interattivi. L’approccio proposto risponde a queste esigenze offrendo al contempo opzioni e strumenti avanzati per affrontare situazioni complesse come la co-eluizione degli aliti, la calibrazione di aliti multipli, l’analisi di tipo gruppo e l’allineamento del rilevamento parallelo.
La letteratura referenziata copre bene molti possibili scenari in cui GC×GC e, più in generale, cromatografia bidimensionale completa, offrono soluzioni uniche e risultati affidabili che non possono essere raggiunti da 1cromatografia D nell’analisi a esecuzione singola. 5,32,33 Sebbene GC×GC sia lo strumento più potente che aumenta la capacità di separazione e la sensibilità, ci sono sempre limitazioni alla potenza di separazione, alla sensibilità e ad altre capacità sistemiche. Con l’avvicinarsi di questi limiti sistemici, l’analisi dei dati diventa progressivamente più difficile. Pertanto, la ricerca e lo sviluppo devono continuare a migliorare gli strumenti analitici a nostra disposizione.
The authors have nothing to disclose.
La ricerca è stata sostenuta da Progetto Ager − Fondazioni in rete per la ricerca agroalimentare. Acronimo di progetto Violin – Valorizzazione degli olivi italiani attraverso strumenti analitici innovativi (https://olivoeolio.progettoager.it/index.php/i-progetti-olio-e-olivo/violin-valorization-of-italian-olive-products-through-innovative-analytical-tools/violin-il-progetto). Il software GC Image è disponibile per una prova gratuita per i lettori che desiderano dimostrare e testare il protocollo.
1D SolGel-Wax column (100% polyethylene glycol; 30 m × 0.25 mm dc × 0.25 μm df). Carrier gas helium at a constant nominal flow of 1.3 mL/min. | Trajan SGE Analytical Science, Ringwood, Australia | PN 054796 | Carrier gas helium at a constant nominal flow of 1.3 mL/min. Oven temperature programming set as follows: 40°C (2 min) to 240°C (10 min) at 3.5°C/min. |
2D OV1701 column (86% polydimethylsiloxane, 7% phenyl, 7% cyanopropyl; 1 m × 0.1 mm dc × 0.10 μm df) from . | Mega, Legnano, Milan, Italy | PN MEGA-1701 | |
Automated system for sample preparation: SPR Autosampler for GC | SepSolve-Analytical, Llantrisant, UK | ||
Extra Virgin Olive oils: Sicily and Tuscany, Italy | Project VIOLIN (Ager – Fondazioni in rete per la ricerca agroalimentare) | Samples (n=10) were collected during the production year 2018 within the "Violin" project sampling campaign. Oils were submitted to HS-SPME to sample volatiles according to a reference protocol validated in a previous study of Stilo et al.14 | |
Gas chromatograph: Model 7890B GC | Agilent Technologies Wilmington DE, USA | ||
GC Image GC×GC edition V 2.9 | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Image processing software | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Mass spectrometer: BenchTOF-Select | Markes International Llantrisant, UK | ||
Methyl-2-octynoate (CAS 111-12-6) | Merck-Millipore/Supelco | PN: 68982 | |
Modulator controller: Optimode v2.0 | SRA Intruments, Cernusco sul Naviglio, Milan, Italy | ||
Modulator: KT 2004 loop type | Zoex Corporation Houston, TX, USA | ||
MS library and search software: NIST Library V 2017, Software V 2.3 | National Institute of Standards and Technology (NIST), Gaithersburg MD | https://www.nist.gov/srd/nist-standard-reference-database-1a-v17 | |
n-alkanes C8-C40 for retention indexing | Merck-Millipore/Supelco | PN: 40147-U | |
n-hexane (CAS 110-54-3) gas chromatography MS SupraSolv | Merck-Millipore/Supelco | PN: 100795 | |
Solid Phase Microextraction fiber | Merck-Millipore/Supelco | PN 57914-U | |
α- /β-thujone (CAS 546-80-5) | Merck-Millipore/Sigma Aldrich | PN: 04314 |