Ce protocole présente une approche pour prendre des empreintes digitales et explorer les données multidimensionnelles collectées par chromatographie en phase gazeuse bidimensionnelle complète couplée à la spectrométrie de masse. Des algorithmes de reconnaissance de formes dédiés (correspondance de modèles) sont appliqués pour explorer les informations chimiques cryptées dans la fraction volatile extra vierge de l’huile d’olive (c’est-à-dire le volatilome).
Le traitement et l’évaluation des données sont des étapes essentielles de la chromatographie en phase gazeuse bidimensionnelle complète (GCxGC), en particulier lorsqu’elles sont couplées à la spectrométrie de masse. Les informations riches chiffrées dans les données peuvent être très précieuses mais difficiles d’accès efficacement. La densité et la complexité des données peuvent entraîner de longs délais d’élaboration et nécessiter des procédures laborieuses et dépendantes des analystes. Des outils de traitement des données efficaces mais accessibles sont donc essentiels pour permettre la diffusion et l’acceptation de cette technique multidimensionnelle avancée dans les laboratoires pour une utilisation quotidienne. Le protocole d’analyse de données présenté dans ce travail utilise l’empreinte digitale chromatographique et l’appariement de modèles pour atteindre l’objectif de déconstruction hautement automatisée de chromatogrammes bidimensionnels complexes en caractéristiques chimiques individuelles pour une reconnaissance avancée des modèles informatifs dans les chromatogrammes individuels et dans les ensembles de chromatogrammes. Le protocole offre une cohérence et une fiabilité élevées avec peu d’intervention. Dans le même temps, la supervision des analystes est possible dans une variété de contextes et de fonctions de contrainte qui peuvent être personnalisées pour offrir la flexibilité et la capacité de s’adapter à différents besoins et objectifs. La correspondance de modèle est montrée ici comme une approche puissante pour explorer le volatilome extra vierge de l’huile d’olive. L’alignement croisé des pics est effectué non seulement pour des cibles connues, mais également pour des composés non ciblés, ce qui augmente considérablement la puissance de caractérisation pour un large éventail d’applications. Des exemples sont présentés pour prouver la performance pour la classification et la comparaison des modèles chromatographiques à partir d’ensembles d’échantillons analysés dans des conditions similaires.
La chromatographie en phase gazeuse bidimensionnelle complète combinée à la détection spectrométrique de masse en temps de vol (GC×GC-TOF MS) est aujourd’hui l’approche analytique la plus informative pour la caractérisation chimique d’échantillons complexes1,2,3,4,5. Dans GC×GC, les colonnes sont connectées en série et interfacées par un modulateur (p. ex., une interface de mise au point thermique ou basée sur une vanne) qui emprisonne les composants élués de la première colonne de dimension(1D) avant leur réinfiltration dans la deuxième colonne de dimension(2D). Cette opération est effectuée dans un délai de modulation fixe(PM),généralement compris entre 0,5 et 8 s. Par modulation thermique, le processus comprend le cryo-piégeage et la mise au point de la bande d’élution avec certains avantages pour la puissance de séparation globale.
Bien que GC×GC soit une technique de séparation bidimensionnelle, le processus produit des valeurs de données séquentielles. Le convertisseur analogique-numérique (A/N) du détecteur obtient le signal chromatographique de sortie à une certaine fréquence. Ensuite, les données sont stockées dans des formats propriétaires spécifiques qui contiennent non seulement les données numérisées, mais aussi les métadonnées connexes (informations sur les données). Le convertisseur A/N utilisé dans les systèmes GC×GC aide à mapper l’intensité du signal chromatographique à un nombre numérique (DN) en fonction du temps dans les deux dimensions analytiques. Les détecteurs à canal unique (p. ex. détecteur à ionisation de flamme (FID), détecteur à capture d’électrons (ECD), détecteur à chimiluminescence de soufre (SCD), etc.) produisent des valeurs uniques par temps d’échantillonnage, tandis que les détecteurs multicanaux (p. ex. détecteur spectrométrique de masse (MS)) produisent plusieurs valeurs (généralement sur une plage spectrale) par temps d’échantillonnage tout au long de l’analyse.
Pour visualiser les données 2D,l’élaboration commence par la rastérisation d’une seule période de modulation (ou cycle) valeurs de données sous la forme d’une colonne de pixels (éléments d’image correspondant à des événements de détecteur). Le long de l’ordonnée (axe Y, de bas en haut), le temps de séparation 2Dest visualisé. Les colonnes de pixels sont traitées séquentiellement afin que l’abscisse (axe X, de gauche à droite) signale le temps de séparation 1D. Cet ordre présente les données 2Ddans un système de coordonnées cartésiennes droitiers, avec l’ordinal de rétention 1Dcomme premier index dans le tableau.
Le traitement des données des chromatogrammes 2Ddonne accès à un niveau d’information plus élevé que les données brutes, ce qui permet la détection des pics 2D,l’identification des pics, l’extraction des données de réponse pour l’analyse quantitative et l’analyse comparative croisée.
Les modèles de crête 2Dpeuvent être traités comme l’empreinte digitale unique de l’échantillon et les composés détectés comme des caractéristiques de minutie pour une analyse comparative croisée efficace. Cette approche, connue sous le nom de prise d’empreintes digitales basée sur un modèle6,7, a été inspirée par l’empreinte digitale biométrique6. Les systèmes automatiques de vérification biométrique des empreintes digitales reposent en fait sur des caractéristiques uniques du bout des doigts: bifurcations et terminaisons de crête, localisées et extraites d’impressions encrées ou d’images détaillées. Ces caractéristiques, appelées minuties features, sont ensuite croisées avec les modèles stockés disponibles8,9.
Comme mentionné ci-dessus, chaque modèle de séparation GC×GC est composé de pics 2D répartis rationnellement sur un plan bidimensionnel. Chaque pic correspond à un seul analyte, a son potentiel informatif et peut être traité comme une caractéristique unique pour l’analyse comparative des modèles.
Ici, nous présentons une approche efficace pour l’empreinte chimique par GC×GC-TOF MS avec l’ionisation en tandem. L’objectif est de cataloguer de manière complète et quantitative les entités à partir d’un ensemble de chromatogrammes.
Par rapport aux logiciels commerciaux existants ou aux routines internes10,11 qui utilisent une approche de fonctionnalités de pointe, la prise d’empreintes digitales basée sur un modèle se caractérise par une spécificité élevée, une efficacité et un temps de calcul limité. En outre, il dispose d’une flexibilité intrinsèque qui permet l’alignement croisé des caractéristiques de minutie (c’est-à-dire des pics de 2D) entre les chromatogrammes gravement mal alignés comme ceux acquis par différentes instrumentations ou dans des études à long terme12,13,14.
Les opérations de base de la méthode proposée sont décrites brièvement pour guider le lecteur vers une bonne compréhension de la complexité du modèle 2Det de la puissance de l’information. Ensuite, en explorant la matrice de données de sortie de l’instrument, l’identification chimique est effectuée et des analytes ciblés connus sont situés sur l’espace bidimensionnel. Le modèle de pics ciblés est ensuite construit et appliqué à une série de chromatogrammes acquis au sein d’un même lot analytique. Les métadonnées relatives aux temps de rétention, aux signatures spectrales et aux réponses (absolues et relatives) sont extraites des modèles réalignés des pics ciblés et adoptées pour révéler les différences de composition dans l’ensemble d’échantillons.
En tant qu’étape supplémentaire et unique du processus, une prise d’empreintes digitales combinée non ciblée et ciblée (UT) est également effectuée sur des chromatogrammes pré-ciblés pour étendre le potentiel d’empreintes digitales aux analytes connus et inconnus. Le processus produit un modèle UT pour une analyse comparative vraiment complète qui peut être largement automatisée.
En dernière étape, la méthode effectue l’alignement croisé des caractéristiques dans deux signaux de détecteur parallèles produits avec des énergies d’ionisation électronique élevées et faibles (70 et 12 eV).
Le protocole est assez flexible dans les analyses de support d’un seul chromatogramme ou d’un ensemble de chromatogrammes et avec la chromatographie variable et/ou plusieurs détecteurs. Ici, le protocole est démontré avec une suite logicielle GC×GC disponible dans le commerce (voir le tableau des matériaux) combinée à une bibliothèque MS et à un logiciel de recherche (voir le tableau des matériaux). Certains des outils nécessaires sont disponibles dans d’autres logiciels et des outils similaires pourraient être mis en œuvre indépendamment des descriptions dans la littérature par Reichenbach et ses collègues15,16,17,18,19. Les données brutes pour la démonstration sont dérivées d’une étude de recherche sur l’huile d’olive extra vierge (EVO) menée dans le laboratoire des auteurs14. En particulier, la fraction volatile (c’est-à-dire le volatilome) des huiles EVO italiennes est échantillonnée par microextraction en phase solide dans l’espace libre (HS-SPME) et analysée par GC×GC-TOF MS pour capturer les empreintes diagnostiques pour la qualité et la qualification sensorielle des échantillons. Des détails sur les échantillons, les conditions d’échantillonnage et la structure analytique sont fournis dans la table des matières.
Les étapes 1 à 6 décrivent le prétraitement des chromatogrammes. Les étapes 7 à 9 décrivent le traitement et l’analyse des chromatogrammes individuels. Les étapes 10 à 12 décrivent la création et l’appariement des modèles, qui constituent la base de l’analyse des échantillons croisés. Les étapes 13 à 16 décrivent l’application du protocole à un ensemble de chromatogrammes, avec les étapes 14 à 16 pour l’analyse UT.
La visualisation des données gc×GC-TOF ms est une étape fondamentale pour une compréhension appropriée des résultats obtenus par des séparations bidimensionnelles complètes. Les tracés d’images avec colorisation personnalisée permettent aux analystes d’apprécier les différences de réponse des détecteurs et donc la distribution différentielle des composants de l’échantillon. Cette approche visuelle change complètement le point de vue des analystes sur l’interprétation et l’élaboration des chromatogrammes. Cette première étape, une fois comprise et utilisée avec confiance par les chromatographes, ouvre une nouvelle perspective dans la poursuite du traitement.
Un autre aspect fondamental du traitement des données est l’accessibilité à la matrice de données complète (c.-à-d. les données spectrales et les réponses ms) pour tous les points d’échantillonnage, chacun d’eux correspondant à un seul événement de détecteur. A cet égard, 2D pics d’intégration, de sorte que la collecte des événements de détecteur correspondant à un seul analyte représente une étape critique. Dans le protocole actuel, la détection des pics 2D est basée sur l’algorithme de bassin versant18 avec quelques adaptations incluses pour améliorer la sensibilité de détection en cas de composés de co-élution partielle. Pour rendre ce processus plus spécifique, il faut procéder à la déconvolution et adopter des procédures plus sophistiquées. Ceci est possible en effectuant une détection de pic d’ions pour les données MS; l’algorithme traite le tableau de données et isole la réponse à partir d’analytes simples en fonction des profils spectraux19,31.
Une étape importante mais critique du protocole, et de tout processus d’interprétation des données GC×GC-MS, concerne l’identification des analytes. Cette procédure, proposée aux étapes 8 et 9, en l’absence d’une analyse de confirmation avec des normes authentiques, doit être menée avec soin par l’analyste. Des actions automatisées sont disponibles dans n’importe quel logiciel commercial; ils comprennent l’évaluation de la similarité des signatures spectrales MS par rapport aux spectres de référence collectés (c’est-à-dire les bibliothèques spectrales) et l’évaluation des rapports caractéristiques entre les ions qualificatifs/quantificateurs. Cependant, des critères de confirmation supplémentaires sont nécessaires pour lever l’ambiguïté de l’identification des isomères. Le protocole propose l’adoption d’indices de rétention linéaires pour hiérarchiser la liste des candidats; la limite ici concerne la disponibilité des données de conservation et leur cohérence.
La principale caractéristique qui rend cette approche unique est la correspondance de modèle12,13,15,29. La correspondance de modèles permet la reconnaissance de formes 2Dde manière très efficace, spécifique et intuitive. Il peut être défini, en termes de sensibilité et de spécificité, en appliquant des valeurs de seuil personnalisées et/ou des fonctions de contrainte tandis que l’analyste peut superviser la procédure en interagissant activement avec les paramètres de la fonction de transformation. La particularité de ce procédé repose sur la possibilité de croiser les informations de pics ciblés et non ciblés entre les échantillons d’un lot uniforme mais aussi entre les échantillons acquis dans les mêmes conditions nominales malgré un désalignement moyen à grave. Les avantages de cette opération sont liés à la possibilité de préserver toutes les identifications d’analytes ciblés, ce qui est une tâche fastidieuse pour l’analyste, et toutes les métadonnées enregistrées pour les pics ciblés et non ciblés des sessions d’élaboration précédentes.
La correspondance de modèle est également très efficace en termes de temps de calcul; les fichiers de données MS basse résolution se composent d’environ 1 à 2 Go de données compressées, tandis que les analyses MS haute résolution peuvent atteindre 10 à 15 Go par seule exécution analytique. La correspondance de modèle ne traite pas la matrice de données complète à chaque fois mais, dans un premier temps, effectue l’alignement du temps de rétention entre les chromatogrammes à l’aide de pics de modèle, puis traite les pics candidats dans la fenêtre de recherche pour leur correspondance de similarité avec la référence dans le modèle. En cas de désalignement grave, la situation la plus difficile, les transformations polynomiales globales du second ordre ont été plus performantes que les méthodes locales tout en réduisant le temps de calcul13.
Pour que la technique GC×GC se répande largement au-delà du milieu universitaire et des laboratoires de recherche, les outils de traitement des données doivent faciliter les opérations de base pour la visualisation et l’inspection des chromatogrammes; l’identification des analytes devrait offrir la possibilité d’adopter des algorithmes et des procédures normalisés (p. ex., l’algorithme de recherche NIST et l’étalonnage IT); et l’analyse comparative croisée devrait être intuitive, efficace et appuyée par des outils interactifs. L’approche proposée répond à ces besoins tout en offrant des options et des outils avancés pour faire face à des situations complexes telles que la co-élution des analytes, l’étalonnage de plusieurs analytes, l’analyse de type groupe et l’alignement de détection parallèle.
La littérature référencée couvre bien de nombreux scénarios possibles où gc×GC et, plus généralement, chromatographie bidimensionnelle complète, offrent des solutions uniques et des résultats fiables qui ne peuvent pas être obtenus par 1D-chromatographie en une seule fois. 5,32,33 Bien que le GC×GC soit l’outil le plus puissant qui augmente la capacité de séparation et la sensibilité, il y a toujours des limites au pouvoir de séparation, à la sensibilité et à d’autres capacités systémiques. À mesure que ces limites systémiques sont approchées, l’analyse des données devient de plus en plus difficile. Par conséquent, la recherche et le développement doivent continuer à améliorer les outils d’analyse à notre disposition.
The authors have nothing to disclose.
La recherche a été soutenue par Progetto Ager − Fondazioni in rete per la ricerca agroalimentare. Acronyme du projet Violon – Valorisation des produits oléicoles italiens grâce à des outils d’analyse innovants (https://olivoeolio.progettoager.it/index.php/i-progetti-olio-e-olivo/violin-valorization-of-italian-olive-products-through-innovative-analytical-tools/violin-il-progetto). Le logiciel GC Image est disponible pour un essai gratuit pour les lecteurs qui souhaitent démontrer et tester le protocole.
1D SolGel-Wax column (100% polyethylene glycol; 30 m × 0.25 mm dc × 0.25 μm df). Carrier gas helium at a constant nominal flow of 1.3 mL/min. | Trajan SGE Analytical Science, Ringwood, Australia | PN 054796 | Carrier gas helium at a constant nominal flow of 1.3 mL/min. Oven temperature programming set as follows: 40°C (2 min) to 240°C (10 min) at 3.5°C/min. |
2D OV1701 column (86% polydimethylsiloxane, 7% phenyl, 7% cyanopropyl; 1 m × 0.1 mm dc × 0.10 μm df) from . | Mega, Legnano, Milan, Italy | PN MEGA-1701 | |
Automated system for sample preparation: SPR Autosampler for GC | SepSolve-Analytical, Llantrisant, UK | ||
Extra Virgin Olive oils: Sicily and Tuscany, Italy | Project VIOLIN (Ager – Fondazioni in rete per la ricerca agroalimentare) | Samples (n=10) were collected during the production year 2018 within the "Violin" project sampling campaign. Oils were submitted to HS-SPME to sample volatiles according to a reference protocol validated in a previous study of Stilo et al.14 | |
Gas chromatograph: Model 7890B GC | Agilent Technologies Wilmington DE, USA | ||
GC Image GC×GC edition V 2.9 | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Image processing software | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Mass spectrometer: BenchTOF-Select | Markes International Llantrisant, UK | ||
Methyl-2-octynoate (CAS 111-12-6) | Merck-Millipore/Supelco | PN: 68982 | |
Modulator controller: Optimode v2.0 | SRA Intruments, Cernusco sul Naviglio, Milan, Italy | ||
Modulator: KT 2004 loop type | Zoex Corporation Houston, TX, USA | ||
MS library and search software: NIST Library V 2017, Software V 2.3 | National Institute of Standards and Technology (NIST), Gaithersburg MD | https://www.nist.gov/srd/nist-standard-reference-database-1a-v17 | |
n-alkanes C8-C40 for retention indexing | Merck-Millipore/Supelco | PN: 40147-U | |
n-hexane (CAS 110-54-3) gas chromatography MS SupraSolv | Merck-Millipore/Supelco | PN: 100795 | |
Solid Phase Microextraction fiber | Merck-Millipore/Supelco | PN 57914-U | |
α- /β-thujone (CAS 546-80-5) | Merck-Millipore/Sigma Aldrich | PN: 04314 |