Este protocolo presenta un enfoque para la huella digital y explorar los datos multidimensionales recogidos por la cromatografía de gases bidimensional integral acoplada a la espectrometría de masas. Los algoritmos de reconocimiento de patrones dedicados (coincidencia de plantillas) se aplican para explorar la información química cifrada en la fracción volátil del aceite de oliva virgen extra (es decir, volatilome).
El procesamiento y la evaluación de datos son pasos críticos de la cromatografía de gases bidimensional integral (GCxGC), particularmente cuando se acoplan a la espectrometría de masas. La rica información cifrada en los datos puede ser muy valiosa pero difícil de acceder de manera eficiente. La densidad y complejidad de los datos pueden conducir a largos tiempos de elaboración y requerir procedimientos laboriosos y dependientes de los analistas. Por lo tanto, las herramientas de procesamiento de datos eficaces pero accesibles son clave para permitir la difusión y aceptación de esta técnica multidimensional avanzada en los laboratorios para su uso diario. El protocolo de análisis de datos presentado en este trabajo utiliza huellas dactilares cromatográficas y coincidencia de plantillas para lograr el objetivo de la deconstrucción altamente automatizada de cromatogramas bidimensionales complejos en características químicas individuales para el reconocimiento avanzado de patrones informativos dentro de cromatogramas individuales y a través de conjuntos de cromatogramas. El protocolo ofrece alta consistencia y confiabilidad con poca intervención. Al mismo tiempo, la supervisión de analistas es posible en una variedad de entornos y funciones de restricción que se pueden personalizar para proporcionar flexibilidad y capacidad para adaptarse a diferentes necesidades y objetivos. La coincidencia de plantillas se muestra aquí como un enfoque poderoso para explorar extra-virgin Volatilome de aceite de oliva. La alineación cruzada de picos se realiza no solo para objetivos conocidos, sino también para compuestos no segmentados, lo que aumenta significativamente el poder de caracterización para una amplia gama de aplicaciones. Se presentan ejemplos para evidenciar el desempeño para la clasificación y comparación de patrones cromatográficos de conjuntos de muestras analizados en condiciones similares.
La cromatografía de gases bidimensional integral combinada con la detección espectrométrica de masas en tiempo de vuelo (GC×GC-TOF MS) es hoy en día el enfoque analítico más informativo para la caracterización química de muestras complejas1,2,3,4,5. En GC×GC, las columnas están conectadas en serie e interconectadas por un modulador (por ejemplo, una interfaz de enfoque térmica o basada en válvulas) que atrapa los componentes de eluting de la primera dimensión(1D) columna antes de su reinyección en la segunda dimensión(2D) columna. Esta operación se realiza dentro de un período de tiempo de modulación fija(PM),que generalmente oscila entre 0,5–8 s. Mediante la modulación térmica, el proceso incluye la crio-captura y el enfoque de la banda de eluting con algunos beneficios para la potencia de separación general.
Aunque GC×GC es una técnica de separación bidimensional, el proceso produce valores de datos secuenciales. El convertidor analógico a digital (A/D) del detector obtiene la salida de la señal cromatográfica a una frecuencia determinada. Luego, los datos se almacenan en formatos propietarios específicos que no solo contienen los datos digitalizados, sino también los metadatos relacionados (información sobre los datos). El convertidor A/D empleado en los sistemas GC×GC ayuda a mapear la intensidad de la señal cromatográfica a un número digital (DN) en función del tiempo en las dos dimensiones analíticas. Los detectores de un solo canal (por ejemplo, detector de ionización de llama (FID), detector de captura de electrones (ECD), detector de quimioluminiscencia de azufre (SCD), etc.) producen valores únicos por tiempo de muestreo, mientras que los detectores multicanal (por ejemplo, detector espectrométrico de masas (MS)) producen múltiples valores (normalmente, en un rango espectral) por tiempo de muestreo a lo largo del ciclo analítico.
Para visualizar datos 2D,la elaboración comienza con la rasterización de un solo período de modulación (o ciclo) valores de datos como una columna de píxeles (elementos de imagen correspondientes a eventos del detector). A lo largo de la ordenada (eje Y, de abajo a arriba) se visualiza el tiempo de separación 2D. Las columnas de píxeles se procesan secuencialmente para que la abscisa (eje X, de izquierda a derecha) informe de un tiempo de separación 1D. Esta ordenación presenta los datos 2Den un sistema de coordenadas cartesianas diestro, con el ordinal de retención 1Dcomo primer índice en la matriz.
El procesamiento de datos de cromatogramas 2Dda acceso a un nivel de información más alto que los datos sin procesar, lo que permite la detección de picos 2D,la identificación de picos, la extracción de datos de respuesta para análisis cuantitativos y análisis comparativos cruzados.
Los patrones de pico 2Dse pueden tratar como la huella digital única de la muestra y los compuestos detectados como características de minucias para un análisis comparativo cruzado efectivo. Este enfoque, conocido como huellas dactilares basadas en plantillas6,7,se inspiró en las huellas dactilares biométricas6. Los sistemas automáticos de verificación biométrica de huellas dactilares, de hecho, se basan en características únicas de la yema de los dedos: bifurcaciones y terminaciones de crestas, localizadas y extraídas de impresiones entintada o imágenes detalladas. Estas características, denominadas características de minucias, se cruzan con las plantillas almacenadas disponibles8,9.
Como se mencionó anteriormente, cada patrón de separación GC×GC se compone de picos 2Ddistribuidos racionalmente en un plano bidimensional. Cada pico corresponde a un solo anallito, tiene su potencial informativo y se puede tratar como una sola característica para el análisis comparativo de patrones.
Aquí, presentamos un enfoque eficaz para la huella química por GC×GC-TOF MS con ionización en tándem. El objetivo es catalogar de forma exhaustiva y cuantitativa las características de un conjunto de cromatogramas.
En comparación con el software comercial existente o las rutinas internas10,11 que emplean un enfoque de características máximas, la huella digital basada en plantillas se caracteriza por una alta especificidad, eficiencia y tiempo computacional limitado. Además, tiene una flexibilidad intrínseca que permite la alineación cruzada de características de minucias (es decir, picos 2D)entre cromatogramas gravemente desalineados como los adquiridos por diferentes instrumentaciones o en estudios de marco de largo plazo12,13,14.
Las operaciones básicas del método propuesto se describen brevemente para guiar al lector a una buena comprensión de la complejidad del patrón 2Dy la potencia de la información. Luego, al explorar la matriz de datos de salida del instrumento, se realiza la identificación química y se conocen analitos dirigidos ubicados sobre el espacio bidimensional. La plantilla de picos dirigidos se construye y se aplica a una serie de cromatogramas adquiridos dentro del mismo lote analítico. Los metadatos relacionados con los tiempos de retención, las firmas espectrales y las respuestas (absolutas y relativas) se extraen de patrones re-alineados de picos específicos y se adoptan para revelar diferencias de composición en el conjunto de muestras.
Como un paso adicional y único del proceso, también se realiza una huella digital combinada no dirigida y dirigida (UT) en cromatogramas pre-dirigidos para extender el potencial de huellas dactilares a analitos conocidos y desconocidos. El proceso produce una plantilla de UT para un análisis comparativo verdaderamente completo que se puede automatizar en gran medida.
Como paso final, el método realiza la alineación cruzada de características en dos señales de detectores paralelos producidas con altas y bajas energías de ionización de electrones (70 y 12 eV).
El protocolo es bastante flexible en el apoyo a análisis de un solo cromatograma o un conjunto de cromatogramas y con cromatografía variable y/o múltiples detectores. Aquí, el protocolo se demuestra con una suite de software GC×GC disponible comercialmente (consulte tabla de materiales)combinada con una biblioteca de MS y un software de búsqueda (consulte tabla de materiales). Algunas de las herramientas necesarias están disponibles en otro software y herramientas similares podrían implementarse independientemente de las descripciones en la literatura de Reichenbach y sus compañeros de trabajo15,16,17,18,19. Los datos brutos para la demostración se derivan de un estudio de investigación sobre aceite de oliva virgen extra (EVO) realizado en el laboratorio de los autores14. En particular, la fracción volátil (es decir, volatilome) de los aceites EVO italianos es muestreada por microextracción de fase sólida del espacio de cabeza (HS-SPME) y analizada por GC×GC-TOF MS para capturar huellas dactilares de diagnóstico para la calidad y calificación sensorial de las muestras. Los detalles sobre las muestras, las condiciones de muestreo y la configuración analítica se proporcionan en la Tabla de materiales.
Los pasos 1 a 6 describen el preprocesamiento de los cromatogramas. Los pasos 7 a 9 describen el procesamiento y análisis de cromatogramas individuales. Los pasos 10 a 12 describen la creación y la coincidencia de plantillas, que son la base para el análisis de muestras cruzadas. Los pasos 13 a 16 describen la aplicación del protocolo a través de un conjunto de cromatogramas, con los pasos 14 a 16 para el análisis ut.
La visualización de los datos de GC×GC-TOF MS es un paso fundamental para una comprensión adecuada de los resultados logrados por las separaciones bidimensionales integrales. Las gráficas de imagen con coloración personalizada permiten a los analistas apreciar las diferencias de respuesta del detector y, por lo tanto, la distribución diferencial de los componentes de la muestra. Este enfoque visual cambia por completo la perspectiva de los analistas sobre la interpretación y elaboración de cromatogramas. Este primer paso, una vez entendido y utilizado con confianza por los cromatógrafos, abre una nueva perspectiva en el procesamiento posterior.
Otro aspecto fundamental del procesamiento de datos es la accesibilidad a la matriz de datos completa (es decir, datos espectrales y respuestas de MS) para todos los puntos de muestra, cada uno de los cuales corresponde a un solo evento de detector. En este sentido, la integración de picos 2D,de modo que la colección de eventos detectores correspondientes a un solo analito representan un paso crítico. En el protocolo actual, la detección de picos 2Dse basa en el algoritmo de cuenca18 con algunas adaptaciones incluidas para mejorar la sensibilidad de detección en caso de compuestos co-eluting parciales. Para que este proceso sea más específico, se debe hacer la deconvolución y adoptar procedimientos más sofisticados. Esto es posible mediante la realización de una detección de pico de iones para los datos de EM; el algoritmo procesa la matriz de datos y aísla la respuesta de analitos individuales basados en perfiles espectrales19,31.
Un paso importante pero crítico del protocolo, y de cualquier proceso de interpretación de datos GC×GC-MS, se relaciona con la identificación de analitos. Este procedimiento, propuesto en los pasos 8 y 9, en ausencia de un análisis confirmatorio con estándares auténticos, debe ser conducido cuidadosamente por el analista. Las acciones automatizadas están disponibles en cualquier software comercial; incluyen la evaluación de la similitud de la firma espectral ms contra los espectros de referencia recogidos (es decir, bibliotecas espectrales) y la evaluación de las relaciones características entre los iones calificador/cuantificador. Sin embargo, se necesitan criterios confirmatorios adicionales para desambiguar la identificación de isómeros. El protocolo propone la adopción de índices de retención lineales para priorizar la lista de candidatos; el límite aquí se relaciona con la disponibilidad de datos de retención y su coherencia.
La principal característica que hace que este enfoque sea único es la coincidencia de plantillas12,13,15,29. La coincidencia de plantillas permite el reconocimiento de patrones 2Dde una manera muy efectiva, específica e intuitiva. Se puede establecer, en términos de sensibilidad y especificidad, mediante la aplicación de valores de umbral personalizados y / o funciones de restricción, mientras que el analista puede supervisar el procedimiento interactuando activamente con los parámetros de la función de transformación. La peculiaridad de este proceso se basa en la posibilidad de alinear de forma cruzada la información de picos dirigidos y no dirigidos entre muestras de un lote uniforme, pero también entre muestras adquiridas con las mismas condiciones nominales a pesar de la desalineación media a grave. Las ventajas de esta operación se relacionan con la posibilidad de preservar todas las identificaciones de analitos dirigidos, que es una tarea que consume mucho tiempo para el analista, y todos los metadatos guardados para picos específicos y no dirigidos de sesiones de elaboración anteriores.
La coincidencia de plantillas también es muy efectiva en términos de tiempo computacional; los archivos de datos de EM de baja resolución constan de aproximadamente 1 a 2 Gb de datos empaquetados, mientras que los análisis de EM de alta resolución pueden alcanzar los 10 a 15 Gb por cada ejecución analítica única. La coincidencia de plantillas no procesa la matriz de datos completa cada vez, sino que, al principio, realiza la alineación en tiempo de retención entre cromatogramas utilizando picos de plantilla y, a continuación, procesa los picos candidatos dentro de la ventana de búsqueda para su coincidencia de similitud con la referencia en la plantilla. En caso de desalineación severa, la situación más desafiante, las transformaciones polinómicas globales de segundo orden tuvieron un mejor desempeño que los métodos locales, al tiempo que recisó el tiempo computacional13.
Para que la técnica GC×GC se extienda ampliamente más allá de la academia y los laboratorios de investigación, las herramientas de procesamiento de datos tienen que facilitar las operaciones básicas para la visualización y la inspección de cromatogramas; la identificación de analitos debe ofrecer la posibilidad de adoptar algoritmos y procedimientos estandarizados (por ejemplo, algoritmo de búsqueda nist y calibración IT); y el análisis comparativo cruzado debe ser intuitivo, eficaz y estar respaldado por instrumentos interactivos. El enfoque propuesto aborda estas necesidades al tiempo que ofrece opciones y herramientas avanzadas para hacer frente a situaciones complejas como la co-elución de analitos, la calibración de múltiples analitos, el análisis de tipo de grupo y la alineación de detección paralela.
La literatura referenciada cubre bien muchos escenarios posibles donde GC×GC y, más generalmente, cromatografía bidimensional integral, ofrecen soluciones únicas y resultados confiables que no se pueden lograr mediante 1cromatografía D en análisis de una sola ejecución. 5,32,33 Aunque GC×GC es la herramienta más poderosa que aumenta la capacidad de separación y la sensibilidad, siempre hay limitaciones a la potencia de separación, la sensibilidad y otras capacidades sistémicas. A medida que se acercan estos límites sistémicos, el análisis de datos se vuelve progresivamente más difícil. Por lo tanto, la investigación y el desarrollo deben seguir mejorando las herramientas analíticas de que disponemos.
The authors have nothing to disclose.
La investigación fue apoyada por Progetto Ager − Fondazioni in rete per la ricerca agroalimentare. Acrónimo del proyecto Violin – Valorización de los productos de oliva italianos a través de herramientas analíticas innovadoras (https://olivoeolio.progettoager.it/index.php/i-progetti-olio-e-olivo/violin-valorization-of-italian-olive-products-through-innovative-analytical-tools/violin-il-progetto). El software GC Image está disponible para una prueba gratuita para los lectores que deseen demostrar y probar el protocolo.
1D SolGel-Wax column (100% polyethylene glycol; 30 m × 0.25 mm dc × 0.25 μm df). Carrier gas helium at a constant nominal flow of 1.3 mL/min. | Trajan SGE Analytical Science, Ringwood, Australia | PN 054796 | Carrier gas helium at a constant nominal flow of 1.3 mL/min. Oven temperature programming set as follows: 40°C (2 min) to 240°C (10 min) at 3.5°C/min. |
2D OV1701 column (86% polydimethylsiloxane, 7% phenyl, 7% cyanopropyl; 1 m × 0.1 mm dc × 0.10 μm df) from . | Mega, Legnano, Milan, Italy | PN MEGA-1701 | |
Automated system for sample preparation: SPR Autosampler for GC | SepSolve-Analytical, Llantrisant, UK | ||
Extra Virgin Olive oils: Sicily and Tuscany, Italy | Project VIOLIN (Ager – Fondazioni in rete per la ricerca agroalimentare) | Samples (n=10) were collected during the production year 2018 within the "Violin" project sampling campaign. Oils were submitted to HS-SPME to sample volatiles according to a reference protocol validated in a previous study of Stilo et al.14 | |
Gas chromatograph: Model 7890B GC | Agilent Technologies Wilmington DE, USA | ||
GC Image GC×GC edition V 2.9 | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Image processing software | GC Image LLC, Lincoln, Nebraska | https://www.gcimage.com/gcxgc/trial.html | |
Mass spectrometer: BenchTOF-Select | Markes International Llantrisant, UK | ||
Methyl-2-octynoate (CAS 111-12-6) | Merck-Millipore/Supelco | PN: 68982 | |
Modulator controller: Optimode v2.0 | SRA Intruments, Cernusco sul Naviglio, Milan, Italy | ||
Modulator: KT 2004 loop type | Zoex Corporation Houston, TX, USA | ||
MS library and search software: NIST Library V 2017, Software V 2.3 | National Institute of Standards and Technology (NIST), Gaithersburg MD | https://www.nist.gov/srd/nist-standard-reference-database-1a-v17 | |
n-alkanes C8-C40 for retention indexing | Merck-Millipore/Supelco | PN: 40147-U | |
n-hexane (CAS 110-54-3) gas chromatography MS SupraSolv | Merck-Millipore/Supelco | PN: 100795 | |
Solid Phase Microextraction fiber | Merck-Millipore/Supelco | PN 57914-U | |
α- /β-thujone (CAS 546-80-5) | Merck-Millipore/Sigma Aldrich | PN: 04314 |