El protocolo describe un método para predecir la concentración de o-cresol durante la producción de éter de polifenileno utilizando espectroscopia de infrarrojo cercano y regresión parcial de mínimos cuadrados. Para describir el proceso de forma más clara y completa, se utiliza un ejemplo de predicción de la concentración de o-cresol durante la producción de polifenileno para aclarar los pasos.
A diferencia de las variables de proceso macroscópicos, la espectroscopia infrarroja cercana proporciona información del proceso a nivel molecular y puede mejorar significativamente la predicción de los componentes en los procesos industriales. La capacidad de registrar espectros para muestras sólidas y líquidas sin ningún pretratamiento es ventajosa y el método es ampliamente utilizado. Sin embargo, las desventajas de analizar datos espectrales de infrarrojo cercano de alta dimensión incluyen la redundancia de la información y la multicolinealidad de los datos espectrales. Por lo tanto, proponemos utilizar el método de regresión de mínimos cuadrados parciales, que tradicionalmente se ha utilizado para reducir la dimensionalidad de los datos y eliminar la colinealidad entre las entidades originales. Implementamos el método para predecir la concentración de o-cresol durante la producción de éter de polifenileno. El enfoque propuesto ofrece las siguientes ventajas sobre los métodos de predicción de regresión de componentes: 1) la regresión parcial de mínimos cuadrados resuelve el problema de la multicolinealidad de las variables independientes y evita eficazmente el sobreajuste, que se produce en un ajuste excesivo, que se produce en un análisis de regresión debido a la alta correlación entre las variables independientes; 2) el uso de los espectros infrarrojos cercanos da como resultado una alta precisión porque es un método no destructivo y no contaminante para obtener información a escalas microscópicas y moleculares.
La espectroscopia de infrarrojo cercano (NIR) (NIRS) ha obtenido una amplia aceptación como una tecnología analítica moderna rápida, eficiente, no destructiva y no contaminante; el método se ha utilizado durante los últimos años para la detección y análisis de la calidad del producto y la medición de componentes químicos en procesos industriales. La especialidad más esencial del método es su capacidad para registrar espectros para muestras sólidas y líquidas sin ningún preprocesamiento, haciendo que NIRS sea especialmente adecuado para la detección y análisis directo y rápido de productos naturales y sintéticos1,2. A diferencia de los sensores tradicionales que miden las variables de proceso (por ejemplo, temperatura, presión, nivel de líquido, etc.) a escala macroscópica e inevitablemente sufren el ruido externo y la interferencia de fondo, NIRS detecta la información estructural de la composición química a escalamicroscópica y molecular. Por lo tanto, la información esencial se puede medir con mayor precisión y eficacia que con otros métodos3,4.
El éter de polifenilo, como uno de los plásticos de ingeniería, se utilizan ampliamente debido a su resistencia al calor, retardante de llama, aislamiento, propiedades eléctricas, estabilidad dimensional, resistencia al impacto, resistencia a la fluencia, resistencia mecánica y otras propiedades5. Más importante aún, no es tóxico e inofensivo en comparación con otros plásticos de ingeniería. En la actualidad, 2,6-xilenol es una de las materias primas básicas para la síntesis de éter de polifenileno, y por lo general se prepara mediante alquilación catalizada de fenol con método de metanol6. Hay dos productos principales de este método de preparación, o-cresol y 2,6-xylenol. Después de una serie de pasos de separación y extracción, 2,6 xilenol se utiliza para producir éter de polifenileno. Sin embargo, las cantidades traza de o-cresol permanecen en 2,6-xylenol. O-cresol no participa en la síntesis de éter de polifenileno y permanecerá en el producto de éter de polifenileno, lo que resulta en una disminución en la calidad del producto o incluso el subestándar. En la actualidad, la mayoría de las empresas todavía analizan las composiciones de mezclas orgánicas complejas, como los productos de éter de polifenilo de fase líquida que contienen impurezas (por ejemplo, o-cresol) mediante análisis de separación física o química como la cromatografía7,8. El principio de separación de la cromatografía es el uso de la mezcla de composiciones en la fase fija y la fase de flujo en la disolución, análisis, adsorción, desorción u otra afinidad de las pequeñas diferencias en la interpretación. Cuando las dos fases se mueven en relación entre sí, las composiciones están separadas por las acciones anteriores repetidamente en las dos fases. Dependiendo del objeto, normalmente se tarda unos minutos a unas pocas decenas de minutos en completar una operación compleja de separación de materiales. Se puede ver que la eficiencia de medición es baja.
Hoy en día, la medición de la calidad del producto y la avanzada tecnología de control basada en este análisis para la industria moderna de materiales químicos de proceso fino es la dirección clave para mejorar aún más la calidad del producto. En la industria de procesos de producción de éter de polifenilo, la medición en tiempo real del contenido de o-cresol en el producto de éter de polifenileno es de gran importancia para el desarrollo. El análisis cromatográfico claramente no puede cumplir con los requisitos de la tecnología de control avanzada para la medición en tiempo real de sustancias y la retroalimentación de la señal. Por lo tanto, proponemos el método de regresión parcial de mínimos cuadrados (PLSR) para establecer un modelo lineal entre los datos NIRS y la concentración de o-cresol, que realiza la medición en línea del contenido de o-cresol en el producto de éter de polifenileno líquido de salida .
El preprocesamiento para NIRS desempeña el papel más importante antes del modelado estadístico multivariante. Los números de onda NIRS en el espectro NIR y los tamaños de partículas de muestras biológicas son comparables, por lo que es conocido por efectos de dispersión inesperados que influyen en los espectros de muestras registrados. Al realizar métodos de preprocesamiento adecuados, estos efectos son fáciles de eliminar en gran medida9. Las técnicas de preprocesamiento más utilizadas en NIRS se clasifican como métodos de corrección de dispersión y derivados espectrales. El primer grupo de métodos incluye corrección de dispersión multiplicativa, detrending, transformaciones de variación normales estándar y normalización. Los métodos de derivación espectral incluyen el uso de la primera y la segunda derivada.
Antes de desarrollar un modelo de regresión cuantitativa, es importante eliminar las variaciones de dispersión no sistemáticas de los datos NIRS porque tienen una influencia significativa en la precisión del modelo predictivo, su complejidad y parsimonia. La selección de un método de preprocesamiento adecuado siempre debe depender del paso de modelado posterior. Aquí, si el conjunto de datos espectral NIR no sigue la ley Lambert-Beer, otros factores tienden a compensar el comportamiento no ideal de la predicción de los componentes predichos. La desventaja de la existencia de tales factores innecesarios conduce al aumento de la complejidad del modelo, incluso lo más probable, una reducción de la robustez. Por lo tanto, la aplicación de derivados espectrales y una normalización convencional a los datos espectrales es una parte esencial del método.
Después del preprocesamiento espectral, se obtienen los datos NIRS con una alta relación señal-ruido y baja interferencia de fondo. El análisis NIRS moderno proporciona la rápida adquisición de grandes cantidades de absorbancia en un rango espectral adecuado. La composición química de la muestra se predice entonces extrayendo las variables relevantes utilizando la información contenida en la curva espectral. En general, NIRS se combina con técnicas de análisis multivariante para análisis cualitativos o cuantitativos10. Un análisis de regresión lineal multivariante (MLR) se utiliza comúnmente para desarrollar y extraer la relación matemática entre los datos y los componentes en los procesos industriales y se ha utilizado ampliamente en el análisis NIRS.
Sin embargo, hay dos problemas fundamentales al implementar un MLR para los datos NIRS preprocesados. Un problema es la redundancia variable. La alta dimensionalidad de los datos NIRS a menudo hace que la predicción de una variable dependiente no sea confiable porque se incluyen variables que no tienen correlación con los componentes. Estas variables redundantes reducen la eficiencia de la información de los datos espectrales y afectan a la precisión del modelo. Para eliminar la redundancia variable, es esencial desarrollar y maximizar la correlación entre los datos NIRS y los componentes predichos.
Otro problema es el problema de la multicolinealidad en los datos NIRS. Una de las suposiciones importantes de varios modelos de regresión lineal es que no hay ninguna relación lineal entre ninguna de las variables explicativas del modelo de regresión. Si existe esta relación lineal, se ha demostrado que hay multicolinealidad en el modelo de regresión lineal y se infringe la suposición. En varias regresiones lineales, como una regresión de mínimos cuadrados (OLSR) normal, las correlaciones múltiples entre las variables afectan a la estimación del parámetro, aumentan el error del modelo y afectan a la estabilidad del modelo. Para eliminar la correlación multilineal entre los datos espectrales NIR, utilizamos métodos de selección variable que maximizan la variabilidad inherente de las muestras.
Aquí, proponemos utilizar el PLSR, que es una generalización de la regresión lineal múltiple que ha sido ampliamente utilizado en el campo de NIRS11,12. El PLSR integra las funciones básicas del MLR, el análisis de correlación canónica (CCA) y el análisis de componentes principales (PCA) y combina el análisis de previsión con un análisis de connotación de datos no modelo. El PLSR se puede dividir en dos partes. La primera parte selecciona los componentes de las variables de característica y los componentes predichos mediante el análisis parcial de mínimos cuadrados (PLS). PLS maximiza la variabilidad inherente de los componentes principales haciendo que la covarianza de los componentes principales y los componentes predichos sea lo más grande posible al extraer los componentes principales. A continuación, se establece el modelo OLSR de concentración de o-cresol para los componentes principales seleccionados. PLSR es adecuado para el análisis de datos ruidosos con numerosas variables independientes que son fuertemente colineales y altamente correlacionadas y para el modelado simultáneo de varias variables de respuesta. Además, PLSR extrae la información efectiva de los espectros de muestra, supera el problema de la multicolinealidad, y tiene las ventajas de una fuerte estabilidad y alta precisión de predicción13,14.
El siguiente protocolo describe el proceso de utilización del modelo PLSR para medir la concentración de o-cresol utilizando datos espectrales NIR. La fiabilidad y precisión del modelo se evalúan cuantitativamente utilizando el coeficiente de determinación (), el coeficiente de correlación de predicción () y el error de predicción cuadrada media de la validación cruzada (MSPECV). Además, para mostrar intuitivamente las ventajas del PLSR, los indicadores de evaluación se visualizan en varias gráficas para un análisis cualitativo. Por último, los indicadores de evaluación de un experimento se presentan en formato de tabla para ilustrar cuantitativamente la fiabilidad y precisión del modelo PLSR.
Este protocolo describe el proceso de realización del PLSR en la medición de la concentración de o-cresol restante en el producto líquido de éter de polifenileno con NIRS.
Los dos pasos críticos en este proceso son el preprocesamiento de los datos espectrales NIR originales y la selección de variables de los datos espectrales NIR de alta dimensión.
Generalmente, la interferencia de fondo no sistemática conduce a la desviación de dispersión no sistemática…
The authors have nothing to disclose.
Este trabajo fue apoyado por la National Natural Science Foundation of China (Grant Nos. 61722306 y 61473137) y el National First First-class Discipline Program of Light Industry Technology and Engineering (LITE2018-025).
MPA II Multi Purpose FT-NIR Analyzer | Bruker | 1 | |
Fiber Optic Probes(Liquid phase) | Bruker | 1 | |
Liquid chromatography analyzer | / | 1 | |
Laboratory Equipment and Supplies(e.g. test tube, etc.) | / | ||
MATLAB | MathWork | 1 | |
OPUS | Bruker | 1 | |
Principal computer | DELL | 1 | |
The Unscrambler | CAMO | 1 |