Протокол описывает метод прогнозирования концентрации о-крезола во время производства полифенилового эфира с использованием ближней инфракрасной спектроскопии и частичной регрессии наименьших квадратов. Для более четкого и полного описания процесса используется пример прогнозирования концентрации о-крезола во время производства полифенилена.
В отличие от макроскопических технологических переменных, ближнеинфракрасная спектроскопия обеспечивает информацию о процессах на молекулярном уровне и может значительно улучшить прогнозирование компонентов в промышленных процессах. Способность записывать спектры для твердых и жидких образцов без предварительной обработки является выгодным и метод широко используется. Однако недостатки анализа высокомерных ближнеинжекрасных спектральных данных включают избыточность информации и многокомпонентность спектральных данных. Таким образом, мы предлагаем использовать метод регрессии частичнонаили лишь квадратов, который традиционно используется для уменьшения размерности данных и устранения коллизионности между исходными объектами. Мы внедряем метод прогнозирования концентрации о-крезола при производстве полифенилена эфира. Предлагаемый подход предлагает следующие преимущества перед методами регрессии компонентов: 1) частичная регрессия наименьших квадратов решает проблему многокомпонентности независимых переменных и эффективно избегает переоборудования, которое происходит в регрессионный анализ из-за высокой корреляции между независимыми переменными; 2) использование ближнего инфракрасного спектра приводит к высокой точности, потому что это неразрушающий и не загрязняющий метод для получения информации в микроскопических и молекулярных масштабах.
Ближайшая инфракрасная (NIR) спектроскопия (NIRS) получила широкое признание как быстрая, эффективная, неразрушающая и не загрязняющая современные аналитические технологии; этот метод использовался в течение последних нескольких лет для обнаружения и анализа качества продукции и измерения химических компонентов в промышленных процессах. Наиболее важной специальностью метода является его способность записывать спектры для твердых и жидких образцов без предварительной обработки, что делает NIRS особенно подходящим для прямого и быстрого обнаружения и анализа натуральных и синтетических продуктов1,2. В отличие от традиционных датчиков, измеряющих переменные процесса (например, температуры, давления, уровня жидкости и т.д.) в макроскопическом масштабе и неизбежно терпящих внешний шум и фоновое вмешательство, NIRS обнаруживает структурную информацию химического состава в микроскопических и молекулярных масштабах. Таким образом, важную информацию можно измерить более точно и эффективно, чем с помощью других методов3,4.
Полифениловый эфир, как один из инженерных пластмасс, широко используются из-за его теплостойкости, огнезащитной, изоляции, электрических свойств, мерной устойчивости, сопротивления удара, устойчивость ползучести, механической прочности и других свойств5. Что еще более важно, он нетоксичен и безвреден по сравнению с другими инженерными пластмассами. В настоящее время 2,6-ксиленол является одним из основных сырьевых материалов для синтеза полифенилового эфира, и обычно готовится путем катализированной алкилирования фенола методом6. Есть два основных продукта этого метода приготовления, о-крезол и 2,6-ксиленол. После серии разъединения и извлечения шаги, 2,6 ксиленола используется для производства полифенилена эфира. Тем не менее, следовые количества о-крезола остаются в 2,6-ксиленол. O-крезол не участвует в синтезе полифенилена эфира и останется в полифениловом эфире, что приведет к снижению качества продукции или даже некачественному. В настоящее время большинство компаний до сих пор анализируют составы сложных органических смесей, таких как продукты жидкой фазы полифенилового эфира, содержащие примеси (например, o-cresol) с помощью физического или химического анализа разделения, таких как хроматография7,8. Принципом разделения хроматографии является использование смеси композиций в фиксированной фазе и фазы потока в процессе растворения, анализа, адсорбции, дезорпации или иного сродства незначительных различий в производительности. Когда две фазы движутся относительно друг к другу, композиции разделены вышеуказанными действиями неоднократно в двух фазах. В зависимости от объекта, обычно требуется от нескольких минут до нескольких десятков минут, чтобы завершить сложную операцию разделения материала. Видно, что эффективность измерений низка.
В настоящее время измерение качества продукции и передовые технологии управления, основанные на этом анализе для современной индустрии тонкого процесса химических материалов, является ключевым направлением для дальнейшего улучшения качества продукции. В отрасли производства полифенилового эфира измерение содержания о-крезоля в полифенилевом эфире имеет большое значение для развития. Хроматографический анализ явно не может отвечать требованиям передовой технологии управления для измерения веществ в реальном времени и обратной связи с сигналами. Поэтому мы предлагаем метод частичной регрессии наименьших квадратов (PLSR) для создания линейной модели между данными NIRS и концентрацией o-cresol, которые реализуют онлайн-измерение содержания о-крезола в жидком полифенилене эфирный продукт розетки .
Предварительная обработка NIRS играет самую важную роль до многовариантного статистического моделирования. Волновые числа NIRS в спектре NIR и размеры частиц биологических образцов сопоставимы, поэтому он известен неожиданными эффектами рассеяния, которые оказывают влияние на зарегистрированные спектры образцов. Выполняя соответствующие методы предварительной обработки, эти эффекты легко устранить в основном9. Наиболее часто используемые методы предварительной обработки в NIRS классифицируются как методы коррекции рассеяния и спектральных производных методов. Первая группа методов включает в себя мультипликационную коррекцию рассеяния, детрендионирование, стандартные нормальные изменения вариатов и нормализацию. Методы спектрального производного включают использование первой и второй производных.
Перед разработкой модели количественной регрессии важно удалить из данных NIRS вариации несистематического рассеяния, поскольку они оказывают значительное влияние на точность прогностической модели, ее сложность и скупость. Выбор подходящего метода предварительной обработки всегда должен зависеть от последующего этапа моделирования. Здесь, если спектральный набор данных NIR не соответствует закону Ламберта-Пива, то другие факторы, как правило, компенсируют неидеальное поведение прогноза для прогнозируемых компонентов. Недостаток существования таких ненужных факторов приводит к увеличению сложности модели, даже наиболее вероятно, снижению надежности. Таким образом, применение спектральных производных и условная нормализация к спектральным данным является неотъемлемой частью метода.
После спектральной предварительной обработки получаются данные NIRS с высоким соотношением сигнала к шуму и низким фоновым интерференцией. Современный анализ NIRS обеспечивает быстрое приобретение большого количества абсорбции в соответствующем спектральном диапазоне. Химический состав образца затем прогнозируется путем извлечения соответствующих переменных с использованием информации, содержащейся в спектральной кривой. Как правило, NIRS сочетается с многовариантными методами анализа для качественного или количественного анализа10. Многовариантный линейный регрессионный анализ (MLR) обычно используется для разработки и добычи математических связей между данными и компонентами в промышленных процессах и широко используется в анализе NIRS.
Однако при внедрении MLR для предварительно обработанных данных NIRS существуют две фундаментальные проблемы. Одной из проблем является избыточность переменной. Высокая размерность данных NIRS часто делает прогнозирование зависимой переменной ненадежным, поскольку включены переменные, не имеющие корреляции с компонентами. Эти избыточные переменные снижают информационную эффективность спектральных данных и влияют на точность модели. Для устранения избыточности переменной необходимо разработать и максимизировать корреляцию между данными NIRS и прогнозируемыми компонентами.
Еще одной проблемой является проблема многокомпонентности данных NIRS. Одним из важных предположений нескольких линейных моделей регрессии является отсутствие линейной связи между какими-либо из пояснительных переменных модели регрессии. Если эта линейная связь существует, доказано, что в модели линейной регрессии существует многокомпонентность и это предположение нарушается. В нескольких линейных регрессиях, таких как регрессия наименьших квадратов (OLSR), несколько корреляций между переменными влияют на оценку параметров, увеличивают погрешность модели и влияют на стабильность модели. Чтобы устранить многолинейную корреляцию между спектральными данными NIR, мы используем методы переменного отбора, которые максимизируют врожденную изменчивость образцов.
Здесь мы предлагаем использовать PLSR, который представляет собой обобщение нескольких линейных регрессии, которая широко используется в области NIRS11,12. PLSR интегрирует основные функции MLR, канонического анализа корреляции (CCA) и анализа основных компонентов (PCA) и сочетает анализ прогнозирования с немодельным анализом коннотации данных. PLSR можно разделить на две части. Первая часть выбирает компоненты характерных переменных и прогнозируемых компонентов путем частичного анализа наименьших квадратов (PLS). PLS максимизирует врожденную изменчивость основных компонентов, делая ковариантность основных компонентов и прогнозируемых компонентов как можно больше при извлечении основных компонентов. Далее для основных выбранных компонентов устанавливается модель концентрации OLSR о-кресола. PLSR подходит для анализа шумных данных с многочисленными независимыми переменными, которые сильно взаимосвязаны и сильно коррелируют, и для одновременного моделирования нескольких переменных ответа. Также PLSR извлекает эффективную информацию образцовых спектров, преодолевает проблему мультиколлинеритити, а также обладает преимуществами сильной стабильности и высокой точности прогнозирования13,14.
В следующем протоколе описывается процесс использования модели PLSR для измерения концентрации о-крезоля с использованием спектральных данных NIR. Надежность и точность модели оцениваются количественно с помощьюкоэффициента определения (),коэффициента корреляции прогноза () и средней квадратной ошибки прогнозирования перекрестной проверки (MSPECV). Более того, чтобы интуитивно показать преимущества PLSR, индикаторы оценки визуализированы в нескольких участках для качественного анализа. Наконец, индикаторы оценки эксперимента представлены в формате таблицы, чтобы количественно проиллюстрировать надежность и точность модели PLSR.
Этот протокол описывает процесс выполнения PLSR по измерению концентрации o-cresol, оставшейся в жидком продукте полифенилена эфира с NIRS.
Двумя важнейшими шагами в этом процессе являются предварительная обработка исходных спектральных данных NIR и выбор переменных высокомер?…
The authors have nothing to disclose.
Эта работа была поддержана Национальным фондом естественных наук Китая (Грант No 61722306 и 61473137) и Национальной первоклассной дисциплинарной программой легкой промышленности (LITE2018-025).
MPA II Multi Purpose FT-NIR Analyzer | Bruker | 1 | |
Fiber Optic Probes(Liquid phase) | Bruker | 1 | |
Liquid chromatography analyzer | / | 1 | |
Laboratory Equipment and Supplies(e.g. test tube, etc.) | / | ||
MATLAB | MathWork | 1 | |
OPUS | Bruker | 1 | |
Principal computer | DELL | 1 | |
The Unscrambler | CAMO | 1 |