Het protocol beschrijft een methode voor het voorspellen van de concentratie van o-Cresol tijdens de productie van polyfenyleensulfon ether met behulp van near-infraroodspectroscopie en gedeeltelijke kleinste kwadraten regressie. Om het proces duidelijker en volledig te beschrijven, wordt een voorbeeld van het voorspellen van de o-Cresol-concentratie tijdens de productie van polyfenyleensulfon gebruikt om de stappen te verduidelijken.
In tegenstelling tot macroscopische procesvariabelen biedt Near-Infrared spectroscopie procesinformatie op moleculair niveau en kan de voorspelling van de componenten in industriële processen aanzienlijk verbeteren. De mogelijkheid om spectra op te nemen voor vaste en vloeibare monsters zonder voor behandeling is voordelig en de methode wordt op grote schaal gebruikt. De nadelen van het analyseren van High-dimensionale Near-Infrared spectrale gegevens omvatten echter informatie redundantie en multicollineariteit van de spectrale gegevens. Daarom stellen we voor om gedeeltelijke kleinste kwadraten regressiemethode te gebruiken, die traditioneel is gebruikt om de gegevendimensionaliteit te verkleinen en de collineariteit tussen de oorspronkelijke functies te elimineren. We implementeren de methode voor het voorspellen van de o-Cresol-concentratie tijdens de productie van polyfenyleensulfon ether. De voorgestelde aanpak biedt de volgende voordelen ten opzichte van component regressie Voorspellings methoden: 1) gedeeltelijke kleinste kwadraten regressie lost het multicollineariteits probleem van de onafhankelijke variabelen op en vermijdt effectief overfitting, wat optreedt in een regressieanalyse door de hoge correlatie tussen de onafhankelijke variabelen; 2) het gebruik van de Near-Infrared Spectra resulteert in een hoge nauwkeurigheid, omdat het een niet-destructieve en niet-vervuilende methode is om informatie te verkrijgen op microscopische en moleculaire schalen.
Near Infrared (NIR) spectroscopie (NIRS) heeft brede acceptatie gekregen als een snelle, efficiënte, niet-destructieve en niet-vervuilende moderne analytische technologie; de methode is de afgelopen jaren gebruikt voor de detectie en analyse van productkwaliteit en de meting van chemische componenten in industriële processen. De meest essentiële specialiteit van de methode is de mogelijkheid om spectra op te nemen voor vaste en vloeibare monsters zonder voor verwerking, waardoor NIRS vooral geschikt zijn voor de directe en snelle opsporing en analyse van natuurlijke en synthetische producten1,2. In tegenstelling tot traditionele sensoren die procesvariabelen (bijv. temperatuur, druk, vloeistofpeil enz.) op een macroscopische schaal meten en onvermijdelijk de externe ruis en achtergrond interferentie ondervinden, detecteert NIRS de structurele informatie van de chemische samenstelling op microscopische en moleculaire schalen. Zo kan essentiële informatie nauwkeuriger en effectiever worden gemeten dan met andere methoden3,4.
Polyphenyl ether, als een van de technische kunststoffen, worden veel gebruikt als gevolg van de hittebestendigheid, vlamvertragend, isolatie, elektrische eigenschappen, dimensionele stabiliteit, slagvastheid, kruip weerstand, mechanische sterkte en andere eigenschappen5. Wat nog belangrijker is, het is niet-toxisch en onschadelijk in vergelijking met andere technische kunststoffen. Op dit moment, 2, 6-xylenol is een van de fundamentele grondstoffen voor de synthese van polyfenyleensulfon ether, en het wordt meestal bereid door gekatalyseerde alkylatie van fenol met methanol methode6. Er zijn twee belangrijke producten van deze bereidingswijze, o-cresol en 2, 6-xylenol. Na een reeks van scheiding en extractie stappen, 2, 6 xylenol wordt gebruikt voor de productie van polyfenyleensulfon ether. Echter, sporen van o-Cresol blijven in 2, 6-xylenol. O-Cresol neemt niet deel aan de synthese van polyfenyleensulfon ether en blijft in het polyfenyleensulfon ether product, resulterend in een afname van de productkwaliteit of zelfs de onderstandaard. Op dit moment analyseren de meeste bedrijven nog steeds de samenstellingen van complexe organische mengsels zoals vloeibare fase-polyfenylsulfaat-ether producten die onzuiverheden bevatten (bijv. o-Cresol) door middel van fysische of chemische scheidings analyse, zoals chromatografie7,8. Het scheidings principe van chromatografie is het gebruik van het mengsel van composities in de vaste fase en de stromings fase in de ontbinding, analyse, adsorptie, desorptie of andere affiniteit van de kleine verschillen in de prestatie. Wanneer de twee fasen ten opzichte van elkaar worden verplaatst, worden de composities herhaaldelijk in de twee fasen gescheiden door de bovenstaande acties. Afhankelijk van het object duurt het meestal enkele tientallen minuten om een complexe materiaal scheidings operatie te voltooien. Men kan zien dat de meet efficiëntie laag is.
Tegenwoordig is het meten van de productkwaliteit en de geavanceerde besturingstechnologie op basis van deze analyse voor de moderne materialen industrie voor fijn proces de belangrijkste richting om de productkwaliteit verder te verbeteren. In de procesindustrie van polyfenylsulfaat ether productie, real-time meting van o-Cresol inhoud in polyfenyleensulfon ether product is van grote ontwikkeling belang. Chromatografische analyse kan duidelijk niet voldoen aan de eisen van geavanceerde besturingstechnologie voor real-time meting van stoffen en signaal feedback. Daarom stellen we de gedeeltelijke kleinste kwadraten regressie (plsr) methode voor het vaststellen van een lineair model tussen de gegevens van de NIRS en de o-Cresol-concentratie, die de online meting van o-Cresol-inhoud in het vloeibare polyfenyleensulfon ether product van Outlet realiseren .
De voor verwerking voor NIRS speelt de belangrijkste rol voorafgaand aan multivariate statistische modellering. NIRS Golf in het NIR-spectrum en de deeltjesgroottes van biologische monsters zijn vergelijkbaar, dus het staat bekend om onverwachte Scatter effecten die invloed hebben op de opgenomen sample spectra. Door het uitvoeren van geschikte pre-processing methoden, deze effecten zijn gemakkelijk te worden geëlimineerd grotendeels9. De meest gebruikte voorbewerkings technieken in NIRS zijn gecategoriseerd als Scatter correctie en spectrale afgeleide methoden. De eerste groep methoden omvat multiplicatieve Scatter correctie, detrending, standaard normale variabele transformaties, en normalisering. De spectrale afleiding methoden omvatten het gebruik van de eerste en tweede derivaten.
Voorafgaand aan de ontwikkeling van een kwantitatief regressiemodel is het belangrijk om de niet-systematische Scatter variaties uit de gegevens van de NIRS te verwijderen, omdat ze een aanzienlijke invloed hebben op de nauwkeurigheid van het voorspellende model, de complexiteit en parsimony. De selectie van een geschikte voorbewerkings methode moet altijd afhangen van de daaropvolgende stap voor modellering. Hier, als de NIR spectrale dataset de Lambert-Beer Law niet volgt, dan hebben andere factoren de neiging om het niet-ideale gedrag van de voorspelling voor voorspelde componenten te compenseren. Het nadeel van het bestaan van dergelijke onnodige factoren leidt tot de toename van de model complexiteit, zelfs hoogstwaarschijnlijk, een vermindering van de robuustheid. De toepassing van spectrale derivaten en een conventionele normalisering op de spectrale gegevens is dus een essentieel onderdeel van de methode.
Na spectrale voor verwerking worden de NIRS-gegevens met een hoge signaal-ruis verhouding en een lage achtergrond storing verkregen. Moderne NIRS-analyse biedt de snelle verwerving van grote hoeveelheden absorptie over een geschikt spectrale bereik. De chemische samenstelling van het monster wordt vervolgens voorspeld door de relevante variabelen te extraheren met behulp van de informatie in de spectrale curve. In het algemeen worden NIRS gecombineerd met multivariate analysetechnieken voor kwalitatieve of kwantitatieve analyses10. Een multivariate lineaire regressie (MLR) analyse wordt vaak gebruikt voor het ontwikkelen en Mining van de wiskundige relatie tussen de gegevens en de componenten in industriële processen en is op grote schaal gebruikt in de NIRS-analyse.
Er zijn echter twee fundamentele problemen bij de implementatie van een MLR voor voorverwerkte NIRS-gegevens. Een probleem is de variabele redundantie. De hoge dimensionaliteit van de NIRS-gegevens maakt vaak de voorspelling van een afhankelijke variabele onbetrouwbaar, omdat er variabelen worden opgenomen die geen correlatie hebben met de componenten. Deze redundante variabelen verminderen de informatie-efficiëntie van de spectrale gegevens en beïnvloeden de nauwkeurigheid van het model. Om de variabele redundantie te elimineren, is het essentieel om de correlatie tussen de NIRS-gegevens en de voorspelde componenten te ontwikkelen en te maximaliseren.
Een ander probleem is het probleem van de multicollineariteit in de gegevens van de NIRS. Een van de belangrijke veronderstellingen van meerdere lineaire regressiemodellen is dat er geen lineaire relatie is tussen een van de verklarende variabelen van het regressiemodel. Als deze lineaire relatie bestaat, wordt bewezen dat er multicollineariteit in het model van de lineaire regressie is en de veronderstelling wordt geschonden. In meerdere lineaire regressie, zoals een gewone kleinste kwadraten regressie (OLSR), meerdere correlaties tussen de variabelen van invloed op de schatting van de parameter, de model fout verhogen en invloed hebben op de stabiliteit van het model. Om de multilineaire correlatie tussen de NIR-spectrale gegevens te elimineren, gebruiken we variabele selectiemethodes die de inherente variabiliteit van de samples maximaliseren.
Hier stellen we voor om de plsr te gebruiken, wat een generalisatie is van meerdere lineaire regressie die op grote schaal is gebruikt op het gebied van NIRS11,12. De PLSR integreert de basisfuncties van de MLR, canonieke correlatieanalyse (CCA) en Principal component Analysis (PCA) en combineert de prognose analyse met een niet-model data connotatie analyse. De PLSR kan worden onderverdeeld in twee delen. Het eerste deel selecteert de componenten van de karakteristieke variabelen en de voorspelde componenten door gedeeltelijke kleinste kwadraten analyse (PLS). PLS maximaliseert de inherente variabiliteit van de belangrijkste componenten door de covariantie van de belangrijkste componenten en voorspelde componenten zo groot mogelijk te maken bij het uitpakken van de belangrijkste componenten. Vervolgens wordt het OLSR-model van o-Cresol-concentratie vastgesteld voor de geselecteerde hoofdcomponenten. PLSR is geschikt voor de analyse van lawaaierige gegevens met talrijke onafhankelijke variabelen die sterk collineair en sterk gecorreleerd zijn en voor het simultaan modelleren van verschillende responsvariabelen. Plsr extraheert ook de effectieve informatie van het monster spectra, overkomt het probleem van multicollineariteit, en heeft de voordelen van sterke stabiliteit en hoge voorspelling nauwkeurigheid13,14.
Het volgende protocol beschrijft het proces van het gebruik van het PLSR-model voor het meten van de o-Cresol-concentratie met behulp van NIR spectrale gegevens. De betrouwbaarheid en nauwkeurigheid van het model worden kwantitatief geëvalueerd met behulp van de bepalingscoëfficiënt (), de voorspellingcorrelatiecoëfficiënt () en de gemiddelde vierkante voorspelling fout van kruisvalidatie (mspecv). Om intuïtief de voordelen van de PLSR te laten zien, worden de evaluatie-indicatoren bovendien op verschillende percelen gevisualiseerd voor een kwalitatieve analyse. Ten slotte worden de evaluatie-indicatoren van een experiment gepresenteerd in tabelformaat om de betrouwbaarheid en nauwkeurigheid van het PLSR-model kwantitatief te illustreren.
Dit protocol beschrijft het proces van het uitvoeren van de plsr op de meting van de o-Cresol-concentratie die overblijft in het vloeibare product van polyfenyleensulfon ether met NIRS.
De twee kritieke stappen in dit proces zijn de voor verwerking van de oorspronkelijke NIR spectrale gegevens en de variabelen selectie van de High-dimensionale NIR spectrale gegevens.
Over het algemeen leidt de niet-systematische achtergrond storing tot de niet-systematische verstroo…
The authors have nothing to disclose.
Dit werk werd gesteund door de National Natural Science Foundation van China (Grant NOS. 61722306 en 61473137) en nationaal eersteklas discipline programma van lichte industrie technologie en engineering (LITE2018-025).
MPA II Multi Purpose FT-NIR Analyzer | Bruker | 1 | |
Fiber Optic Probes(Liquid phase) | Bruker | 1 | |
Liquid chromatography analyzer | / | 1 | |
Laboratory Equipment and Supplies(e.g. test tube, etc.) | / | ||
MATLAB | MathWork | 1 | |
OPUS | Bruker | 1 | |
Principal computer | DELL | 1 | |
The Unscrambler | CAMO | 1 |