CN118091002A - Hplc-dad光谱数据库及其构建方法、基于hplc-dad光谱数据库的物质判别方法和搜索方法及其系统 - Google Patents
Hplc-dad光谱数据库及其构建方法、基于hplc-dad光谱数据库的物质判别方法和搜索方法及其系统 Download PDFInfo
- Publication number
- CN118091002A CN118091002A CN202410218272.2A CN202410218272A CN118091002A CN 118091002 A CN118091002 A CN 118091002A CN 202410218272 A CN202410218272 A CN 202410218272A CN 118091002 A CN118091002 A CN 118091002A
- Authority
- CN
- China
- Prior art keywords
- spectrum
- database
- data
- hplc
- dad
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 226
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000010276 construction Methods 0.000 title claims description 7
- 238000012850 discrimination method Methods 0.000 title claims description 6
- 239000000463 material Substances 0.000 title claims description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 50
- 230000003595 spectral effect Effects 0.000 claims abstract description 44
- 239000000126 substance Substances 0.000 claims abstract description 40
- 238000009499 grossing Methods 0.000 claims abstract description 31
- 239000007788 liquid Substances 0.000 claims abstract description 28
- 239000002537 cosmetic Substances 0.000 claims abstract description 24
- 239000013558 reference substance Substances 0.000 claims abstract description 13
- 238000002835 absorbance Methods 0.000 claims description 51
- 230000014759 maintenance of location Effects 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000000118 hair dye Substances 0.000 claims description 8
- CBCKQZAAMUWICA-UHFFFAOYSA-N 1,4-phenylenediamine Chemical compound NC1=CC=C(N)C=C1 CBCKQZAAMUWICA-UHFFFAOYSA-N 0.000 claims description 7
- 238000000862 absorption spectrum Methods 0.000 claims description 5
- 239000003755 preservative agent Substances 0.000 claims description 4
- 238000004611 spectroscopical analysis Methods 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 3
- OIQXFRANQVWXJF-QBFSEMIESA-N (2z)-2-benzylidene-4,7,7-trimethylbicyclo[2.2.1]heptan-3-one Chemical compound CC1(C)C2CCC1(C)C(=O)\C2=C/C1=CC=CC=C1 OIQXFRANQVWXJF-QBFSEMIESA-N 0.000 claims description 2
- 229940100555 2-methyl-4-isothiazolin-3-one Drugs 0.000 claims description 2
- KEVCVWPVGPWWOI-UHFFFAOYSA-N 4-[(1,3-dimethylimidazol-1-ium-2-yl)diazenyl]aniline;chloride Chemical compound [Cl-].CN1C=C[N+](C)=C1N=NC1=CC=C(N)C=C1 KEVCVWPVGPWWOI-UHFFFAOYSA-N 0.000 claims description 2
- 229940061720 alpha hydroxy acid Drugs 0.000 claims description 2
- 150000001280 alpha hydroxy acids Chemical class 0.000 claims description 2
- 229940124350 antibacterial drug Drugs 0.000 claims description 2
- BEGLCMHJXHIJLR-UHFFFAOYSA-N methylisothiazolinone Chemical compound CN1SC=CC1=O BEGLCMHJXHIJLR-UHFFFAOYSA-N 0.000 claims description 2
- REQCZEXYDRLIBE-UHFFFAOYSA-N procainamide Chemical compound CCN(CC)CCNC(=O)C1=CC=C(N)C=C1 REQCZEXYDRLIBE-UHFFFAOYSA-N 0.000 claims description 2
- 229960000244 procainamide Drugs 0.000 claims description 2
- 230000000475 sunscreen effect Effects 0.000 claims description 2
- 239000000516 sunscreening agent Substances 0.000 claims description 2
- 229940043810 zinc pyrithione Drugs 0.000 claims description 2
- PICXIOQBANWBIZ-UHFFFAOYSA-N zinc;1-oxidopyridine-2-thione Chemical compound [Zn+2].[O-]N1C=CC=CC1=S.[O-]N1C=CC=CC1=S PICXIOQBANWBIZ-UHFFFAOYSA-N 0.000 claims description 2
- 238000004587 chromatography analysis Methods 0.000 abstract description 10
- 239000011159 matrix material Substances 0.000 abstract description 5
- 230000008569 process Effects 0.000 abstract description 5
- 230000008859 change Effects 0.000 abstract description 4
- 239000000523 sample Substances 0.000 description 32
- -1 2, 4-diaminophenoxy ethanolamine hydrochloride Chemical compound 0.000 description 11
- 150000001875 compounds Chemical class 0.000 description 11
- 238000010586 diagram Methods 0.000 description 9
- 238000004128 high performance liquid chromatography Methods 0.000 description 9
- 238000007405 data analysis Methods 0.000 description 7
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 6
- 238000010521 absorption reaction Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 239000011259 mixed solution Substances 0.000 description 5
- 238000002203 pretreatment Methods 0.000 description 5
- 239000012488 sample solution Substances 0.000 description 5
- PLIKAWJENQZMHA-UHFFFAOYSA-N 4-aminophenol Chemical compound NC1=CC=C(O)C=C1 PLIKAWJENQZMHA-UHFFFAOYSA-N 0.000 description 4
- 229910019142 PO4 Inorganic materials 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000002371 ultraviolet--visible spectrum Methods 0.000 description 3
- KJCVRFUGPWSIIH-UHFFFAOYSA-N 1-naphthol Chemical compound C1=CC=C2C(O)=CC=CC2=C1 KJCVRFUGPWSIIH-UHFFFAOYSA-N 0.000 description 2
- CDAWCLOXVUBKRW-UHFFFAOYSA-N 2-aminophenol Chemical compound NC1=CC=CC=C1O CDAWCLOXVUBKRW-UHFFFAOYSA-N 0.000 description 2
- CWLKGDAVCFYWJK-UHFFFAOYSA-N 3-aminophenol Chemical compound NC1=CC=CC(O)=C1 CWLKGDAVCFYWJK-UHFFFAOYSA-N 0.000 description 2
- 230000005526 G1 to G0 transition Effects 0.000 description 2
- QIGBRXMKCJKVMJ-UHFFFAOYSA-N Hydroquinone Chemical compound OC1=CC=C(O)C=C1 QIGBRXMKCJKVMJ-UHFFFAOYSA-N 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 239000000654 additive Substances 0.000 description 2
- 238000009835 boiling Methods 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 238000004043 dyeing Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 235000013373 food additive Nutrition 0.000 description 2
- 239000002778 food additive Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 150000008040 ionic compounds Chemical class 0.000 description 2
- 238000004811 liquid chromatography Methods 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000008055 phosphate buffer solution Substances 0.000 description 2
- GHMLBKRAJCXXBS-UHFFFAOYSA-N resorcinol Chemical compound OC1=CC=CC(O)=C1 GHMLBKRAJCXXBS-UHFFFAOYSA-N 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- REFMEZARFCPESH-UHFFFAOYSA-M sodium;heptane-1-sulfonate Chemical compound [Na+].CCCCCCCS([O-])(=O)=O REFMEZARFCPESH-UHFFFAOYSA-M 0.000 description 2
- 239000013582 standard series solution Substances 0.000 description 2
- 239000012086 standard solution Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000005303 weighing Methods 0.000 description 2
- GEYOCULIXLDCMW-UHFFFAOYSA-N 1,2-phenylenediamine Chemical compound NC1=CC=CC=C1N GEYOCULIXLDCMW-UHFFFAOYSA-N 0.000 description 1
- WZCQRUWWHSTZEM-UHFFFAOYSA-N 1,3-phenylenediamine Chemical compound NC1=CC=CC(N)=C1 WZCQRUWWHSTZEM-UHFFFAOYSA-N 0.000 description 1
- BOKGTLAJQHTOKE-UHFFFAOYSA-N 1,5-dihydroxynaphthalene Chemical compound C1=CC=C2C(O)=CC=CC2=C1O BOKGTLAJQHTOKE-UHFFFAOYSA-N 0.000 description 1
- XAWPKHNOFIWWNZ-UHFFFAOYSA-N 1h-indol-6-ol Chemical compound OC1=CC=C2C=CNC2=C1 XAWPKHNOFIWWNZ-UHFFFAOYSA-N 0.000 description 1
- KZTWOUOZKZQDMN-UHFFFAOYSA-N 2,5-diaminotoluene sulfate Chemical compound OS(O)(=O)=O.CC1=CC(N)=CC=C1N KZTWOUOZKZQDMN-UHFFFAOYSA-N 0.000 description 1
- YWNSGSNRKLNTHJ-UHFFFAOYSA-N 2-(4-aminoanilino)ethanol;sulfuric acid Chemical compound OS(O)(=O)=O.NC1=CC=C(NCCO)C=C1 YWNSGSNRKLNTHJ-UHFFFAOYSA-N 0.000 description 1
- HCPJEHJGFKWRFM-UHFFFAOYSA-N 2-amino-5-methylphenol Chemical compound CC1=CC=C(N)C(O)=C1 HCPJEHJGFKWRFM-UHFFFAOYSA-N 0.000 description 1
- BMTSZVZQNMNPCT-UHFFFAOYSA-N 2-aminopyridin-3-ol Chemical compound NC1=NC=CC=C1O BMTSZVZQNMNPCT-UHFFFAOYSA-N 0.000 description 1
- GQFGHCRXPLROOF-UHFFFAOYSA-N 2-chloro-1,4-phenylenediamine sulfate Chemical compound OS(O)(=O)=O.NC1=CC=C(N)C(Cl)=C1 GQFGHCRXPLROOF-UHFFFAOYSA-N 0.000 description 1
- ZTMADXFOCUXMJE-UHFFFAOYSA-N 2-methylbenzene-1,3-diol Chemical compound CC1=C(O)C=CC=C1O ZTMADXFOCUXMJE-UHFFFAOYSA-N 0.000 description 1
- HVHNMNGARPCGGD-UHFFFAOYSA-N 2-nitro-p-phenylenediamine Chemical compound NC1=CC=C(N)C([N+]([O-])=O)=C1 HVHNMNGARPCGGD-UHFFFAOYSA-N 0.000 description 1
- 229940018563 3-aminophenol Drugs 0.000 description 1
- IQXUIDYRTHQTET-UHFFFAOYSA-N 4-amino-3-nitrophenol Chemical compound NC1=CC=C(O)C=C1[N+]([O-])=O IQXUIDYRTHQTET-UHFFFAOYSA-N 0.000 description 1
- JQVAPEJNIZULEK-UHFFFAOYSA-N 4-chlorobenzene-1,3-diol Chemical compound OC1=CC=C(Cl)C(O)=C1 JQVAPEJNIZULEK-UHFFFAOYSA-N 0.000 description 1
- QGNGOGOOPUYKMC-UHFFFAOYSA-N 4-hydroxy-6-methylaniline Chemical compound CC1=CC(O)=CC=C1N QGNGOGOOPUYKMC-UHFFFAOYSA-N 0.000 description 1
- ZVNPWFOVUDMGRP-UHFFFAOYSA-N 4-methylaminophenol sulfate Chemical compound OS(O)(=O)=O.CNC1=CC=C(O)C=C1.CNC1=CC=C(O)C=C1 ZVNPWFOVUDMGRP-UHFFFAOYSA-N 0.000 description 1
- DGRGLKZMKWPMOH-UHFFFAOYSA-N 4-methylbenzene-1,2-diamine Chemical compound CC1=CC=C(N)C(N)=C1 DGRGLKZMKWPMOH-UHFFFAOYSA-N 0.000 description 1
- RAUWPNXIALNKQM-UHFFFAOYSA-N 4-nitro-1,2-phenylenediamine Chemical compound NC1=CC=C([N+]([O-])=O)C=C1N RAUWPNXIALNKQM-UHFFFAOYSA-N 0.000 description 1
- DBFYESDCPWWCHN-UHFFFAOYSA-N 5-amino-2-methylphenol Chemical compound CC1=CC=C(N)C=C1O DBFYESDCPWWCHN-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 229910021419 crystalline silicon Inorganic materials 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- DGLRDKLJZLEJCY-UHFFFAOYSA-L disodium hydrogenphosphate dodecahydrate Chemical compound O.O.O.O.O.O.O.O.O.O.O.O.[Na+].[Na+].OP([O-])([O-])=O DGLRDKLJZLEJCY-UHFFFAOYSA-L 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- QELUYTUMUWHWMC-UHFFFAOYSA-N edaravone Chemical compound O=C1CC(C)=NN1C1=CC=CC=C1 QELUYTUMUWHWMC-UHFFFAOYSA-N 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 239000000706 filtrate Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 229940018564 m-phenylenediamine Drugs 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- DFQICHCWIIJABH-UHFFFAOYSA-N naphthalene-2,7-diol Chemical compound C1=CC(O)=CC2=CC(O)=CC=C21 DFQICHCWIIJABH-UHFFFAOYSA-N 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- PJNZPQUBCPKICU-UHFFFAOYSA-N phosphoric acid;potassium Chemical compound [K].OP(O)(O)=O PJNZPQUBCPKICU-UHFFFAOYSA-N 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- VHNQIURBCCNWDN-UHFFFAOYSA-N pyridine-2,6-diamine Chemical compound NC1=CC=CC(N)=N1 VHNQIURBCCNWDN-UHFFFAOYSA-N 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 238000002336 sorption--desorption measurement Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 229940126680 traditional chinese medicines Drugs 0.000 description 1
- 238000002137 ultrasound extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/62—Detectors specially adapted therefor
- G01N30/74—Optical detectors
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N30/00—Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
- G01N30/02—Column chromatography
- G01N30/86—Signal analysis
- G01N30/8651—Recording, data aquisition, archiving and storage
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种基于HPLC‑DAD光谱数据库的物质判别方法和搜索方法及其系统,涉及高效液相色谱‑二极管阵列检测器(HPLC‑DAD)色谱光谱分析领域,以解决HPLC‑DAD待测物色谱峰因色谱条件改变、基质干扰、光谱相似、光谱特征不明显而无法识别、识别过程繁琐以及耗时较长的技术问题。该方法包括1、采集化妆品中多种安全风险物质对照品的HPLC‑DAD三维色谱‑光谱原始数据,构建谱图数据库框架;2、采用背景补偿加Savitzky‑Golay平滑的光谱预处理方法获取标准化光谱数据;3、建立待测物的标准化参比光谱数据库;4、采用夹余弦角算法,计算待测样品的标准化光谱与对照品的标准化参比光谱之间的相似度,进行库搜索,设置相似度阈值,根据相似度和阈值判定结果,实现对待测物色谱峰的识别。该系统包括数据采集模块、原始数据框架模块、数据预处理模块及标准化参比光谱数据库模块、搜索判别模块。本发明通过构建的HPLC‑DAD光谱数据库,光谱可对待测物色谱峰进行快速准确的识别,色谱可对待测物准确定量。
Description
技术领域
本发明涉及高效液相色谱-二极管阵列检测器(HPLC-DAD)色谱光谱分析及化妆品安全风险物质检测领域,尤其涉及一种HPLC-DAD光谱数据库及其构建方法、基于HPLC-DAD光谱数据库的物质判别方法和搜索方法及其系统。
背景技术
在使用高效液相色谱-二极管阵列检测器(HPLC-DAD)获取待测样品的色谱-光谱信号后,需要对获取的色谱峰进行结果匹配,然而一个色谱分析系统有几十个色谱峰,每个色谱峰采集200~800nm波长的吸光度,数据量巨大,对各色谱峰的识别仍需人眼识别,通过与对照品保留时间、光谱比较识别,当保留时间漂移、色谱峰重叠、基质干扰、待测物光谱相似、特征峰不明显时,对色谱峰的识别费时费力,不仅检测效率低下,误判风险较高,数据利用率也较低。
发明内容
本发明通过根据所述经过预处理后的HPLC-DAD色谱-光谱数据结合预设的标准化参比光谱数据库,计算相似度,根据所述相似度获得所述待测样品的匹配光谱,相对于传统利用保留时间识别的方法,实现不同色谱仪器数据的共享,不受色谱条件差异的制约,减少人为因素的影响,计算量大大降低,缩短算法运行的时间,缩短数据分析时间,扩大筛查范围,提高识别准确度而且操作简单,提供一种基于HPLC-DAD光谱数据库的判别方法和搜索系统。
本发明解决上述技术问题的技术方案如下:
本发明首先公开了一种HPLC-DAD光谱数据库,HPLC-DAD光谱数据库是高效液相色谱-二极管阵列检测器HPLC-DAD采集的三维色谱-光谱数据信号,是保留时间-波长-吸光度响应值三维数据库,其中光谱数据用于定性识别,色谱数据用于定量测定。
优选的,HPLC-DAD三维色谱-光谱数据库包括化妆品中的165种禁限用安全风险物质,分别是化妆品中包括对苯二胺的32种染发剂组分、42种防腐剂、包括3-亚苄基樟脑的23种防晒剂组分、36种抗菌类药物、包括普鲁卡因胺的15种组分、包括碱性橙31的7种组分、包括α-羟基酸的10种组分;其中,42种防腐剂:包括甲基异噻唑啉酮的23种组分,包括吡硫鎓锌的19种组分。
优选的,通过采集的数据实时录入,实现数据库内容不断扩充。
本发明还公开了一种HPLC-DAD光谱数据库的构建方法,包括以下步骤:
S1、采用高效液相色谱-二极管阵列检测器联用仪以标准检测方法采集化妆品中安全风险物质对照品的原始数据;采用ASCⅡ码形式构建HPLC-DAD三维色谱-光谱原始数据库框架;
S2、对色谱-光谱原始数据中的各色谱峰的各条光谱数据进行预处理,得到标准化光谱数据;
S3、将步骤S2中的标准化光谱数据导入到HPLC-DAD光谱数据库框架,得到标准化HPLC-DAD光谱数据库。
优选的,步骤S2中,所述预处理采用的方法为背景补偿加Savitzky-Golay平滑预处理,去处噪音和背景干扰、降低基线漂移的影响,但是不改变光谱形状和宽度;
根据以下方程式执行背景补偿:
Scorr=S-Sb
Scorr:背景补偿后的光谱;S:背景补偿前的光谱;Sb:背景光谱
根据以下方程式计算背景补偿后的波长λi处的吸光度:
Αcorr(λi)=A(λi)-Ab(λi)
Acorr(λi):背景补偿后的吸光度;A(λi):背景补偿前的吸光度;Ab(λi):背景吸光度;
Ab(λi)是根据以下方程式获得:
As(λi):峰开始处的吸光度;Ae(λi):峰结束处的吸光度;t:背景已补偿的光谱的保留时间;te:峰开始的保留时间;ts:峰结束的保留时间;通过整个波长范围内计算得到Scorr;
Savitzky-Golay平滑公式为:
xj,smooth为平滑后的光谱数据集;xj+i为采集的光谱数据集;为平滑系数,即第i期原始数据xj+i在平滑窗口的权重,由最小二乘拟合多项式求得;m为窗口宽度。
本发明还公开了一种基于HPLC-DAD光谱数据库的物质判别方法,包括以下步骤:
S1、采用高效液相色谱-二极管阵列检测器(HPLC-DAD)联用仪按照《化妆品安全技术规范》2015年版的标准检测方法采集化妆品中安全风险物质对照品的三维色谱-光谱原始数据;采用ASCⅡ码形式构建HPLC-DAD三维色谱-光谱原始数据库框架;
S2、对色谱-光谱原始数据中的各色谱峰光谱进行预处理,将色谱-光谱原始数据中的各条光谱进行背景补偿加Savitzky-Golay卷积平滑处理,得到待测物对照品的标准化参比光谱数据;
S3、将步骤S2中的标准化参比光谱数据输入到HPLC-DAD光谱数据库框架,得到标准化参比光谱数据库;
S4、采集待测样品的高效液相色谱-二极管阵列检测器(HPLC-DAD)三维色谱-光谱原始数据,并按照步骤S2中的方法进行预处理,得到待测物标准化光谱数据;
S5、采用的夹余弦角算法,将待测物标准化光谱数据作为维数与波长数相等的空间向量S1,通过计算待测标准化光谱数据与对照品的标准化参比光谱数据S2之间的夹余弦相似度,计算公式如下:
S1=(A1(λ1),A1(λ2),…,A1(λn))
S2=(A2(λ1),A2(λ2),…,A2(λn))
其中,吸收光谱S1与S2表示各波长处的吸光度的两个向量,λi为波长,A1为待测各波长处的吸光度,A2为标准品各波长处的吸光度。
角余弦值用来衡量样本向量间的差异,夹角越小,余弦值越接近于1,反之则趋于-1;夹角余弦值越接近1,两个光谱的匹配度越高;但是,通常两个光谱使从单一成分得到时,峰内光谱的形状都应该相同。
然而,在实际测定中,由于检测器的背景噪音、流动相、浓度等因素,导致角度θ不一定为“0”,夹余弦相似度不一定为“1”,因此设置阈值(t)和夹余弦相似度进行比较,来评估两个光谱的形状是否匹配,阈值一般设置为0.90~1.00,作为待测物色谱峰的识别的判定依据。
在步骤S2中,所述预处理采用的方法为背景补偿加Savitzky-Golay平滑预处理,去处噪音和背景干扰、降低基线漂移的影响,但是不改变光谱形状和宽度。
根据以下方程式执行背景补偿:
Scorr=S-Sb
Scorr:背景补偿后的光谱;S:背景补偿前的光谱;Sb:背景光谱
根据以下方程式计算背景补偿后的波长λi处的吸光度:
Αcorr(λi)=A(λi)-Ab(λi)
Acorr(λi):背景补偿后的吸光度;A(λi):背景补偿前的吸光度;Ab(λi):背景吸光度;
Ab(λi)是根据以下方程式获得:
As(λi):峰开始处的吸光度;Ae(λi):峰结束处的吸光度;t:背景已补偿的光谱的保留时间;te:峰开始的保留时间;ts:峰结束的保留时间。
通过整个波长范围内计算得到Scorr。
Savitzky-Golay卷积平滑算法是光谱分析中常用的预处理方法之一,可以提高光谱的平滑性,并降低噪音的干扰;Savitzky-Golay卷积平滑算法通过卷积的过程实现,即通过线性最小二乘法将相邻数据点的连续子集与一个低次多项式拟合。
Savitzky-Golay平滑公式为:
xj,smooth为平滑后的光谱数据集;xj+i为采集的光谱数据集;为平滑系数,即第i期原始数据xj+i在平滑窗口的权重,由最小二乘拟合多项式求得;m为窗口宽度。
Savitzky-Golay卷积平滑的优点是,在同一段曲线上,任意位置可以任意选取不同的窗宽,满足不同平滑滤波的需要;其最大的特点是去除信号噪声的同时保持信号的形状、宽度不变。
同时,本发明还提供一种基于HPLC-DAD光谱数据库的物质搜索方法,其与物质判别方法的特殊之处在于:提取一个色谱条件下所有色谱峰的光谱数据,根据步骤S2所述的预处理后的信号数据结合预设的对照品参比光谱数据库,根据步骤S5计算相似度,并设置各待测物的相似度阈值(0.90~1.00),进行HPLC-DAD光谱数据库搜索,相似系数越接近1,光谱匹配度越高,现实待测化合物色谱峰的识别。
同时,本发明还一种基于HPLC-DAD光谱数据库的物质判别方法和搜索系统,该系统包括数据采集模块、原始数据框架模块、数据预处理模块及标准化参比光谱数据库模块、搜索判别模块;
所述数据采集模块的输出与数据预处理模块的输入相接,数据采集模块用于采集待测样品的HPLC-DAD三维色谱-光谱原始数据;
所述数据预处理模块用于对三维色谱-光谱原始数据进行处理得到待测样品的标准化光谱数据;
所述数据预处理模块的输出与标准化参比光谱数据库模块的另一个输入相接,标准化参比光谱数据库模块用于标准化参比光谱数据库框架的构建或更新,并对标准化参比光谱数据进行处理获得标准化参比光谱数据库模型;
所述搜索判别模块用于待测样品标准化光谱数据的相似度计算和搜索,实现色谱峰的识别和判别。
本发明的有益效果:
1、本发明利用相似度评价待测样品光谱与对照品光谱的相关性,实现待测物质智能化筛查鉴定,解决因色谱柱、流动相、不同仪器等色谱条件的改变而无法利用相对保留时间识别的色谱峰的归属问题,解决目前安全风险物质监管中无法量化和自动化,需要人为判断,特别是对于色谱峰较多的检测系统判断较为麻烦、效率较低的问题。
2、本发明对原始光谱数据进行数据预处理,以增强感兴趣的待测物的光谱信息,减少干扰,并将处理后的数据以ASCⅡ码形式保存,建立数据库,实现当色谱峰光谱特征不明显、光谱相似、重叠、基质干扰等复杂情况下对待测物的智能化筛查判别。
3、本发明提出的一种基于HPLC-DAD光谱数据库的判别方法和搜索系统,获得了化妆品中安全风险物质的HPLC-DAD三维光谱数据库模型,并基于此实现了非法添加禁用物质的快速筛查、超量使用限用物质的判别;既是对安全风险监管自动化判别的新探索,也是对利用保留时间识别色谱峰的有力补充。
4、本发明提供的系统中将标准化HPLC-DAD光谱数据库与采集模块集成设计,可以将采集的数据实时录入标准化参比光谱数据库,实现对标准化参比光谱数据库的更新。
5、本发明提供的系统中将标准化HPLC-DAD光谱数据库与数据预处理模块、数据库搜索模块集成设计,可以将采集的数据实时进行库搜索,实现数据采集、数据预处理、数据录入、数据搜索一体化实时操作。
6、本发明提供的系统中能够为化妆品中非法添加禁用物质、超量使用限用组分、带入污染物质和衍生性效应物质等安全风险的识别和客观评价化妆品质量提供可靠的依据。
7、本发明依托建立的化妆品中标准化HPLC-DAD光谱数据库及时发现问题,可以保障市场监管高效有序,满足化妆品安全监管的预警需求。
8、本发明出的一种基于HPLC-DAD光谱数据库的判别方法和搜索系统可以尝试将此技术扩展运用于中药中非法添加违禁成分、食品中非法添加化学物质、滥用食品添加剂等领域的快速筛查。
附图说明
图1为本发明的实施例提供的一种基于HPLC-DAD光谱数据库的判别方法和搜索系统的流程示意图;
图2为本发明的实施例提供的一种基于HPLC-DAD光谱数据库的判别方法和搜索系统的结构框架图;
图3为本发明的其他实施例提供的染发剂2,4-二氨基苯氧基乙醇胺盐盐酸的三维色谱-光谱图;
图4为本发明的其他实施例提供的染发剂2,4-二氨基苯氧基乙醇胺盐盐酸的原始光谱图;
图5为本发明的其他实施例提供的2,4-二氨基苯氧基乙醇胺盐盐酸的背景补偿加平滑后的光谱图;
图6为本发明的其他实施例提供的数据库构建流程示意图;
图7为本发明的其他实施例提供的数据库创建逻辑示意图;
图8为本发明的其他实施例提供的数据预处理逻辑示意图;
图9为本发明的其他实施例提供的数据库搜索逻辑示意图;
图10为本发明的其他实施例提供的数据库搜索原理示意图;
图11为本发明的其他实施例提供的色谱峰识别结果示意图;
图12为本发明的其他实施例提供的32种染发剂标准品色谱图;
图13为本发明的其他实施例提供的HPLC-DAD结构示意图。
图14为本发明的其他实施例提供的HPLC-DAD检测器原理示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实施例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,为一种基于HPLC-DAD光谱数据库的物质搜索方法,以染发类化妆品中对苯二胺等32种组分为例,包括:
依据《化妆品安全技术规范》(2015年版)7.2对苯二胺等32种组分的检测方法,本方法规定了高效液相色谱法测定化妆品中对苯二胺等32种组分的含量,适用于染发类化妆品中对苯二胺等32种组分含量的测定。
本方法所指的32种组分为染料,包括对苯二胺、对氨基苯酚、甲苯-2,5-二胺硫酸盐、间氨基苯酚、邻苯二胺、2-氯对苯二胺硫酸盐、邻氨基苯酚、间苯二酚、2-硝基对苯二胺、甲苯-3,4-二胺、4-氨基-2-羟基甲苯、2-甲基间苯二酚、6-氨基间甲酚、苯基甲基吡唑啉酮、N,N-二乙基甲苯-2,5-二胺盐酸盐、4-氨基-3-硝基苯酚、间苯二胺、2,4-二氨基苯氧基乙醇盐酸盐、氢醌、4-氨基间甲酚、2-氨基-3-羟基吡啶、N,N-双(2-羟乙基)对苯二胺硫酸盐、对甲基氨基苯酚硫酸盐、4-硝基邻苯二胺、2,6-二氨基吡啶、N,N-二乙基对苯二胺硫酸盐、6-羟基吲哚、4-氯间苯二酚、2,7-萘二酚、N-苯基对苯二胺、1,5-萘二酚和1-萘酚。
本方法共有三个色谱系统,第一个色谱系统分离包括对氨基苯酚等16个组分,第二个色谱系统分离包括2,4-二氨基苯氧基乙醇胺盐酸盐等10个组分,第三个色谱系统分离其余8个组分。
本方法色谱柱为Discovery RP-AMIDE C16色谱保护柱(4.6×50mm,5μm)和Discovery RP-AMIDE C16色谱柱(4.6×250mm,5μm)(美国SUPELCO公司);流动相为磷酸盐混合溶液(称取十二水合磷酸氢二钠1.8g、磷酸二氢钾2.8g和庚烷磺酸钠(C7H15SO3Na)1.0g,用水稀释至1L,混匀,制成含庚烷磺酸钠(1g/L)的磷酸盐缓冲液,用磷酸溶液(3.5)调节pH至6,使用0.45μm微孔滤膜过滤);系统Ⅰ流动相:乙腈(3.3)+磷酸盐混合溶液(3.6)=10+90;系统Ⅱ流动相:甲醇(3.2)+磷酸盐混合溶液(3.6)=10+90;系统Ⅲ流动相:乙腈(3.3)+磷酸盐混合溶液(3.6)=40+60;流速为1.0mL/min;检测波长范围为190~800nm;柱温为25℃。
混合标准系列溶液的配制:精密称取32种染发剂适量于10mL容量瓶中,用无水乙醇稀释至刻度,配制成浓度为500mg/L的混合标准溶液;取混合标准溶液适量,用无水乙醇稀释,配制成浓度为10mg/L、25mg/L、50mg/L、100mg/L、250mg/L、500mg/L的混合标准系列溶液。临用现配。
S1、依据上述色谱方法采集32种组分染料对照品HPLC-DAD信号,获得所述待对照品的HPLC-DAD三维色谱-光谱原始数据信号,色谱图见图12。
S2、对色谱-光谱原始数据中的各色谱峰光谱进行预处理,将色谱-光谱原始数据中的各条光谱进行背景补偿加Savitzky-Golay卷积平滑处理,得到待测物对照品的标准化参比光谱数据;
需要说明的是,在某一实施例中,DAD检测器所检测到的信号由两部分组成,其一是仪器检测到的背景噪音,包括检测器的噪音以及流动相的噪音:其一是流出组分的响应信号,其中仪器本身的噪音主要由DAD检测器硬件以及软件设置有关,如带宽、狭缝宽度、时间常数、采样频率等;流动相的噪音主要色括流动相本身的背景紫外吸收以及流动相组成或者添加剂的梯度变化等。光谱预处理可以包括光谱背景基线去除和光谱去噪等,去除基线背景干扰的办法很多,本专利采用以下方程式执行背景补偿:
Scorr=S-Sb
Scorr:背景补偿后的光谱;S:背景补偿前的光谱;Sb:背景光谱
根据以下方程式计算背景补偿后的波长λi处的吸光度:
Αcorr(λi)=A(λi)-Ab(λi)
Acorr(λi):背景补偿后的吸光度;A(λi):背景补偿前的吸光度;Ab(λi):背景吸光度;
Ab(λi)是根据以下方程式获得:
As(λi):峰开始处的吸光度;Ae(λi):峰结束处的吸光度;t:背景已补偿的光谱的保留时间;te:峰开始的保留时间;ts:峰结束的保留时间。
通过整个波长范围内计算得到Scorr。
Savitzky-Golay平滑公式为:
xj,smooth为平滑后的光谱数据集;xj+i为采集的光谱数据集;为平滑系数,即第i期原始数据xj+i在平滑窗口的权重,由最小二乘拟合多项式求得;m为窗口宽度。
S3、将步骤S2中的标准化参比光谱数据输入到HPLC-DAD光谱数据库框架,得到本发明提出的标准化HPLC-DAD光谱数据库;该数据库在物质判别和搜索时,即作为标准化参比光谱数据库;
称取待测样品0.5g(精确到0.001g)于10mL具塞比色管中,加无水乙醇+水(1+1)的混合溶液至10mL刻度,涡旋1min,冰浴超声提取15min。如为浑浊溶液,可取适量离心(5000rpm)5min,取上清液经0.45μm微孔滤膜过滤,滤液作为待测样品溶液,并尽快测定。
S4、采集上述待测样品溶液的高效液相色谱-二极管阵列检测器(HPLC-DAD)三维色谱-光谱原始数据,并按照步骤S2中的方法进行预处理,得到待测物标准化光谱数据;
S5、根据所述待测物标准化光谱数据结合标准化参比光谱数据库,计算相似度;
在某一实施例中,计算相似度可以包括:
采用的相似度为余弦距离,也称为余弦相似度,是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量,余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,夹角等于0,即两个向量相等,这就叫"余弦相似性",计算方法如下:
S1=(A1(λ1),A1(λ2),…,A1(λn))
S2=(A2(λ1),A2(λ2),…,A2(λn))
其中,吸收光谱S1与S2表示各波长处的吸光度的两个向量,在本专利可表示实测光谱和数据库光谱,λi为波长,A1为待测各波长处的吸光度,A2为标准品各波长处的吸光度,n表示光谱的维度。
根据步骤S5计算相似度,并设置各待测物的相似度阈值(0.90~1.00),进行HPLC-DAD光谱数据库搜索,大于相似度阈值(t)且相似度越接近1,光谱匹配度越高,现实待测化合物色谱峰的识别。
设置搜索条件:波长范围和最多匹配数;设置库文件参数:选择搜索光谱库文件里的所有库文件,也可以指定文件夹搜索光谱库的指定文件夹中的所有文件;选择预过滤器,然后选择关键词来进一步根据化合物名称、保留时间或者其他关键词过滤搜索结果。然后执行库搜索,搜索结果显示匹配数、目标峰光谱的保留时间和最大吸收波长λmax,显示在搜索中匹配(发现)的光谱信息表,按从最高相似度到最低相似度显示光谱信息,显示与未知光谱(目标)重叠的搜索光谱,搜索结果见图11。
设置截取HPLC-DAD光谱时的光谱条件(采集数据时,190-800nm,但是有些化合物在400-800nm没有紫外吸收,所以要设置搜索波长范围),开通过滤器,选择过滤器类型,计算最大最小吸收波长λmax/min,相似度计算波长范围,设置相似度阈值,小于阈值的搜索结果被过滤掉不显示在结果表中,以进行更高准确度的峰识别和库搜索。
本专利的光谱数据采用背景补偿价Savitzky-Golay平滑的预处理的方法,因此过滤掉仪器本身的噪音和流动相的噪音,主要色括流动相本身的背景紫外吸收以及流动相组成或者添加剂的梯度变化等,因此采用不同的高效液相色谱仪和不同的色谱条件采集的数据均可使用标准化参比光谱数据可搜索,不受色谱条件和仪器限制。
本专利通过根据所述标准化数据信号结合标准化参比光谱数据库,计算相似度,根据所述相似度获得所述待测样品的匹配光谱,相对于传统方法,计算量大大降低,缩短算法运行的时间,算法耗时大幅减少,而且操作简单。
在某一实施例中,高效液相色谱二极管阵列检测器联用仪(HPLC-DAD)采集待测样品的光谱之后,先判断实测光谱的信噪比,因为光谱预处理和后续的数据库选择都与信噪比高度相关,本专利采用行业内较为通用的计算方法,如下所示:
S/N≥3
S表示色谱峰的峰高,N表示噪声。
信噪比较低,都会导致谱峰识别不准确,存在“伪峰”存在,所以需要给谱峰识别的数据库条件放宽,如果实测光谱信噪比高,可以认为光谱受噪声影响小,识别的谱峰都是准确的,此时可以使匹配的数据库条件严格,相似度阈值更高。
信噪比由所使用的设备的性能决定。
本专利也可以主动选择数据库类型,用户可以通过自己的专业知识或者经验主动选择使用禁用组分数据库和限用物质数据库等,也可由算法自适应选择数据库(原始光谱数据库和标准化参比光谱数据库)。因为从该数据库设计的原理分析,很明显不分类即全库匹配,虽然计算量大,耗时长,但是正确率不受数据库分类干扰,所以正确率是最高的,选择禁用组分数据库数据和限用组分数据库匹配,其计算量和耗时依次递减,但是正确率也会相应逐级降低。
在本实施例中,针对165种化合物是采用背景补偿和平滑的处理方法。在其它构建的HPLC-DAD光谱数据库(构建方法参照图6的流程示意图)中,可选地,所述对待测样品信号进行预处理,具体包括:
所述提取的标准化参比光谱数据库中每个光谱的谱峰,具体包括:采用高效液相色谱-二极管阵列检测器(HPLC-DAD)技术按照《化妆品安全技术规范》2015年版的标准检测方法采集32种染发剂对照品6个不同浓度的三维色谱-光谱数据,色谱见图12,其中以2,4-二氨基苯氧基乙醇胺盐盐酸为例,其三维数据见图3,选择该色谱峰提取其原始光谱图,见图4。
对待测对照品信号进行背景补偿和Savitzky-Golay平滑预处理,预处理后的光谱图见图5。
将预处理后的光谱数据储存于高效液相色谱-二极管阵列检测器(HPLC-DAD)联用仪数据分析系统,将所有色谱峰提取其光谱数据并进行预处理储存于数据分析系统,选择检测限浓度,中浓度、高浓度三个浓度点的光谱数据选择不同的预处理方法进行预处理。
选择剩余三个浓度点的光谱数据并进行数据预处理,选择不同的预处理方法处理原始光谱数据,计算相似度,选择相似度最高的预处理方式,作为标准化预处理方法,化妆品中的禁限用物质选择背景补偿和Savitzky-Golay平滑预处理方法均可满足相似度阈值要求,并实现色谱峰准确识别。
按照图7的流程示意图,将检测限浓度,中浓度、高浓度三个浓度点的光谱数据按照标准化预处理方法(参照图8)处理后储存于数据分析系统,构建标准化参比数据库。
采用高效液相色谱-二极管阵列检测器(HPLC-DAD)技术采集待测样品的三维色谱-光谱原始数据,选择各色谱峰提取其原始光谱信号。
对待测样品光谱信号进行背景补偿和Savitzky-Golay平滑预处理;
参照图9和图10,利用光谱匹配系统,搜索所述的标准化参比数据库,计算相似度,并设置各待测物的相似度阈值(0.90~1.00),进行谱库搜索,相似系数越接近1,光谱匹配度越高,现实待测化合物色谱峰的识别,搜索结果见图11。
在某一实施例中,如图2所示,一种基于HPLC-DAD光谱数据库的判别方法和搜索系统,包括:数据采集模块1101、原始数据框架模块1102、数据预处理模块1103、标准化参比光谱数据库模块1104和搜索判别模块1105;
所述数据采集模块1101用于对待测样品信号进行采集,获得所述待测样品信号的原始三维色谱-光谱信号;
所述原始数据框架模块1102用于原始三维色谱-光谱信号储存;
所述数据预处理模块1103用于对待测样品原始信号数据预处理,数据预处理方法包括:平滑处理、背景补偿、内插、一阶导数、二阶导数以及它们的组合,根据待测物化学结构不同,其光谱特征不同,选择不同的光谱预处理方法,选择不同的光谱数据库,见图7和8,例如:32种染发剂,光谱特征明显,但样品基质复杂干扰较多,选择平滑处理加背景补偿,待测样品与对照品光谱相似度能达到0.99以上。因此根据所述相似度选择所述待测样品的匹配光谱预处理方法。在本实施例,建立了165种化合物的HPLC-DAD光谱数据库。在其他实施例中,可对该数据库进行扩充,采用不同的光谱预处理方法,建立不同的数据库。
本专利通过根据所述一种基于HPLC-DAD光谱数据库的判别方法和搜索系统结合参比光谱数据库,计算相似度,根据所述相似度获得所述待测样品的匹配光谱,相对于传统方法,计算量大大降低,缩短算法运行的时间,算法耗时大幅减少,而且操作简单。
可以理解,在一些实施例中,可以包含如上述各实施例中的部分或全部可选实施方式。
需要说明的是,上述各实施例是与在先方法实施例对应的产品实施例,对于产品实施例中各可选实施方式的说明可以参考上述各方法实施例中的对应说明,在此不再赘述。
在一些实施例中,高效液相色谱法的应用范围十分广泛,对样品的适用性广,不受分析对象挥发性和热稳定性的限制,几乎所有的化合物包括高沸点、极性、离子型化合物和大分子物质均可用高效液相色谱法分析测定,80%则需用高效液相色谱来分析,光电二极管阵列检测器已在高效液相色谱分析中大量使用,一般认为是液相色谱最有发展、最好的检测器。所以可以利用物质的紫外-可见光谱来研究物质结构,在众多光谱分析技术中,HPLC-DAD光谱分析技术有其独特的优势:
灵敏度高、噪音低、线性范围宽、对流速和温度的波动不灵敏,适用于梯度洗脱及制备色谱、可得任意波长的色谱图,极为方便、可得任意时间的光谱图,相当于与紫外联用、色谱峰纯度鉴定、光谱图检索等功能,可提供组分的定性信息,色谱峰可用于化合物定量分析。
高压:流动相为液体,流经色谱柱时,受到的阻力较大,为了能迅速通过色谱柱,必须对载液加高压。
高速:分析速度快、载液流速快,较经典液体色谱法速度快得多,通常分析一个样品在15~30分钟,有些样品甚至在5分钟内即可完成,一般小于1小时。
高效:分离效能高。可选择固定相和流动相以达到最佳分离效果,比工业精馏塔和气相色谱的分离效能高出许多倍。
高灵敏度:紫外检测器可达0.01ng,进样量在μL数量级。
应用范围广:80%以上的有机化合物可用高效液相色谱分析,几乎所有的化合物包括高沸点、极性、离子型化合物和大分子物质均可用高效液相色谱法分析测定,测定具有紫外吸收的物质,包括无机物、有机物、聚合物、矿石、动植物组织、催化剂、药品、食品添加剂等。
正是由于高效液相色谱-二极管阵列检测器(HPLC-DAD)联用仪分析的众多优点,其应用已经广泛渗透到了人们生产、生活的各个领域。高效液相色谱-二极管阵列检测器(HPLC-DAD)联用仪的使用可以简单地归纳为三点:
色谱-光谱数据获取;
色谱-光谱数据处理;
光谱结果匹配,色谱峰识别;
紫外-可见光谱获取即使用高效液相色谱-二极管阵列检测器(HPLC-DAD)联用仪采集待测样品的色谱-光谱信号。HPLC-DAD联用仪通常由流动相储液器、泵、进样器、色谱柱、检测器、数据分析系统等几部分组成。储液器中的流动相被高压泵打入系统,样品溶液经进样器进入流动相,被流动相载入色谱柱(固定相)内,由于样品溶液中的各组分在两相中具有不同的分配系数,在两相中做相对运动时,经过反复多次的吸附-解吸的分配过程,各组分在移动速度上产生较大的差别,被分离成单个组分依次从柱内流出,通过检测器时,样品浓度被转换成电信号传送到数据分析系统记录,数据经过分析处理后以图谱形式打印出来;高效液相色谱系统组成如图13所示。
二极管阵列检测器即光电二级阵列管检测器又称光电二极管列阵检测器或光电二极管矩阵检测器,表示为PDA(photo-diode array)、PDAD(photo-diode arraydetector)或(Diode array detector,DAD)是20世纪80年代出现的一种光学多通道检测器。在晶体硅上紧密排列一系列光电二极管,每一个二极管相当于一个单色器的出口狭缝,二极管越多分辨率越高,一般是一个二极管对应接受光谱上一个纳米谱带宽的单色光,复色光通过样品池被组分选择性吸收后再进入单色器,照射在二极管阵列装置上,使每个纳米波长的光强度转变为相应的电信号强度,即获得组分的吸收光谱,数据处理系统将电信号进行数据分析,DAD检测器原理示意图如图14所示,光源1发出的连续光经过聚光镜、滤光片后,通过流通池2,再经过全息光栅3色散成单色光照射到二极管阵列检测元件4上进行检测。
在使用高效液相色谱仪获取待测样品的三维色谱-光谱信号后,需要对获取的光谱信号进行结果匹配,由于紫外-可见光谱信号具有指纹性即唯一性,所以只要跟数据库中的库文件进行一一比对,就能匹配出相应的结果。假设数据库中有100个数据库文件,那么只需要将获取的光谱信号与这100各数据库文件进行相似度计算,就能找到跟待测样品最接近的数据库文件,进完成了紫外-可见光谱结果匹配。
为此本发明提供一种计算量少,计算时间少,操作简单的快速数据库匹配方法。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的方法实施例仅仅是示意性的,例如,步骤的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个步骤可以结合或者可以集成到另一个步骤,或一些特征可以忽略,或不执行。
上述方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种HPLC-DAD光谱数据库,其特征在于:HPLC-DAD光谱数据库是高效液相色谱-二极管阵列检测器HPLC-DAD采集的三维色谱-光谱数据信号,是保留时间-波长-吸光度响应值三维数据库,其中光谱数据用于定性识别,色谱数据用于定量测定。
2.根据权利要求1所述的数据库,其特征在于:HPLC-DAD三维色谱-光谱数据库包括化妆品中的165种禁限用安全风险物质,分别是化妆品中包括对苯二胺的32种染发剂组分、42种防腐剂、包括3-亚苄基樟脑的23种防晒剂组分、36种抗菌类药物、包括普鲁卡因胺的15种组分、包括碱性橙31的7种组分、包括α-羟基酸的10种组分;其中,42种防腐剂:包括甲基异噻唑啉酮的23种组分,包括吡硫鎓锌的19种组分。
3.根据根据权利要求1所述的数据库,其特征在于:通过采集的数据实时录入,实现数据库内容不断扩充。
4.一种HPLC-DAD光谱数据库的构建方法,其特征在于,包括以下步骤:
S1、采用高效液相色谱-二极管阵列检测器联用仪以标准检测方法采集化妆品中安全风险物质对照品的原始数据;采用ASCⅡ码形式构建HPLC-DAD三维色谱-光谱原始数据库框架;
S2、对色谱-光谱原始数据中的各色谱峰的各条光谱数据进行预处理,得到标准化光谱数据;
S3、将步骤S2中的标准化光谱数据导入到HPLC-DAD光谱数据库框架,得到标准化HPLC-DAD光谱数据库。
5.根据权利要求4所述的构建方法,其特征在于,步骤S2中,所述预处理采用的方法为背景补偿加Savitzky-Golay平滑预处理,去处噪音和背景干扰、降低基线漂移的影响,但是不改变光谱形状和宽度;
根据以下方程式执行背景补偿:
Scorr=S-Sb
Scorr:背景补偿后的光谱;S:背景补偿前的光谱;Sb:背景光谱
根据以下方程式计算背景补偿后的波长λi处的吸光度:
Αcorr(λi)=A(λi)-Ab(λi)
Acorr(λi):背景补偿后的吸光度;A(λi):背景补偿前的吸光度;Ab(λi):背景吸光度;
Ab(λi)是根据以下方程式获得:
As(λi):峰开始处的吸光度;Ae(λi):峰结束处的吸光度;t:背景已补偿的光谱的保留时间;te:峰开始的保留时间;ts:峰结束的保留时间;通过整个波长范围内计算得到Scorr;
Savitzky-Golay平滑公式为:
xj,smooth为平滑后的光谱数据集;xj+i为采集的光谱数据集;为平滑系数,即第i期原始数据xj+i在平滑窗口的权重,由最小二乘拟合多项式求得;m为窗口宽度。
6.一种基于HPLC-DAD光谱数据库的物质判别方法,其特征在于它包括以下步骤:
S1、采用高效液相色谱-二极管阵列检测器联用仪以标准检测方法采集化妆品中安全风险物质对照品的原始数据;采用ASCⅡ码形式构建HPLC-DAD三维色谱-光谱原始数据库框架;
S2、对色谱-光谱原始数据中的各色谱峰的各条光谱数据进行预处理,得到标准化光谱数据;
S3、将步骤S2中的标准化光谱数据导入到HPLC-DAD光谱数据库框架,得到标准化HPLC-DAD光谱数据库,作为标准品参比光谱数据库;
S4、采集待测样品的高效液相色谱-二极管阵列检测器三维色谱-光谱原始数据,并按照步骤S2中的方法进行预处理,得到待测物标准化光谱数据;
S5、采用的夹余弦角算法,将待测物标准化光谱数据作为维数与波长数相等的空间向量,通过计算待测标准化光谱S1与标准品的标准化参比光谱S2之间的夹余弦相似度cosθ,计算公式如下:
S1=(A1(λ1),A1(λ2),…,A1(λn))
S2=(A2(λ1),A2(λ2),…,A2(λn))
其中,吸收光谱S1与S2表示各波长处的吸光度的两个向量,λi为波长,A1为待测各波长处的吸光度,A2为标准品各波长处的吸光度;
S6、设置阈值t和夹余弦相似度cosθ进行比较,来评估两个光谱的形状是否匹配,cosθ>t则说明两个光谱的形状匹配。
7.根据权利要求6所述的物质判别方法,其特征在于,步骤S2和S4中,所述预处理采用的方法为背景补偿加Savitzky-Golay平滑预处理,去处噪音和背景干扰、降低基线漂移的影响,但是不改变光谱形状和宽度;
根据以下方程式执行背景补偿:
Scorr=S-Sb
Scorr:背景补偿后的光谱;S:背景补偿前的光谱;Sb:背景光谱
根据以下方程式计算背景补偿后的波长λi处的吸光度:
Αcorr(λi)=A(λi)-Ab(λi)
Acorr(λi):背景补偿后的吸光度;A(λi):背景补偿前的吸光度;Ab(λi):背景吸光度;
Ab(λi)是根据以下方程式获得:
As(λi):峰开始处的吸光度;Ae(λi):峰结束处的吸光度;t:背景已补偿的光谱的保留时间;te:峰开始的保留时间;ts:峰结束的保留时间;通过整个波长范围内计算得到Scorr;
Savitzky-Golay平滑公式为:
xj,smooth为平滑后的光谱数据集;xj+i为采集的光谱数据集;为平滑系数,即第i期原始数据xj+i在平滑窗口的权重,由最小二乘拟合多项式求得;m为窗口宽度。
8.一种基于HPLC-DAD光谱数据库的物质搜索方法,其特征在于,它包括以下步骤:
S1、采用高效液相色谱-二极管阵列检测器联用仪以标准检测方法采集化妆品中安全风险物质对照品的原始数据;采用ASCⅡ码形式构建HPLC-DAD三维色谱-光谱原始数据库框架;
S2、对色谱-光谱原始数据中的各色谱峰的各条光谱数据进行预处理,得到标准化光谱数据;
S3、将步骤S2中的标准化光谱数据导入到HPLC-DAD光谱数据库框架,得到标准化HPLC-DAD光谱数据库,作为标准品参比光谱数据库;
S4、采集待测样品的高效液相色谱-二极管阵列检测器三维色谱-光谱原始数据,并按照步骤S2中的方法进行预处理,得到待测物标准化光谱数据;
S5、采用的夹余弦角算法,将待测物标准化光谱数据作为维数与波长数相等的空间向量,计算待测标准化光谱S1与各个标准品Aj的标准化参比光谱S2j之间的夹余弦相似度cosθj,计算公式如下:
S1=(A1(λ1),A1(λ2),…,A1(λn))
Sj=(Aj(λ1),Aj(λ2),…,Aj(λn))
cosθj=i=1nA1(λi)×Aj(λi)A1(λi)2Aj(λi)2
其中,吸收光谱S1与Sj表示各波长处的吸光度的两个向量,λi为波长,A1为待测各波长处的吸光度,Aj为各个标准品各波长处的吸光度;
S6、在大于阈值t的cosθj中搜索cosθj最大值,该最大值所对应的标准品Aj即为待测物;若所有cosθj均小于阈值t,则说明标准化HPLC-DAD光谱数据库未录入该待测物。
9.根据权利要求8所述的物质搜索方法,其特征在于,步骤S2和S4中,所述预处理采用的方法为背景补偿加Savitzky-Golay平滑预处理,去处噪音和背景干扰、降低基线漂移的影响,但是不改变光谱形状和宽度;
根据以下方程式执行背景补偿:
Scorr=S-Sb
Scorr:背景补偿后的光谱;S:背景补偿前的光谱;Sb:背景光谱
根据以下方程式计算背景补偿后的波长λi处的吸光度:
Αcorr(λi)=A(λi)-Ab(λi)
Acorr(λi):背景补偿后的吸光度;A(λi):背景补偿前的吸光度;Ab(λi):背景吸光度;
Ab(λi)是根据以下方程式获得:
As(λi):峰开始处的吸光度;Ae(λi):峰结束处的吸光度;t:背景已补偿的光谱的保留时间;te:峰开始的保留时间;ts:峰结束的保留时间;通过整个波长范围内计算得到Scorr;
Savitzky-Golay平滑公式为:
xj,smooth为平滑后的光谱数据集;xj+i为采集的光谱数据集;为平滑系数,即第i期原始数据xj+i在平滑窗口的权重,由最小二乘拟合多项式求得;m为窗口宽度。
10.一种基于HPLC-DAD光谱数据库的物质判别和搜索系统,其特征在于:该系统包括数据采集模块、原始数据框架模块、数据预处理模块及标准化参比光谱数据库模块、搜索判别模块;所述数据采集模块的输出与数据预处理模块的输入相接,数据采集模块用于采集待测样品的HPLC-DAD三维色谱-光谱原始数据,其输出模块与原始数据框架模块的输入相接;所述的原始数据框架模块用于储存采集的原始数据;所述数据预处理模块用于对三维色谱-光谱原始数据进行预处理计算得到待测物的标准化参比光谱数据;所述数据预处理模块的输出与标准化参比光谱数据库模块的另一个输入相接,标准化参比光谱数据库模块用于标准化参比光谱数据库框架的构建、储存或更新,获得标准化参比光谱数据库模型;搜索判别模块用于待测样品标准化光谱数据的相似度的计算和搜索,实现色谱峰的识别和结果判定。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2024102004937 | 2024-02-23 | ||
| CN202410200493 | 2024-02-23 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN118091002A true CN118091002A (zh) | 2024-05-28 |
Family
ID=91145051
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202410218272.2A Pending CN118091002A (zh) | 2024-02-23 | 2024-02-28 | Hplc-dad光谱数据库及其构建方法、基于hplc-dad光谱数据库的物质判别方法和搜索方法及其系统 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN118091002A (zh) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119246736A (zh) * | 2024-12-04 | 2025-01-03 | 山东信得科技股份有限公司 | 一种基于成分分析的药品质量检测方法及系统 |
| CN119829556A (zh) * | 2024-12-19 | 2025-04-15 | 吉林大学 | 一种基于参考光谱库的地面测量光谱数据质量审核方法 |
| CN121499706A (zh) * | 2026-01-14 | 2026-02-10 | 西安凯翔光电科技有限公司 | 基于色谱柱分析的化合物监测方法、系统及介质 |
-
2024
- 2024-02-28 CN CN202410218272.2A patent/CN118091002A/zh active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN119246736A (zh) * | 2024-12-04 | 2025-01-03 | 山东信得科技股份有限公司 | 一种基于成分分析的药品质量检测方法及系统 |
| CN119829556A (zh) * | 2024-12-19 | 2025-04-15 | 吉林大学 | 一种基于参考光谱库的地面测量光谱数据质量审核方法 |
| CN121499706A (zh) * | 2026-01-14 | 2026-02-10 | 西安凯翔光电科技有限公司 | 基于色谱柱分析的化合物监测方法、系统及介质 |
| CN121499706B (zh) * | 2026-01-14 | 2026-04-10 | 西安凯翔光电科技有限公司 | 基于色谱柱分析的化合物监测方法、系统及介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN118091002A (zh) | Hplc-dad光谱数据库及其构建方法、基于hplc-dad光谱数据库的物质判别方法和搜索方法及其系统 | |
| Bonnier et al. | Understanding the molecular information contained in principal component analysis of vibrational spectra of biological systems | |
| EP0140599B1 (en) | Method and apparatus for analysis employing multiple separation processes | |
| Li et al. | Morphological weighted penalized least squares for background correction | |
| Suciu et al. | Application of fluorescence spectroscopy using classical right angle technique in white wines classification | |
| Monakhova et al. | Chemometrics-assisted spectrophotometric method for simultaneous determination of vitamins in complex mixtures | |
| JP5458913B2 (ja) | 三次元クロマトグラム用データ処理方法及びデータ処理装置 | |
| Aziz et al. | A systematic literature review on the current detection tools for authentication analysis of cosmetic ingredients | |
| CN105528580B (zh) | 一种基于吸收峰特征的高光谱曲线匹配方法 | |
| CN107091815A (zh) | 一种鉴定红木真伪的方法 | |
| CN110749565A (zh) | 一种快速鉴别普洱茶存储年份的方法 | |
| CN103675147B (zh) | 一种饮料中咖啡因的快速测定的方法 | |
| CN115808402A (zh) | 一种红花中是否含有染色剂的检测方法 | |
| Liu et al. | Chemometric analysis based on HPLC multi-wavelength fingerprints for prediction of antioxidant components in Turpiniae Folium | |
| Alaerts et al. | Exploratory analysis of chromatographic fingerprints to distinguish rhizoma chuanxiong and rhizoma ligustici | |
| CN102507829B (zh) | 一种烟草hplc指纹图谱数据库的建立方法及应用 | |
| EP1167966A2 (en) | Method and apparatus for impurity detection | |
| CN114324219A (zh) | 一种化妆品中视黄醇及6种视黄醇衍生物含量的检测方法 | |
| Mani-Varnosfaderani et al. | Designating the geographical origin of Iranian almond and red jujube oils using fluorescence spectroscopy and l1-penalized chemometric methods | |
| CN109765326A (zh) | 辣椒制品中苏丹红的快速检测方法 | |
| Wang et al. | Species identification and concentration quantification of crude oil samples in petroleum exploration using the concentration-synchronous-matrix-fluorescence spectroscopy | |
| Shamshiri et al. | Geographical authentication of saffron by chemometrics applied to the ion mobility spectrometry data | |
| CN118858496B (zh) | 一种中药原料品质监测分析方法 | |
| WO2019211767A1 (en) | Methods for authenticating botanicals using a marker compound's related chromatographic profile and mass spectral profile jointly | |
| Chen et al. | Advanced applications of spectral technology combined with chemometrics in rapid quantitative analysis and holistic quality evaluation of Cortex Fraxini |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |