專利名稱:一種光譜的多組分分析方法
技術域本發明屬于光譜分析技術領域,具體涉及一種光譜的多組分分析方法,能較好地減少噪聲干擾,解決非線性、小樣本條件下的多組分定量分析問題,可用于儀器進行溶液的多組分濃度測量。
背景技術:
光譜信號的多組分分析技術是光譜分析技術中的重要組成部分,是指運用相關的算法對測量的光譜數據進行相應的分析處理,從而達到不經分離、一次測量就可同時得出混合物中各組分含量的目的。常用的分析方法有多元線性回歸、K矩陣、卡爾曼濾波、主成分回歸、神經網絡等。實際應用時,在儀器噪聲干擾、多組分體系交互影響較大、非線性關系明顯且已知標準樣本少的情況下,上述方法的分析效果均不大理想,因而研究減少噪聲干擾、解決非線性、小樣本條件下的多組分分析方法是很必要的。
發明內容
本發明的目的在于提供一種解決非線性、小樣本條件下的光譜多組分分析問題的方法。
為實現上述目的,該方法主要包括光譜分析、小波分析、均勻設計、支持向量機和交叉校驗步驟。所述方法主要包括以下內容通過對未知待測溶液組分的濃度進行簡單的估算,確定所選用的均勻設計表,根據均勻設計表配置相應的樣本溶液并進行測量,記錄所得的數據,用支持向量機和交叉校驗的方法,建立并訓練支持向量機,最后用支持向量機進行多組分分析。在對原始測量數據進行處理前都要運用小波方法進行了相應的去噪聲處理。具體內容如下(結合圖1)1)對未知待測溶液組分的濃度進行估算對未知待測溶液的光譜用小波分析的方法對其進行相應的去噪聲處理。配置一個已知各組分濃度的樣本溶液和相應的各個單組分溶液,測定它們吸光度并用小波分析的方法進行去噪聲處理,根據朗伯-比爾定理,求出各個單組分的單位吸光度矩陣,利用加和性定理,求出已知濃度的樣本溶液中各組分濃度偏差的百分比值。同理,利用未知待測溶液的吸光度和單位吸光度矩陣得出待測溶液各組分濃度的原始估計,最后利用各組分中濃度偏差的百分比值最終估算出待測溶液各組分的濃度。
2)根據實際的需要確定所選用的均勻設計表,安排具體的濃度數值。總的指導原則是對每個組分而言,使得估計的組分濃度在數值上大致位于表中組分濃度的中間位置。
3)對根據均勻設計表配置相應的樣本集溶液,并進行相應地測量,記錄所得的數據,并用小波分析的方法對其進行相應的去噪聲處理。
4)利用獲得已知濃度的樣本集數據,根據交叉校驗的方法(一般采用留一法)建立并訓練支持向量機,最后用訓練好的支持向量機對未知待測溶液進行多組分分析。建立基于支持向量機的多組分分析模型的具體方法如下,其基本結構見圖2所示,圖中SVM-1、SVM-2、SVM-h分別表示組分1、組分2、組分h對應的支持向量機;yk為待測溶液的吸光度,c1、c2、ch分別為組分1、組分2、組分h對應的預測濃度值。
設有n個由h種組分組成的樣本,其濃度矩陣為C,在m個分析通道測得相應的吸光度矩陣為Y,如式(1)所示,多組分分析的目的就是根據已知樣本的濃度和吸光度矩陣,建立相關的模型,在利用該模型去預測未知試樣各組分的濃度。
C=c1,1c1,2···c1,nc2,1c2,2···c2,n············ch,1ch,2···ch,nY=y1,1y1,2···y1,ny2,1y2,2···y2,n············ym,1ym,2···ym,n---(1)]]>其中yk,i,cf,i,k=1,…,m,i=1,…,n,f=1,…,h;yk,i是第i個樣品在第k個分析通道處測量吸光度;cf,i表示第i個樣品中第.f個組分的濃度。
由式(1)可以看出,多組分分析是一個多維輸入多維輸出的問題;而基于支持向量機的回歸分析算法只能對多維輸入,單維輸出的情況進行處理。因此,要想利用它來進行多組分分析就存在一個如何將其推廣到多維輸入多維輸出的問題。采用的方法是建立多個支持向量機,每個支持向量機對應一種組分,如有h種組分就相應地建立h個支持向量機,然后分別以已知標準樣本校正集的吸光度矩陣Y為輸入集合,以校正集的濃度矩陣C為目標集合采用交叉校驗的方式對各個支持向量機進行訓練,最后以未知試樣的吸光度為輸入,利用訓練好的各個支持向量機就可得出各組分的濃度。
圖1光譜多組分分析的流程圖;圖2基于支持向量機的多組分分析模型;圖3溶液D去噪聲前的光譜;圖4溶液D去噪聲后的光譜;圖5估算時用到的光譜;圖65個訓練樣本光譜;圖7建立的支持向量機;具體的實施方式有含A、B兩種組分的溶液D,求溶液D中A、B兩種組分的濃度首先,配置已知溶液C,溶液C中A、B的濃度分別為30、40濃度單位。配置A和B的單組分溶液,A、B的濃度分別為30、40濃度單位。對上述溶液進行測量,再小波分析的方法進行去除噪聲處理,求波長點430nm和450nm處進行分析,具體的吸光度數據見表1。選用的均勻設計表見表2。
表1吸光譜數值表
表2均勻設計表
可以求得溶液C中A、B的濃度分別為45.3574、59.5142,和實際值相比的偏差百分比分別為0.5119、0.4879。
同理,求得溶液D中A、B的濃度估計分別為60.4274、74.5145,進而得出估算濃度為39.9679、50.0803。39.9679取整數40,50.0803取整數50,得出均勻設計表的具體數值,見表3。
表3均勻設計表的具體取值
配置溶液,進行去噪聲處理,具體數據的結果見圖4所示,圖4顯示的是溶液D去噪聲后的光譜,圖3顯示的是溶液D去噪聲前的光譜;圖5顯示的是估算時用到的光譜;最后,建立兩個支持向量機并用所得的數據進行訓練,圖6是5個訓練樣本光譜;最后用訓練好的支持向量機對溶液D中A、B兩種組分的濃度進行預測,其數值分別為40.0002、50.0003。圖7是建立的支持向量機。圖中SVM-A、SVM-B分別表示組分A、組分B所對應的支持向量機;yk為待測溶液D的吸光度,CA、CB分別為組分A、組分B對應的預測濃度值。
權利要求
1.一種光譜的多組分分析方法,其特征在于包括以下步驟1)對未知待測溶液組分的濃度進行估算對未知待測溶液的光譜用小波分析的方法對其進行去噪聲處理,配置一個已知各組分濃度的樣本溶液和相應的各個單組分溶液,測定它們吸光度并用小波分析的方法進行去噪聲處理,根據朗伯-比爾定理,求出各個單組分的單位吸光度矩陣,利用加和性定理,求出已知濃度的樣本溶液中各組分濃度偏差的百分比值;同理,利用未知待測溶液的吸光度和單位吸光度矩陣得出待測溶液各組分濃度的原始估計,最后利用各組分中濃度偏差的百分比值最終估算出待測溶液各組分的濃度;2)根據實際的需要確定所選用的均勻設計表,安排具體的濃度數值,總的指導原則是對每個組分而言,使得估計的組分濃度在數值上大致位于表中組分濃度的中間位置;3)根據均勻設計表配置樣本集溶液,并進行測量,記錄所得的數據,并用小波分析的方法對其進行去噪聲處理;4)利用獲得已知濃度的樣本集數據,根據交叉校驗的方法建立并訓練支持向量機,最后用訓練好的支持向量機對未知待測溶液進行多組分分析。
全文摘要
本發明屬于光譜分析技術領域,具體涉及一種光譜的多組分分析方法。該方法的步驟包括對未知待測溶液組分的濃度進行簡單的估算,確定選用均勻設計表和具體的濃度數值,根據均勻設計表配置相應的樣本溶液并進行測量,記錄所得的數據,用支持向量機和交叉校驗的方法,建立并訓練支持向量機,最后用支持向量機進行多組分分析。其中在對原始測量數據進行處理前都要運用小波方法進行了相應的去噪聲處理。本發明為減少實驗樣本數、克服非線性因素的影響、獲取最佳預測效果提供了一種分析方法,可為光譜儀和基于光譜法的生化分析儀用戶進行多組分分析提供參考。
文檔編號G01J3/42GK1880944SQ20061007084
公開日2006年12月20日 申請日期2006年3月14日 優先權日2005年9月27日
發明者溫志渝, 熊寧虹, 梁玉前 申請人:重慶大學