專利名稱:處理系列波譜尤其是nmr波譜的方法
技術領域:
根據權利要求1的前言,本發明涉及處理系列波譜的方法,尤其是處理NMR波譜的方法。
背景技術:
混合物的分析和比較是分析化學的重要課題,尤其是在環境科學、生物學、食品工業和過程化學中。例如,在代謝組學領域中,利用確定的波譜方法例如液相色譜/質譜法(LC-MS)或核磁共振(NMR)波譜法獲得的波譜來表征動物和人的生物流體(biofluids)。通常需要分析和比較整組波譜,例如由一系列樣品獲得的眾多單個波譜。為了區分與樣品總濃度變化相關的效應(例如通過稀釋樣品,改變樣品的全部被分析物)及影響樣品組成的效應(混合物中組分的相對濃度),需要使用所謂的歸一化方法。在不同的實驗條件下獲得各種樣品的數據時,也需要歸一化。
至今,在代謝組學研究中-例如研究尿樣-的常用方法是使給定NMR波譜中的信號歸一化,從而獲得所述波譜的恒定總積分。這意味著系列波譜中每一個NMR波譜按比例繪制成相同的曲線下預定面積。潛在的假設是每一個波譜的積分主要是總尿濃度的函數。假設由于代謝組響應引起的各個被分析物濃度的變化相對于總尿濃度的變化而言相對較小,則總尿濃度的變化分別影響全部波譜和波譜的所述預定面積。但是,代謝組研究中的動物可以排泄極大量的物質例如糖類,其可以在波譜中占主要地位并因此實質性地影響歸一化。另外,隨尿一起排泄的藥物相關化合物也可以通過它們的相應峰的積分來影響歸一化,并且因此對波譜的總積分有顯著貢獻。在比較混合物的其它分析應用中出現同樣的問題,其中相對高濃度的未知污染物的出現可顯著影響波譜的總積分或者波譜的所述預定面積。
在US 2003/0111596 A1中公開了利用質譜法研究化學混合物組分的定量方法。如具體在所述文件的0040段中所述,該已知方法基于
a)從多個化學樣品獲得一組樣品波譜,每一個波譜包含具有峰強度的峰;b)選擇基準波譜;c)至于所要歸一化的所述樣品波譜的每一個,對所有峰或對峰總數的一部分計算樣品波譜和基準波譜之間的強度比;d)用從所述強度比計算得到的歸一化系數乘以樣品波譜。
上述方法基于這樣的事實,即在許多實際環境下,所述強度比的大多數將基本相等,代表在樣品和基準波譜之間濃度不變化的組分。然后利用非參數測量由所述強度比計算歸一化系數。優選地,歸一化系數選擇為所述強度比的中值。
如在US 2003/0111596 A1的0031段中進一步指出的,該已知歸一化方法可應用于產生含信號(或峰)的波譜的任何類型的波譜方法或波譜測量方法中,所述信號(或峰)的強度或面積與組分濃度成比例。具體地,它因此可應用于NMR波譜學。
然而,在US 2003/0111596 A1中公開的方法沒有解決識別和消除所謂“異常值”的問題,這些異常值尤其可以是來自人為因素或人為扭曲的單個信號,但也可以是具有某種偏差的整個波譜,例如由于在采集期間的技術故障。這種問題在大量波譜的定量分析中是特別重要的,例如在代謝組研究中。
發明內容
本發明的主要目的是克服現有定量處理波譜、尤其是處理NMR波譜方法的局限和缺點。
通過本發明的方法來實現上述和其它目的。
根據權利要求1,提供處理系列波譜、尤其是處理NMR波譜的方法,包括下列步驟a)選擇主波譜范圍;b)在所述主波譜范圍內記錄多個主波譜;c)在所述主波譜范圍內獲得基準主波譜;d)對每一個所述主波譜進行主波譜除以所述基準主波譜的分格除法(bin-wisedivision)以獲得對應的系列譜商(spectral quotients);
e)對至少一個所述主波譜計算得自對應的系列譜商的相關系列統計量;和f)對至少一個所述系列統計量進行異常值檢測測試。
雖然本發明方法適用于NMR波譜并通過在NMR波譜中的應用來舉例說明,但是它還可應用于產生包含信號(或峰)的波譜的其它類型波譜,所述信號(或峰)的強度或面積與組分濃度成比例,例如質譜或各種類型的光譜。
在本發明內容中,視情況而定,術語“波譜范圍”將用作波譜中的單一區域或多個不連接的區域。具體地,感興趣的波譜范圍可以是多個波譜區域,每一個波譜區域含有一定數量的信號峰。如本發明的某些實施方案所采用的,定語“主要的”在本文中用來與“輔助的”進行對比。具體地,“主波譜范圍”將被用于表示含有某些樣品的一個或多個相關信號峰的波譜范圍。應該注意,通常在含有所述主波譜范圍和輔助波譜范圍(如果可應用的話)的整個波譜范圍中獲得波譜;而且,整個波譜范圍可含有不用于進一步分析的其它波譜范圍。例如,代謝組研究中的1H NMR波譜通常記錄-8-+14ppm范圍的總波譜范圍,從中選擇分別由1-4.5和6-9.5ppm的兩個區域構成主波譜范圍。如今基本上在所有波譜學應用中,獲得的是數字化形式的波譜數據。例如,通常一維NMR波譜可以作為系列強度值而獲得,每一個強度值與特定波譜頻道(spectral channel)或“格”(bin)相關。因此,術語“格”也可以指強度值的總和。因而,第二波譜除以第一波譜的“分格除法”在本文中應理解為采用第一波譜的某些格中強度值,用第二波譜的相同格中的強度值除以它,將除法結果分配到所得的系列譜商的相同格中并對感興趣的波譜范圍中所有格重復該程序。應該理解,如果可得的波譜是非數字化的,即模擬態,則根據本發明仍然可以實施分格除法。這僅僅需要利用現有信號處理技術中已知的適當分格(binning)程序首先將所有模擬波譜轉換成數字形式。
術語“統計量”是指任意數,其大小表示所關心的某些量的量值,例如關聯強度、偏差量、差值大小和分布形狀。例子包括平均值、方差、相關系數等。
術語“異常值”是指任意實體(entity)-具體是信號峰、包含幾個單峰或者甚至是整組波譜的其譜圖或部分譜圖-其對于給定變量的分值基本偏離預定數值范圍。因此,“異常值檢測測試”應該理解為目的在于測定一個給定實體相對于給定測試標準是否應該被認為是異常值的任意類型的程序。
根據本發明的方法可以容易地在波譜數據的自動處理中實施。如下文將進一步舉例說明的,將用于處理系列NMR波譜的實際類型的異常值檢測測試可適用于所關心的任何應用。本方法可以嵌入整個程序中,其中例如證實為異常值的譜圖應該在進一步的分析中被放棄。
有利的實施方案限定在從屬權利要求中。
通常,將選擇對應于主波譜的系列統計量,以便充分描述譜商分布的位置和形狀。因此,有利的是利用至少一個位置量和至少一個寬度量。在根據權利要求2的實施方案中,對應于主波譜的系列統計量包含其譜商的中值和通過其譜商的第三四分位數減去其譜商的第一四分位數而獲得的四分位數間差值。已知這些統計量是相對穩定的。但是,其它的選擇也是可以的可以利用眾數或均值作為位置量,也可以利用其它四分位數間差值作為寬度量。
在根據權利要求3的實施方案中,所述異常值檢測測試包含測定所述四分位數間差值是否超出了預定的閾值寬度。該四分位數之間的差值大表示譜商的寬分布,并因此意味著橫切瞬時波譜的強度相對于基準波譜表現出實質性差異并且不僅僅是簡單的比例縮放行為。根據權利要求4,閾值寬度由得自整組主波譜的所述四分位數間差值分布來確定。換言之,首先獲得在給定系列的全部波譜中發現的四分位數間差值的總印象(impression)從而隨后限定用于異常值檢測測試的閾值寬度。
在根據權利要求5的實施方案中,所述異常值檢測測試包含確定譜商的所述中值與一常數的差是否大于預定閾值商偏差。該大偏差值表示瞬時波譜的總強度相對于給定標準值的偏差。根據權利要求6,閾值商偏差由得自整組主波譜的譜商的所述中值的分布來確定。換言之,首先獲得在給定組的全部波譜中得到的譜商中值的總印象從而限定用于異常值檢測測試的閾值偏差。
另一個有利的實施方案限定在權利要求7中,根據該實施方案,本方法還包括下列步驟a)選擇與所述主波譜范圍不重疊的輔助波譜范圍;b)記錄與所述主波譜中的每一個所述主波譜相關的所述輔助波譜范圍中的相關輔助波譜;c)獲得所述輔助波譜范圍中的基準輔助波譜;d)對每一個所述輔助波譜進行輔助波譜除以所述基準輔助波譜的分格除法以獲得對應的系列輔助譜商;和e)對每一個所述輔助波譜計算來自對應的系列輔助譜商的相關系列統計量;并且,其中所述異常值檢測測試包括比較主波譜統計量和相關輔助波譜統計量。具體地,可以在預期可能出現問題或人為現象的區域中選擇輔助波譜范圍,而在已知不易受問題和人為現象影響的區域中選擇主波譜范圍。然后,輔助波譜可以用作一種診斷工具。如前所述,本文中所討論的任意波譜范圍可以由單一波譜區域構成,或者由兩個或甚至更多的不相連的波譜區域構成。
另一個有利的實施方案限定在權利要求8中,根據該實施方案,對每一個主波譜實施步驟1e)以獲得全部系列的統計量,從該全部系列的統計量中導出系列全局(global)統計量,其中對所述系列全局統計量實施所述異常值檢測測試。換言之,利用來自整個系列波譜的統計信息來實施異常值檢測測試,這應該使測試盡可能客觀。根據權利要求9,所述系列整體統計量包含a)全部系列的所述四分位數間差值的中值;和b)全部系列的所述四分位數間差值的四分位數間差值。
但是,統計量的其它選擇是可以的。
原則上,可利用未校正的強度波譜數據來實施上文中討論的方法。但是,在大多數應用中,優選應用在權利要求10中限定的方法,根據該方法,在實施分格除法之前,使每一個所述主波譜和每一個所述輔助波譜(如果可應用的話)經歷歸一化程序。有利的是,這根據權利要求11來完成,其中對任意一個所述主波譜或輔助波譜的所述歸一化程序包括下列步驟a)對所述波譜進行預處理以獲得預處理波譜;b)計算所述預處理波譜的積分強度;和c)將所述預處理波譜乘以與所述積分強度成反比的歸一化系數。
這種預處理程序將通常取決于波譜的類型和質量。在噪聲數據的情況下,其可以包括平滑或濾波程序;具體地,其可以包括基線校正或減法程序,這將適合于具有基本平坦或緩慢變化背景成分的波譜。具體對于NMR波譜而言,預處理程序可包括填零、定相、應用窗口函數和線性預測。其它的預處理步驟可包括波譜的積分和微分。
實際上,歸一化系數包含比例常數,該常數確保任意歸一化的波譜具有預定的積分強度,例如1或100或任意其它的適當值。
對于將用于處理系列波譜的基準波譜存在幾種選擇。例如,它可以是計算基準波譜、得自數據庫或理論波譜的基準波譜。根據權利要求12,基準主或輔助波譜分別作為在對應主或輔助波譜范圍中記錄的多個空白或對照波譜的中值而獲得。作為替代方案,根據權利要求13,基準主或輔助波譜可以由所述主或輔助波譜的子系列獲得。這種子系列可以僅由單一波譜或多個波譜構成;在由多個波譜構成時,例如,基準波譜可以作為所述多個波譜的中值或均值而獲得。最后,應該注意的是,術語“子系列”應該理解為包括子系列等同于整個系列波譜的情況。
結合附圖參考本發明各種實施方案的下列描述,本發明的上述和其它特征和目的以及實現它們的方法將變得更加清楚并且本發明本身將得到更好地理解,其中圖1表示關于208變量(格)代謝系列研究的四個樣品相對于相同研究的基準樣品的譜商分布;圖2表示典型代謝系列研究的第3四分位數減去第1四分位數的差值(所謂四分位數之間得差值(d))-中值(m)的圖;方形表示未偏離的波譜,圓點表示顯著損傷的波譜(沒有樣品、不良接收器獲取、錯誤定相...),而星號表示局部不規則的波譜(尖峰、藥物相關化合物、異常量的代謝物...);為檢測異常值設置m(0.8和1.2)和d(1)的固定閾值;圖3表示研究具體閾值而不是固定絕對閾值的來自圖2數據的圖;對于所有閾值,n設置為3;圖4表示用于系統變化的分格(binned)形式的“金(golden)”1H NMR波譜;圖5表示由于系統變化而不同的四組系列波譜(A)樣品濃度的系統變化;(B)單峰強度的系統變化(C)樣品濃度和單峰強度的系統同時變化;(D)10格的塊(blocks)的系統變化;圖6表示在不同時間點(16小時到72小時和16小時到168小時)的兩個動物(30號和28號動物)的原始波譜,同時在右手側示出圖像放大區的波譜;圖7表示通過對圖5的四個數據系列的不同歸一化方法而實現的恢復;恢復率為1意味著歸一化程序將不同樣品中具有相同相對濃度的分析物重新按比例縮放至相同的歸一化濃度;圖8表示利用不同基準波譜的商歸一化結果;圖9表示30號和28號動物在不同時間點的含主要信號的波譜區,所述信號沒有由于代謝組學響應(1.44-1.84ppm)而變化;頂行表示商歸一化波譜,中間行表示積分歸一化波譜,底行表示向量長度歸一化波譜;圖10表示在環孢菌素研究中(左側)和在羅格列酮(rosiglitazone)(右側)研究中圖解測定異常值的四分位數間差值d-中值m的圖;圖11表示確認為圖10右側圖中的異常值的一些波譜(A)水共振的不良抑制;(B)負基線;(C)空白樣品和(D)伴隨技術問題例如氣泡而獲得的波譜;和圖12表示對于對應6.04ppm化學位移的信號格的譜商對樣品編號的圖,所述譜商通過將樣品信號除以全部商的中值而獲得;該值大大偏離1表示在對應樣品中抑制水共振存在問題。
具體實施例方式
下文描述實施本發明方法所需的背景和技術,最主要的是包括各種歸一化方法的討論。雖然這些方法可用于各種類型的波譜學,但是以下討論將用NMR波譜特別是1H-NMR波譜來舉例說明。
通常,感興趣的NMR波譜將根據它的作為化學位移δ函數的強度I來描述。但是,將假設波譜能夠以分格數字化形式獲得并因此計為I(i),其中i是指示給定格的變化指數。“信號”I(i)可以理解為通過對第i個格所跨越的波譜范圍的信號進行積分而獲得的結果。在多數情況下,將等距離分格。
1.波譜歸一化本部分描述波譜歸一化常用的三種技術,即積分歸一化、肌酸酐歸一化和向量長度歸一化。接著,導出商歸一化。前三種歸一化技術可以表達為下列具體的通式I(i)=Iold(i)Σk∫jkljku(I(x))ndx---(1)]]>其中Iold(i)和I(i)分別是歸一化之前和之后的波譜強度,k是用于歸一化的波譜區指數,jkl和jku分別是波譜區k的上界和下界,求強度I(x)的冪次n對該波譜區k的積分。
1.1積分歸一化至于積分歸一化,假設波譜的積分主要是樣品濃度的函數。尿的線性濃度系列應該產生線性系列的對應波譜積分。假設單個分析物的各自濃度變化的影響與尿的總濃度變化相比很小。
積分歸一化程序用波譜的積分或部分波譜的積分來除每一個波譜。因此,通式(1)中的冪次n取1。在代謝組學NMR測量領域中,通常的方法是選擇實際包含兩個波譜區的波譜范圍,即一個是9.98-5.98ppm和另一個是4.50-0.22ppm。而且,通常進一步將每一個波譜乘以系數100,因此最終每一個波譜的總積分為100。
積分歸一化的問題是信號的相互依存性。很明顯,任意單一強信號將導致歸一化程序按比例減小所有其它的信號,因此導致混合物中所有分析物濃度明顯減少。
1.2肌酸酐歸一化對于人和動物尿液的檢測,常用的程序是利用肌酸酐的濃度使分析物的濃度和波譜歸一化。潛在的假設是進入到尿中的肌酸酐排泄物恒定。對于歸一化存在兩種可能可以通過臨床化學方法外部測定或通過NMR波譜中肌酸酐相關信號的積分內部測定肌酸酐的水平。后一種方法可以表達為特定情況的積分歸一化。根據通式(1),采用兩個積分區(對應3.04和4.05ppm的肌酸酐峰)和冪次1。
但是,肌酸酐歸一化的實際應用面臨技術和生物性困難。如果通過NMR波譜測定肌酸酐濃度,則具有重疊峰的代謝物會干擾肌酸酐濃度的測定(例如在3.04ppm的肌酸)。利用1H NMR波譜測定肌酸酐的第二個難題在于肌酸酐在4.05ppm附近的化學位移取決于樣品的pH值。因此,必需將選峰算法或更大范圍的波譜用來進行歸一化。
肌酸酐歸一化的生物性挑戰是由于代謝組學響應而引起的肌酸酐濃度變化,這在一些研究中已被發現。在歸一化時,通常還不知道由于代謝組學響應而引起的肌酸酐水平的可能增大。因而,基于肌酸酐的歸一化在代謝組學研究中并不常用并且在本文中將不再討論。因此,肌酸酐峰將被用于研究子系列波譜的肌酸酐水平和用各種方法獲得的歸一化系數之間的相關性,在該子系列波譜中,已知在濃度水平和肌酸酐之間存在嚴格的相關性。
1.3向量長度歸一化在許多科學領域中應用的歸一化技術基于將波譜視為向量。換言之,采用序列強度值I(i)來表示相關向量的分量。進一步假設通過對應樣品的濃度來測定這種向量長度;樣品的組分將因此確定向量的方向。因此,通過將向量長度設置為1來完成不同濃度的調整。注意,這等價于將通式(1)的冪次n設置為2。與積分歸一化類似,由于普通向量長度的計算,使得波譜中所有峰相互影響。
1.4商歸一化商歸一化依賴于下面的假設單個分析物的濃度變化僅影響部分波譜,而樣品的總濃度變化影響全部波譜。與使用積分歸一化不同,計算給定波譜和基準波譜之間的最可幾商,然后將所述商用于獲得歸一化或換算系數。
對于該方法,實施波譜的分格除法和預先選擇基準波譜以獲得系列譜商。應該理解,該方法在一些適當選擇的波譜范圍中進行。理想地,譜商的分布將是窄的;在兩個不同濃度的等同樣品的限制中,各個譜商將隨濃度比而不同。
可以由幾種方法測定的最可幾譜商表示樣品和基準之間的濃度比。圖1的圖面A表示代謝組學研究的樣品R14r30h+000和同一研究的基準樣品之間譜商的分布。發現該樣品比基準樣品略微更濃縮,因為最可幾商(近似為直方圖的最大值)位于約1.1。另一方面,圖1的圖面B表示同一研究的對比性稀釋樣品的結果,結果發現與基準樣品相比具有約0.6的最可幾商。
但是,如果單個分析物由于代謝組學變化而變化,則僅有對應波譜的某些部分將受影響。結果是譜商的分布更寬。圖1的圖面C表示樣品的譜商分布,該樣品由于強代謝組學變化而具有跨越其波譜的極端強度變化。由于分別具有增大和減小強度的部分波譜,這產生了寬的分布,超過值10的極端譜商是由該特定樣品中排出的極端量的葡萄糖所導致。因此,由于尿的總濃度是基本不變的,因此最可幾譜商仍接近1。相反,圖1的圖面D表示具有兩種效果的樣品直方圖,即,由于強代謝組學響應和由于增加尿排泄的樣品稀釋而引起的特定變化。因此,譜商的分布被擴大并且移動到更低值。
商歸一化的一個重要方面是最可幾譜商的確定,這是由于這將被用作換算系數。在前文中,最可幾譜商通過取譜商直方圖的最大值來確定。但是,分布最大值的精確位置取決于分格寬度。因此,目前所提出的直方圖的圖解分析不能夠認為是限定最優譜商的穩定和普遍的方法。采用過粗的分格導致相當大的量化誤差(例如1和1.1的商之間的差對應10%的量化誤差),而太細分格導致直方圖沒有清晰的最大值,如圖1的圖面D所示。實際方法是通過利用商的中值來近似得到最可幾商。中值法的優點在于需要用于直方圖的商非離散分組(分格),這是任意的。中值法允許非常精細地調整波譜而沒有極端值明顯影響調整的危害。
用于計算譜商的基準波譜可以是由“金”基準樣品獲得的單一波譜。作為替代方案,可以使用幾個波譜的中值或平均波譜。基準波譜的類型的影響在4.1.3部分中討論。發現基準波譜應該盡可能具有代表性。因此,推薦計算基準波譜作為多個沒有給藥樣品(對照和給藥前樣品)的中值波譜。
積分歸一化(通常積分到100)可以在商歸一化之前進行。這使得利用不同波譜儀測量的比較研究簡單化,所述不同波譜儀產生不同絕對標度值的波譜。通常,商歸一化方法將由此包括下列步驟
A1.實施積分歸一化(通常采用100的恒定積分)。
A2.選擇或計算基準波譜(最優方法計算未給藥樣品的中值波譜)。
A3.進行樣品波譜除以基準波譜的分格除法以獲得對應的系列譜商。
A4.計算譜商的中值。
A5.通過將樣品波譜乘以所述中值的倒數而重新按比例縮放樣品波譜。
如前文所述,步驟A1是任選的,但在大多數情況下將是有利的。
2.異常值檢測2.1背景作為商歸一化基礎的方法學得以進一步發展以提供異常值的自動檢測。在自動樣品制備、測量和數據處理過程中,可以發生許多影響所得數據質量的事情。例如,技術問題如檢測器的增益不正確、水共振的抑制不充分、在波譜兩個邊界處的尖峰,或在數據處理過程中的問題,如基準不正確、基線校正錯誤和定相不適當均可在測量NMR波譜時發生。另外,尿不存在或濃度太低的樣品應該被自動檢測出來。
在代謝組學研究中(或例如用于產品批次質量控制的所得NMR波譜),大多數分析物具有穩定的相對濃度,并因而大多數信號峰將相應地表現出來。相反,有缺陷的波譜通常具有不同的整體形狀,這導致了與原波譜相比異常寬的譜商分布。這種特征可用于檢測異常值和限定范圍以判斷對化學組成類似的樣品所進行的測量的總體質量。
2.2異常值檢測方法異常值的離線檢測方法(本文中“離線”是指在實驗完成后進行的檢測)包括下列步驟B1.對來自研究的整個系列波譜實施積分歸一化。
B2.計算基準波譜(未給藥樣品的中值波譜)。
B3進行樣品波譜除以基準波譜的分格除法以獲得對應的系列譜商。
B4.對每一個波譜,計算譜商的中值(下文中表示為m)和譜商的第一和第三四分位數之間的差(下文中稱為“四分位數間差值”并表示為d)。中值m可用于瞬時波譜的商歸一化(實際上利用m的倒數作為換算系數)。
B5.進行異常值檢測測試。例如,四分位數間差值d是瞬時波譜的形狀與基準波譜形狀差異程度的量度。因此,異常值的標準可以是超出預選的閾值寬度的d值。下文中進一步討論異常值檢測測試。
如上文所述,步驟B1是任選的,但是在大多數情況下將是有利的。通常,對測量系列的所有波譜實施步驟B4,但這不是嚴格的要求,即,也可以僅對子系列波譜實施步驟B4。
由于僅有步驟B2需要修改,因此上述程序的在線版本的修改是相當溫和的,所述在線版本可用于實時控制波譜檢測和處理。實際方法是在系列測量開始時測量給藥前樣品或對照樣品的基準系列。然后基于該系列波譜來計算基準中值波譜。采用穩定中值允許一定百分比的有缺陷數據存在基準系列中。上述方法的所有后續步驟均基于波譜/波譜基準(spectrum basis)并由此很好的適合于算法的在線版本。
2.3發現異常值和損壞數據由于采集期間的技術故障導致的大部分異常值將得到整體形狀不同的波譜(例如,任意形狀的線和曲線,而不是真實波譜)。因此,不同形狀導致相應波譜的譜商分布非常寬。結果是異常大的四分位數間差值d。雖然是任意的,但是d的固定值1被證明對于代謝組學研究的NMR波譜是合理的閾值寬度。超出該閾值寬度的d值通常表示損壞波譜或影響大部分波譜的問題。除了利用固定和任意閾值的d外,也可以利用具有中值md的和d的四分位數之間差值dd的d的分布。然后可以根據d臨界=md+n·dd來設定d的閾值,其中n是用于調整異常值測定的靈敏度和特異性的參數。
通過察看譜商的中值m可以檢測第二種異常值。如果四分位數間差值d沒有指示異常值,但是譜商的中值m明顯偏離1,則可能是僅在小波譜范圍中的強偏離波譜“愚弄”了積分歸一化(步驟B1)。這可以是由僅影響一小部分波譜的技術問題(例如尖峰或不良的水峰抑制)或由具有異常代謝組學響應的動物所引起。雖然不能在異常動物和技術問題之間做出區分,但是異常值檢測指示必須進一步研究該樣品。對于與m相關的異常值檢測的經驗方法是與理想值1具有±0.15的偏差。而且,除了采用這些硬性閾值之外,還可以采用研究的特性閾值例如中值m的中值mm和中值m的四分位數間差值dm。因此,所述中值的臨界閾值可以根據m臨界=mm+n·dm來設定,參數n確定靈敏度和特異性。
2.4發現特定技術問題如果已知波譜內的區域通常受特定技術問題的影響,則可以選擇該區域作為輔助波譜范圍。然后可以將在該輔助波譜范圍內的譜商與在波譜的不受影響波譜區內即下文中所謂“主波譜范圍”的譜商比較,從而檢測特定問題。該方法因而包括下列步驟C1.選擇主波譜范圍和與主波譜范圍不重疊的輔助波譜范圍。
C2.主波譜范圍中記錄多個主波譜,并且對每一個所述主波譜,記錄輔助波譜范圍內的相關輔助波譜。
C3.在主波譜范圍中獲得基準主波譜和在所述輔助波譜范圍內獲得基準輔助波譜。
C4.對每一個主波譜進行主波譜除以基準主波譜的分格除法以獲得對應的系列譜商;并且對每一個輔助波譜進行輔助波譜除以基準輔助波譜的分格除法以獲得對應的系列輔助譜商。
C5.對至少一個所述主波譜計算主譜商的中值,稱為mp。
C6.對與所述主波譜相關的每一個輔助波譜計算輔助譜商的中值,稱為ma。
C7.計算mp和ma的商,稱為qs。
C8.通過比較qs和基準值1來進行異常值檢測測試。
如果該譜商基本偏離1,則在特定輔助區域中的波譜基本與其余波譜不同,這是特定問題的強烈指示。而且,可以采用固定閾值或基于qs分布的軟性閾值。用這種方法可以處理的典型問題是水共振抑制的質量。為此,選擇特定輔助范圍以包含與水共振附近的波譜區域。
2.5確定整個研究的質量通常,代謝組學研究通過測量相當數量的樣品來進行。這些樣品由接受一定藥物或物質的“給藥”動物和沒有接受所述藥物和物質的“未給藥”動物而獲得。由此測量的波譜將表現出變化,這是由于固有的動物間變化、代謝組學響應和測量間變化(技術問題...)。在這些變化中,代謝組學響應通常導致波譜中最大的局部變化。通常由于代謝組學研究的目標是研究代謝組學響應,因此代謝組學研究的“質量”可以通過觀察波譜形狀的非局部變化來判斷,因為這些很可能不是由代謝組學響應所引起。如果在2.2部分中引入的算法通過下列步驟擴展,則可獲得研究整體質量的測量C9.對所有波譜實施步驟C5(和相應步驟C6)并且對每一個波譜計算商的四分位數間差值d和商的中值m。然后對該研究的所有中值m計算四分位數間差值dm。之后計算該研究的全部中值m的中值mm。還計算該研究的所有差值d的中值(還稱為md)。最后計算該研究的所有四分位數間差值d的四分位數間差值dd。
如果研究含有許多形狀顯著不同的波譜,則md和dd的值將會更高。這可能由于波譜的不良定相、非常低濃度的樣品、測量失敗等原因而發生。對波譜質量的相應影響給代謝組學響應的數據分析提出了更多挑戰。
dm的高值表示對于幾個波譜來說積分歸一化和商歸一化偏差顯著。如果md和dd較高,則這種偏差可能是由有缺陷的波譜引起。另一方面,dm高值和同時md與dd低值意味著研究中的幾個波譜中僅有一小部分是不一致的。這意味著由于強代謝組學響應或者由于波譜中的局部缺陷,例如尖峰、污染物或藥物相關化合物,使得這幾個樣品超出范圍(outlying)。
2.6圖解檢測異常值檢測異常值的圖解工具可以通過將d對m作圖來獲得。因此,正常波譜將圍繞m=1群集,同時具有較低的d值。在圖2中,這些波譜表示為方塊。具有廣泛損傷的波譜具有比通常設定為1的特定閾值更大的d值。在圖2中,這些波譜位于厚水平線之上并由圓圈表示。由于強代謝組學響應、由于污染物或由于波譜局部損壞而超出范圍的波譜位于d的閾值以下,但明顯偏離m=1。通常將m的閾值設定為0.80和1.20。在圖2中,這些波譜位于兩個箱體(boxes)之內并用星號表示。利用參數n=3用可變閾值實施同樣的程序產生的結果示于圖3中。
3.實施例在此分析了具有不同背景的四種數據組。第一種數據基于模擬。因此,代謝組學研究的典型尿NMR波譜是系統性變化的以便模擬可能影響歸一化的各種影響。模擬范圍為從在實際變化直到非實際極端變化。第二實驗數據組是基于來自一個代謝組學研究樣品的NMR測量值。因此,歸一化方法受到具有極大量代謝物樣品和同時受到尿濃度變化的挑戰。對于該數據組,由于技術問題引起的異常值已被濾除。第三數據組是未給藥大鼠的超過4000個NMR測量值的集合。這些樣品僅表示正常的生物和分析變化,因此該數據組允許在最低要求的條件下比較各種歸一化程序的性能。第四數據組基于來自沒有排除任何數據的兩個代謝組學研究的測量值。因此,可能遇到包括空白樣品測量、具有次最優質量的樣品和由于技術問題導致的不良波譜的各種挑戰。這些數據將用于說明在實際情況中異常值的驗證。
3.1用于歸一化的模擬數據組對于歸一化方法的穩定性的模擬,系統性地改變“金波譜(golden spectrum)”。將金波譜計算為來自未給藥大鼠的超過4000波譜的中值波譜。因此認為金波譜代表大鼠尿代謝組學領域中典型的波譜。波譜范圍(9.96-0.4ppm)被均分成0.04ppm的積分格。4.48-6ppm(水和尿)之間范圍的格被排除并且發生檸檬酸鹽共振的范圍(2.72/2.67ppm和2.56/2.52ppm)的格被合并到兩個格中,從而產生總共201個格。使波譜歸一化到100的總積分。第201個格(0.4ppm)的強度被人為設定為0.5。僅更改該峰以模擬濃度的非特定變化但是不用于特定變化。該格將被用作基準格以判斷歸一化方法的質量。在圖4中示出分格的金波譜。
通過以0.1的步幅(steps)系統變化樣品的非特定濃度,直到雙倍濃度從而產生第一組模擬數據。這通過將金波譜的每一個格乘以系數1.1、1.2、1.3等來實施。11個波譜的系列示于圖5的圖面A中。
通過系統改變一個單一格而產生第二組的模擬數據。因而,在2.7ppm的峰(通常在波譜中可見的檸檬酸鹽的兩個峰中一個)以10%的步幅增大總強度積分(總計10步幅)。11個波譜的系列示于圖5的圖面B中。顯然,該單峰占據了整個波譜。
第三組模擬數據表示第一和第二模擬數據組修改的組合。因此,對于每一步,樣品的非特定濃度增大10%的步幅并且同時金波譜的積分強度的10%被加到2.7ppm處的峰處。對應波譜示于圖5的圖面C中。
對于第四組模擬數據,系統更改10個格的塊,以模擬幾個峰的特定變化。因此,對10個格的每一個,起始10個格的強度增加了1%的金波譜積分強度。對于第二波譜,前20個格被增大。總體而言,產生20個波譜,該波譜不斷地逐步增大更多的格直到最后波譜的300%積分強度(與金波譜相比)。系統變化可視為圖5的圖面D中的格的塊,由此,僅系列波譜的第一個和最后一個波譜是直接可視的。必須注意,對于研究中所有回歸一化方法,錯誤格的位置是不相關的。
3.2用于歸一化的代謝組學研究波譜實際代謝組學研究波譜被用于利用實驗數據來測試各種歸一化方法,在該代謝組學研究中,將環孢霉素施加到動物中。對于動物研究,根據在別處(Lindon JC,Nicholson JK,Holmes E,Antti H,Bollard ME,Keun H,Beckonert O,Ebbels TM,Reily MD,Robertson D,Stevens GJ,Luke P,Breau AP,Cantor GH,Bible RH,Niederhauser U,Senn H,Schlotterbeck G,Sidelmann UG,Laursen SM,Tymiak A,Car BD,Lehman-McKeeman L,Cole JM,Loukaci A,Thomas C,Tox ApplParamacology 187,2003,137-146)描述的COMET協議來實施測量和處理。數據組含有通過在不同的時間點對10個對照動物、10個低劑量給藥動物和10個高劑量給藥動物取樣而獲得的總共231個樣品。從該數據組中除去已經檢測為由于技術問題而導致的異常值的18個樣品。如3.1部分中所述來實施波譜區域的分格和排除。兩個高劑量給藥動物的所有時間點的非歸一化波譜和放大部分示于圖6。
3.3用于歸一化的對照樣品為了使不同歸一化方法的實施不僅在強代謝組學響應的困難條件下有效而且在正常條件下也有效,建立了未給藥大鼠NMR波譜的集合。因此,基于最小極端變化,從來自對照動物和給藥前樣品的4521樣品中選擇出4023樣品。該樣品集合表示大鼠的代謝組學特征的正常變化。
由于并不是所有的動物都已給藥,因此樣品的肌酸酐水平不受代謝組學變化的影響并因此樣品的肌酸酐水平代表對樣品的總濃度的良好測量。因此,歸一化方法的性能可以基于歸一化樣品的肌酸酐水平的變化來比較。因此,通過4.02-4.10ppm之間波譜的積分來測定肌酸酐水平以說明由于pH變化導致的肌酸酐峰的移動。
3.4異常值驗證的研究對于異常值的驗證,采用兩個研究。第一研究對應于3.2部分中描述的環孢霉素研究,但是現在包括人工驗證的異常值(與3.2部分對比)。第二代謝組學研究使用羅格列酮作為給藥化合物并含有80個樣品,其中45個波譜來自給藥動物,35個波譜來自未給藥動物。根據COMET協議(Lindon JC等人;Ioc.cit.)實施測量和數據的處理。而且,沒有去除人工驗證的異常值。用于判斷研究的總體質量(參見2.5部分)的標準被應用到含有60個樣品的附加第三研究(30個樣品來自給藥動物,另三十個來自未給藥動物)。該研究的第一測量面臨著關于水共振抑制的問題,水共振導致自動基線校正和定相不良。該研究的數據也進行人工基線校正和定相。另外,利用最優化脈沖系列(Bax脈沖)再次測量該研究的樣品,產生最優視覺質量的波譜。
4.結果按照下列次序來展示結果。首先,利用模擬數據組來比較積分歸一化、向量長度歸一化和商歸一化。然后對代謝組學研究的波譜進行比較。最后利用幾個代謝組學研究來展示采用商歸一化檢測異常值的可能性。
4.1歸一化方法一模擬對于模擬數據組的結果(詳見3.1部分),計算改進波譜和金波譜的0.4ppm格的強度的商。僅根據濃度的非特定變化人工修改該峰。因此,通過構建這種基準幅度,商1意味著相對峰強度的最優恢復并且通過對應的歸一化方法商1意味著波譜的最優歸一化。
4.1.1各種歸一化方法的性能在這部分中,比較積分歸一化和向量歸一化與商歸一化。對于商歸一化,利用金波譜作為基準波譜。基準波譜的系統變化稍后討論。在圖7中,表示了四個數據組的三種歸一化方法的結果。對于僅含有非特定變化的總濃度的數據組1,所有三種方法均表現出最優歸一化。恢復率1意味著僅隨總濃度而變化(例如樣品稀釋)的峰和分析物被歸一化到相同的恒定濃度。象預期一樣,全部三種方法均能夠足以將稀釋樣品的實際系列波譜歸一化。
僅含有一個單信號和非稀釋樣品的特定變化的第二數據組示出表現大不相同的三種方法。向量長度歸一化對單峰的變化高度靈敏。因而,由于利用二次項計算長度,因此由于波譜單格增大導致的濃度向量長度增加極大。向量長度的重新縮放均布于全部格,這導致低估沒有變化的格。對于積分歸一化,由于一個格的強度增加的影響均勻分布而不是對全部格取二次項,因此與實際性能的偏離不是那么驚人。例如,當積分歸一化分布于所有格時,波譜10在一個單格中含有附加100%的總強度,因此導致所有格縮小兩倍。另一方面,商歸一化沒有受單格變化的影響并因此產生對全部波譜的最優歸一化。
含有第一和第二數據系列的組合變化的第三數據系列表現出與第二數據系列很相似的結果。單格的變化強烈影響對向量長度和固定積分的歸一化。
第四數據系列模擬幾個格的組合變化。對于第一波譜,10個格(來自201)的強度被增大(每一個格增大1%總強度),對于第二波譜,20個格的強度被增大,依此類推。對于這種情況,向量長度歸一化表現出比積分歸一化更好的性能,但是這兩種方法對第一波譜均表現出偏離最優歸一化。另一方面,商歸一化一直表現為最優歸一化,系統性增大了201個格中100個格的強度。對于系統性增大甚至更多格的波譜,性能急劇下降。然而,超過半數格在相同方向上系統性變化的這種情況是非常不現實的。對于可以被認為是現實情況的5-25%的格的系統變化,并且甚至對于已是非常極端情況的30%-50%的格的系統變化,商歸一化表現良好。
4.1.2噪聲的影響上文列出的四個數據系列的數據分析被重復兩次,由此人為噪聲被加入到波譜中。對于第一次重復,均勻噪聲被加入到每一個信號,所述均勻噪聲具有0.6%平均強度的標準偏差/信號。這種噪聲量估計是來自波譜區域中超過4000個波譜的典型波譜儀噪聲,在所述波譜區域中沒有生物性變化存在。對于第二次重復,噪聲量增加了十倍從而接近未處理動物的典型生物噪聲。對于兩次重復,所有歸一化方法證明是對噪聲不敏感的。實際上,由于歸一化方法考慮到所有的格(平滑效應),因此,歸一化系數的變化明顯低于每一個格的變化。例如,數據系列1的歸一化系數對0.6%噪聲的標準偏差為0.04%-0.1%,對6%噪聲的標準偏差為0.2%-0.4%。
4.1.3商歸一化基準波譜的影響與向量長度歸一化和積分歸一化相比,商歸一化需要基準波譜。基準波譜對商歸一化性能的影響在本部分中研究。除了利用“金波譜”(1)作為基準波譜之外,還利用下列基準波譜(2)3×4個模擬數據系列的所有波譜的中值波譜,所述所有波譜僅由于非特定變化和由于噪聲而不同。利用來自所有候選波譜的每一個信號格的中值來構建中值波譜。
(3)所有波譜的中值波譜,所述所有波譜僅由于非特定變化、由于噪聲和由于小于或等于總積分的20%的變化而不同。
(4)所有波譜的中值波譜,所述所有波譜僅由于非特定變化、由于噪聲和由于小于或等于總積分的100%的變化而不同。
(5)所有波譜的中值波譜(所有3×4個模擬數據系列)。
(6)在每一個格中具有恒定值1的波譜。
對于上述六個不同的基準波譜,對前述四個無噪聲數據系列實施商歸一化。對于前三個數據系列,基準波譜之間沒有發現顯著差異。對于第四數據系列,可以在圖8中看見明顯差異。利用恒定值作為基準波譜表現出非常差的性能。由于波譜和基準波譜之間譜商的分布對應于波譜本身的分布并因此譜商的分布是平坦和寬的,因而這種發現是不言而喻的。因此,幾個峰的增大將顯著地改變中值。可以看出,如果基準波譜盡可能對應于代表性波譜而沒有特定變化(允許非特定變化),則獲得最穩定歸一化。還可以看出,總強度的高達20%的特定變化不會明顯地影響歸一化,而具有高達100%積分強度特定變化的波譜的歸一化較不穩定。由于完整數據系列6包含具有許多格超高特定變化的非現實超大量的波譜,因此在圖8中表示的所有數據的模擬明顯是基準波譜影響的放大。然而,模擬顯示出歸一化研究的最優方法是利用代表未給藥動物例如對照動物和/或給藥前時間點的數據作為基準波譜。計算代表性波譜的可行方法是分別使用大量對照波譜或給藥前波譜的平均值或中值。計算中值而不是平均值的優點是在波譜中對異常值的較高容限。這在代謝組學研究中經常遇到。
模擬數據系列的目的是測試在現實、極端和一定程度上的非現實條件下的不同歸一化方法。信號的特定變化均僅在一個方向上實施(信號增大),這是由于這更需要歸一化過程如果不同信號特定變化成不同方向,則對歸一化過程而言變化相互抵消。例如,20個信號增加10強度單位和15個信號增加10強度單位,則歸一化方法僅受5個信號變化的影響。因此,對于現實條件,利用數據系列4的模擬應該僅被認為適用于最初一些波譜,而不是全部波譜。
當查看不同的模擬時,很明顯,對于所有不同現實和極端條件,商歸一化均表現得優于普通歸一化方法。特別是當單格極端變化時,這可能發生在代謝組學研究中,商歸一化仍發現了最優歸一化系數,而其它的歸一化方法將單格的過量強度的影響分配到全部格上。因此,引入了具有僅影響單格的系數的所有其它格的人為負相關。
此外,在模擬中表明,商歸一化的最佳基準波譜是最具代表性的沒有特定變化的波譜。因此,對于代謝組學波譜,最優基準波譜應該基于對照動物或在給藥前的時間點的動物波譜來計算(例如作為中值波譜計算)。
4.2歸一化方法-環孢霉素研究在這部分中,利用在3.2部分中詳細描述的完全代謝組學研究的數據來比較三種歸一化方法的性能。通過目測發現,在1.44ppm-1.84ppm化學位移之間的所有信號對不同動物和不同時間點非常穩定。這些信號不受該研究中特定代謝組學變化的影響而僅受尿濃度差異的影響。因此,不同樣品之間的這部分波譜積分的相對標準偏差被用作歸一化方法的質量標準。對于兩個高劑量給藥的動物28和30,在圖9中對利用不同方法歸一化的這部分波譜作圖。動物28在時間點48h和72h排出極大量的葡萄糖,而動物30在所有時間點表現出典型的代謝組學響應。為了比較,兩個動物的完整非歸一化波譜在圖6中表示。
最后,將該研究的所有樣品用于研究不同方法的歸一化系數和在4.02-4.10ppm間積分測定的肌酸酐濃度之間的相關性。
對于積分歸一化,動物28和30的波譜在圖9的中間行表示。明顯的是,動物30在1.44ppm-1.84ppm之間表現出更適合的信號,而對于動物28,時間點48h和72h的波譜太低。這些時間點的波譜表現出非常高的葡萄糖峰,由于限制總積分因此這些葡萄糖峰抑制剩余的波譜。該研究所有積分歸一化樣品在1.44ppm-1.84ppm之間的積分表現出10.3%的相對標準偏差。歸一化系數對肌酸酐峰的線性回歸表現為0.87的相關系數。
向量長度歸一化圖(圖9,底行)表現出較差的歸一化。兩個動物的幾個波譜在1.44ppm-1.84ppm之間表現出太低或太高的信號,并且兩個葡萄糖樣品(動物28,48h和72h)偏離最大。該區域中信號在所有樣品中不同,這可以由15.0%的相對標準偏差看出。而且與肌酸的相關性差(r=0.62)。
從圖9的頂行可以看出,商歸一化對本文中繪圖的樣品是較好的。1.44ppm-1.84ppm之間的信號非常適合于所有樣品。該區域中所有樣品信號的4.5%的低相對標準偏差和與肌酸酐峰極佳的相關性(r=0.99)表明商歸一化是對全部研究最一致的歸一化。
4.3歸一化方法-正常樣品一個令人感興趣的問題是驗證不同歸一化方法對對照動物和給藥前動物不僅在困難條件下而且在“正常條件下”的性能。所選的4023未給藥樣品(詳見3.3部分)不含有強代謝組學響應或藥品相關化合物。因此,預計所有三種歸一化方法應該表現出類似的性能。由于未給藥動物應該具有很穩定的相對肌酸酐水平,因此本文中通過肌酸酐峰的相對標準偏差來評估三種歸一化方法的性能。
結果很值得關注向量長度歸一化具有不可接受的12.2%的肌酸酐峰高相對標準偏差,而積分歸一化具有7.6%的低相對標準偏差,并且商歸一化性能最佳,具有6.7%的低相對標準偏差。這意味著甚至當觀察對照動物時,由于代謝組學變動引起的特定變化是如此之高使得在歸一化方法之間存在顯著差異,由此商歸一化表現出最佳的性能。
4.4異常值驗證用商歸一化方法將包括通過目測波譜檢測的異常值的環孢霉素研究歸一化(詳見3.4部分數據系列)。對于異常值的自動驗證,對每一個樣品,除了商的中值m外,還計算譜商的第三和第一四分位數之間的四分位數間差值d。在圖10的左圖面中,對該研究的全部樣品用d對m來繪圖。通過目測波譜發現的異常值表示為圓點、三角形和菱形。很明顯,所有非遠離中心的樣品群集在非常低的d值和約為1的中值處。具有極端代謝組學響應的樣品在這種情況下是極大量的葡萄糖,該樣品位于低d值和低m值處。由于技術問題、空白樣品和具有水共振抑制不良的樣品所引起的異常值均位于高d值處(高于3)。這意味著d>1的樣品閾值檢測出由于非代謝組學相關問題引起的所有異常值。而且,極端葡萄糖樣品可以用d<1和m<0.8的簡單閾值來檢測為極端代謝組學響應。第二研究的質量圖(參見3.4部分)在圖10的右圖面中表示。而且,d>1的樣品閾值檢測出先前通過目測所有波譜驗證的全部異常值。由于典型問題導致的一些遠離中心的波譜示于圖11中。
在圖12中,證實了對于羅格列酮研究而言,商歸一化是如何被用于檢測特定問題的。在該實施例中,監測了水共振抑制的質量。首先,對該研究實施商歸一化。然后,計算6.04ppm處波譜除以所有商的中值得到的譜商。如果對應值強烈偏離1,則波譜明顯不同于水共振附近的基準。很明顯,四個樣品具有較差的水抑制。這四個樣品也已經被人工驗證并且在圖10的右圖面中表示為三角形▲。
表1三個數據系列的不同質量特征。質量特征值越低表示全部研究中的波譜的形狀越類似。
對于第三數據系列(參見3.4部分),商歸一化的另一個應用示于表1中。其中,示出了四分位數間差值的中值md和四分位數間差值的差值dd(詳見2.5部分)。第一次測量對幾個樣品具有較差的水抑制,較差的水抑制對自動定相和基線校正有不利的影響。人工基線校正和定相可以改善這些樣品的視覺質量。然而,具有最優脈沖次序的樣品的第二次測量明顯地改善了水抑制和波譜質量(如目測所證實)。從表1明顯可知,全部三個異常值標準均與波譜質量的視覺印象一致。因此md表達了波譜內的平均不均勻性。由于僅有一些波譜受不良水抑制的影響,因此md僅適度減少。在另一方面,由于樣品的再處理和再測量主要改善具有較差水抑制的樣品,因此描述不同波譜之間這種不均勻性的差異的dd急劇減少。兩種質量特征均允許評估波譜內和波譜之間的均勻性而不需要檢驗波譜。
權利要求
1.處理系列波譜具體是NMR波譜的方法,包括下列步驟a)選擇主波譜范圍;b)記錄所述主波譜范圍內的多個主波譜;c)獲得所述主波譜范圍內的基準主波譜;d)對每一個所述主波譜進行所述主波譜除以所述基準主波譜的分格除法以獲得對應的系列譜商;和e)對至少一個所述主波譜計算來自對應系列譜商的相關系列統計量;其特征在于,該方法還包括以下步驟f)對至少一個所述系列統計量進行異常值檢測測試。
2.根據權利要求1所述的方法,其中對應于主波譜的系列統計量包含其譜商的中值和由其譜商的第三四分位數減去其譜商的第一四分位數而得到的四分位數間差值。
3.根據權利要求2所述的方法,其中所述異常值檢測測試包括確定所述四分位數間差值是否超出預定的閾值寬度。
4.根據權利要求3所述的方法,其中所述閾值寬度由取自整個系列主波譜的所述四分位數間差值的分布來確定。
5.根據權利要求2所述的方法,其中所述異常值檢測測試包括確定所述譜商的中值與一常數的差是否大于預定的閾值商偏差。
6.根據權利要求5所述的方法,其中所述閾值商偏差由取自整個系列主波譜的所述譜商中值的分布來確定。
7.根據權利要求1所述的方法,還包括下列步驟a)選擇與所述主波譜范圍不重疊的輔助波譜范圍;b)記錄與所述主波譜范圍中的每一個所述主波譜相關的所述輔助波譜范圍中的輔助波譜;c)獲得所述輔助波譜范圍中的基準輔助波譜;d)對每一個所述輔助波譜進行輔助波譜除以所述基準輔助波譜的分格除法以獲得對應的系列輔助譜商;和e)對每一個所述輔助波譜計算來自對應的系列輔助譜商的相關系列統計量;其中所述異常值檢測測試包括比較主波譜的統計量和相關輔助波譜的統計量。
8.根據權利要求1所述的方法,其中對每一個所述主波譜實施步驟1e)以獲得全部系列的統計量,從該全部系列的統計量得出系列全局統計量,并且其中對所述系列全部統計量進行所述異常值檢測測試。
9.根據權利要求2和8所述的方法,其中所述系列全局統計量包含a)全部系列的所述四分位數間差值的中數;和b)全部系列的所述四分位數間差值的四分位數間差值。
10.根據權利要求1-9中任意一項所述的方法,其中在實施分格除法之前使每一個所述主波譜或輔助波譜經歷歸一化過程。
11.根據權利要求10所述的方法,其中對任意一個所述主波譜或輔助波譜的所述歸一化方法包括下列步驟a)對所述波譜進行預處理以獲得預處理波譜;b)計算所述預處理波譜的積分強度;和c)用與所述積分強度成反比的歸一化系數乘以所述預處理波譜。
12.根據權利要求1-11中任意一項所述的方法,其中所述基準主或輔助波譜分別作為在對應的主波譜或輔助波譜范圍內記錄的多個空白或對照波譜的中值而得到。
13.根據權利要求1-11中任意一項所述的方法,其中由所述主波譜或輔助波譜的子系列獲得所述基準主或輔助波譜。
全文摘要
處理系列波譜具體是NMR波譜的方法,包括下列步驟a)選擇主波譜范圍;b)記錄所述主波譜范圍內的多個主波譜;c)獲得所述主波譜范圍內的基準主波譜;d)對每一個所述主波譜進行所述主波譜除以所述基準主波譜的分格除法以獲得對應的系列譜商;e)對至少一個所述主波譜計算來自對應系列譜商的相關系列統計量;和f)對至少一個所述系列統計量進行異常值檢測測試。
文檔編號G01N24/00GK1838107SQ20061005786
公開日2006年9月27日 申請日期2006年3月1日 優先權日2005年3月24日
發明者弗蘭克·迪特勒, 阿爾弗雷德·羅斯, 格茨·施洛特貝克, 漢斯·森 申請人:F·霍夫曼-拉·羅奇股份有限公司