[發明專利]一種模型自適應的NMR代謝組學數據歸一化方法有效
| 申請號: | 201510084309.8 | 申請日: | 2015-02-16 |
| 公開(公告)號: | CN104615903B | 公開(公告)日: | 2017-05-03 |
| 發明(設計)人: | 董繼揚;鄧伶莉 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 廈門南強之路專利事務所(普通合伙)35200 | 代理人: | 馬應森 |
| 地址: | 361005 *** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 自適應 nmr 代謝 數據 歸一化 方法 | ||
技術領域
本發明涉及核磁共振,尤其是涉及一種模型自適應的NMR代謝組學數據歸一化方法。
背景技術
代謝組學方法是上世紀90年代末期發展起來的一門新興科學,它借助高通量、高靈敏度與高精確度的現代分析技術,分析細胞、組織和生物體液中內源性代謝物的整體組成,并通過代謝物復雜的、動態的變化,辨識和解析被研究對象的生理病理狀態。
由于核磁共振(NMR)技術具有非侵入和無偏向性的特點,使其成為代謝組學主要的分析技術。高通量、高分辨的現代NMR分析儀器在獲取生物樣品中更豐富、更準確的代謝信息的同時,也給后續的數據分析帶來了巨大的挑戰。通常,一個生物樣品的一維1H NMR譜就有4k~32k個數據點,而且這些數據點之間存在嚴重的共線性。為了獲知導致數據變異的主要原因,需要結合多維統計模式識別等統計計算方法。
目前,主要采用主成分分析(Principal Component Analysis,PCA)(Wold S:Principal component analysis.Chemometrics and Intelligent Laboratory Systems 1987,2(1):37-52)、偏最小二乘分析(Partial Least Square,PLS)(Geladi P,Kowalski BR:Partial least-squares regression:a tutorial.Analytica Chimica Acta 1986,185:1-17)和正交偏最小二乘分析(Orthogonal PLS,OPLS)(Trygg J,Wold S:Orthogonal projections to latent structures(O-PLS).Journal of Chemometrics 2002,16(3):119-128)等多變量線性投影方法降低數據維數和消除共線性,并獲取感興趣的生物代謝信息。但是,在復雜的生物樣品中,不同代謝物的濃度差別往往很大。當利用PCA和PLS這類基于方差的多變量統計方法對這些未經處理的數據分析時,小尺度信號的作用容易被大尺度信號所覆蓋。實際上,大尺度信號的這種變化可能只是由于尺度大造成的,并不能反映數據本身的變化情況,獲取結果可能是無意義的,因此為了消除數據尺度差異過大帶來的不良影響,需要對數據進行歸一化處理。
數據歸一化方法很多,NMR代謝組學中常用的歸一化方法主要有單位方差歸一法(Unit Variance,UV)(Van Den Berg RA,Hoefsloot HC,Westerhuis JA,Smilde AK,Van Der Werf MJ:Centering,scaling,and transformations:improving the biological information content of metabolomics data.BMC Genomics 2006,7(1):142)、帕萊托歸一法(Patero)(Odunsi K,Wollman RM,Ambrosone CB,Hutson A,McCann SE,Tammela J,Geisler JP,Miller G,Sellers T,Cliby W:Detection of epithelial ovarian cancer using 1H-NMR-based metabonomics.International Journal of Cancer 2005,113(5):782-788)和變量穩定性歸一法(Variable Stability,縮寫為VAST)(Keun HC,Ebbels T,Antti H,Bollard ME,Beckonert O,Holmes E,Lindon JC,Nicholson JK:Improved analysis of multivariate data by variable stability scaling:application to NMR-based metabolic profiling.Analytica Chimica Acta 2003,490(1):265-276),其一般通式可以表示為:
其中,sj為矩陣X第j列(第j個變量)的歸一化權重系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510084309.8/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





