[發明專利]一種生物代謝組學數據處理方法、分析方法及裝置和應用有效
| 申請號: | 202111130359.7 | 申請日: | 2021-09-26 |
| 公開(公告)號: | CN113588847B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 趙丹;李安州;郭磊;劉萌萌;李靖瀟;王燕;劉小芬 | 申請(專利權)人: | 萱闈(北京)生物科技有限公司;鄭州市第三人民醫院 |
| 主分類號: | G01N30/02 | 分類號: | G01N30/02;G01N30/72;G01N30/86 |
| 代理公司: | 北京箴思知識產權代理有限公司 11913 | 代理人: | 李春暉 |
| 地址: | 100006 北京市東城區王府井*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 生物 代謝 數據處理 方法 分析 裝置 應用 | ||
本發明公開了一種生物代謝組學數據處理方法、分析方法及裝置和應用。生物代謝組學數據處理方法包括篩選出多個待測樣品中的差異代謝物的步驟,生物代謝組學數據包括待測樣品的液相色譜?質譜數據,篩選的方法包括:(1)對生物代謝組學數據進行預處理和標準化處理,得到二維矩陣數據;(2)缺失峰補齊處理:對所述二維矩陣數據進行稀疏重構處理,再進行降維處理;(3)對步驟(2)得到的數據進行化學計量分析,篩選出待測樣品中的差異代謝物。本發明的方法可用于分析不斷有新樣品增加,樣品收集時間長的代謝組學數據,識別和確定差異代謝物的結構,準確度和精度均較高。
技術領域
本發明屬于代謝組學技術領域,尤其涉及一種生物代謝組學數據處理方法、分析方法及裝置和應用。
背景技術
代謝組學的應用極為廣泛,幾乎已經滲透到生活的各個方面。尤其是在現代生命科學和醫藥科學領域,應用更為普遍,其應用范圍包括臨床醫學、藥物研發、生物農業、食品安全、環境科學以及生物能源等方面。
在疾病診斷方面,由于機體的病理變化,代謝產物也產生了某種相應的變化,應用代謝組學分析對這些由疾病引起的代謝產物的響應進行分析,可以促進疾病生物標志物的發現以及輔助臨床診斷。如代謝組學技術被應用于胃癌、肝癌、前列腺癌、腸癌和心血管疾病等重大疾病方面的研究。
代謝組學的數據處理主要包括原始數據的預處理和多變量數據分析兩個步驟,其目的在于揭示生物樣品的關鍵性生物標志物、代謝節點和代謝途徑,最終幫助揭示代謝組學的數據分析結果。數據處理是挖掘過程中的重要一步,如果存在許多不相關、冗余的信息、噪聲或不可靠的數據,則使得數據訓練期間的特征識別更加困難。
LC/MS成為復雜生物樣品中分析代謝產物的首選方法,但是基于LC/MS的代謝組學數據,都具有信息量大、維度高以及數據復雜性強等特點,如何處理以及更好地整合代謝組學數據仍然面臨著巨大的挑戰,比如臨床數據收集時間長,分析樣本量巨大;為了確定各種生物系統中的生物擾動、分析代謝變化的時間依懶性、以及評估個性化醫療中的治療效果和高危人群分層,來自大規模代謝學研究中的數據通常收集期可達數月甚至數年之久,并且必須分成多個批次,需要綜合考慮各實驗批次研究中所得到的全部數據,另外,相對于小樣本而言巨大數量的變量所造成的維度災難,以及當數據分析過程中需要評估大量參數以及測試大量統計假設時,如果樣本量過小在估計參數或者測試統計假設上帶來的困難,也需要慎重考慮數據整合的重要性和必要性。
目前,通常使用開源程序處理LC/MS代謝組學數據,但是由于這些軟件不能對儀器產生的原始數據進行識別,所以需要使用者準備符合軟件格式要求的數據,也因此需要使用與儀器配套的軟件對原始數據進行處理,直至成為可供分析使用的數據集。當前的一些程序對于整合不同樣本和不同批次的代謝組學數據,存在一些問題和局限性,數據處理時間和難度會隨樣本數增加而增加,不適用于不斷有新樣本需要測試的代謝組學數據分析,結果的準確度和精度相對較低。
因此,本領域亟需開發一種準確度和精度均較高,且可用于處理不斷有新樣品增加,樣品收集周期較長的代謝組學數據的分析方法。
發明內容
本發明所要解決的技術問題是克服現有技術中在整合不同樣本和不同批次的代謝組學數據時,數據處理時間和難度會隨樣品增加而增加,不適用于不斷有新樣品需要進行處理的代謝組學數據分析,且現有方法的準確度和精度都較低等缺陷,而提供一種生物代謝組學數據處理方法、分析方法及裝置和應用。本發明的生物代謝組學數據處理方法可用于分析不斷有新樣品增加,樣品收集時間長的代謝組學數據,例如結直腸癌高危人群血清成分的代謝組學數據,通過采用液質譜聯用(LC-MS)方式檢測正常人群和高危人群(腺瘤、癌前病變、癌癥)血清樣本的代謝組學數據,比較和分析正常人群和患者血清中不同代謝產物的質譜峰,識別和確定差異代謝物的結構,為對差異代謝物的功能和代謝途徑的確定提供研究基礎,便于進一步判斷出不同個體(患者)的病理、生理狀態,為后期臨床診斷和治療提供依據。本發明的生物代謝組學數據處理方法的準確度和精度更高。
本發明采用以下技術方案解決上述技術問題:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于萱闈(北京)生物科技有限公司;鄭州市第三人民醫院,未經萱闈(北京)生物科技有限公司;鄭州市第三人民醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111130359.7/2.html,轉載請聲明來源鉆瓜專利網。





