[發明專利]一種代謝混合物MS/MS質譜的仿真生成方法及系統有效
| 申請號: | 201610049964.4 | 申請日: | 2016-01-25 |
| 公開(公告)號: | CN105760708B | 公開(公告)日: | 2018-12-14 |
| 發明(設計)人: | 周家銳;紀震;殷夫;朱澤軒 | 申請(專利權)人: | 哈爾濱工業大學深圳研究生院 |
| 主分類號: | G06F19/12 | 分類號: | G06F19/12 |
| 代理公司: | 深圳市君勝知識產權代理事務所(普通合伙) 44268 | 代理人: | 王永文;劉文求 |
| 地址: | 518055 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 代謝 混合物 ms 仿真 生成 方法 系統 | ||
本發明公開一種代謝混合物MS/MS質譜的仿真生成方法及系統。本發明不依賴于真實實驗,可通過修改參數設定,大量產生所需的代謝混合物MS/MS仿真質譜,其成本極低,樣本量不受采集條件限制。此外,當條件與環境變動時,也無需重新設計并進行實驗;有助于提升代謝組學的研發效率。本發明使用非線性回歸模型生成MS/MS仿真質譜,避免了傳統算法中簡單線性疊加所帶來的準確性問題。此外,通過統計真實代謝質譜數據建立噪聲概率模型,涵蓋了現實應用中需要面臨的復雜干擾情況。所生成的質譜數據更符合實際,可有效指導代謝組學的前期研發,并部分用于算法性能的驗證。
技術領域
本發明涉及仿真領域,尤其涉及一種代謝混合物MS/MS質譜的仿真生成方法及系統。
背景技術
代謝物是生物體內完成代謝過程的小分子有機化合物總稱,其包含了豐富的生理狀態信息。代謝組學基于對代謝物的整體系統性研究,可有效揭示生理現象背后的真實機理,并更為全面地展示生命體的動態狀態,因此獲得了越來越多的重視,被廣泛應用于諸多科研與實用領域中。質譜分析(Mass Spectrometry,MS)是代謝組學最為重要的研究工具之一。其中的二級質譜(MS/MS)因其可有效鑒別不同代謝物質,并準確衡量信號強度,近年來已成為主要的發展方向,其數據形式如圖1和圖2所示。在實際應用中,一般需分析包含多種代謝物的混合物質,其MS/MS質譜成為相關研究與開發的數據基礎。
現有的代謝混合物MS/MS質譜主要由兩種方法獲得:
第一種是直接通過實際實驗,使用質譜儀取得特定混合物樣本的MS/MS質譜,這一方法可得到真實的譜線數據,是代謝組學最為重要的信息來源與支撐。但其成本較高,在不同混合物與參數條件下的質譜差異較大,難以滿足相關研究的需求。
第二種是使用計算機仿真技術,根據已知的單一代謝物MS/MS質譜及理化知識,生成推定的譜數據(Putative Spectra)。此方法成本較低,可大量產生特定參數條件下的代謝混合物仿真質譜。但準確度不高,用于研究開發可能導致錯誤結果。
在現有的代謝組學研究中,一般使用計算機仿真所生成的MS/MS質譜數據進行初期研發,而后再基于實驗數據驗證其真實性能。仿真質譜的準確程度決定了相關研究的質量與速度。
現有基于實驗的代謝混合物MS/MS質譜生成方法,其缺點在于:
第一,混合物中的各種化學分子在進行二級質譜分析時會相互影響,所產生的MS/MS數據并非各單一物質譜線的簡單疊加。且質譜儀參數設置不同,譜線分布也會有所差異。因此實驗數據往往難以重復利用,需針對特定的研發項目,重新設計并采集所有的質譜信息,所需成本極高。
第二,某些特定的代謝混合物,例如糖尿病人的血液樣本等,采集難度較大、成本較高。且在每個個體上僅能獲得有限的樣本量,其總數難以保證。影響了后續研究的進行。
現有基于計算機仿真的混合物MS/MS質譜生成方法,其缺點在于:
第一,現有算法往往基于各單一代謝物質譜的線性疊加,與實際情況中的非線性混合狀況差異較大。當用于代謝組學研究時,容易導致模型過于簡化。在真實的混合物MS/MS質譜上的分析性能不佳。
第二,現有方法所使用的噪聲模型過于簡單,一般為與生物信息無關的高斯噪聲或編輯誤差等,所生成的MS/MS仿真質譜難以反映實際情況。
因此,現有技術還有待于改進和發展。
發明內容
鑒于上述現有技術的不足,本發明的目的在于提供一種代謝混合物MS/MS質譜的仿真生成方法及系統,旨在解決現有的代謝混合物MS/MS質譜生成方法要么成本高、采集難度大、要么分析性能不佳、誤差大等問題。
本發明的技術方案如下:
一種代謝混合物MS/MS質譜的仿真生成方法,其中,包括步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學深圳研究生院,未經哈爾濱工業大學深圳研究生院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610049964.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡?,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





