[發明專利]一種蛋白質鑒定的大規模分布式并行加速方法及其系統有效
| 申請號: | 201010292032.5 | 申請日: | 2010-09-26 |
| 公開(公告)號: | CN102411680A | 公開(公告)日: | 2012-04-11 |
| 發明(設計)人: | 王樂珩;王文平;遲浩;吳妍潔;周郴;付巖;孫瑞祥;賀思敏 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 蛋白質 鑒定 大規模 分布式 并行 加速 方法 及其 系統 | ||
技術領域
本發明涉及一種規模化蛋白質鑒定的分布式并行加速方法,特別是涉及一種采用分布式并行技術以在多個計算節點上,有效分擔搜索任務從而提高蛋白質鑒定速度的方法及其系統。
背景技術
“蛋白質組”(Proteome)描繪了特定生物樣品中在給定時刻和給定條件下表達的蛋白質的全體。顧名思義,蛋白質組學就是對蛋白質組的研究,其最基本的任務就是確定出哪些蛋白質在生物體內得到了表達、表達量是多少、翻譯后修飾以及蛋白與蛋白相互作用等,由此獲得蛋白質水平上關于疾病發生、細胞代謝等過程的整體而全面的認識。在當前的蛋白質組研究中,基于串聯質譜的蛋白質鑒定是最廣泛使用的技術之一,參考文獻1《Aebersold,R.and?Mann,M.Mass?spectrometry-based?proteomics,Nature,2003,422:198-207》中對相關的內容有較為詳細的說明。
基于串聯質譜鑒定蛋白質的基本步驟是:首先將混合蛋白樣品酶切為肽,經過液相色譜分離后,進入質譜儀,得到肽的實驗串聯質譜圖,然后對質譜圖進行分析,得到對應的肽序列,最后通過肽到蛋白質歸并分析,得到混合蛋白樣品中的蛋白質列表,從而達到對蛋白質進行鑒定的目的。在鑒定產生實驗串聯質譜的肽序列的過程中,數據庫搜索的方法被廣泛采用。如在參考文獻2《Eng,J.K.,McCormack,A.L.and?Yates,J.R.An?approach?to?correlate?tandemmass?spectral?data?of?peptides?with?amino?acid?sequences?in?a?protein?database.JAm?Soc?Mass?Spectrom,1994,5:976-989》、參考文獻3《Perkins,D.N.,Pappin,D.J.,Creasy,D.M.and?Cottrell,J.S.Probability-based?protein?identification?by?searchingsequence?databases?using?mass?spectrometry?data.Electrophoresis,1999,20:3551-3567》以及參考文獻4《Field,H.I.,,D.and?Beavis,R.C.RADARS,a?bioinformatics?solution?that?automates?proteome?mass?spectral?analysis,optimisesprotein?identification,and?archives?data?in?a?relational?database.Proteomics,2002,2:36-47》中都對采用數據庫搜索的方法實現肽序列的鑒定做了詳細說明。
采用數據庫搜索的方法通過肽序列鑒定實現蛋白質鑒定的方法主要包括以下步驟:首先,模擬生物學中的酶切規則將蛋白質數據庫中的蛋白質序列切分成肽序列;然后計算切分得到的各個肽序列的質量;最后利用質譜數據中的母離子質量誤差窗口尋找符合一定質量范圍內的肽序列,將符合要求的肽序列輸入給打分函數以實現對肽序列的鑒定。
由于近年來隨著蛋白質數據庫的規模不斷增長,對非特異性酶切肽的鑒定需求不斷增加,導致肽序列的規模不斷增大,同時,質譜數據的生成速度也在不斷增長,因此對蛋白質的鑒定速度提出了更高的要求。但前述的蛋白質鑒定方法在效率上卻有不足,因此需要對上述的數據庫搜索方法進行加速。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010292032.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具發光功能的化妝品盒
- 下一篇:一種應用甘草提升煙梗品質的方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





