[發明專利]一種從頭測序方法有效
| 申請號: | 201710913734.2 | 申請日: | 2017-09-30 |
| 公開(公告)號: | CN107729719B | 公開(公告)日: | 2020-05-26 |
| 發明(設計)人: | 楊皓;遲浩;曾文鋒;周文婧;劉超;賀思敏 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G16B25/00 | 分類號: | G16B25/00;G16B45/00;G16B50/30 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇;李科 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 從頭 方法 | ||
本發明提一種從頭測序方法,該方法包括:在通過酶切產生的兩個數據集中查找鏡像肽段對應的鏡像譜圖;從所述鏡像譜圖中檢測高可信譜峰和普通譜峰;根據所述高可信譜峰和普通譜峰構建有向無環圖,其中,所述高可信譜峰對應的結點是高可信結點,普通譜峰對應的結點是普通結點;基于所構建的有向無環圖生成候選肽段。本發明的方法利用鏡像譜圖相互佐證,能夠提高肽段從頭測序的準確率。
技術領域
本發明涉及生物信息技術領域,尤其涉及一種從頭測序方法。
背景技術
目前,基于質譜數據的蛋白質鑒定方法分為兩類:數據庫搜索和肽段從頭測序。由于蛋白質數據庫的不斷發展和完善,數據庫搜索是鑒定蛋白質的主要方法。然而,由于從頭測序方法不依賴于現有的數據庫,其根據肽段有規律碎裂的特點,直接從譜圖中推導出肽段序列,對于鑒定未知蛋白質、翻譯后修飾以及氨基酸突變等具有數據庫搜索方法不可替代的優勢。
現有的從頭測序方法主要分為三類:化學標記技術、質譜技術和基于算法的測序。基于化學標記技術的方法,可以將肽段的N端、C端、或者兩者同時進行標記,使得信號離子擁有質量差信息,通過質量差信息來有效區分信號峰以及噪音峰,例如,使用18O的H2O進行標記,使得所有y離子均有2Da(Dalton)的質量偏差,從而有效的區分b離子和噪聲峰;基于質譜技術的方法,采用三級譜碎裂技術,在常規的二級譜基礎上,選擇高峰再次進行碎裂,使得譜圖的信噪比更高、數據質量更好,此外,基于質譜技術的方法還可利用不同碎裂方式的結合,例如CID+ETD、HCD+ETD、CID+HCD+ETD,或者利用最近出現的激光的UVPD(351nmultraviolet photodissociation)碎裂方式,該種方式會產生明顯多的y離子系列,幾乎很少的b離子,這樣不用去識別每根峰的離子類型(b還是y);基于算法的測序方法包括:Open-pNovo、Novor、Uvnovo和DeepNovo等,其中Open-pNovo使用RankBoost排序方法對結果進行重排序,Novor使用決策樹為氨基酸以及肽段進行打分,Uvnovo使用隨機森林為每條肽段進行打分,DeepNovo使用深度學習來推斷下一個氨基酸類型。
然而,現有的從頭測序方法存在兩個問題:1)離子碎裂不全,從而無法區分AB和BA兩種情況,導致相當多的譜圖無法使用從頭測序方法獲取完整肽段;2)譜峰的離子類型未知,一般認為一根峰只能匹配一種類型的離子,因此,在譜峰的離子類型未知的情況下,需要枚舉每根峰的離子類型,在計算候選肽段時需要考慮反對稱約束進行求解,而這是個NP難(NP-hard)問題。
因此,需要對現有技術進行改進,以克服從頭測序方法存在的缺陷。
發明內容
本發明的目的在于提供一種改進的肽段從頭測序方法,其利用鏡像譜圖互相佐證來提高肽段鑒定的準確度。
根據本發明的第一方面,提供了一種從頭測序方法。該方法包括以下步驟:
步驟1:在通過酶切產生的兩個數據集中查找鏡像肽段對應的鏡像譜圖;
步驟2:從所述鏡像譜圖中檢測高可信譜峰和普通譜峰;
步驟3:根據所述高可信譜峰和普通譜峰構建有向無環圖,其中,所述高可信譜峰對應的結點是高可信結點,普通譜峰對應的結點是普通結點;
步驟4:基于所構建的有向無環圖生成候選肽段。
在本發明的從頭測序方法中,所述兩個數據集是使用胰蛋白酶在氨基酸K、R的C端酶切產生的數據集以及使用鏡像胰蛋白酶在氨基酸的K、R的N端酶切產生的數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710913734.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種業務管理系統
- 下一篇:停車場管理方法及裝置





