[發明專利]從頭測序方法及裝置有效
| 申請號: | 201611019740.5 | 申請日: | 2016-11-14 |
| 公開(公告)號: | CN106770605B | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 楊皓;遲浩;周文婧;何昆;曾文鋒;劉超;孫瑞祥;賀思敏 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G01N27/62 | 分類號: | G01N27/62 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇;蘇曉麗 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選肽 肽段鑒定 修飾邊 測序 質譜 肽譜 修飾 匹配 肽段序列 大影響 細粒度 準確率 肽段 解析 轉化 統計 發現 | ||
1.一種從頭測序方法,包括:
將待解析的譜圖轉化為質譜連接圖,其中所述譜圖中每根譜峰被轉化為所述質譜連接圖的節點,在所述質譜連接圖中如果兩兩節點之間的質量差為氨基酸質量或普通修飾質量,則這兩個節點之間連接有普通邊,該普通邊的打分基于質量大的節點對應的譜峰的強度來確定,如果兩兩節點之間的質量差為意外修飾質量,則這兩個節點之間連接有修飾邊,該修飾邊的打分基于質量大的節點對應的譜峰的強度來確定;
統計所述質譜連接圖中各條路徑的得分,提取路徑得分高的前若干條普通路徑和修飾路徑作為候選肽段,其中,所述普通路徑為僅由普通邊組的路徑,所述修飾路徑為由普通邊和修飾邊組成的路徑且其中僅包含一條修飾邊;
對于每個候選肽段進行肽譜匹配打分,取肽譜匹配打分最高的候選肽段作為所述譜圖對應的肽段。
2.一種從頭測序方法,包括:
將待解析的譜圖轉化為質譜連接圖,其中所述譜圖中每根譜峰被轉化為所述質譜連接圖的節點,在所述質譜連接圖中如果兩兩節點之間的質量差為氨基酸質量或普通修飾質量,則這兩個節點之間連接有普通邊,該普通邊的打分基于質量大的節點對應的譜峰的強度來確定,如果兩兩節點之間的質量差為意外修飾質量,則這兩個節點之間連接有修飾邊,該修飾邊的打分基于質量大的節點對應的譜峰的強度來確定;
統計所述質譜連接圖中各條路徑的得分,提取路徑得分高的前若干條普通路徑和修飾路徑作為候選肽段,并記錄各候選肽段的路徑排名,其中,所述普通路徑為僅由普通邊組的路徑,所述修飾路徑為由普通邊和修飾邊組成的路徑且其中僅包含一條修飾邊;
對于每個候選肽段進行肽譜匹配打分;
將每個候選肽段的肽譜匹配打分、路徑排名及該候選肽段的修飾豐度作為特征提供給預先訓練好的排序分類器來給該候選肽段進行打分,取得分最高的候選肽段作為所述譜圖對應的肽段。
3.根據權利要求1或2所述的方法,其中兩個節點之間普通邊的打分為質量大的節點對應的譜峰的強度取以自然數為底的對數,兩個節點之間修飾邊的打分為質量大的節點對應的譜峰的強度取以自然數為底的對數。
4.根據權利要求1或2所述的方法,其中兩個節點之間的修飾邊的打分為質量大的節點對應的譜峰的強度乘以該修飾邊對應的意外修飾的豐度,其中該意外修飾的豐度為該修飾邊連接的兩個節點之間相差的意外修飾質量對應的意外修飾可能出現的概率或頻度。
5.根據權利要求4所述的方法,其中修飾邊對應的意外修飾的豐度等于在該修飾邊連接的兩個節點之間相差的意外修飾質量在所述質譜連接圖的所有節點之間出現的次數除以所述質譜連接圖中修飾邊的總數。
6.根據權利要求4所述的方法,其中意外修飾的豐度是預先設定的。
7.根據權利要求6所述的方法,還包括通過下面的方式來設定某種意外修飾的豐度:
隨機提取多個現有譜圖,統計其中某種意外修飾出現的次數;
將該種意外修飾在所述多個譜圖中出現的次數與所有意外修飾在所述譜圖中出現次數總和的比值作為該種意外修飾的豐度。
8.根據權利要求1或2所述的方法,其中將所述譜圖中每根譜峰轉化成質譜連接圖中的兩個節點,其中一個節點對應b離子,另一個節點對應y離子。
9.根據權利要求8所述的方法,其中對于每根譜峰,對應b離子的節點質量為該譜峰質量減去1,對應y離子的節點質量為所述譜圖中母離子的質量減去該譜峰質量和1個水分子質量。
10.根據權利要求4所述的方法,其中對于每個候選肽段,如果該候選肽段來自普通路徑,則其修飾豐度為1;如果該候選肽段來自修飾路徑,則其修飾豐度為該修飾路徑中修飾邊對應的意外修飾的豐度。
11.根據權利要求10所述的方法,其中所述排序分類器是以一組已知其對應肽段和修飾的譜圖為樣本集,以從各樣本提取的肽段的肽譜匹配打分、路徑排名和修飾豐度為特征來訓練的。
12.一種從頭測序裝置,包括:
轉化單元,用于將待解析的譜圖轉化為質譜連接圖,其中所述譜圖中每根譜峰被轉化為所述質譜連接圖的節點,在所述質譜連接圖中如果兩兩節點之間的質量差為氨基酸質量或普通修飾質量,則這兩個節點之間連接有普通邊,該普通邊的打分基于質量大的節點對應的譜峰的強度來確定,如果兩兩節點之間的質量差為意外修飾質量,則這兩個節點之間連接有修飾邊,該修飾邊的打分基于質量大的節點對應的譜峰的強度來確定;
路徑提取單元,用于統計所述質譜連接圖中各條路徑的得分,提取路徑得分高的前若干條普通路徑和修飾路徑作為候選肽段,其中,所述普通路徑為僅由普通邊組的路徑,所述修飾路徑為由普通邊和修飾邊組成的路徑且其中僅包含一條修飾邊;
匹配打分單元,用于對于每個候選肽段進行肽譜匹配打分,取肽譜匹配打分最高的候選肽段作為所述譜圖對應的肽段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611019740.5/1.html,轉載請聲明來源鉆瓜專利網。





