[發明專利]用于評價生物分子交聯質譜鑒定隨機性的半監督學習方法有效
| 申請號: | 202010938863.9 | 申請日: | 2020-09-09 |
| 公開(公告)號: | CN112151109B | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 張麗華;張瑋杰;楊開廣;單亦初;劉健慧;張玉奎 | 申請(專利權)人: | 中國科學院大連化學物理研究所 |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B20/00;G16B40/00;G16B50/00 |
| 代理公司: | 沈陽科苑專利商標代理有限公司 21002 | 代理人: | 王倩 |
| 地址: | 116023 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 評價 生物 分子 交聯 鑒定 隨機性 監督 學習方法 | ||
1.用于評價生物分子交聯質譜鑒定隨機性的半監督學習方法,其特征在于,利用半監督學習方法對化學交聯的生物分子所獲得的液相色譜質譜聯用鑒定信息進行過濾,依據生物分子化學交聯的實驗要求,將待分析的體系與交聯劑混合發生交聯反應;對反應后的樣品進行質譜分析得到二級譜圖;對二級譜圖進行信息檢索,得到鑒定結果;對鑒定結果中的交聯信息提取得到特征信息;將特征信息輸入半監督學習模型進行訓練,得到訓練好的模型;將特征信息輸入至訓練好的模型,得到評價結果,使評價結果中不包含因為化學反應隨機性而產生的化學交聯信息;
所述交聯劑具有的反應活性基團包括NHS基團、補骨酯素基團、苯胺基團、醛基基團、芳基疊氮、二苯甲酮以及雙吖丙啶基團中的一種或兩種以上;
所述鑒定結果包含譜圖的編號、生物分子的序列信息、兩條生物分子的序列信息,生物分子的交聯位點、兩條生物分子的蛋白或基因歸屬信息、肽段譜圖匹配得分、假發現率值、q值中的至少一種;
所述特征信息包括生物分子信息、數據庫檢索信息、質譜信息和色譜信息中的至少一種;
所述生物分子信息包括肽段分子的序列或核酸分子的序列、肽段分子或核酸分子的長度、肽段分子或核酸分子所發生的修飾、化學交聯發生位點、肽段分子所歸屬的蛋白質分子的結構和序列信息、核酸分子所歸屬的基因的信息;
所述數據庫檢索信息包括每一個鑒定結果中的生物分子與單張質譜圖的匹配得分、檢索結果所處的假發現率值;
所述質譜信息包括質譜參數、每一個鑒定結果的二級譜圖或三級譜圖,鑒定結果中每一個碎片信息在譜圖中的位置和譜峰強度;
所述色譜信息包括色譜參數、每一個鑒定結果在一級質譜圖中重構色譜曲線的峰位置、峰高以及峰面積,鑒定結果中每一個碎片在一級質譜圖中的重構色譜曲線的峰位置、峰高以及峰面積。
2.根據權利要求1所述的用于評價生物分子交聯質譜鑒定隨機性的半監督學習方法,其特征在于,所述生物分子包括蛋白質分子,肽段分子以及核酸分子中的一種或兩種以上。
3.根據權利要求1所述的用于評價生物分子交聯質譜鑒定隨機性的半監督學習方法,其特征在于,所述半監督學習模型為邏輯斯蒂回歸、貝葉斯分類器、支持向量機、隨機森林、決策樹、k-臨近算法中的一種。
4.根據權利要求1所述的用于評價生物分子交聯質譜鑒定隨機性的半監督學習方法,其特征在于,所述半監督學習模型在進行訓練或預測前均需要經過預處理對特征信息進行修正,通過下式實現:
或
其中,為一個待判斷的交聯肽段樣本向量,A為所選用特征的權重矩陣,矩陣A是在公式三的基礎上,按照特征處理函數繼續計算得到,g、f均為對樣本向量中的特征進行映射并處理的函數;μ1,μ2,…,μn表示進行線性映射時矩陣的對角線值,dim表示計算矩陣的維度,n為樣本向量的維度,N表示自然數,μmn表示進行線性映射時矩陣的第m行第n列矩陣元素,m表示映射值域空間的維度,Z表示整數,μij′表示經過非線性映射時計算矩陣中的元素值。
5.根據權利要求4所述的用于評價生物分子交聯質譜鑒定隨機性的半監督學習方法,其特征在于,所述特征處理函數包括相加,歸一化,中心化,sigmoid函數處理,絕對值函數處理,對數函數處理中的一種或兩種以上。
6.根據權利要求1所述的用于評價生物分子交聯質譜鑒定隨機性的半監督學習方法,其特征在于,所述評價結果包括鑒定譜圖的編號,譜圖所對應的序列信息,譜圖的半監督模型打分值,該鑒定結果所對應的生物分子信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院大連化學物理研究所,未經中國科學院大連化學物理研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010938863.9/1.html,轉載請聲明來源鉆瓜專利網。





