[發明專利]蛋白質預測模型的生成方法、裝置、設備和存儲介質在審
| 申請號: | 201911329669.4 | 申請日: | 2019-12-20 |
| 公開(公告)號: | CN111048145A | 公開(公告)日: | 2020-04-21 |
| 發明(設計)人: | 湯一凡;崔朝輝;趙立軍;張霞 | 申請(專利權)人: | 東軟集團股份有限公司 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B5/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 柳欣 |
| 地址: | 110179 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 蛋白質 預測 模型 生成 方法 裝置 設備 存儲 介質 | ||
1.一種蛋白質預測模型的生成方法,其特征在于,包括:
獲取多個第一蛋白質,每個所述第一蛋白質均包括第一位點和第二位點,所述第一位點為與目標物質發生結合作用的位點;
提取每個所述第一位點對應的第一特征向量和每個所述第二位點對應的第二特征向量;
利用所述第一特征向量和所述第二特征向量訓練預先構建的初始預測模型,生成目標預測模型,所述目標預測模型用于預測蛋白質中的位點是否具有和所述目標物質結合的功能。
2.根據權利要求1所述的方法,其特征在于,所述第一特征向量的數量和所述第二特征向量的數量相同。
3.根據權利要求1所述的方法,其特征在于,所述提取每個所述第一位點對應的第一特征向量和每個所述第二位點對應的第二特征向量,包括:
利用蛋白質對比工具獲得各所述第一蛋白質對應的第一位置特異性得分矩陣PSSM;
以各所述第一蛋白質的每個所述第一位點為中心,基于所述第一PSSM向外擴展預設長度,得到各所述第一位點對應的所述第一特征向量;
以各所述第一蛋白質的每個所述第二位點為中心,基于所述第一PSSM向外擴展所述預設長度,得到各所述第二位點對應的所述第二特征向量。
4.根據權利要求3所述的方法,其特征在于,所述方法還包括:
獲取待預測的第二蛋白質,所述第二蛋白質包括N個位點,N為大于1的整數;
提取所述第二蛋白質的第i位點對應的第i特征向量,其中,i=1,2,…,N;
根據所述第i特征向量和所述目標預測模型,獲得第i預測結果,所述第i預測結果用于表征所述第i位點是否具有和所述目標物質結合的功能;
當所述第i預測結果表征所述第i位點具有和所述目標物質結合的功能,則,確定所述第二蛋白質為能夠和所述目標物質結合的蛋白質。
5.根據權利要求4所述的方法,其特征在于,所述提取所述第二蛋白質的第i位點對應的第i特征向量,包括:
利用所述蛋白質對比工具獲得所述第二蛋白質對應的第二PSSM;
以所述第i位點為中心,基于所述第二PSSM向外擴展所述預設長度,得到所述第i位點對應的所述第i特征向量;
所述根據所述第i特征向量和所述目標預測模型,獲得第i預測結果,具體為:
將所述第i特征向量輸入所述目標預測模型,輸出所述第i預測結果。
6.根據權利要求1-5任意一項所述的方法,其特征在于,所述目標物質為:糖類、脂質、脫氧核糖核酸DNA、核糖核酸RNA、酸性糖類或非酸性糖類中的任意一種。
7.一種蛋白質預測模型的生成裝置,其特征在于,包括:
第一獲取模塊,用于獲取多個第一蛋白質,每個所述第一蛋白質均包括第一位點和第二位點,所述第一位點為與目標物質發生結合作用的位點;
第一提取模塊,用于提取每個所述第一位點對應的第一特征向量和每個所述第二位點對應的第二特征向量;
第一生成模塊,用于利用所述第一特征向量和所述第二特征向量訓練預先構建的初始預測模型,生成目標預測模型,所述目標預測模型用于預測蛋白質中的位點是否具有和所述目標物質結合的功能。
8.根據權利要求7所述的裝置,其特征在于,所述目標物質為:糖類、脂質、脫氧核糖核酸DNA、核糖核酸RNA、酸性糖類或非酸性糖類中的任意一種。
9.一種蛋白質預測模型的生成設備,其特征在于,所述設備包括處理器以及存儲器:
所述存儲器用于存儲程序代碼,并將所述程序代碼傳輸給所述處理器;
所述處理器用于根據所述程序代碼中的指令執行權利要求1至6任一項所述的方法。
10.一種存儲介質,其特征在于,所述存儲介質用于存儲程序代碼,所述程序代碼用于執行權利要求1至6任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東軟集團股份有限公司,未經東軟集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911329669.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種有機發光顯示面板及顯示裝置
- 下一篇:混凝土生產過程故障排查及報警系統





