[發明專利]蛋白質結構識別方法、訓練方法及裝置在審
| 申請號: | 202310433211.3 | 申請日: | 2023-04-21 |
| 公開(公告)號: | CN116434835A | 公開(公告)日: | 2023-07-14 |
| 發明(設計)人: | 崔超;薛洋;方曉敏;張肖男 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B40/00;G06N3/0464;G06N3/08 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 楊靜 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 蛋白質 結構 識別 方法 訓練 裝置 | ||
本公開提供了蛋白質結構識別方法、訓練方法及裝置,涉及生物信息技術和人工智能技術領域,尤其涉及深度學習技術領域。該訓練方法的具體實現方案為:利用掩碼語言處理網絡對樣本蛋白質的氨基酸特征序列進行處理,得到包括氨基酸共進化信息的第一特征;利用關系圖神經網絡對樣本蛋白質的空間結構特征進行處理,得到包括空間結構信息的第二特征;基于對比損失函數,根據第一特征和第二特征得到特征損失值;以及基于特征損失值,調整掩碼語言處理網絡和圖神經網絡的模型參數,得到經訓練的深度學習模型。
技術領域
本公開涉及生物信息技術和人工智能技術領域,尤其涉及深度學習技術領域,具體涉及一種蛋白質結構識別方法、訓練方法及裝置。
背景技術
蛋白質是組成人體內的酶、激素、抗體等活性物質的基本單元。由于蛋白質的功能與蛋白質分子的空間結構緊密相關,因此,具有不同空間結構的蛋白質呈現出不同的理化性質,對蛋白質空間結構的準確識別在研究蛋白質的功能及作用機理具有重要意義。
發明內容
本公開提供了一種用于蛋白質結構識別方法、訓練方法及裝置。
根據本公開的一方面,提供了一種深度學習模型的訓練方法,包括:利用掩碼語言處理網絡對樣本蛋白質的氨基酸特征序列進行處理,得到包括氨基酸共進化信息的第一特征;利用關系圖神經網絡對樣本蛋白質的空間結構特征進行處理,得到包括空間結構信息的第二特征;基于對比損失函數,根據第一特征和第二特征得到特征損失值;以及基于特征損失值,調整掩碼語言處理網絡和圖神經網絡的模型參數,得到經訓練的深度學習模型。
根據本公開的另一方面,提供了一種蛋白質結構識別方法,包括:利用上述深度學習模型對待識別蛋白質的特征數據進行處理,得到包括氨基酸共進化信息和空間結構信息的特征序列,其中,特征數據包括以下至少之一:氨基酸特征序列和空間結構特征;以及對特征序列進行識別,得到待識別蛋白質的結構信息。
根據本公開的另一方面,提供了一種深度學習模型的訓練裝置,包括:第一處理模塊、第二處理模塊、對比損失模塊和調整模塊。第一處理模塊,用于利用掩碼語言處理網絡對樣本蛋白質的氨基酸特征序列進行處理,得到包括氨基酸共進化信息的第一特征。第二處理模塊,用于利用關系圖神經網絡對樣本蛋白質的空間結構特征進行處理,得到包括空間結構信息的第二特征。對比損失模塊,用于基于對比損失函數,根據第一特征和第二特征得到特征損失值。調整模塊,用于基于特征損失值,調整掩碼語言處理網絡和圖神經網絡的模型參數,得到經訓練的深度學習模型。
根據本公開的另一方面,提供了一種蛋白質結構識別裝置,包括:特征融合模塊和特征識別模塊。特征融合模塊,用于上述深度學習模型對待識別蛋白質的特征數據進行處理,得到包括氨基酸共進化信息和空間結構信息的特征序列,其中,特征數據包括以下至少之一:氨基酸特征序列和空間結構特征。特征識別模塊,用于對特征序列進行識別,得到待識別蛋白質的結構信息。
根據本公開的另一方面,提供了一種電子設備,包括:至少一個處理器;以及與至少一個處理器通信連接的存儲器;其中,存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行如上的方法。
根據本公開的另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,計算機指令用于使計算機執行如上的方法。
根據本公開的另一方面,提供了一種計算機程序產品,包括計算機程序,計算機程序在被處理器執行時實現如上的方法。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本公開的限定。其中:
圖1示意性示出了根據本公開實施例的可以應用深度學習模型的訓練方法或蛋白質結構識別方法及裝置的示例性系統架構;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310433211.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:膏狀膠粘劑密度測試方法及裝置
- 下一篇:碳資產數據的安全存儲方法





