[發明專利]一種基于深度卷積神經網絡的DNA綁定殘基預測方法有效
| 申請號: | 202010533489.4 | 申請日: | 2020-06-12 |
| 公開(公告)號: | CN111785321B | 公開(公告)日: | 2022-04-05 |
| 發明(設計)人: | 胡俊;白巖松;樊學強;鄭琳琳;張貴軍 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B50/00;G06N3/04;G06N3/08 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 卷積 神經網絡 dna 綁定 殘基 預測 方法 | ||
一種基于深度卷積神經網絡的DNA綁定殘基預測方法,首先,根據輸入的殘基數為L待進行配體綁定殘基預測的蛋白質序列信息,使用psi?blast程序和PSSpred程序獲取矩陣PSSM和PSS;然后,將兩個矩陣組合為一個特征矩陣F;其次,我們將蛋白質序列處理成殘基樣本;再次,搭建深度卷積神經網絡,利用已知綁定殘基的蛋白質序列構建數據集,并將數據集劃分為M組數據子集,利用這十組數據子集訓練出M個網絡模型;最后,將待進行預測的蛋白質序列處理成殘基樣本,并輸入到被訓練過的M個網絡模型中,綜合這M個模型的預測結果,預測蛋白質序列中的殘基是否為綁定殘基。本發明計算代價小、預測精度高。
技術領域
本發明涉及生物信息學、模式識別與計算機應用領域,具體而言涉及一種基于深度卷積神經網絡的DNA綁定殘基預測方法。
背景技術
蛋白質與配體相互作用在生命過程中是普遍存在且不可或缺的,這種相互作用在生物分子的識別和信號傳遞過程中起著非常重要的作用。其中DNA分子屬于配體分子中的一類,準確識別蛋白質序列中DNA分子的綁定殘基,有助于理解蛋白質功能、分析蛋白質與DNA分子之間的相互作用機制及設計藥物靶蛋白,具有重要的生物學意義。
調研文獻發現,許多用于預測蛋白質序列中DNA綁定殘基的方法已被提出,如:DISPLAR(Tjong H,Zhou H.an accurate method for predicting DNA-binding sites onprotein surfaces[J].Nucleic Acids Research,2007,35(5):1465-1477.即:Tjong H等.一種準確預測蛋白質表面上的DNA綁定殘基的方法[J].核酸研究,2007,35(5):1465-1477)、DELIA(Xia C,Pan X,Shen H,et al.Protein-ligand binding residueprediction enhancement through hybrid deep heterogeneous learning of sequenceand structure data[J].Bioinformatics,2020.即:Xia C等.通過對序列和結構數據的混合深度學習提高蛋白質配體綁定殘基的預測性能[J].生物信息學,2020)、CNN(Zeng H,Edwards M D,Liu G,et al.Convolutional neural network architectures forpredicting DNA–protein binding[J].Bioinformatics,2016,32(12): 121-127.即:ZengH等.基于卷積神經網絡預測DNA蛋白質綁定殘基[J].生物信息學,2016,32(12))、ENSEMBLE-CNN(Zhang Y,Qiao S,Ji S,et al.Predicting DNA Binding Sites inProtein Sequences by an Ensemble Deep Learning Method[C]. internationalconference on intelligent computing,2018:301-306.即:Zhang Y等,通過集成深度學習方法預測蛋白質序列中的DNA結合位點[C].國際智能計算會議,2018:301-306)。盡管已有方法可以用于預測蛋白質序列中的DNA綁定殘基,但是普遍使用了大量實驗數據和機器學習算法,所以代價較大,同時由于訓練集合中的噪音信息沒有得到足夠的關注,預測精度并不能保證是最優的,有待進一步提升。
綜上所述,已有的DNA綁定殘基的預測方法在計算代價、預測精度兩個方面距離實際應用的要求還有很大差距,迫切地需要改進。
發明內容
為了克服已有的DNA綁定殘基預測方法在計算代價、預測精度兩個方面的不足,本發明提出一種計算代價小、預測精度高的基于深度卷積神經網絡的DNA 綁定殘基預測方法。
本發明解決其技術問題所采用的技術方案是:
一種基于深度卷積神經網絡的DNA綁定殘基預測方法,所述方法包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010533489.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光伏組件監控系統
- 下一篇:一種尸體腦動脈加壓灌注設備





