[發明專利]一種基于卷積神經網絡的DNA綁定殘基預測方法在審
| 申請號: | 202010918314.5 | 申請日: | 2020-09-03 |
| 公開(公告)號: | CN112149881A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 胡俊;白巖松;鄭琳琳;樊學強;張貴軍 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06K9/62;G06N3/04;G16B30/00;G16B50/30 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 dna 綁定 殘基 預測 方法 | ||
一種基于卷積神經網絡的DNA綁定殘基預測方法,首先,根據輸入殘基數為L的待進行DNA綁定殘基預測的蛋白質序列信息,分別使用HHblits、PSIPRED、SANN和I?LBR程序獲取特征矩陣PSFM、PSS、PSA和ILBR;然后,將以上四個矩陣組合為一個特征矩陣F并將其轉化為特征張量;其次,我們將蛋白質序列處理成殘基樣本;再次,搭建卷積神經網絡,利用已知綁定殘基的蛋白質序列構建數據集并訓練所搭建的網絡;最后,將待進行預測的蛋白質序列的殘基樣本輸入到訓練的模型中,根據模型輸出概率是否大于判定閾值threshold,進而判斷對應的殘基是否為DNA綁定殘基。本發明計算代價小、預測精度高。
技術領域
本發明涉及生物信息學、模式識別與計算機應用領域,具體而言涉及一種基于卷積神經網絡的DNA綁定殘基預測方法。
背景技術
蛋白質與配體相互作用在生命過程中是普遍存在且不可或缺的,這種相互作用在生物分子的識別和信號傳遞過程中起著非常重要的作用。DNA分子是重要的一類配體分子,準確識別蛋白質序列中DNA分子的綁定殘基,有助于理解蛋白質功能、分析蛋白質與DNA分子之間的相互作用機制及設計藥物靶蛋白,具有重要的生物學意義。
調研文獻發現,許多用于預測蛋白質序列中DNA綁定殘基的方法已被提出,如:DNAPred(Zhu Y,Hu J,Song X,et al.DNAPred:Accurate Identification of DNA-Binding Sites from Protein Sequence by Ensembled Hyperplane-Distance-BasedSupport Vector Machines[J].Journal of Chemical Information and Modeling,2019,59(6):3057-3071.即:Zhu Y等.集成基于超平面距離的支持向量機來準確識別蛋白質序列中的DNA綁定位點[J].化學信息和建模期刊,2019,59(6):3057-3071)、DELIA(Xia C,PanX,Shen H,et al.Protein-ligand binding residue prediction enhancement throughhybrid deep heterogeneous learning of sequence and structure data[J].Bioinformatics,2020.即:Xia C等.通過對序列和結構數據的混合深度學習提高蛋白質配體綁定殘基的預測性能[J].生物信息學,2020)、CNNsite(Zhou J,Lu Q,Xu R,etal.CNNsite:prediction of DNA-binding residues in proteins using convolutionalneural network with sequence features[J],2016:78-85.即:Zhou J等.基于序列特征的卷積神經網絡預測蛋白質DNA綁定殘基[J],2016:78-85)、ENSEMBLE-CNN(Zhang Y,QiaoS,Ji S,et al.Predicting DNA Binding Sites in Protein Sequences by an EnsembleDeep Learning Method[C].international conference on intelligent computing,2018:301-306.即:Zhang Y等.基于集成學習方法預測蛋白質序列中的DNA綁定位點[C].國際智能計算會議,2018:301-306)等。盡管已有方法可以用于預測蛋白質序列中的DNA綁定殘基,但是訓練集合中的噪音信息沒有得到足夠的關注,預測精度并不能保證是最優的,有待進一步提升。
綜上所述,已有的DNA綁定殘基的預測方法在計算代價、預測精度兩個方面距離實際應用的要求還有很大差距,迫切地需要改進。
發明內容
為了克服已有的DNA綁定殘基預測方法在計算代價、預測精度兩個方面的不足,本發明提出一種計算代價小、預測精度高的基于卷積神經網絡的DNA綁定殘基預測方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010918314.5/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





