[發明專利]基于模塊化密集卷積網絡的賴氨酸乙?;稽c預測方法有效
| 申請號: | 202011344614.3 | 申請日: | 2020-11-25 |
| 公開(公告)號: | CN112447265B | 公開(公告)日: | 2021-08-20 |
| 發明(設計)人: | 王會青;顏志良;劉丹;趙虹;趙健;趙靜;趙森 | 申請(專利權)人: | 太原理工大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B15/00;G16B5/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 成都東恒知盛知識產權代理事務所(特殊普通合伙) 51304 | 代理人: | 何健雄 |
| 地址: | 030000 *** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 模塊化 密集 卷積 網絡 賴氨酸 乙?;?/a> 預測 方法 | ||
1.一種基于模塊化密集卷積網絡的賴氨酸乙?;稽c預測方法,其特征在于,包括:
S1獲取賴氨酸乙酰化位點實驗數據并進行預處理,通過編碼方式將預處理后的數據轉化為數值向量,構建位點初始特征空間;
S2采用模塊化密集卷積網絡,從位點初始特征空間分別提取蛋白質結構特性、蛋白質原始序列和氨基酸理化屬性的高級特征,并通過密集跳躍連接獲取低層級特征和高層級特征;
S3引入壓縮-激發SE層評估特征的重要性,加權每個特征圖,實現蛋白質結構特性、蛋白質原始序列和氨基酸理化屬性三類信息的自適應動態融合,得到融合特征;
S4基于融合特征和softmax層構建賴氨酸乙酰化位點預測模型,預測潛在的賴氨酸乙?;稽c;
S5訓練基于模塊化密集卷積網絡的賴氨酸乙酰化位點預測模型;
S6通過十折交叉驗證、獨立測試、模型泛化能力測試和對未知賴氨酸乙?;稽c的識別能力四種類型實驗,評估賴氨酸乙?;稽c預測模型。
2.根據權利要求1所述的基于模塊化密集卷積網絡的賴氨酸乙酰化位點預測方法,其特征在于,步驟S1中,獲取賴氨酸乙?;稽c實驗數據并進行預處理包括:
S11從蛋白質賴氨酸修飾數據庫獲取經實驗驗證的賴氨酸乙?;鞍踪|序列;
S12利用CD-HIT工具進行序列去冗余,閾值設定為0.4;
S13將過濾后的賴氨酸乙?;鞍踪|序列隨機選擇10%,構建獨立測試數據集,剩余賴氨酸乙?;鞍踪|序列作為訓練數據集。
3.根據權利要求2所述的基于模塊化密集卷積網絡的賴氨酸乙?;稽c預測方法,其特征在于,步驟S1中,通過編碼方式將預處理后的數據轉化為數值向量,具體包括:
1)使用one-of-21編碼位點的蛋白質原始序列信息,得到蛋白質原始序列信息的向量表示;
2)采用Atchley因子編碼位點的氨基酸理化屬性信息,每個氨基酸殘基由5個Atchley因子表示,得到氨基酸理化屬性信息的向量表示;
3)通過SPIDER3獲取蛋白質結構特性信息,包括3種屬性中的8個指數,二級結構:α螺旋P(H)、β鏈P(C)、γ環P(E);局部骨干扭轉角:ψ、θ、τ;可及表面積:ASA;得到蛋白質結構特性信息的向量表示。
4.根據權利要求1所述的基于模塊化密集卷積網絡的賴氨酸乙?;稽c預測方法,其特征在于,步驟S2具體包括:
1)引入模塊化網絡結構的設計思想,構建結構、序列和理化三個信息模塊;
2)采用堆疊密集卷積塊對每個模塊進行高級特征的提取,通過密集跳躍連接同時獲取低層級特征和高層級特征。
5.根據權利要求4所述的基于模塊化密集卷積網絡的賴氨酸乙?;稽c預測方法,其特征在于,引入模塊化網絡結構的設計思想,構建結構、序列和理化三個信息模塊,具體包括:
基于蛋白質結構特性、蛋白質原始序列和氨基酸理化屬性分別構建了結構模塊、序列模塊和理化模塊和三個特征提取子模塊,各子模塊間參數空間相互獨立。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于太原理工大學,未經太原理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011344614.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示屏控制方法、裝置和電子設備
- 下一篇:一種圓形軌跡施肥裝置





