[發明專利]基于遷移學習的賴氨酸丙酰化預測方法和系統有效
| 申請號: | 202110289477.6 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN112820350B | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 黎昂;陳敏;譚艷;鄧英偉;孫旭東 | 申請(專利權)人: | 湖南工學院 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G06N3/08;G06N3/04 |
| 代理公司: | 衡陽雁城專利代理事務所(普通合伙) 43231 | 代理人: | 龍騰 |
| 地址: | 421002 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 遷移 學習 賴氨酸 丙酰化 預測 方法 系統 | ||
1.基于遷移學習的賴氨酸丙酰化預測方法,其特征在于:
1)構建深度遞歸神經網絡模型,將所述深度遞歸神經網絡模型的框架設定為依次由嵌入層、第一雙向長短時記憶網絡層、雙向門控循環單元層、第二雙向長短時記憶網絡層、退出層、扁平化層、完全連接層和輸出層構成;
2)對深度遞歸神經網絡模型進行訓練,先將已知的賴氨酸丙二酰化蛋白分割成肽段序列,形成包含相應陽性和陰性樣本集的賴氨酸丙二酰化修飾數據,再將賴氨酸丙二酰化修飾數據輸入深度遞歸神經網絡模型以對其進行訓練;
3)對訓練后的深度遞歸神經網絡模型進行微調,先將已知的賴氨酸丙酰化蛋白分割成肽段序列,形成包含相應陽性和陰性樣本集的賴氨酸丙酰化修飾數據,再將賴氨酸丙酰化修飾數據輸入訓練后的深度遞歸神經網絡模型以對其進行微調;
4)以經過已知賴氨酸丙二酰化修飾數據訓練再通過已知賴氨酸丙酰化修飾數據微調的深度遞歸神經網絡模型作為特征提取器;
5)以經過已知賴氨酸丙酰化蛋白序列特征進行參數優化和訓練的支持向量機模型作為最終分類器;
6)利用特征提取器提取待分析蛋白的目標序列特征,并將提取的目標序列特征輸入最終分類器中,對丙酰化修飾位點進行預測并輸出預測結果。
2.根據權利要求1所述的基于遷移學習的賴氨酸丙酰化預測方法,其特征在于,在步驟5)之前,還包括:
構建支持向量機,將已知賴氨酸丙酰化蛋白序列分割成肽段序列,形成陽性和陰性樣本集,并通過特征提取器從陽性和陰性樣本集中提取序列特征,再利用提取的序列特征優化支持向量機窗口大小和超參數并訓練支持向量機模型的步驟。
3.根據權利要求1所述的基于遷移學習的賴氨酸丙酰化預測方法,其特征在于:步驟6)中,利用特征提取器提取待分析蛋白的目標序列特征是先將待分析蛋白序列分割成肽段序列,再利用特征提取器從肽段序列中提取目標序列特征。
4.根據權利要求2或3所述的基于遷移學習的賴氨酸丙酰化預測方法,其特征在于:在將各蛋白序列分割成肽段序列時,都是將對應的蛋白序列分割成以賴氨酸為中心且上游和下游各含有n個氨基酸殘基的肽段;對于分割得到的上游和/或下游少于n個氨基酸殘基的肽段,在對應肽段的前端和/或末端以字符“X”補齊;其中,n為大于等于1的自然數。
5.根據權利要求3所述的基于遷移學習的賴氨酸丙酰化預測方法,其特征在于:籍由所述嵌入層將輸入的肽段序列的氨基酸字符整數索引轉換成嵌入向量,并以完全連接層的輸出作為要提取的序列特征。
6.基于遷移學習的賴氨酸丙酰化預測系統,其特征在于,包括:
特征提取器,所述特征提取器包括經過已知賴氨酸丙二酰化修飾數據訓練再通過已知賴氨酸丙酰化修飾數據微調的深度遞歸神經網絡模型;
最終分類器,所述最終分類器包括經過已知賴氨酸丙酰化序列特征進行參數優化和訓練的支持向量機模型;
該賴氨酸丙酰化預測系統按照權利要求1-5中任意一項所述的賴氨酸丙酰化預測方法對待分析蛋白的丙酰化修飾位點進行預測并輸出預測結果。
7.根據權利要求6所述的基于遷移學習的賴氨酸丙酰化預測系統,其特征在于,還包括:
序列分割器,用于將各蛋白序列分割成以賴氨酸為中心且上游和下游各含有n個氨基酸殘基的肽段序列,并在分割得到的上游和/或下游少于n個氨基酸殘基的肽段序列的前端和/或末端以字符“X”補齊;其中,n為大于等于1的自然數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南工學院,未經湖南工學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110289477.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種珍奇物品用高穩定型展示架
- 下一篇:一種帶通電流保護電路





