[發(fā)明專利]基于AI技術繪制毒株蛋白質二維譜的方法在審
| 申請?zhí)枺?/td> | 202010995311.1 | 申請日: | 2020-09-21 |
| 公開(公告)號: | CN112397138A | 公開(公告)日: | 2021-02-23 |
| 發(fā)明(設計)人: | 張輝;王利 | 申請(專利權)人: | 內蒙古民族大學 |
| 主分類號: | G16B15/00 | 分類號: | G16B15/00;G16B40/00 |
| 代理公司: | 沈陽維特專利商標事務所(普通合伙) 21229 | 代理人: | 王翠 |
| 地址: | 028000 內蒙古自*** | 國省代碼: | 內蒙古;15 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 ai 技術 繪制 蛋白質 二維 方法 | ||
1.一種基于AI技術繪制毒株蛋白質二維譜的方法,其特征在于,包括如下步驟:
S1:獲取毒株蛋白質樣本的一級結構以及二級結構;
S2:將所述毒株蛋白質樣本的一級結構中的氨基酸序列視為線性排列,形成一維單通道數據;
S3:將所述毒株蛋白質樣本的二級結構中四個主鏈原子在三維空間各坐標系的投影,形成主鏈骨架原子的三通道數據;
S4:基于生成式對抗網絡構建蛋白質生成二維譜模型,采用多個毒株蛋白質樣本,分別以音樂風格以及蛋白質序列作為約束條件,進行所述蛋白質生成二維譜模型的訓練,獲得模型參數;
S5:在步驟S4獲得的模型參數下,利用蛋白質生成二維譜模型進行毒株蛋白質的二維譜繪制。
2.根據權利要求1所述基于AI技術繪制毒株蛋白質二維譜的方法,其特征在于,步驟S2中,將所述毒株蛋白質樣本的一級結構中的氨基酸序列視為線性排列,形成一維單通道數據,具體為:
依據圖像灰度值0~255的取值范圍,設置組成蛋白質的20種氨基酸的值為s1~s20;
依據所述毒株蛋白質樣本中氨基酸的序列以及所述氨基酸對應的數值,形成一維單通道數據。
3.根據權利要求1所述基于AI技術繪制毒株蛋白質二維譜的方法,其特征在于,步驟S3中,將所述毒株蛋白質樣本的二級結構中四個主鏈原子在三維空間各坐標系的投影,形成主鏈骨架原子的三通道數據,具體為:
根據圖像灰度值0~255的取值范圍,設置主鏈氨基酸骨架原子Cα、C、N、O的值分別為k1、k2、k3和k4;
將四個主鏈原子在三維空間各坐標系的投影形成主鏈骨架原子的三通道分布灰度圖像,數據為三通道數據。
4.根據權利要求1所述基于AI技術繪制毒株蛋白質二維譜的方法,其特征在于,所述多個毒株蛋白質樣本包括:自然毒株蛋白質樣本以及采用生成式對抗網絡增加的毒株蛋白質樣本。
5.根據權利要求1所述基于AI技術繪制毒株蛋白質二維譜的方法,其特征在于,步驟S4中,基于生成式對抗網絡構建的蛋白質生成二維譜模型,包括:
二維譜生成器(G1)、音樂生成判別器(D1)、音樂風格判別器(D2)、蛋白質逆生成器(F1)以及蛋白質判別器(D3);
所述蛋白質生成二維譜模型的訓練過程包括:
S401:將毒株蛋白質樣本中一級結構的單通道數據、毒株蛋白質樣本中二級結構的三通道數據以及音樂風格約束的單通道數據輸入到二維譜生成器(G1)中,生成二維譜,輸出音樂作品;
S402:通過所述音樂判別器(D1)判斷所述二維譜生成器(G1)所生成的音樂與真實音樂的差距;
S403:通過所述音樂風格判別器(D2)判斷所生成的音樂是否為符合指定風格約束;
S404:依據步驟S402和步驟403的判別結果,調整所述二維譜生成器(G1)和所述音樂判別器(D1)對應的模型參數,直至符合閾值要求;
S405:通過所述蛋白質逆向生成器(F1),以所述二維譜生成器(G1)生成的二維譜以及蛋白質序列約束(L)作為其輸入,生成人造蛋白質序列(X3);
S406:通過所述蛋白質判別器(D3)判別所述人造蛋白質序列(X3)與真實蛋白質序列(X1)的差距,如果差距超過閾值,調整所述二維譜生成器(G1)和所述音樂判別器(D1)對應的模型參數后,重復步驟S401~步驟S405,直至所述人造蛋白質序列(X3)與真實蛋白質序列(X1)的差距符合閾值要求。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于內蒙古民族大學,未經內蒙古民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010995311.1/1.html,轉載請聲明來源鉆瓜專利網。





