[發明專利]基于AI技術繪制毒株蛋白質二維譜的方法在審
| 申請號: | 202010995311.1 | 申請日: | 2020-09-21 |
| 公開(公告)號: | CN112397138A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 張輝;王利 | 申請(專利權)人: | 內蒙古民族大學 |
| 主分類號: | G16B15/00 | 分類號: | G16B15/00;G16B40/00 |
| 代理公司: | 沈陽維特專利商標事務所(普通合伙) 21229 | 代理人: | 王翠 |
| 地址: | 028000 內蒙古自*** | 國省代碼: | 內蒙古;15 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 ai 技術 繪制 蛋白質 二維 方法 | ||
本發明公開了一種基于AI技術繪制毒株蛋白質二維譜的方法,該方法針對毒株蛋白質序列、結構與音樂在表現形式上的特點,基于AI技術實現了由毒株蛋白質結構生成二維樂譜的方法,從而建立起毒株蛋白質序列與音樂的一一對應關系,以輔助毒株蛋白質的分析研究。該方法將毒株蛋白質以二維譜的方式進行表達后,在進行毒株蛋白質的研究時,既可通過二維譜從視覺上直觀看到不同毒株蛋白質的區別之處,也可將二維譜演奏成音樂,從聽覺上感知不同毒株蛋白質的不同,為毒株蛋白質的研究提供了一種新的方式方法。
技術領域
本發明公開涉及人工智能應用的技術領域,尤其涉及一種基于AI技術繪制毒株蛋白質二維譜的方法。
背景技術
在生命科學領域,AI技術也逐漸開啟無法替代的數據分析地位。蛋白質作為生命體的重要組成,具有序列的多樣性和功能結構的復雜性,以致蛋白質研究至今依然是科學家們難以徹底攻破的生命領域。
目前,進行蛋白質表征的方式主要由蛋白質的氨基酸序列以及空間結構等,是否可通過其他形式進行蛋白質的表征,以提升蛋白質的可視化效果,便于分析,成為人們研究的焦點。
發明內容
鑒于此,本發明提供了一種基于AI技術繪制毒株蛋白質二維譜的方法,通過AI技術將毒株蛋白質以二維譜的形式進行表征,在增加蛋白質可視化效果的同時,還將不同的毒株蛋白質與不同的音樂對應,以從視覺和聽覺雙方面輔助蛋白質的分析研究。
本發明提供的技術方案,具體為,一種基于AI技術繪制毒株蛋白質二維譜的方法,其特征在于,包括如下步驟:
S1:獲取毒株蛋白質樣本的一級結構以及二級結構;
S2:將所述毒株蛋白質樣本的一級結構中的氨基酸序列視為線性排列,形成一維單通道數據;
S3:將所述毒株蛋白質樣本的二級結構中四個主鏈原子在三維空間各坐標系的投影,形成主鏈骨架原子的三通道數據;
S4:基于生成式對抗網絡構建蛋白質生成二維譜模型,采用多個毒株蛋白質樣本,分別以音樂風格以及蛋白質序列作為約束條件,進行所述蛋白質生成二維譜模型的訓練,獲得模型參數;
S5:在步驟S4獲得的模型參數下,利用蛋白質生成二維譜模型進行毒株蛋白質的二維譜繪制。
優選,步驟S2中,將所述毒株蛋白質樣本的一級結構中的氨基酸序列視為線性排列,形成一維單通道數據,具體為:
依據圖像灰度值0~255的取值范圍,設置組成蛋白質的20種氨基酸的值為s1~s20;
依據所述毒株蛋白質樣本中氨基酸的序列以及所述氨基酸對應的數值,形成一維單通道數據。
進一步優選,步驟S3中,將所述毒株蛋白質樣本的二級結構中四個主鏈原子在三維空間各坐標系的投影,形成主鏈骨架原子的三通道數據,具體為:
根據圖像灰度值0~255的取值范圍,設置主鏈氨基酸骨架原子Cα、C、N、O的值分別為k1、k2、k3和k4;
將四個主鏈原子在三維空間各坐標系的投影形成主鏈骨架原子的三通道分布灰度圖像,數據為三通道數據。
進一步優選,所述多個毒株蛋白質樣本包括:自然毒株蛋白質樣本以及采用生成式對抗網絡增加的毒株蛋白質樣本。
進一步優選,步驟S4中,基于生成式對抗網絡構建的蛋白質生成二維譜模型,包括:
二維譜生成器、音樂生成判別器、音樂風格判別器、蛋白質逆生成器以及蛋白質判別器;
所述蛋白質生成二維譜模型的訓練過程包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于內蒙古民族大學,未經內蒙古民族大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010995311.1/2.html,轉載請聲明來源鉆瓜專利網。





