[發(fā)明專利]基于三元組損失的蛋白質(zhì)折疊識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010947616.5 | 申請(qǐng)日: | 2020-09-10 |
| 公開(kāi)(公告)號(hào): | CN112116949B | 公開(kāi)(公告)日: | 2022-08-16 |
| 發(fā)明(設(shè)計(jì))人: | 於東軍;劉巖 | 申請(qǐng)(專利權(quán))人: | 南京理工大學(xué) |
| 主分類號(hào): | G16B15/20 | 分類號(hào): | G16B15/20;G06N3/04 |
| 代理公司: | 南京理工大學(xué)專利中心 32203 | 代理人: | 岑丹 |
| 地址: | 210094 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 三元 損失 蛋白質(zhì) 折疊 識(shí)別 方法 | ||
1.一種基于三元組損失的蛋白質(zhì)折疊識(shí)別方法,其特征在于,包括以下步驟:
步驟1:訓(xùn)練數(shù)據(jù)預(yù)處理:使用One-hot編碼分別對(duì)N組蛋白質(zhì)訓(xùn)練數(shù)據(jù)進(jìn)行編碼,得到蛋白質(zhì)序列的數(shù)字表達(dá);
步驟2:把蛋白質(zhì)序列的One-hot編碼輸入到SSA蛋白質(zhì)殘基與殘基接觸圖預(yù)測(cè)工具中,預(yù)測(cè)獲得蛋白質(zhì)殘基與殘基之間的接觸圖;
步驟3:將接觸圖固定為設(shè)定大小,獲得N個(gè)固定大小的矩陣;
步驟4:將N個(gè)矩陣生成三元組數(shù)據(jù),將三元組數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò),并以三元組損失作為目標(biāo)函數(shù),使用隨機(jī)梯度下降算法迭代至設(shè)定次數(shù),選取三元組損失最小的卷積神經(jīng)網(wǎng)絡(luò)模型保存;
步驟5:將查詢蛋白與所有的模板蛋白按照步驟1-3進(jìn)行處理后分別輸入保存的卷積神經(jīng)網(wǎng)絡(luò)中,將卷積神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果作為蛋白質(zhì)特定于折疊類型的特征;
步驟6:計(jì)算查詢蛋白與模板蛋白的相似度,將相似度最高的模板蛋白的折疊類型分配給查詢蛋白。
2.根據(jù)權(quán)利要求1所述的基于三元組損失的蛋白質(zhì)折疊識(shí)別方法,其特征在于,步驟3中將接觸圖大小固定為256×256。
3.根據(jù)權(quán)利要求1所述的基于三元組損失的蛋白質(zhì)折疊識(shí)別方法,其特征在于,步驟3中采用抽樣或者填充操作對(duì)接觸圖大小進(jìn)行固定。
4.根據(jù)權(quán)利要求1所述的基于三元組損失的蛋白質(zhì)折疊識(shí)別方法,其特征在于,每個(gè)三元組包含一個(gè)錨定蛋白、一個(gè)正蛋白、一個(gè)負(fù)蛋白,所述正蛋白折疊類型與錨定蛋白相同,所述負(fù)蛋白折疊類型與錨定蛋白不同。
5.根據(jù)權(quán)利要求1所述的基于三元組損失的蛋白質(zhì)折疊識(shí)別方法,其特征在于,目標(biāo)函數(shù)具體為:
式中,表示的是錨定蛋白與正樣本蛋白之間的歐式距離,表示的是錨定蛋白與負(fù)樣本蛋白之間的歐式距離,m是指錨定蛋白與正樣本蛋白之間的歐式距離與錨定蛋白與負(fù)樣本蛋白之間的歐式距離之間的最小間隔,[]+表示括號(hào)內(nèi)的值大于0則取該值為損失,小于0的時(shí)候,取0為損失。
6.根據(jù)權(quán)利要求1所述的基于三元組損失的蛋白質(zhì)折疊識(shí)別方法,其特征在于,計(jì)算查詢蛋白與模板蛋白的余弦距離作為相似度評(píng)分,距離越小,評(píng)分越高。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京理工大學(xué),未經(jīng)南京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010947616.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。





