[發(fā)明專利]基于深度度量學(xué)習(xí)的蛋白質(zhì)折疊識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010948824.7 | 申請(qǐng)日: | 2020-09-10 |
| 公開(kāi)(公告)號(hào): | CN112116950B | 公開(kāi)(公告)日: | 2022-08-12 |
| 發(fā)明(設(shè)計(jì))人: | 於東軍;劉巖 | 申請(qǐng)(專利權(quán))人: | 南京理工大學(xué) |
| 主分類號(hào): | G16B15/20 | 分類號(hào): | G16B15/20;G06N3/04;G06N3/08 |
| 代理公司: | 南京理工大學(xué)專利中心 32203 | 代理人: | 岑丹 |
| 地址: | 210094 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 度量 學(xué)習(xí) 蛋白質(zhì) 折疊 識(shí)別 方法 | ||
1.一種基于深度度量學(xué)習(xí)的蛋白質(zhì)折疊識(shí)別方法,其特征在于,包括:
對(duì)蛋白質(zhì)進(jìn)行編碼,得到蛋白質(zhì)序列的數(shù)字表達(dá);
將蛋白質(zhì)序列的數(shù)字表達(dá)輸入到SSA模型,取模型輸出層的上一層輸出作為蛋白質(zhì)殘基-殘基潛在的關(guān)系圖,并將關(guān)系圖固定為設(shè)定大小;
將蛋白質(zhì)殘基-殘基潛在的關(guān)系圖輸入到訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)中,獲取分類層前一層的輸出作為深度特征;
將深度特征輸入到訓(xùn)練好的孿生網(wǎng)絡(luò)中得到最終的蛋白質(zhì)特征;
基于蛋白質(zhì)特征計(jì)算查詢蛋白與模板蛋白之間的歐式距離,將與查詢蛋白質(zhì)距離最近的模板蛋白質(zhì)的折疊類型分配給查詢蛋白質(zhì)。
2.根據(jù)權(quán)利要求1所述基于深度度量學(xué)習(xí)的蛋白質(zhì)折疊識(shí)別方法,其特征在于,采用抽樣或者填充操作將關(guān)系圖固定為設(shè)定大小。
3.根據(jù)權(quán)利要求1所述基于深度度量學(xué)習(xí)的蛋白質(zhì)折疊識(shí)別方法,其特征在于,關(guān)系圖大小固定為256×256。
4.根據(jù)權(quán)利要求1所述基于深度度量學(xué)習(xí)的蛋白質(zhì)折疊識(shí)別方法,其特征在于,卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程為:
將蛋白質(zhì)殘基-殘基潛在的關(guān)系圖輸入卷積神經(jīng)網(wǎng)絡(luò)中,以交叉熵?fù)p失作為網(wǎng)絡(luò)的目標(biāo)函數(shù),使用隨機(jī)梯度下降算法優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)。
5.根據(jù)權(quán)利要求1所述基于深度度量學(xué)習(xí)的蛋白質(zhì)折疊識(shí)別方法,其特征在于,孿生網(wǎng)絡(luò)的訓(xùn)練過(guò)程為:
構(gòu)建孿生網(wǎng)絡(luò)訓(xùn)練樣本,將孿生網(wǎng)絡(luò)訓(xùn)練樣本輸入到孿生網(wǎng)絡(luò)的兩個(gè)子網(wǎng)絡(luò)中對(duì)孿生網(wǎng)絡(luò)使用隨機(jī)梯度下降算法學(xué)習(xí)孿生網(wǎng)絡(luò)的參數(shù),當(dāng)網(wǎng)絡(luò)迭代次數(shù)達(dá)到設(shè)定次數(shù)的時(shí)候,訓(xùn)練終止;
孿生網(wǎng)絡(luò)訓(xùn)練樣本的構(gòu)建方法為:
將卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本輸入到訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò),獲得訓(xùn)練樣本的深度特征;
從卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本中隨機(jī)選擇若干對(duì)樣本對(duì)應(yīng)的深度特征作為孿生網(wǎng)絡(luò)訓(xùn)練樣本,若每對(duì)樣本的蛋白質(zhì)折疊類型屬于同一類型,將該對(duì)樣本標(biāo)簽設(shè)為0,否則設(shè)為1。
6.根據(jù)權(quán)利要求5所述基于深度度量學(xué)習(xí)的蛋白質(zhì)折疊識(shí)別方法,其特征在于,孿生網(wǎng)絡(luò)的損失函數(shù)為:
其中,W表示為整個(gè)孿生網(wǎng)絡(luò)需要學(xué)習(xí)的參數(shù),N為蛋白質(zhì)樣本對(duì),Y為兩個(gè)蛋白質(zhì)是否為同一折疊類型的標(biāo)簽,DW為兩個(gè)蛋白質(zhì)深度特征之間的歐式距離,m為設(shè)置的閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京理工大學(xué),未經(jīng)南京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010948824.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





