[發(fā)明專(zhuān)利]基于三元組損失的蛋白質(zhì)折疊識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 202010947616.5 | 申請(qǐng)日: | 2020-09-10 |
| 公開(kāi)(公告)號(hào): | CN112116949B | 公開(kāi)(公告)日: | 2022-08-16 |
| 發(fā)明(設(shè)計(jì))人: | 於東軍;劉巖 | 申請(qǐng)(專(zhuān)利權(quán))人: | 南京理工大學(xué) |
| 主分類(lèi)號(hào): | G16B15/20 | 分類(lèi)號(hào): | G16B15/20;G06N3/04 |
| 代理公司: | 南京理工大學(xué)專(zhuān)利中心 32203 | 代理人: | 岑丹 |
| 地址: | 210094 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 三元 損失 蛋白質(zhì) 折疊 識(shí)別 方法 | ||
本發(fā)明公開(kāi)了一種基于三元組損失的蛋白質(zhì)折疊識(shí)別方法,包括以下幾個(gè)步驟:使用one?hot編碼對(duì)蛋白質(zhì)進(jìn)行編碼,將編碼后的蛋白質(zhì)輸入到SSA程序中,得到蛋白質(zhì)殘基與殘基之間的接觸圖,把接觸圖作為輸入數(shù)據(jù),輸入到預(yù)先訓(xùn)練好的深度學(xué)習(xí)框架中,網(wǎng)絡(luò)的輸出就為蛋白質(zhì)特定于折疊識(shí)別的特征;把查詢(xún)蛋白的特征與蛋白質(zhì)數(shù)據(jù)庫(kù)中已知蛋白質(zhì)折疊類(lèi)別的模板蛋白質(zhì)相比較,將距離查詢(xún)蛋白最近的模板蛋白質(zhì)的折疊類(lèi)別被分配給查詢(xún)蛋白。本發(fā)明借鑒三元組損失的訓(xùn)練思想,使得同類(lèi)之間的蛋白質(zhì)結(jié)構(gòu)距離更近,不同類(lèi)之間的蛋白質(zhì)結(jié)構(gòu)更遠(yuǎn),從而使得蛋白質(zhì)的特征表達(dá)具有更強(qiáng)的鑒別力,使得識(shí)別效率更高。
技術(shù)領(lǐng)域
本發(fā)明屬于生物信息學(xué)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)領(lǐng)域,具體為一種基于三元組損失的蛋白質(zhì)折疊識(shí)別方法。
背景技術(shù)
蛋白質(zhì)折疊類(lèi)型的確定可以揭示生命的第二套遺傳密碼,具體來(lái)說(shuō)就是蛋白質(zhì)的一級(jí)結(jié)構(gòu)是如何決定他的空間結(jié)構(gòu)的方式。眾所周知,蛋白質(zhì)的三維結(jié)構(gòu)對(duì)于研究蛋白質(zhì)的功能與性質(zhì)起著至關(guān)重要的作用,而正確的確定蛋白質(zhì)的折疊識(shí)別又是預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)的關(guān)鍵一環(huán)。另外,由于蛋白質(zhì)的折疊方式對(duì)蛋白質(zhì)的異質(zhì)性以及分子功能都有著深遠(yuǎn)的影響,所以在醫(yī)藥人工設(shè)計(jì)蛋白質(zhì)、尋找致命機(jī)理以及包涵體復(fù)性等領(lǐng)域都會(huì)有著巨大的促進(jìn)作用。因次,快速而準(zhǔn)確的識(shí)別蛋白質(zhì)的折疊類(lèi)型對(duì)生命科學(xué),醫(yī)藥科學(xué)的發(fā)展都有著重要的意義。
在研究的早期階段,確定蛋白質(zhì)的結(jié)構(gòu)通常采用的是傳統(tǒng)的實(shí)驗(yàn)方法,例如X射線晶體法和核磁共振光譜法。但是,這些傳統(tǒng)的方法的缺點(diǎn)也十分的明顯,成本高而且耗費(fèi)的時(shí)間相當(dāng)長(zhǎng)。另外隨著實(shí)驗(yàn)技術(shù)的發(fā)展以及人類(lèi)結(jié)構(gòu)基因組的不斷推進(jìn),蛋白質(zhì)數(shù)據(jù)庫(kù)中累積了大量的具有已知折疊類(lèi)型的蛋白質(zhì)。因次應(yīng)用生物信息學(xué)中的相關(guān)知識(shí),研發(fā)能夠直接快速的從蛋白質(zhì)序列出發(fā)進(jìn)行蛋白質(zhì)的折疊識(shí)別的方法有著迫切的需求,并且對(duì)于發(fā)現(xiàn)和認(rèn)識(shí)蛋白質(zhì)的功能也有著重要的意義。
在之前的研究中,國(guó)內(nèi)外的研究者提出了各種蛋白質(zhì)折疊識(shí)別方法,這些方法從原理上分大致可以分為兩類(lèi):基于模板的方法和基于機(jī)器學(xué)習(xí)的方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于南京理工大學(xué),未經(jīng)南京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010947616.5/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。





