[發(fā)明專(zhuān)利]基于元學(xué)習(xí)的生物活性肽預(yù)測(cè)方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202111256399.6 | 申請(qǐng)日: | 2021-10-27 |
| 公開(kāi)(公告)號(hào): | CN114067914A | 公開(kāi)(公告)日: | 2022-02-18 |
| 發(fā)明(設(shè)計(jì))人: | 魏樂(lè)義;何文嘉 | 申請(qǐng)(專(zhuān)利權(quán))人: | 山東大學(xué) |
| 主分類(lèi)號(hào): | G16B40/20 | 分類(lèi)號(hào): | G16B40/20;G16B40/30;G16B30/00;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 濟(jì)南圣達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 37221 | 代理人: | 朱忠范 |
| 地址: | 250101 山東*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 學(xué)習(xí) 生物 活性 預(yù)測(cè) 方法 系統(tǒng) | ||
本發(fā)明提供一種基于元學(xué)習(xí)的生物活性肽預(yù)測(cè)方法及系統(tǒng),屬于生物信息技術(shù)領(lǐng)域,獲取待預(yù)測(cè)的生物活性肽序列信息;利用通過(guò)最大化互信息與最小化交叉熵的聯(lián)合優(yōu)化改進(jìn)的元學(xué)習(xí)算法預(yù)先訓(xùn)練好的預(yù)測(cè)模型對(duì)待預(yù)測(cè)的生物活性肽序列信息進(jìn)行處理,獲得生物活性肽的功能類(lèi)型。本發(fā)明能夠統(tǒng)一預(yù)測(cè)多種的生物活性肽;基于Embedding技術(shù)而不基于特征工程和人工設(shè)計(jì)的特征,能夠通過(guò)微調(diào)或推斷等方式來(lái)預(yù)測(cè)多肽是否具有某種特定的功能活性;使用來(lái)自各種功能肽的少量樣本,獲取了各種功能之間的區(qū)別信息并表征功能差異,提高了下游功能肽預(yù)測(cè)效果,尤其是在小樣本場(chǎng)景下與傳統(tǒng)方法相比性能有顯著提升。
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息技術(shù)領(lǐng)域,具體涉及一種基于元學(xué)習(xí)的生物活性肽預(yù)測(cè)方法及系統(tǒng)。
背景技術(shù)
多肽通常由10-100個(gè)氨基酸組成,與傳統(tǒng)化療相比,功能活性肽具有以下優(yōu)點(diǎn):生物介體、顯著的效力、高選擇性和低毒性。從天然肽中提取的藥物已經(jīng)徹底改變了一些疾病的治療,例如1型糖尿病。此后,越來(lái)越多的多肽類(lèi)藥物被發(fā)現(xiàn)。例如,一種基于抗血管生成肽(AAP)的藥物,單克隆抗VEGF(血管內(nèi)皮生長(zhǎng)因子)抗體,可以抑制腫瘤血管生長(zhǎng),從而提高癌癥患者的生存率。抗菌肽(ABPs)是先天免疫的效應(yīng)分子,可以靶向細(xì)菌膜,通過(guò)細(xì)胞凋亡反應(yīng)殺死細(xì)菌,其殺菌速度快于細(xì)菌的生長(zhǎng)速度。抗結(jié)核肽(ATPs)由于其低免疫原性、低毒性和針對(duì)侵襲性病原體的靶向免疫反應(yīng)的特點(diǎn),已成為結(jié)核病治療的候選藥物。其他肽的生物活性包括抗癌和DPP IV抑制劑等。因此,發(fā)現(xiàn)新的潛在多肽生物活性對(duì)新藥開(kāi)發(fā)具有重要意義。
盡管肽類(lèi)藥物具有優(yōu)異的優(yōu)勢(shì),但全球市場(chǎng)上只有約80種肽類(lèi)藥物,約700種肽仍處于臨床試驗(yàn)或臨床前研究階段。限制肽藥物開(kāi)發(fā)的主要原因之一是難以識(shí)別生物活性肽,這是肽藥物發(fā)現(xiàn)管道中的關(guān)鍵步驟。為了促進(jìn)肽類(lèi)藥物的發(fā)現(xiàn),提出了基于機(jī)器學(xué)習(xí)的功能肽預(yù)測(cè)算法,并取得了一些進(jìn)展。這種方法使模型能夠區(qū)分功能性肽和非功能性肽,從而加速肽藥物的開(kāi)發(fā)。
近年來(lái),已經(jīng)開(kāi)發(fā)出了幾種基于機(jī)器學(xué)習(xí)的方法來(lái)識(shí)別各種生物活性肽。例如,Laengsri等人構(gòu)建了TargetAntiAngio,一種基于序列的分類(lèi)器,用于使用傳統(tǒng)機(jī)器學(xué)習(xí)預(yù)測(cè)AAP。Wei等人開(kāi)發(fā)了一系列預(yù)測(cè)因子,如ACPred FL、PEPred Suite和ACPred Fuse,以促進(jìn)準(zhǔn)確預(yù)測(cè)ACP的發(fā)展。Manavalan等人通過(guò)采用ERT算法對(duì)一個(gè)名為AtbPpred的預(yù)測(cè)工具進(jìn)行建模,以識(shí)別ATP,從而提高了模型的魯棒性和精度。至于神經(jīng)肽,有人提出了一種稱(chēng)為NeuroPIpred的工具,通過(guò)特征工程來(lái)預(yù)測(cè)、設(shè)計(jì)和掃描昆蟲(chóng)神經(jīng)肽。此外,各種用于預(yù)測(cè)其他種類(lèi)的功能肽的計(jì)算方法相繼被提出,如Deep AntiFP、iQSP、iUmami SCM、PreAIP、PSBP-SVM、THPep等。
盡管取得了很大進(jìn)展,但仍然存在以下主要挑戰(zhàn)。首先,許多基于機(jī)器學(xué)習(xí)的相關(guān)任務(wù)都受到樣本數(shù)較少的影響。低容量標(biāo)記樣本(經(jīng)實(shí)驗(yàn)驗(yàn)證的生物活性肽)無(wú)法支持傳統(tǒng)的監(jiān)督學(xué)習(xí)來(lái)訓(xùn)練魯棒的高性能模型,容易導(dǎo)致過(guò)度擬合和泛化能力差的問(wèn)題。其次,大多數(shù)現(xiàn)有的利用工程特性的方法都是針對(duì)特定的功能肽設(shè)計(jì)的;沒(méi)有通用的計(jì)算方法可以同時(shí)準(zhǔn)確預(yù)測(cè)不同肽的生物活性。更重要的是,它們不能支持看不見(jiàn)的(新的)肽生物活性發(fā)現(xiàn),這也是監(jiān)督學(xué)習(xí)的一個(gè)限制。第三,大多數(shù)基于機(jī)器學(xué)習(xí)的多肽預(yù)測(cè)器仍然依賴(lài)于人工設(shè)計(jì)的統(tǒng)計(jì)特征,這在很大程度上依賴(lài)于研究人員的先驗(yàn)知識(shí)。此外,人工設(shè)計(jì)的的特征無(wú)法捕獲不同肽功能的高潛在非線性信息。重要的是,人工設(shè)計(jì)的的特征缺乏對(duì)不同肽功能預(yù)測(cè)任務(wù)的適應(yīng)性。也就是說(shuō),他們可能在一項(xiàng)特定任務(wù)上表現(xiàn)良好,但在其他任務(wù)上表現(xiàn)不佳。此外,特征工程通常會(huì)產(chǎn)生數(shù)百維的特征向量,導(dǎo)致維數(shù)災(zāi)難。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種通過(guò)最大化互信息與最小化交叉熵的聯(lián)合優(yōu)化改進(jìn)現(xiàn)有的元學(xué)習(xí)算法原型網(wǎng)絡(luò),不依賴(lài)于特征工程,能夠通過(guò)微調(diào)或推斷等方式來(lái)預(yù)測(cè)多肽是否具有某種特定的功能活性的基于元學(xué)習(xí)的生物活性肽預(yù)測(cè)方法及系統(tǒng),以解決上述背景技術(shù)中存在的至少一項(xiàng)技術(shù)問(wèn)題。
為了實(shí)現(xiàn)上述目的,本發(fā)明采取了如下技術(shù)方案:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于山東大學(xué),未經(jīng)山東大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111256399.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 根據(jù)用戶(hù)學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





