[發(fā)明專(zhuān)利]一種化合物-靶蛋白綁定預(yù)測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010595906.8 | 申請(qǐng)日: | 2020-06-28 |
| 公開(kāi)(公告)號(hào): | CN113851195A | 公開(kāi)(公告)日: | 2021-12-28 |
| 發(fā)明(設(shè)計(jì))人: | 鄭光;呂誠(chéng);喬安杰;胡成杰;劉昊;李立;何小鵑 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所 |
| 主分類(lèi)號(hào): | G16C20/50 | 分類(lèi)號(hào): | G16C20/50;G16C20/70;G06N3/08;G06N3/04 |
| 代理公司: | 北京市隆安律師事務(wù)所 11323 | 代理人: | 劉東方 |
| 地址: | 100700 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 化合物 蛋白 綁定 預(yù)測(cè) 方法 | ||
1.一種化合物-靶蛋白綁定預(yù)測(cè)方法,其特征在于,所述方法包括:
(1)獲取化合物-靶蛋白綁定數(shù)據(jù)(正樣本)和化合物-靶蛋白非綁定數(shù)據(jù)(負(fù)樣本);
(2)抽取用于訓(xùn)練、測(cè)試及驗(yàn)證的化合物-靶蛋白綁定/非綁定數(shù)據(jù)集(正/負(fù)樣本集);
構(gòu)建化合物-靶蛋白綁定深度學(xué)習(xí)模型(正模型),采用正/負(fù)樣本集正向訓(xùn)練化合物-靶蛋白綁定深度學(xué)習(xí)模型(正),提取化合物-靶蛋白綁定的特征(正特征),獲得最終化合物-靶蛋白綁定深度學(xué)習(xí)模型(正模型);和
構(gòu)建化合物-靶蛋白非綁定深度學(xué)習(xí)初步模型(負(fù)模型),采用正/負(fù)樣本集負(fù)向訓(xùn)練取化合物-靶蛋白非綁定深度學(xué)習(xí)模型(負(fù)),提取化合物-靶蛋白綁定的特征(負(fù)特征),得到最終化合物-靶蛋白非綁定深度學(xué)習(xí)模型(負(fù)模型);
(3)通過(guò)最終化合物-靶蛋白綁定的深度學(xué)習(xí)模型(正模型)進(jìn)行預(yù)測(cè)、以得到化合物-靶蛋白綁定關(guān)系(正);和
通過(guò)最終化合物-靶蛋白非綁定的深度學(xué)習(xí)模型(負(fù)模型)進(jìn)行預(yù)測(cè)、以得到化合物-靶蛋白非綁定關(guān)系(負(fù));
(4)精簡(jiǎn)的化合物-靶蛋白綁定關(guān)系=綁定關(guān)系(正)-非綁定關(guān)系(負(fù))。
2.根據(jù)權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于,所述步驟(1)進(jìn)一步包括:化合物-靶蛋白綁定數(shù)據(jù)(正樣本)的獲取包括從科技文獻(xiàn)和/或網(wǎng)上公開(kāi)的化合物-靶蛋白綁定數(shù)據(jù)庫(kù)中獲取;
優(yōu)選所述數(shù)據(jù)庫(kù)包括:ChemSpider,PubChem,BindingDB,ZINC或ChEMBL,或它們中兩種或兩種以上的組合。
3.根據(jù)權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于,所述步驟(1)進(jìn)一步包括:化合物-靶蛋白非綁定數(shù)據(jù)(負(fù)樣本)為隨機(jī)生成化合物-靶蛋白的數(shù)據(jù)從中排除化合物-靶蛋白綁定數(shù)據(jù)(正樣本)后的化合物-靶蛋白非綁定數(shù)據(jù)(負(fù)樣本)。
4.根據(jù)權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于,所述步驟(1)進(jìn)一步包括:所述化合物-靶蛋白綁定數(shù)據(jù)(正樣本)、化合物-靶蛋白非綁定數(shù)據(jù)(負(fù)樣本)的比例范圍為(0.1:1)~(1:100)之間;優(yōu)選化合物-靶蛋白綁定數(shù)據(jù)(正樣本)、化合物-靶蛋白非綁定數(shù)據(jù)(負(fù)樣本)比例是(1:1)。
5.根據(jù)權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于,所述步驟(2)中深度學(xué)習(xí)模型為全連接網(wǎng)絡(luò)模型、卷積神經(jīng)網(wǎng)絡(luò)模型、遞歸神經(jīng)網(wǎng)絡(luò)模型、深度置信網(wǎng)絡(luò)模型、或編碼器-解碼器網(wǎng)絡(luò)模型;
優(yōu)選為遞歸神經(jīng)網(wǎng)絡(luò)模型、全連接網(wǎng)絡(luò)模型、卷積神經(jīng)網(wǎng)絡(luò)模型、或編碼器-解碼器網(wǎng)絡(luò)模型;
最佳為遞歸神經(jīng)網(wǎng)絡(luò)模型。
6.根據(jù)權(quán)利要求所述的預(yù)測(cè)方法,其特征在于,所述步驟(2)中,
所述深度學(xué)習(xí)模型(正模型)為遞歸神經(jīng)網(wǎng)絡(luò)(正模型)、卷積神經(jīng)網(wǎng)絡(luò)(正模型)、全連接網(wǎng)絡(luò)(正模型)或編碼器-解碼器網(wǎng)絡(luò)(正模型);
所述深度學(xué)習(xí)模型(負(fù)模型)為遞歸神經(jīng)網(wǎng)絡(luò)(負(fù)模型)、卷積神經(jīng)網(wǎng)絡(luò)(負(fù)模型)、全連接網(wǎng)絡(luò)(負(fù)模型)或編碼器-解碼器網(wǎng)絡(luò)(負(fù)模型)。
7.根據(jù)權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于,所述步驟(2)進(jìn)一步包括:
所述訓(xùn)練、測(cè)試及驗(yàn)證化合物-靶蛋白綁定/非綁定數(shù)據(jù)集(正樣本集/負(fù)樣本集)為:將正/負(fù)樣本數(shù)據(jù)按照282:1:1的比例隨機(jī)抽取分成訓(xùn)練、測(cè)試和驗(yàn)證數(shù)據(jù)集,隨機(jī)打亂順序后,隨機(jī)抽取128個(gè)樣本數(shù)據(jù)為一組,導(dǎo)入深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,訓(xùn)練中當(dāng)loss值不再降低時(shí)、終止訓(xùn)練,從而得到化合物-靶蛋白綁定/非綁定的特征。
8.根據(jù)權(quán)利要求1所述的預(yù)測(cè)方法,其特征在于,所述步驟(2)進(jìn)一步包括:
將正/負(fù)樣本集的綁定標(biāo)簽分別設(shè)置為[1,0]和[0,1](或者對(duì)偶的[0,1]和[1,0])以進(jìn)行訓(xùn)練;和
將正/負(fù)樣本集的綁定標(biāo)簽分別設(shè)置為[0,1]和[1,0](或者對(duì)偶的[1,0]和[0,1])以進(jìn)行訓(xùn)練。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,未經(jīng)中國(guó)中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010595906.8/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類(lèi)預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





