[發(fā)明專利]化學(xué)品雌激素受體激活活性的預(yù)測(cè)模型及篩查方法在審
| 申請(qǐng)?zhí)枺?/td> | 202011642815.1 | 申請(qǐng)日: | 2020-12-30 |
| 公開(公告)號(hào): | CN112634993A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設(shè)計(jì))人: | 劉嫻;王理國(guó);張愛茜;薛嶠;潘文筱 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)院生態(tài)環(huán)境研究中心 |
| 主分類號(hào): | G16C10/00 | 分類號(hào): | G16C10/00;G16C20/70;G06N3/08;G06N3/04 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 王江選 |
| 地址: | 100085*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 化學(xué)品 雌激素 受體 激活 活性 預(yù)測(cè) 模型 方法 | ||
1.一種化學(xué)品雌激素受體激活活性預(yù)測(cè)模型的建立方法,包括:
S1獲取已知雌激素受體激活活性的化學(xué)品數(shù)據(jù),其中,所述化學(xué)品數(shù)據(jù)包括化學(xué)品的SMILES編碼;
S2將SMILES編碼轉(zhuǎn)換得到M×N的數(shù)字矩陣;
S3將獲得的已知化學(xué)品的數(shù)字矩陣數(shù)據(jù)分為訓(xùn)練集和驗(yàn)證集,構(gòu)建以SMILES數(shù)字矩陣為輸入的卷積神經(jīng)網(wǎng)絡(luò)模型;
S4使用訓(xùn)練集訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型,使用驗(yàn)證集確定卷積神經(jīng)網(wǎng)絡(luò)模型的最優(yōu)超參數(shù),得到最優(yōu)卷積神經(jīng)網(wǎng)絡(luò)模型。
2.根據(jù)權(quán)利要求1所述的建立方法,其特征在于,
步驟S1中所述化學(xué)品數(shù)據(jù)還包括化學(xué)品雌激素受體激活活性二元類別。
3.根據(jù)權(quán)利要求1所述的建立方法,其特征在于,
步驟S2中將所述SMILES編碼轉(zhuǎn)換得到M×N的數(shù)字矩陣的方法具體包括:
S2.1將化學(xué)品的SMILES編碼的字符串拆分為單個(gè)字符組成的字符向量;
S2.2設(shè)定字符向量為固定長(zhǎng)度N,若字符向量長(zhǎng)度小于N,則在字符向量后填充字符“0”,使字符向量長(zhǎng)度為N;若字符向量長(zhǎng)度大于N,則取前N個(gè)字符;
S2.3化學(xué)品數(shù)據(jù)中的化學(xué)物共涵蓋M種字符,將該M個(gè)字符按照一定順序排列為字符列表;對(duì)于每個(gè)化學(xué)品,遍歷其長(zhǎng)度為N的SMILES字符向量,根據(jù)字符在字符列表中對(duì)應(yīng)的位置i,將該字符轉(zhuǎn)換為位置i處為1,其余均為0的長(zhǎng)度為M的數(shù)字向量;對(duì)于字符向量后填充的字符“0”,則轉(zhuǎn)換為長(zhǎng)度為M的均為0的數(shù)字向量,得到M×N的數(shù)字矩陣。
4.根據(jù)權(quán)利要求1所述的建立方法,其特征在于,
步驟S3中所述卷積神經(jīng)網(wǎng)絡(luò)模型包括ncv層的卷積層和nfc層全連接層。
5.根據(jù)權(quán)利要求4所述的建立方法,其特征在于,
第i層卷積層包含channeli個(gè)卷積核,卷積核尺寸為channeli-1×ki,其中,卷積步長(zhǎng)為stridei,輸出為大小為channeli×Li的數(shù)據(jù),其中,
其中,將最后一層卷積的輸出大小為的矩陣轉(zhuǎn)換為長(zhǎng)度為的向量作為全連接層的輸入;
其中,全連接層中當(dāng)前層的每一個(gè)結(jié)點(diǎn)都與上一層的所有結(jié)點(diǎn)相連,每層的節(jié)點(diǎn)數(shù)分別為除最后一層外每層輸出均將神經(jīng)網(wǎng)絡(luò)中的線性特征轉(zhuǎn)換為非線性特征;
其中,全連接層的最后一層即輸出層,輸出化學(xué)品雌激素受體激活活性的預(yù)測(cè)值s。
6.根據(jù)權(quán)利要求1所述的建立方法,其特征在于,
步驟S4中所述確定卷積神經(jīng)網(wǎng)絡(luò)模型的最優(yōu)超參數(shù)的方法包括:
S4.1預(yù)設(shè)置一組模型超參數(shù)為{α,λ,Pdp},其中,α為學(xué)習(xí)率,λ為L(zhǎng)2正則化項(xiàng)參數(shù),Pdp為隨機(jī)失活比率;
S4.2基于預(yù)設(shè)置合適的超參數(shù)和訓(xùn)練集數(shù)據(jù)迭代訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型;
S4.3使用驗(yàn)證集的化合物對(duì)超參數(shù){α,λ,Pdp}進(jìn)行優(yōu)化,得到最優(yōu)超參數(shù)。
7.根據(jù)權(quán)利要求6所述的建立方法,其特征在于,
步驟S4.3中所述最優(yōu)超參數(shù)為統(tǒng)計(jì)參數(shù)最優(yōu)時(shí)的超參數(shù);
其中,所述統(tǒng)計(jì)參數(shù)包括真陽(yáng)性、真陰性、假陽(yáng)性、假陰性、敏感性、特異性、準(zhǔn)確率、平衡準(zhǔn)確性中的至少一種。
8.一種化學(xué)品雌激素受體激活活性的預(yù)測(cè)模型,采用如權(quán)利要求1至7任一項(xiàng)所述的建立方法獲得。
9.一種化學(xué)品雌激素受體激活活性的篩查方法,采用如權(quán)利要求8所述的預(yù)測(cè)模型,包括:
將待評(píng)價(jià)化學(xué)品的SMILES編碼,轉(zhuǎn)換成大小為M×N的數(shù)字矩陣后輸入所述的預(yù)測(cè)模型中,得到雌激素受體激活活性預(yù)測(cè)值;
若預(yù)測(cè)值大于或等于預(yù)設(shè)閾值則認(rèn)為化學(xué)品具有雌激素受體激活活性,若預(yù)測(cè)值小于預(yù)設(shè)閾值則認(rèn)為化學(xué)品不具有雌激素受體激活活性。
10.根據(jù)權(quán)利要求9所述的篩查方法,其特征在于,
所述預(yù)設(shè)閾值的確定方法包括:
將若干已知化學(xué)品的SMILES編碼,轉(zhuǎn)換成大小為M×N的數(shù)字矩陣后輸入所述的預(yù)測(cè)模型中,得到雌激素受體激活活性預(yù)測(cè)值集合S;
將S由大到小排序,根據(jù)每個(gè)已知化學(xué)品的預(yù)測(cè)值和對(duì)應(yīng)的活性標(biāo)簽,計(jì)算真陽(yáng)性率和假陽(yáng)性率;以假陽(yáng)性率為x軸,真陽(yáng)性率為y軸,得到接受者操作特性曲線;
接受者操作特性曲線中計(jì)算真陽(yáng)性率相對(duì)于假陽(yáng)性率變化率最大點(diǎn)t所對(duì)應(yīng)的預(yù)測(cè)值st作為判定雌激素激活活性的預(yù)設(shè)閾值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院生態(tài)環(huán)境研究中心,未經(jīng)中國(guó)科學(xué)院生態(tài)環(huán)境研究中心許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011642815.1/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 化學(xué)品泄漏處理系統(tǒng)
- 化學(xué)品安全信息快速查詢和全周期追蹤數(shù)碼標(biāo)簽系統(tǒng)
- 基于地理位置的混存化學(xué)品的貨運(yùn)車廂管理方法和服務(wù)器
- 基于RFID的化學(xué)品倉(cāng)庫(kù)管理方法和服務(wù)器
- 混存化學(xué)品的貨運(yùn)車廂管理方法和服務(wù)器
- 化學(xué)品倉(cāng)庫(kù)管理方法、服務(wù)器與系統(tǒng)
- 化學(xué)品更換智能防呆系統(tǒng)及方法
- 化學(xué)品自動(dòng)供給裝置
- 化學(xué)品存取信息記錄方法及化學(xué)品存儲(chǔ)柜
- 核電站化學(xué)品信息管理方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 利用鑒定纖維樣變性治療中使用的化合物的CTGF和TRKA受體的篩選方法
- 對(duì)感化性受體及與其相關(guān)的配體進(jìn)行的調(diào)節(jié)
- 一種用以治療與食欲素受體1、食欲素受體2、體抑素受體2或多巴胺D<sub>2L</sub>受體相關(guān)的疾病的方法和組合物
- 對(duì)感化性受體及與其相關(guān)的配體進(jìn)行的調(diào)節(jié)
- 嗅覺受體共同受體
- 具有人源化靶向部分和/或經(jīng)過優(yōu)化的嵌合抗原受體相互作用結(jié)構(gòu)域的嵌合抗原受體效應(yīng)細(xì)胞開關(guān)以及其用途
- G蛋白偶聯(lián)受體-配體相互作用關(guān)系的預(yù)測(cè)方法及預(yù)測(cè)系統(tǒng)
- 對(duì)感化性受體及與其相關(guān)的配體進(jìn)行的調(diào)節(jié)
- 氣溶膠生成裝置
- 小柴胡湯對(duì)褪黑素受體1、褪黑素受體2靶標(biāo)的作用





