[發(fā)明專利]基于支持向量機預(yù)測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法有效
| 申請?zhí)枺?/td> | 201110325636.X | 申請日: | 2011-10-24 |
| 公開(公告)號: | CN102708269A | 公開(公告)日: | 2012-10-03 |
| 發(fā)明(設(shè)計)人: | 盧小泉;姬東琴;周喜斌;陳晶;史海材;劉冬;李亞亞 | 申請(專利權(quán))人: | 西北師范大學(xué) |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 北京中恒高博知識產(chǎn)權(quán)代理有限公司 11249 | 代理人: | 夏晏平 |
| 地址: | 730070 甘肅*** | 國省代碼: | 甘肅;62 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 支持 向量 預(yù)測 胞漿型 磷脂酶 sub 抑制劑 抑制 濃度 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于支持向量機預(yù)測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,屬于化學(xué)計量學(xué)和化學(xué)信息學(xué)的交叉領(lǐng)域。
背景技術(shù)
胞漿型磷脂酶A2α是胞漿型磷脂酶A2的三個亞型(分別為α、β、γ)之一,它可以限制花生四烯酸的產(chǎn)生,此外胞漿型磷脂酶A2α的激活導(dǎo)致了大量的油脂中介體的產(chǎn)生,例如白細胞三烯、前列腺素、血小板活化因子等。由于抑制胞漿磷脂酶A2α的激活有著重要的意義,所以胞漿型磷脂酶A2α抑制劑的開發(fā)引起了藥物研究者的興趣。抑制劑分子的抑制濃度實驗數(shù)據(jù)測試困難、費用較高,限制了大量樣本的獲取,而抑制濃度是評價抑制劑效果的主要指標,因此在抑制劑開發(fā)初期,準確預(yù)測抑制劑分子的抑制濃度,可以減少后期抑制劑開發(fā)的風(fēng)險,降低研發(fā)成本。
支持向量機是基于統(tǒng)計學(xué)習(xí)理論的一種新型機器學(xué)習(xí)方法,目的是根據(jù)給定的訓(xùn)練樣本對某系統(tǒng)輸入輸出之間依賴關(guān)系的估計,使它能夠?qū)ξ粗敵鲎龀霰M可能準確的預(yù)測。
發(fā)明內(nèi)容
本發(fā)明的目的是解決現(xiàn)有技術(shù)中胞漿型磷脂酶A2α抑制劑的抑制濃度實驗數(shù)據(jù)測試困難的問題,提供一種基于支持向量機準確預(yù)測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法。
本發(fā)明的目的通過以下技術(shù)方案實現(xiàn),
一種基于支持向量機預(yù)測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,其特征在于,包括如下步驟:
1)樣本集的建立:收集胞漿型磷脂酶A2α抑制劑的分子結(jié)構(gòu);
2)抑制劑分子描述符集的構(gòu)建:輸入胞漿型磷脂酶A2α抑制劑的分子結(jié)構(gòu),計算出與其對應(yīng)的分子描述符值,該分子描述符含有若干個分量;
3)簡化抑制劑分子描述符集;?
4)抑制劑分子描述符集的重新標度:將簡化后的抑制劑分子描述符集映射到[-1,+1]區(qū)間,映射公式為:????????????????????????????????????????????????
其中,x是抑制劑分子描述符的原始值,xpre是重新標度后的值,xmax和xmin分別對應(yīng)抑制劑分子描述符的最大值和最小值,ymax和ymin分別對應(yīng)映射區(qū)間最大值和最小值,即+1和-1;
5)將經(jīng)過步驟2)至4)處理后的樣本集隨機的劃分為訓(xùn)練集和測試集,利用訓(xùn)練集數(shù)據(jù),采用10折隨機交叉驗證方法,對支持向量機模型參數(shù)進行優(yōu)化;
6)用步驟5)所述的訓(xùn)練集和優(yōu)化后得到的支持向量機參數(shù)建立抑制劑分子結(jié)構(gòu)與抑制濃度的關(guān)系模型;
7)將步驟5)所述的測試集數(shù)據(jù)輸入步驟6)所建立的關(guān)系模型,預(yù)測抑制劑的抑制濃度。
進一步,步驟2)所述抑制劑的分子結(jié)構(gòu)的構(gòu)象處于最低能量狀態(tài)。
進一步,步驟2)中分子描述符的計算是采用在線藥物分子描述符計算軟件MODEL完成。
進一步,步驟3)所述的簡化過程為:
(a)刪除與抑制劑分子結(jié)構(gòu)相關(guān)性不大的抑制劑分子描述符;
(b)再刪除描述符值為0的抑制劑分子描述符,刪除對于所有抑制劑所對應(yīng)的分子描述符值都相等的描述符;
(c)使用逐步回歸方法對剩下的抑制劑分子描述符再進行篩選。
進一步,在步驟5)中,樣本集是按4:1的比例隨機劃分為訓(xùn)練集和測試集。
進一步,步驟5)中所述的支持向量機模型參數(shù)優(yōu)化過程為:
設(shè)置容量因子C固定為100;ε不敏感損失函數(shù)的ε值變化范圍的最大值為1,最小值為-1,變化步長為0.01;核函數(shù)參數(shù)γ的值變化范圍的最大值是1,最小值-1,變化步長為0.01;核函數(shù)K選用高斯徑向基核函數(shù);
將訓(xùn)練集隨機的均分為10組,其中的9組用來建立抑制劑分子結(jié)構(gòu)與抑制濃度的關(guān)系模型,剩余的一組用來驗證該模型,依次對每一組進行一次驗證,將驗證后所得到10次結(jié)果的準確率的平均值作為準確的估計;
準確率最高時所對應(yīng)的容量因子C、ε不敏感損失函數(shù)的ε值、核函數(shù)參數(shù)γ的值即為支持向量機模型參數(shù)的最優(yōu)值。?
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西北師范大學(xué),未經(jīng)西北師范大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110325636.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





