[發明專利]基于支持向量機預測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法有效
| 申請號: | 201110325636.X | 申請日: | 2011-10-24 |
| 公開(公告)號: | CN102708269A | 公開(公告)日: | 2012-10-03 |
| 發明(設計)人: | 盧小泉;姬東琴;周喜斌;陳晶;史海材;劉冬;李亞亞 | 申請(專利權)人: | 西北師范大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 北京中恒高博知識產權代理有限公司 11249 | 代理人: | 夏晏平 |
| 地址: | 730070 甘肅*** | 國省代碼: | 甘肅;62 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 支持 向量 預測 胞漿型 磷脂酶 sub 抑制劑 抑制 濃度 方法 | ||
1.一種基于支持向量機預測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,其特征在于,包括如下步驟:
1)樣本集的建立:收集胞漿型磷脂酶A2α抑制劑的分子結構;
2)抑制劑分子描述符集的構建:輸入胞漿型磷脂酶A2α抑制劑的分子結構,計算出與其對應的分子描述符值,該分子描述符含有若干個分量;
3)簡化抑制劑分子描述符集;?
4)抑制劑分子描述符集的重新標度:將簡化后的抑制劑分子描述符集映射到[-1,+1]區間,映射公式為:????????????????????????????????????????????????
其中,x是抑制劑分子描述符的原始值,xpre是重新標度后的值,xmax和xmin分別對應抑制劑分子描述符的最大值和最小值,ymax和ymin分別對應映射區間最大值和最小值,即+1和-1;
5)將經過步驟2)至4)處理后的樣本集隨機的劃分為訓練集和測試集,利用訓練集數據,采用10折隨機交叉驗證方法,對支持向量機模型參數進行優化;
6)用步驟5)所述的訓練集和優化后得到的支持向量機參數建立抑制劑分子結構與抑制濃度的關系模型;
7)將步驟5)所述的測試集數據輸入步驟6)所建立的關系模型,預測抑制劑的抑制濃度。
2.根據權利要求1所述的基于支持向量機預測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,其特征在于:步驟2)所述抑制劑的分子結構的構象處于最低能量狀態。
3.根據權利要求1所述的基于支持向量機預測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,其特征在于:步驟2)中分子描述符的計算是采用在線藥物分子描述符計算軟件MODEL完成。
4.根據權利要求1所述的基于支持向量機預測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,其特征在于,步驟3)所述的簡化過程為:
(a)刪除與抑制劑分子結構相關性不大的抑制劑分子描述符;
(b)再刪除描述符值為0的抑制劑分子描述符,刪除對于所有抑制劑所對應的分子描述符值都相等的描述符;
(c)使用逐步回歸方法對剩下的抑制劑分子描述符再進行篩選。
5.根據權利要求1所述的基于支持向量機預測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,其特征在于:在步驟5)中,樣本集是按4:1的比例隨機劃分為訓練集和測試集。
6.根據權利要求1所述的基于支持向量機預測胞漿型磷脂酶A2α抑制劑的抑制濃度的方法,其特征在于,步驟5)中所述的支持向量機模型參數優化過程為:
設置容量因子C固定為100;ε不敏感損失函數的ε值變化范圍的最大值為1,最小值為-1,變化步長為0.01;核函數參數γ的值變化范圍的最大值是1,最小值-1,變化步長為0.01;核函數K選用高斯徑向基核函數;
將訓練集隨機的均分為10組,其中的9組用來建立抑制劑分子結構與抑制濃度的關系模型,剩余的一組用來驗證該模型,依次對每一組進行一次驗證,將驗證后所得到10次結果的準確率的平均值作為準確的估計;
準確率最高時所對應的容量因子C、ε不敏感損失函數的ε值、核函數參數γ的值即為支持向量機模型參數的最優值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西北師范大學,未經西北師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110325636.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種半導體量子阱光探測器件
- 下一篇:一種基于礦石性質確定礦石入磨粒度的方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





