[發(fā)明專利]基于支持向量機(jī)的藥物分子藥代動(dòng)力學(xué)性質(zhì)和毒性預(yù)測(cè)方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200810045708.3 | 申請(qǐng)日: | 2008-07-31 |
| 公開(kāi)(公告)號(hào): | CN101329699A | 公開(kāi)(公告)日: | 2008-12-24 |
| 發(fā)明(設(shè)計(jì))人: | 楊勝勇;黃奇;魏于全;馬長(zhǎng)英;張會(huì) | 申請(qǐng)(專利權(quán))人: | 四川大學(xué) |
| 主分類號(hào): | G06F17/50 | 分類號(hào): | G06F17/50;G06N1/00;G06N3/12 |
| 代理公司: | 成都信博專利代理有限責(zé)任公司 | 代理人: | 潘育敏;馮義高 |
| 地址: | 610064四*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 支持 向量 藥物 分子 動(dòng)力學(xué) 性質(zhì) 毒性 預(yù)測(cè) 方法 | ||
所屬技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)輔助藥物分子設(shè)計(jì)領(lǐng)域,特別涉及一種基于支持向量機(jī)的藥物分子藥代動(dòng)力學(xué)性質(zhì)和毒性預(yù)測(cè)方法。
背景技術(shù):
在藥物開(kāi)發(fā)的初期,使用計(jì)算機(jī)預(yù)測(cè)藥物分子的藥代動(dòng)力學(xué)性質(zhì)和毒性,可以減少后期藥物開(kāi)發(fā)的風(fēng)險(xiǎn),降低研發(fā)成本。目前常用的預(yù)測(cè)藥物分子藥代動(dòng)力學(xué)性質(zhì)和毒性的方法主要包括多重線性回歸、主成分分析、偏最小二乘方法等。這些方法的缺陷主要包括:它們只適用于化合物結(jié)構(gòu)差異較小的體系,而實(shí)際的藥物分子體系一般結(jié)構(gòu)差異很大;這些方法一般要求樣本的數(shù)量多,而藥代動(dòng)力學(xué)和毒性實(shí)驗(yàn)數(shù)據(jù)測(cè)試?yán)щy、并且費(fèi)用較高,限制了大量實(shí)驗(yàn)數(shù)據(jù)的獲取;由于試驗(yàn)數(shù)據(jù)的不足導(dǎo)致了預(yù)測(cè)能力非常有限。
支持向量機(jī)(Support?Vector?Machine,SVM)是近年來(lái)發(fā)展起來(lái)的一種優(yōu)秀的機(jī)器統(tǒng)計(jì)學(xué)習(xí)方法,它在文字、圖像識(shí)別和數(shù)據(jù)挖掘中已得到較多的應(yīng)用。但是使用SVM的方法還不能很好地完成藥物分子的藥代動(dòng)力學(xué)和毒性預(yù)測(cè)。因?yàn)镾VM本身還存在一些自身無(wú)法解決的問(wèn)題,比如在SVM建模中所使用的描述符有許多是重復(fù)和冗余的,SVM參數(shù)包括懲罰函數(shù)C和核函數(shù)γ的設(shè)置不盡合理等。這些問(wèn)題的存在嚴(yán)重地影響藥物分子藥代動(dòng)力學(xué)性質(zhì)和毒性預(yù)測(cè)模型的質(zhì)量。如何充分利用支持向量機(jī)的統(tǒng)計(jì)學(xué)習(xí)建模和計(jì)算機(jī)快速處理外部巨大數(shù)據(jù)的獨(dú)特優(yōu)勢(shì),開(kāi)發(fā)適用于藥物分子的藥代動(dòng)力學(xué)和毒性預(yù)測(cè)模型,對(duì)計(jì)算機(jī)輔助藥物分子設(shè)計(jì)和創(chuàng)新藥物研發(fā)有著十分重要的作用。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于支持向量機(jī)的新的藥物分子藥代動(dòng)力學(xué)性質(zhì)和毒性預(yù)測(cè)方法。本方法既充分利用支持向量機(jī)的統(tǒng)計(jì)學(xué)習(xí)建模優(yōu)勢(shì),又充分利用計(jì)算機(jī)快速處理外部大量數(shù)據(jù)的能力,其基本思路是引用藥物分子描述符程序計(jì)算出描述符,進(jìn)行描述符的預(yù)處理,在構(gòu)建新的SVM預(yù)測(cè)模型過(guò)程中同時(shí)充分考慮藥物分子描述符的選擇和SVM參數(shù)的優(yōu)化,并建立藥物分子藥代動(dòng)力學(xué)性質(zhì)和毒性的預(yù)測(cè)系統(tǒng),使其預(yù)測(cè)質(zhì)量和效率大為提高。
本發(fā)明的目的是這樣達(dá)到的:一種基于SVM的藥物分子藥代動(dòng)力學(xué)性質(zhì)和毒性預(yù)測(cè)方法,其特征在于:構(gòu)建新的計(jì)算機(jī)程序預(yù)測(cè)模型,在構(gòu)建過(guò)程中同時(shí)進(jìn)行藥物分子描述符的選擇和SVM參數(shù)的優(yōu)化;構(gòu)建步驟包括:描述符的計(jì)算,描述符的預(yù)處理,對(duì)描述符數(shù)據(jù)集進(jìn)行重新標(biāo)度,采用集成的方法同時(shí)進(jìn)行描述符的優(yōu)化和SVM參數(shù)優(yōu)化;SVM參數(shù)的優(yōu)化使用共扼梯度法,對(duì)懲罰函數(shù)C和核函數(shù)γ進(jìn)行優(yōu)化;描述符的優(yōu)化使用遺傳算法,個(gè)體適應(yīng)度函數(shù)采用綜合反映預(yù)測(cè)準(zhǔn)確度和描述符數(shù)目的適應(yīng)度函數(shù)Fit=WA×SVM_accuracy+Wf×NF,其中SVM_accuracy為該個(gè)體的5重交叉驗(yàn)證的精度,WA為對(duì)應(yīng)的權(quán)重,NF為描述符的個(gè)數(shù),WF為對(duì)應(yīng)的權(quán)重。在獲得每個(gè)染色體的適應(yīng)度函數(shù)后,通過(guò)輪盤(pán)賭,雜交和突變等運(yùn)算產(chǎn)生下一代種群;描述符的選擇和SVM參數(shù)優(yōu)化的集成是在SVM參數(shù)優(yōu)化的基礎(chǔ)上對(duì)每一個(gè)個(gè)體進(jìn)行適應(yīng)度函數(shù)的計(jì)算,完成輪盤(pán)賭,雜交和突變的數(shù)據(jù)集成。
所述對(duì)SVM參數(shù)優(yōu)化使用共扼梯度法,對(duì)懲罰函數(shù)C和核函數(shù)γ進(jìn)行優(yōu)化的方法是:設(shè)C′,γ′是最優(yōu)的懲罰函數(shù)和核函數(shù),A′值最小表示SVM預(yù)測(cè)的精度最高,C′=logC,γ′=logγ,A′=-A;然后按照以下步驟進(jìn)行:
(1)在初始點(diǎn)x0=(C′0,γ′0)處計(jì)算梯度的負(fù)值,即r0=-g0,設(shè)置第一個(gè)共扼方向d0=r0;
(2)設(shè)xi=x0,di=d0,沿di方向線性搜索αi,使得-f(xi+αidi)最小,然后產(chǎn)生xi+1=xi+αidi;
(3)在新的點(diǎn)計(jì)算ri+1=-gi+1;
(4)檢查是否滿足收斂條件,即|ri+1|<tolerance的設(shè)定值,如果滿足則退出,否則繼續(xù)下一步。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川大學(xué),未經(jīng)四川大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810045708.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 移動(dòng)向量解碼方法和移動(dòng)向量解碼裝置
- 一種用于支持向量機(jī)的在線向量選取方法
- 用于在幀序列中執(zhí)行運(yùn)動(dòng)估計(jì)的數(shù)據(jù)處理系統(tǒng)和方法
- 神經(jīng)網(wǎng)絡(luò)的處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備
- 字符序列處理方法及設(shè)備
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 向量獲取方法、裝置、電子設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 近鄰向量的召回方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種向量運(yùn)算裝置及運(yùn)算方法
- 生成類別向量的方法和裝置





