[發明專利]基于分子親電矢量和擴展支持向量機的基因毒性概率預測方法無效
| 申請號: | 200610030358.4 | 申請日: | 2006-08-24 |
| 公開(公告)號: | CN101131391A | 公開(公告)日: | 2008-02-27 |
| 發明(設計)人: | 蔣華良;羅小民;朱維良;陳凱先;鄭明月;劉治國;薛春霞 | 申請(專利權)人: | 中國科學院上海藥物研究所 |
| 主分類號: | G01N35/00 | 分類號: | G01N35/00;G01N33/00;C12Q1/68;G06F17/00 |
| 代理公司: | 北京金信立方知識產權代理有限公司 | 代理人: | 朱梅;徐志明 |
| 地址: | 201203上海市浦東*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分子 矢量 擴展 支持 向量 基因 毒性 概率 預測 方法 | ||
1.一種基于分子親電矢量(MEV)和擴展支持向量機(SVM)的基因毒性概率預測方法,適用于根據化合物分子結構信息對該化合物進行虛擬毒性評價和篩選,其特征在于,該方法步驟包括:
a.對數據集中的化合物進行原子分類的步驟;
b.計算分子中每種上述步驟所分類的原子類型的原子描述符;
c.根據預定義規則,利用在上述步驟中獲取的原子描述符和分子碎片模式構建特征MEV向量;
d.使用基于F-score的遞歸特征消除(RFE)方法優化上述的MEV向量;
e.使用支持向量機方法對訓練集分子的基因毒性數據和及其特征MEV進行統計學習,得到觀測值類成員的后驗概率進而得到基因毒性的概率預測模型;
f.根據得到的分子基因毒性的概率預測模型,使用C++開發模塊化的分子基因毒性預測程序。
2.根據權利要求1所述的基因毒性概率預測方法,其特征在于、上述步驟a包括:使用基于文本的化學結構提問語言SMARTS描述原子分類;使用SMARTS語法描述的52個原子分類定義規則和3個毒效團子結構定義;使用可編程原子分類PATTY回溯算法完成原子類型指定。
3.根據權利要求1所述的基因毒性概率預測方法,其特征在于上述步驟b中,使用基于根據半經驗Hückel方法計算得到原子描述符,用于描述分子的親電性信息并用于分子基因毒性模建。
4.根據權利要求1或3所述的基因毒性概率預測方法,其特征是上述描述符包括,前線軌道電子密度、電子超離域度、原子π-電荷。
5.根據權利要求1所述的基因毒性概率預測方法,其特征是上述步驟c中、由以下步驟構建特征MEV向量:
(i)給定輸入分子M,先根據預定規則對其產生一個長度為N×5+3的浮點數數組VM,其中N是所有親電性相關的原子類型數目;
(ii)將VM的所有位都初始化為零,并且按每五位合并成為一個子集對應某一特定原子類型;
(iii)M分子的所有原子根據指定原子類型進行排序,具有同種類型的原子將被映射到相同的數組子集中;
(iv)對原子類型A所對應的數組子集,每一位分配一種類型的原子描述變量FA,其值為M分子中所有A類型原子的FA之和。對于預定義毒效團B對應的位,如果分子M中具有B碎片則其值FB為1,否則為0。
6.根據權利要求1所述的基因毒性概率預測方法,其特征是上述步驟d中,使用基于F-score的遞歸特征消除方法優化得到描述分子基因毒性信息的最優描述變量子集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院上海藥物研究所,未經中國科學院上海藥物研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610030358.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:治療心腦血管疾病的中藥提取物的制備方法及其用途
- 下一篇:發光二極管座體結構





