[發(fā)明專利]一種化合物毒性預(yù)測模型建模方法、裝置及其應(yīng)用在審
| 申請?zhí)枺?/td> | 201911128499.3 | 申請日: | 2019-11-18 |
| 公開(公告)號: | CN110890137A | 公開(公告)日: | 2020-03-17 |
| 發(fā)明(設(shè)計)人: | 桑運霞;史偉;宋青芳;臧衛(wèi)東;劉強 | 申請(專利權(quán))人: | 上海爾云信息科技有限公司 |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16B5/00 |
| 代理公司: | 上海光華專利事務(wù)所(普通合伙) 31219 | 代理人: | 朱凌嬌;許亦琳 |
| 地址: | 200240 上海市*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 化合物 毒性 預(yù)測 模型 建模 方法 裝置 及其 應(yīng)用 | ||
本發(fā)明提供一種化合物毒性預(yù)測模型的建模方法,至少包括以下步驟:步驟S101,提供各候選建模化合物的毒性分類標簽;步驟S102,提供各候選建模化合物的分子描述符;步驟S103,提供各候選建模化合物的靶蛋白描述符;步驟S104,提供各候選建模化合物的定量高通量篩選分析描述符,所述定量高通量篩選分析描述符是指定量高通量篩選的PubChem活動評分;步驟S105,構(gòu)建并訓(xùn)練化合物毒性預(yù)測模型。本發(fā)明能夠充分利用藥物候選化合物的理化性質(zhì)、生物活性、靶蛋白作用性質(zhì),同時利用基于集成學(xué)習的機器學(xué)習算法的統(tǒng)計建模優(yōu)勢,構(gòu)建藥物毒性的預(yù)測系統(tǒng),使模型兼具可解釋性和預(yù)測性能,具有更好的理化和生物學(xué)意義和研究價值。
技術(shù)領(lǐng)域
本發(fā)明涉及化學(xué)信息學(xué)和生物信息學(xué)領(lǐng)域,特別是涉及一種化合物毒性預(yù)測模型建模方法、裝置及其應(yīng)用。
背景技術(shù)
現(xiàn)代藥物的研發(fā)過程是一種探索能夠與特異治療標靶相互作用并具有良好的吸收、分布、代謝和排泄性質(zhì)化合物的過程。據(jù)統(tǒng)計,新藥研發(fā)失敗約有30%是由于存在安全性問題而導(dǎo)致的。為了有效提高藥物開發(fā)的率和成功率,需要在藥物研發(fā)的早期階段對化合物的毒性進行評價并將毒性較強的化合物盡早排除。傳統(tǒng)的藥物毒性預(yù)測方法主要使用基于動物活體實驗的毒理學(xué)實驗方法對藥物毒性進行預(yù)測。由于需要在活體動物上驗證藥物的實際應(yīng)用效果,所以傳統(tǒng)方法存在著周期長、花費高且需要耗費大量活體動物等缺點。此外,安全、環(huán)保、動物保護等方面的法規(guī)要求日益嚴格,全球化的市場競爭也使得藥物開發(fā)周期不斷縮短,藥物開發(fā)的資源投入越來越大。傳統(tǒng)藥物毒性預(yù)測方法所存在的缺點,以及當前社會發(fā)展所體現(xiàn)出的特點,都為藥物的藥物開發(fā)人員提出了挑戰(zhàn)。因此,研究基于計算機應(yīng)用技術(shù)的高效準確的藥物毒性預(yù)測方法,對于提高新藥研發(fā)的成功率,降低研發(fā)成本具有重要的意義,并已經(jīng)成為當今毒理學(xué)、藥物分析學(xué)、計算化學(xué)和系統(tǒng)生物學(xué)等多個學(xué)科共同關(guān)注的前沿命題。
發(fā)明內(nèi)容
鑒于以上所述現(xiàn)有技術(shù)的缺點,本發(fā)明的目的在于提供一種化合物毒性預(yù)測模型建模方法、裝置及其應(yīng)用。
本發(fā)明第一方面提供一種化合物毒性預(yù)測模型的建模方法,至少包括以下步驟:
步驟S101,提供各候選建模化合物的毒性分類標簽;
步驟S102,提供各候選建模化合物的分子描述符;
步驟S103,提供各候選建模化合物的靶蛋白描述符;
步驟S104,提供各候選建模化合物的定量高通量篩選分析描述符,所述定量高通量篩選分析描述符是指定量高通量篩選的PubChem活動評分;
步驟S105,構(gòu)建并訓(xùn)練化合物毒性預(yù)測模型:保留同時具有全部描述符和毒性分類標簽的各候選建模化合物,作為建模化合物,構(gòu)建模型輸入訓(xùn)練數(shù)據(jù)集,所述輸入訓(xùn)練數(shù)據(jù)集包含建模化合物的全部描述符特征和毒性分類標簽,利用基于集成學(xué)習的機器學(xué)習算法構(gòu)建并訓(xùn)練化合物毒性預(yù)測模型;所述全部描述符是指分子描述符、靶蛋白描述符和定量高通量篩選分析描述符。
本發(fā)明第二方面提供一種化合物毒性預(yù)測模型的建模裝置,至少包括以下模塊:
毒性分類標簽提供模塊:用于提供各候選建模化合物的毒性分類標簽;
分子描述符提供模塊:用于提供各候選建模化合物的分子描述符;
靶蛋白描述符提供模塊:用于提供各候選建模化合物的靶蛋白描述符;
定量高通量篩選分析描述符提供模塊:用于提供各候選建模化合物的定量高通量篩選分析描述符,所述定量高通量篩選分析描述符是指定量高通量篩選的PubChem活動評分;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海爾云信息科技有限公司,未經(jīng)上海爾云信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911128499.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





