[發(fā)明專利]圖特征提取、脂水分配系數(shù)預測方法及圖特征提取模型在審
| 申請?zhí)枺?/td> | 202011159909.3 | 申請日: | 2020-10-26 |
| 公開(公告)號: | CN112185480A | 公開(公告)日: | 2021-01-05 |
| 發(fā)明(設計)人: | 周文彪 | 申請(專利權)人: | 北京望石智慧科技有限公司 |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G06K9/62;G06N3/04 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 羅嘯 |
| 地址: | 100089 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 提取 水分 系數(shù) 預測 方法 模型 | ||
本發(fā)明公開了一種圖特征提取、脂水分配系數(shù)預測方法及圖特征提取模型,其中,圖特征提取方法包括:獲取待提取特征圖,待提取特征圖由多個節(jié)點以及連接具有關聯(lián)關系的節(jié)點的邊組成;將待提取特征圖輸入到圖特征提取模型進行特征提取,得到每一個節(jié)點的特征,圖特征提取模型包含多個卷積層和GRU網絡層,多個卷積層與GRU網絡層間隔設置,通過GRU網絡層進行具有關聯(lián)關系節(jié)點的特征融合;將最后一層卷積層輸出的每一個節(jié)點的特征輸入到歸并層進行特征融合,得到待提取特征圖的特征。本發(fā)明在每次卷積操作時使用了GRU網絡層來把具有關聯(lián)關系節(jié)點的特征信息融合起來,使得網絡的表達能力更好,更適合表達圖內部節(jié)點之間的相互作用,減少前期的提取工作量。
技術領域
本發(fā)明涉及人工智能技術領域,具體涉及一種圖特征提取、脂水分配系數(shù)預測方法及圖特征提取模型。
背景技術
脂水分配系數(shù)logp=物質在辛醇中的濃度/物質在水中的濃度,該指標是藥物設計中的重要參考要素,它影響著藥物在體內的吸收運轉。該指標雖然可以由簡單的實驗測得,但是在藥物設計早期虛擬篩選階段,需要對大量候選小分子進行實驗測定是不現(xiàn)實的,這時藥化專家往往會借助軟件計算的方法對logp進行粗篩。
相關技術中,通常采用機器學習模型對小分子的logp進行預測,但是特征的提取需要大量的前期工作,而且需要具有較深專業(yè)知識和經驗,工作量大。故亟待提出一種圖特征提取方法,以學到小分子的合理且充足的表征信息,更準確的表達分子的特征,減少工作量。
發(fā)明內容
因此,本發(fā)明要解決的技術問題在于克服現(xiàn)有技術中特征提取需要大量前期工作,工作量大的缺陷,從而提供一種圖特征提取、脂水分配系數(shù)預測方法及圖特征提取模型。
根據(jù)第一方面,本發(fā)明實施例公開了一種圖特征提取方法,包括:獲取待提取特征圖,所述待提取特征圖由多個節(jié)點以及連接具有關聯(lián)關系的節(jié)點的邊組成;將所述待提取特征圖輸入到圖特征提取模型進行特征提取,得到每一個節(jié)點的特征,所述圖特征提取模型包含多個卷積層和GRU網絡層,所述多個卷積層與所述GRU網絡層間隔設置,通過所述GRU網絡層進行具有關聯(lián)關系節(jié)點的特征融合;將最后一層卷積層輸出的每一個節(jié)點的特征輸入到歸并層進行特征融合,得到所述待提取特征圖的特征。
可選地,所述通過所述GRU網絡層進行具有關聯(lián)關系節(jié)點的特征融合,包括:
w′=GRU(w,aroundw)
其中,aroundw表示圖中與節(jié)點w連接的所有其他節(jié)點v對w節(jié)點的總影響;是一個MLP神經網絡,不同類型的邊對應不同的網絡參數(shù);w′表示更新后的節(jié)點w的特征向量。
可選地,所述將最后一層卷積層輸出的每一個節(jié)點的特征輸入到歸并層進行特征融合,包括:將所述最后一層卷積層輸出的每一個節(jié)點的特征輸入到歸并層,通過所述歸并層將每一個節(jié)點的特征映射為模擬指紋后進行特征融合。
可選地,所述通過所述歸并層將每一個節(jié)點的特征映射為模擬指紋后進行特征融合,包括:
其中,w(n)是第n層圖卷積計算后節(jié)點w的輸出特征向量;dim表示任一節(jié)點特征向量映射到dim維向量空間中;表示節(jié)點w第n層卷積的輸出特征向量的映射值;softBitMap表示歸并層的輸出。
根據(jù)第二方面,本發(fā)明實施例還公開了一種脂水分配系數(shù)預測方法,包括如下步驟:利用如第一方面或第一方面任一可選實施方式所述的圖特征提取方法對生物小分子進行特征提取;利用預先訓練好的脂水分配系數(shù)預測模型對提取到的生物小分子特征進行脂水分配系數(shù)預測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京望石智慧科技有限公司,未經北京望石智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011159909.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:葉片、茶渣回收再利用裝置
- 下一篇:一種電泳漆及其制備方法及涂裝工藝





