[發(fā)明專利]一種基于ResUNet神經(jīng)網(wǎng)絡(luò)的化學(xué)結(jié)構(gòu)式分割方法有效
| 申請?zhí)枺?/td> | 202010419502.3 | 申請日: | 2020-05-18 |
| 公開(公告)號: | CN111709293B | 公開(公告)日: | 2023-10-03 |
| 發(fā)明(設(shè)計(jì))人: | 王毅剛;邵錦濤 | 申請(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V30/413;G06V30/148;G06V10/26;G06V30/19;G06V10/764;G06N3/0464;G06V10/82;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務(wù)所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 resunet 神經(jīng)網(wǎng)絡(luò) 化學(xué) 結(jié)構(gòu)式 分割 方法 | ||
本發(fā)明公開了一種基于ResUNet神經(jīng)網(wǎng)絡(luò)的化學(xué)結(jié)構(gòu)式分割方法。本發(fā)明步驟如下:步驟(1)構(gòu)造訓(xùn)練集T,訓(xùn)練集T包括手動標(biāo)注訓(xùn)練集T?1和自動生成訓(xùn)練集T?2兩部分;步驟(2)將訓(xùn)練集T送入ResUNet神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,達(dá)到訓(xùn)練指定次數(shù)或者Loss曲線不再下降且精度不再提高為止,將訓(xùn)練好的ResUNet神經(jīng)網(wǎng)絡(luò)模型保存;步驟(3)使用步驟(2)中訓(xùn)練好的ResUNet神經(jīng)網(wǎng)絡(luò)模型對化學(xué)結(jié)構(gòu)式進(jìn)行分割。本發(fā)明在ResUNet神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,提出一種改進(jìn)的ResUNet神經(jīng)網(wǎng)絡(luò),同時,提出一種自動生成大量化學(xué)結(jié)構(gòu)式訓(xùn)練集的方法進(jìn)行訓(xùn)練集的生成,從而使ResUNet神經(jīng)網(wǎng)絡(luò)能夠?qū)瘜W(xué)結(jié)構(gòu)式進(jìn)行分割,達(dá)到以大量數(shù)據(jù)提升神經(jīng)網(wǎng)絡(luò)識別精度的目的。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)檢測技術(shù)領(lǐng)域,具體涉及一種基于ResUNet神經(jīng)網(wǎng)絡(luò)的化學(xué)結(jié)構(gòu)式分割方法,本發(fā)明在ResUNet神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,提出一種改進(jìn)的ResUNet神經(jīng)網(wǎng)絡(luò),同時,提出一種自動生成大量化學(xué)結(jié)構(gòu)式訓(xùn)練集的方法進(jìn)行訓(xùn)練集的生成,從而使ResUNet神經(jīng)網(wǎng)絡(luò)能夠?qū)瘜W(xué)結(jié)構(gòu)式進(jìn)行分割,達(dá)到以大量數(shù)據(jù)提升神經(jīng)網(wǎng)絡(luò)識別精度的目的。
背景技術(shù)
科學(xué)實(shí)驗(yàn)通常至關(guān)重要的一部分是快速處理和吸收新獲得的數(shù)據(jù)。此外,新的研究方法也離不開收集、分析和利用先前發(fā)表的實(shí)驗(yàn)數(shù)據(jù)。這對于小分子藥物的發(fā)現(xiàn)尤其適用,其中實(shí)驗(yàn)測試的分子集合用于虛擬篩選程序、定量結(jié)構(gòu)活性/性質(zhì)關(guān)系(QSAR/QSPR)分析或基于物理建模方法的驗(yàn)證。由于產(chǎn)生大量實(shí)驗(yàn)數(shù)據(jù)的難度和費(fèi)用,許多藥物發(fā)現(xiàn)項(xiàng)目被迫依賴于相對較小的內(nèi)部實(shí)驗(yàn)數(shù)據(jù)庫。解決藥物發(fā)現(xiàn)中普遍缺乏適當(dāng)?shù)挠?xùn)練集數(shù)據(jù)的一個有希望的解決方案是利用目前正在發(fā)表的數(shù)據(jù)。Medline報告每天發(fā)表超過2000多篇新的生命科學(xué)論文,鑒于新的實(shí)驗(yàn)數(shù)據(jù)以如此高的速度進(jìn)入公共文獻(xiàn),解決與數(shù)據(jù)提取和管理相關(guān)的問題,并盡可能地自動化這些過程變得越來越重要。生命科學(xué)中從公開的來源,如期刊文章和專利文件中提取化學(xué)結(jié)構(gòu)仍然是困難和非常耗時的。
目前,大量書籍和其它出版物依然只有紙質(zhì)版或掃描版可得,造成重用上的困難。一方面,紙質(zhì)版或掃描版的材料不便于進(jìn)行檢索,導(dǎo)致分散在大量文獻(xiàn)中的信息不容易被發(fā)現(xiàn),從而得不到充分利用。另一方面,對這些材料進(jìn)行進(jìn)一步處理涉及繁瑣和易誤的重新輸入工作。
化學(xué)結(jié)構(gòu)式識別的研究進(jìn)展緩慢,主要原因是:一、在文檔中公式被自然語言環(huán)繞,難以定位;二,由于化學(xué)結(jié)構(gòu)式結(jié)構(gòu)復(fù)雜,符號種類繁多且字體多樣、大小不一,具有非規(guī)則性,邏輯性,復(fù)雜性等特征。
目前的化學(xué)結(jié)構(gòu)式的識別方法都分為兩個步驟:一、將化學(xué)結(jié)構(gòu)式從自然語言中定位并分割出來;二、將分割出的化學(xué)結(jié)構(gòu)式送入識別引擎中進(jìn)行識別。其中,當(dāng)前的化學(xué)結(jié)構(gòu)式分割方法基本上是基于傳統(tǒng)圖像處理方法來完成的,其分割準(zhǔn)確度較低,并無法處理一些如自然語言和化學(xué)分子式距離較近等特殊情況。
發(fā)明內(nèi)容
基于此,為了提高化學(xué)結(jié)構(gòu)式的定位與分割準(zhǔn)確度,本發(fā)明在 ResUNet神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,提出一種改進(jìn)的ResUNet神經(jīng)網(wǎng)絡(luò),同時,提出一種自動生成大量化學(xué)結(jié)構(gòu)式訓(xùn)練集的方法進(jìn)行訓(xùn)練集的生成,從而使ResUNet神經(jīng)網(wǎng)絡(luò)能夠?qū)瘜W(xué)結(jié)構(gòu)式進(jìn)行分割,達(dá)到以大量數(shù)據(jù)提升神經(jīng)網(wǎng)絡(luò)識別精度的目的。
一種基于ResUNet神經(jīng)網(wǎng)絡(luò)的化學(xué)結(jié)構(gòu)式分割方法,包括如下步驟:
步驟(1)構(gòu)造訓(xùn)練集T,訓(xùn)練集T包括手動標(biāo)注訓(xùn)練集T-1和自動生成訓(xùn)練集T-2兩部分。其中,手動標(biāo)注出版物中的化學(xué)式作為部分訓(xùn)練集T-1,并使用一種自動生成化學(xué)結(jié)構(gòu)式訓(xùn)練集的方法生成訓(xùn)練集T-2,訓(xùn)練集T-1和訓(xùn)練集T-2的容量比例為1:50;
步驟(2)將訓(xùn)練集T送入改進(jìn)的ResUNet神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,達(dá)到訓(xùn)練指定次數(shù)或者Loss曲線不再下降且精度不再提高為止,將訓(xùn)練好的ResUNet神經(jīng)網(wǎng)絡(luò)模型保存;
步驟(3)使用步驟(2)中訓(xùn)練好的ResUNet神經(jīng)網(wǎng)絡(luò)模型對化學(xué)結(jié)構(gòu)式進(jìn)行分割。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010419502.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于深度學(xué)習(xí)的圖像分割方法、系統(tǒng)及電子設(shè)備
- 一種基于resUnet的光學(xué)元器件損傷檢測方法及系統(tǒng)
- 一種基于深度學(xué)習(xí)的月球撞擊坑識別方法
- 一種基于ResUnet的3視圖PET圖像分割方法
- 一種語音合成方法、裝置、智能終端及可讀介質(zhì)
- 一種基于內(nèi)外應(yīng)力的低分化腺體分割方法
- 一種改進(jìn)U-net的腎臟腫瘤分割方法
- 一種基于ResUNet神經(jīng)網(wǎng)絡(luò)的化學(xué)結(jié)構(gòu)式分割方法
- 一種超聲圖像去噪模型建立方法及超聲圖像去噪方法
- 基于神經(jīng)網(wǎng)絡(luò)的骨影抑制方法、裝置、設(shè)備及存儲介質(zhì)
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 化學(xué)處理方法和化學(xué)處理裝置
- 基礎(chǔ)化學(xué)數(shù)字化學(xué)習(xí)中心
- 化學(xué)處理方法和化學(xué)處理裝置
- 化學(xué)清洗方法以及化學(xué)清洗裝置
- 化學(xué)強(qiáng)化組合物、化學(xué)強(qiáng)化方法及化學(xué)強(qiáng)化玻璃
- 化學(xué)天平(無機(jī)化學(xué))
- 電化學(xué)裝置的化學(xué)配方
- 化學(xué)強(qiáng)化方法、化學(xué)強(qiáng)化裝置和化學(xué)強(qiáng)化玻璃
- 化學(xué)強(qiáng)化方法及化學(xué)強(qiáng)化玻璃
- 化學(xué)打尖方法和化學(xué)組合物





