[發(fā)明專利]通過抑制非感興趣信息的語義分割方法、設備及存儲設備有效
| 申請?zhí)枺?/td> | 201911373503.2 | 申請日: | 2019-12-26 |
| 公開(公告)號: | CN111210439B | 公開(公告)日: | 2022-06-24 |
| 發(fā)明(設計)人: | 劉恒;郭明強;黃穎;吳亮;謝忠;關慶鋒;韓成德;宋振振 | 申請(專利權)人: | 中國地質大學(武漢) |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06V10/44;G06K9/62;G06N3/04;G06N3/08;G06V10/80 |
| 代理公司: | 武漢知產(chǎn)時代知識產(chǎn)權代理有限公司 42238 | 代理人: | 付春霞 |
| 地址: | 430000 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 通過 抑制 感興趣 信息 語義 分割 方法 設備 存儲 | ||
本發(fā)明提出了一種通過抑制非感興趣信息的語義分割方法、設備及存儲設備,本發(fā)明基于深度學習庫優(yōu)化神經(jīng)網(wǎng)絡,提高語義分割結果的精度,主要包括以下步驟:1)構建基礎Unet模型;2)添加注意力機制;3)門特征圖與當前層結果相乘;4)添加新輸出結果和多損失函數(shù);5)對待進行語義分割的圖像進行圖像語義分割。本方法可以提高語義分割神經(jīng)網(wǎng)絡的精度并有效抑制非感興趣信息。
技術領域
本發(fā)明涉及語義分割領域,更具體地說,涉及一種通過抑制非感興趣信息的語義分割方法、設備及存儲設備。
背景技術
采用神經(jīng)網(wǎng)絡對圖像進行語義分割過程中,需要先搭建神經(jīng)網(wǎng)絡。在神經(jīng)網(wǎng)絡的搭建過程中,簡單的神經(jīng)網(wǎng)絡層數(shù)的堆疊不能實現(xiàn)對非感興趣信息的抑制;要想取得更好的泛化效果就需要擴大模型的感受野,但是需要很多的計算資源,不利于模型的在移動設備上的部署。本發(fā)明是基于上述問題提出的解決方法。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術中的缺陷,提出一種抑制非感興趣信息的高精度語義分割方法,基于深度學習庫優(yōu)化神經(jīng)網(wǎng)絡,提高語義分割結果的精度。
本發(fā)明解決其技術問題,所采用的種通過抑制非感興趣信息的語義分割方法包含如下步驟:
步驟1)、利用深度學習庫優(yōu)化神經(jīng)網(wǎng)絡,構建一個基礎的圖像語義分割模型Unet,包括編碼和解碼兩個階段;編碼階段串行進行多次下采樣,每次下采樣通過多層空間維度逐漸增加和特征圖大小都不變的卷積層和一層池化層實現(xiàn);解碼階段串行進行多次上采樣,每次上采樣通過多層空間維度逐漸減小和特征圖大小不變的卷積層和一層上采樣層實現(xiàn);
步驟2)、在每一次下采樣過程中添加注意力機制,基于深度學習庫優(yōu)化神經(jīng)網(wǎng)絡將編碼階段的當前層f(n)做維度和特征圖大小縮小一倍的1×1卷積處理;對當前層f(n)的下一層f(n+1)做維度與f(n)相同和特征圖大小不變的卷積處理;將f(n)和f(n+1)的卷積處理結果進行加權融合;對加權融合后的特征圖進行上采樣與全局平均池化處理后,利用激活函數(shù)激活得到用于管控f(n)的門特征圖G;
步驟3)、將門特征圖G和當前層f(n)相乘,得到解碼階段的補償信息;
步驟4)、基于深度學習庫優(yōu)化神經(jīng)網(wǎng)絡在最后輸出處添加一層維度和特征圖大小都不變的1×1卷積層,用于輸出新結果,從而形成最終的圖像語義分割模型;其中,圖形語義分割模型通過loss1對原輸出層結果進行約束,通過loss2對在原輸出層結果上生成的新結果進行約束,從而實現(xiàn)優(yōu)化和信息補償;其中,loss1、loss2的計算公式如下:
loss1=α×BCE+β×PBL (2)
loss2=α×BCE+β×PBL (3)
α+β=1 (4)
式中,l表示像素值,SK表述像素的標簽集合,S表示像素的預測集合,i和j表示像素的索引坐標,pij表示輸出結果的概率,I()表示滿足括號內(nèi)條件時,值等于1,否則等于0,N表示類別數(shù),BCE表示交叉熵,loss1表示原輸出層的損失函數(shù),loss2為新輸出層損失函數(shù),α表示對分割輸出結果輪廓的約束,分割區(qū)域環(huán)境越復雜,值越大,α0;β表示對分割總體質量的約束,分割區(qū)域越離散,值越大,β0;
步驟5)、獲取帶語義分割標簽的圖像,多張所述圖像形成訓練集,對最終的圖像語義分割模型進行訓練,得到訓練好的模型,用來對待進行語義分割的圖像進行圖像語義分割。
進一步地,在本發(fā)明的通過抑制非感興趣信息的語義分割方法中,步驟1)中,編碼階段串行進行4次下采樣,每次下采樣通過2層空間維度逐漸增加和特征圖大小都不變的3×3卷積層和一層池化層實現(xiàn),卷積層采用tensorflow中的conv函數(shù),池化層采用tensorflow中的Averagepooling函數(shù)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國地質大學(武漢),未經(jīng)中國地質大學(武漢)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911373503.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現(xiàn)方法和信息再現(xiàn)設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





