[發明專利]基于深度學習的圖像類別判定方法、電子設備以及介質在審
| 申請號: | 202010152742.1 | 申請日: | 2020-03-06 |
| 公開(公告)號: | CN111401421A | 公開(公告)日: | 2020-07-10 |
| 發明(設計)人: | 周康明;王林武 | 申請(專利權)人: | 上海眼控科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 倪靜 |
| 地址: | 200032 上海市徐匯*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 圖像 類別 判定 方法 電子設備 以及 介質 | ||
本申請提供一種基于深度學習的圖像類別判定方法、電子設備以及介質,本申請提出一種基于語義分割模型的裁剪版小網絡,針對目標邊界分割不準確及網絡占用計算資源較多問題,對網絡結構做了優化改進,改進后的網絡在提升分割精確度的同時,節約了較多顯存和時間消耗。解決了現有技術中分割算法不太適用這種場景,一方面是這些算法都使用很深的分類網絡提取特征,占用計算資源較多,不能滿足項目實際應用;另一方面,車檢制動是根據滾筒、輪胎等目標的邊界信息進行制動判斷,要求分割邊界精確,而目前算法對這些類別目標的邊界分割不太準確,容易導致制動誤判的問題。
技術領域
本申請涉及一種圖像處理領域,特別是涉及一種基于深度學習的圖像類別判定方法、電子設備以及介質。
背景技術
根據給定一組預定義的類別,語義分割的任務是對一張圖片中每個像素判斷對應的類別(不屬于預定義的任一類則判斷為背景類別)。語義分割已經得到了越來越廣泛的實際應用,例如無人駕駛、醫學圖像分割、場景識別、機器人等。隨著深度學習的發展,基于深度學習的分割算法的性能比基于傳統人工設計特征的算法已經得到了顯著提升,目前工業界主流是使用深度學習的圖像類別判定算法。
深度學習的圖像類別判定自從2014年FCN(Fully Convolutional NeuralNetwork)提出以來,也已經經過多年的發展。通用的網絡框架是采用主流的深度學習分類網絡(比如ResNet、VGG、DenseNet等)提取原始圖片的抽象語義特征,然后基于該特征預測每個像素的類別。這種方法主要難點有以下幾點:
由于分類網絡中池化或卷積層操作,輸出的特征圖尺寸比原始圖片小,而語義分割網絡期望輸出的特征圖尺寸需要和原始輸入圖片尺寸一致,因此需要從分類網絡輸出的低維特征恢復一個與原始輸入尺寸一致的特征圖。
分類網絡中池化操作在減少輸出特征圖尺寸的同時,也丟失了較多物體的位置細節信息,導致分割的物體邊界不準確;
需要對圖片中不同尺寸大小的物體進行分割。
在車輛制動檢測領域,需要對車輪、滾筒和平板等進行分割。目前主流的分割算法不太適用這種場景,一方面是這些算法都使用很深的分類網絡提取特征,占用計算資源較多,不能滿足項目實際應用;另一方面,車檢制動是根據滾筒、輪胎等目標的邊界信息進行制動判斷,要求分割邊界精確,而目前算法對這些類別目標的邊界分割不太準確,容易導致制動誤判。
申請內容
鑒于以上所述現有技術的缺點,本申請的目的在于提供一種基于深度學習的圖像類別判定方法、電子設備以及介質,用于解決現有技術中分割算法不太適用對車輪、滾筒和平板等進行分割等場景,一方面是這些算法都使用很深的分類網絡提取特征,占用計算資源較多,不能滿足項目實際應用;另一方面,車檢制動是根據滾筒、輪胎等目標的邊界信息進行制動判斷,要求分割邊界精確,而目前算法對這些類別目標的邊界分割不太準確,容易導致制動誤判的問題。
為實現上述目的及其他相關目的,本申請提供一種基于深度學習的圖像類別判定方法,包括:獲取待檢測圖像;將所述待檢測圖像輸入至預設的語義分割模型,以供所述語義分割模型執行以下操作:根據用于提取高層特征的高層特征提取層獲取所述待檢測圖像的第一特征圖;對用于提取所述待檢測圖像的低層特征的第一低層特征提取層輸出的圖像進行第一通道數轉換,得到第二特征圖;將所述第一特征圖和所述第二特征圖進行特征融合,得到第三特征圖;對所述第三特征圖進行上采樣得到第四特征圖;對用于提取所述待檢測圖像的低層特征的第二低層特征提取層輸出的圖像進行第二通道數轉換,得到第五特征圖;將所述第四特征圖和所述第五特征圖進行特征融合,輸出分割預測得分圖;獲取所述分割預測得分圖,并根據所述分割預測得分圖確定所述樣本圖像中每個像素的類別。
于本申請的一實施例中,所述預設的語義分割模型具體為:基于ResNet-18網絡,訓練得到的語義分割模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海眼控科技股份有限公司,未經上海眼控科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010152742.1/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





