[發明專利]基于卷積特征譜的圖像可判別區域提取方法有效
| 申請號: | 201710825739.X | 申請日: | 2017-09-14 |
| 公開(公告)號: | CN107578445B | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 孟凡滿;羅堃銘;施雯;郭莉麗;李宏亮;吳慶波 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06T7/73 | 分類號: | G06T7/73;G06N3/04;G06T3/40 |
| 代理公司: | 成都正華專利代理事務所(普通合伙) 51229 | 代理人: | 李林合;李蕊 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 卷積 特征 圖像 判別 區域 提取 方法 | ||
1.基于卷積特征譜的圖像可判別區域提取方法,其特征在于,包括:
獲取待提取圖片,并將其輸入VGG16卷積神經網絡;
計算待提取圖片與VGG16卷積神經網絡的訓練集中所有類別的判別概率;
選取待提取圖片的所有判別概率中的最大判別概率所在類別作為待提取圖片的類別;
采用VGG16卷積神經網絡中第k個卷積階段的池化層的輸入特征譜計算可判別區域:
其中,Tk為第k個卷積階段的池化層的輸入特征譜;c為待提取圖片的類別;為在類別c,針對第k個卷積階段的特征譜構建的特征提取器,和Tk為大小相同的矩陣;x,y和a分別表示計算結果矩陣的三個維度上的元素下標,D為計算結果矩陣第3維的大小;“*”為計算結果矩陣的哈達馬乘積;
對k為3時得到的可判別區域和k為5時得到的可判別區域進行雙線性插值處理,并將兩個可判別區域進行融合形成待提取圖片的最終可判別區域:
其中,δ為位于0~1之間的經驗參數;
所述VGG16卷積神經網絡的構建方法包括:
將數據庫中的所有圖片輸入VGG16卷積神經網絡,數據庫內包括具有多個類別的圖片;
將每張圖片的第三個卷積階段的池化層的輸出特征譜和第五個卷積階段的池化層輸出的特征譜一起輸入至級聯層進行特征級聯;
將級聯層輸出結果輸入全連接層,并將全連接層的輸出特征采用softmax回歸得到圖片在每一個類別上的判別概率;
根據每張圖片的類別和每張圖片在每個類別上的概率,采用分類誤差損失函數計算每張圖片在每個類別的訓練損失;并采用誤差反向傳播算法反傳訓練損失直至VGG16卷積神經網絡的網絡參數收斂。
2.根據權利要求1所述的基于卷積特征譜的圖像可判別區域提取方法,其特征在于,所述經驗參數δ為0.6。
3.根據權利要求1的基于卷積特征譜的圖像可判別區域提取方法,其特征在于,特征提取器的構建方法包括:
計算VGG16卷積神經網絡的全連接層fc7的卷積參數和全連接層fc8的卷積參數的關系式:
其中,Y為全連接層fc7的卷積參數,其大小為4096*4096,Yi為Y中的第i列元素;X為全連接層fc8的卷積參數,其大小為4096*38,Xi,n為X的第i行中的第n個元素;
獲取VGG16卷積神經網絡的全連接層fc6的卷積參數,并按照特征級聯層的順序針對第k個卷積階段的池化層的輸入特征譜構建特征提取器:
其中,Wk為全連接層fc6的卷積參數中針對第k個卷積階段的池化層的輸入特征譜的部分卷積參數,其大小為7*7*Dk*4096,Wik為Wk按照第四個維度順序取出來的第i個矩陣,其大小為7*7*Dk;為在類別n,針對第k個卷積階段的池化層的輸入特征譜構建的特征提取器,其大小為7*7*Dk。
4.根據權利要求1或3的基于卷積特征譜的圖像可判別區域提取方法,其特征在于,所述數據庫的構建方法包括:
獲取具有多個類別的圖片的數據集;
對數據集中所有圖片的尺寸進行歸一化處理,直至所有圖片的尺寸與VGG16卷積神經網絡的輸入相匹配。
5.根據權利要求4的基于卷積特征譜的圖像可判別區域提取方法,其特征在于,構建數據庫時還包括:
對數據集中的所有圖片的尺寸進行歸一化處理后,將每張圖片的R、G、B三個通道分別減去整個數據集中所有圖片分別在R、G、B三個通道上的均值。
6.根據權利要求5的基于卷積特征譜的圖像可判別區域提取方法,其特征在于,所述數據集為IcoSeg數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710825739.X/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





