[發明專利]基于顯著性對象檢測模型的圖像壓縮方法有效
| 申請號: | 201810135190.6 | 申請日: | 2018-02-09 |
| 公開(公告)號: | CN108259909B | 公開(公告)日: | 2020-09-01 |
| 發明(設計)人: | 余春艷;徐小丹;楊素瓊;陳立;王秀 | 申請(專利權)人: | 福州大學 |
| 主分類號: | H04N19/42 | 分類號: | H04N19/42;H04N19/543 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊 |
| 地址: | 350108 福建省福*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 顯著 對象 檢測 模型 圖像 壓縮 方法 | ||
1.一種基于顯著性對象檢測的圖像壓縮方法,其特征在于:包括以下步驟:
步驟S1:使用有去卷積注意力殘差模塊的顯著性對象檢測模型獲取候選檢測框;
步驟S2:采用貪婪非極大值抑制方法對從所述候選檢測框,進行冗余檢測框的消除;
步驟S3:然后根據檢測到的顯著性對象根據置信度值減少壓縮比例對圖像進行壓縮;
所述顯著性對象檢測模型的網絡結構具體如下:
第一層為輸入層,輸入圖像;
第二層由兩個卷積層構成,其中第一個卷積層使用64個卷積核,尺寸為(4,4,3),第二個卷積層使用64個卷積核,尺寸為(3,3,64),激活函數為ReLU函數;
第三層為池化層,尺寸為(2,2),激活函數為ReLU函數;
第四層由兩個卷積層構成,其中第一個卷積層使用128個卷積核,尺寸為(3,3,64),第二個卷積層使用128個卷積核,尺寸為(3,3,128),激活函數為ReLU函數;
第五層為池化層,尺寸為(2,2),激活函數為ReLU函數;
第六層由三個卷積層構成,其中第一個卷積層使用256個卷積核,尺寸為(3,3,128),第二個卷積層使用256個卷積核,尺寸為(3,3,256),第三個卷積層使用256個卷積核,尺寸為(3,3,256),激活函數為ReLU函數;
第七層為池化層,尺寸為(2,2),激活函數為ReLU函數;
第八層由三個卷積層構成,其中第一個卷積層使用512個卷積核,尺寸為(3,3,256),第二個卷積層使用512個卷積核,尺寸為(3,3,512),第三個卷積層使用512個卷積核,尺寸為(3,3,512),激活函數為ReLU函數;
第九層為池化層,尺寸為(2,2),激活函數為ReLU函數;
第十層由三個卷積層構成,其中第一個卷積層使用512個卷積核,尺寸為(3,3,512),第二個卷積層使用512個卷積核,尺寸為(3,3,512),第三個卷積層使用512個卷積核,尺寸為(3,3,512),激活函數為ReLU函數;
第十一層為池化層,尺寸為(3,3),擴充邊緣尺寸為1,激活函數為ReLU函數;
第十二層由兩個卷積層構成,其中第一個卷積層使用1024個卷積核,尺寸為(3,3,512),第二個卷積層使用512個卷積核,尺寸為(3,3,1024),激活函數為ReLU函數;
第十三層由兩個卷積層構成,其中第一個卷積層使用256個卷積核,尺寸為(3,3,512),第二個卷積層使用512個卷積核,尺寸為(3,3,256),激活函數為ReLU函數;
第十四層由兩個卷積層構成,其中第一個卷積層使用128個卷積核,尺寸為(3,3,512),第二個卷積層使用256個卷積核,尺寸為(3,3,128),激活函數為ReLU函數;
第十五層由兩個卷積層構成,其中第一個卷積層使用128個卷積核,尺寸為(3,3,256),第二個卷積層使用256個卷積核,尺寸為(3,3,128),激活函數為ReLU函數;
第十六層為去卷積注意力殘差模塊,其中兩個輸入分別為第十五層輸出與第十四層輸出;
第十七層為去卷積注意力殘差模塊,其中兩個輸入分別為第十六層輸出與第十三層輸出;
第十八層為去卷積注意力殘差模塊,其中兩個輸入分別為第十七層輸出與第十二層輸出;
第十九層為去卷積注意力殘差模塊,其中兩個輸入分別為第十八層輸出與第八層輸出;
第二十層為定位預測模塊,其中輸入為第十九層輸出;
第二十一層為類別預測模塊,其中輸入為第十九層輸出;
第二十二層為PriorBox層,使用第一層與第十九層輸出作為輸入,最大最小尺寸參數分別為44.8與22.4,長寬比率參數為2;
第二十三層為定位預測模塊,其中輸入為第十八層輸出;
第二十四層為類別預測模塊,其中輸入為第十八層輸出;
第二十五層為PriorBox層,使用第一層與第十八層輸出作為輸入,最大最小尺寸參數分別為96.32與44.8,長寬比率參數為2和3;
第二十六層為定位預測模塊,其中輸入為第十七層輸出;
第二十七層為類別預測模塊,其中輸入為第十七層輸出;
第二十八層為PriorBox層,使用第一層與第十七層輸出作為輸入,最大最小尺寸參數分別為147.84與96.32,長寬比率參數為2和3;
第二十九層為定位預測模塊,其中輸入為第十六層輸出;
第三十層為類別預測模塊,其中輸入為第十六層輸出;
第三十一層為PriorBox層,使用第一層與第十六層輸出作為輸入,最大最小尺寸參數分別為199.36與147.84,長寬比率參數為2和3;
第三十二層為定位預測模塊,其中輸入為第十四層輸出;
第三十三層為類別預測模塊,其中輸入為第十四層輸出;
第三十四層為PriorBox層,使用第一層與第十四層輸出作為輸入,最大最小尺寸參數分別為250.88與199.36,長寬比率參數為2和3;
第三十五層為Concat層,對第二十層、第二十三層、第二十六層、第二十九層、第三十二層輸出進行通道連接;
第三十六層為Concat層,對第二十一層、第二十四層、第二十七層、第三十層、第三十三層輸出進行通道連接;
第三十七層為Concat層,對第二十二層、第二十五層、第二十八層、第三十一層、第三十四層輸出進行通道連接;
第三十八層為Reshape層,改變第三十六層輸出維度,參數為(0,-1,2),激活函數為Softmax函數;
第三十九層為Flatten層,將第三十八層輸出平鋪成一維;
第四十層為DetectionOutput層,輸入為第三十六層、第三十九層、第三十七層,類別參數為2,得到最終結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810135190.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:圖像解碼設備
- 下一篇:視頻數據的壓縮方法及裝置、存儲介質、計算設備





