[發(fā)明專利]基于顯著性對象檢測模型的圖像壓縮方法有效
| 申請?zhí)枺?/td> | 201810135190.6 | 申請日: | 2018-02-09 |
| 公開(公告)號: | CN108259909B | 公開(公告)日: | 2020-09-01 |
| 發(fā)明(設(shè)計)人: | 余春艷;徐小丹;楊素瓊;陳立;王秀 | 申請(專利權(quán))人: | 福州大學(xué) |
| 主分類號: | H04N19/42 | 分類號: | H04N19/42;H04N19/543 |
| 代理公司: | 福州元創(chuàng)專利商標(biāo)代理有限公司 35100 | 代理人: | 蔡學(xué)俊 |
| 地址: | 350108 福建省福*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 顯著 對象 檢測 模型 圖像 壓縮 方法 | ||
本發(fā)明是一種基于顯著性對象檢測的圖像壓縮方法。首先,在顯著性對象檢測模型中,采用去卷積注意力殘差模塊來增加上下文信息,以提高檢測精度。然后,采用貪婪非極大值抑制方法從許多顯著性對象候選檢測框中消除冗余的檢測框,找到最佳的顯著性對象位置。最后,利用基于小波變換的圖像壓縮標(biāo)準(zhǔn)對顯著性的區(qū)域與背景采取不同的壓縮率進行壓縮。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)字圖像處理領(lǐng)域,具體涉及一種基于顯著性對象檢測模型的圖像壓縮方法。
背景技術(shù)
隨著科學(xué)技術(shù)的迅速發(fā)展,所獲得的圖像分辨率越來越高,目前的傳輸速率還無法滿足需求,因此需要對圖像進行壓縮處理。圖像壓縮是圖像處理的重要研究領(lǐng)域,現(xiàn)有的壓縮方法要么丟失重要的細節(jié)信息,無法滿足實際的應(yīng)用需要,要么壓縮率過低,難以達到實時處理的要求。將視覺注意機制引入到圖像壓縮中,對顯著性區(qū)域與背景采用不同的壓縮率,這樣不僅可以對整個圖像達到一個高的壓縮率,而且還可以保持重要區(qū)域的高分辨率,實現(xiàn)了可變分辨率的圖像壓縮。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有的圖像壓縮方法存在的問題,提供一種基于顯著性對象檢測的圖像壓縮方法,本發(fā)明能夠通過檢測到的顯著性對象,從而對該對象區(qū)域與背景通過不同壓縮率進行壓縮。
為實現(xiàn)上述目的,本發(fā)明采用以下技術(shù)方案:一種基于顯著性對象檢測的圖像壓縮方法,其包括以下步驟:步驟S1:使用有去卷積注意力殘差模塊的顯著性對象檢測模型獲取候選檢測框;步驟S2:采用貪婪非極大值抑制方法對從所述候選檢測框,進行冗余檢測框的消除;步驟S3:然后根據(jù)檢測到的顯著性對象根據(jù)置信度值減少壓縮比例對圖像進行壓縮。
在本發(fā)明一實施例中,所述顯著性對象檢測模型包含去卷積注意力殘差模塊、定位預(yù)測模塊及類別預(yù)測模塊。
進一步的,去卷積注意力殘差模塊具體操作如下:設(shè)輸入分別為特征圖C1和特征圖C2,其大小分別為(h1,w1,k1)和(h2,w2,k2)且特征圖C1的尺寸小于特征圖C2的尺寸;第一層為去卷積層,使用k2個卷積核,尺寸為(4,4,k1),激活函數(shù)為ReLU函數(shù),輸入為特征圖C1;第二層為卷積層,使用k2個卷積核,尺寸為(1,1,k2),激活函數(shù)為Sigmoid函數(shù);第三層為Eltwise層,對第一層與第二層輸出進行逐像素相加,激活函數(shù)為ReLU函數(shù);第四層為剪切層,根據(jù)特征圖C2的尺寸對上一層輸出進行剪切;第五層為Eltwise層,對特征圖C2與上一層輸出進行逐像素相乘,激活函數(shù)為ReLU函數(shù)。
進一步的,定位預(yù)測模塊具體操作如下:設(shè)輸入特征圖C1,其大小為(h1,w1,k1);第一層為卷積層,使用16個卷積核,尺寸為(1,1,k1);第二層為Permute層,對特征進行重新排列,順序為(0,2,3,1);第三層為Flatten層,將特征平鋪成一維。
進一步的,類別預(yù)測模塊具體操作如下:設(shè)輸入特征圖C1,其大小為(h1,w1,k1);第一層為卷積層,使用8個卷積核,尺寸為(1,1,k1);第二層為Permute層,對特征進行重新排列,順序為(0,2,3,1);第三層為Flatten層,將特征平鋪成一維。
在本發(fā)明一實施例中,所述顯著性對象檢測模型的網(wǎng)絡(luò)結(jié)構(gòu)具體如下:
第一層為輸入層,輸入圖像;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學(xué),未經(jīng)福州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810135190.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





