[發明專利]一種深度語義感知與BPG壓縮工具的圖像壓縮方法在審
| 申請號: | 201911404225.2 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111145277A | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 吳振東;李銳;金長新 | 申請(專利權)人: | 山東浪潮人工智能研究院有限公司 |
| 主分類號: | G06T9/00 | 分類號: | G06T9/00;G06N3/04 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 羅文曌 |
| 地址: | 250100 山東省濟南市高新*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 深度 語義 感知 bpg 壓縮工具 圖像 壓縮 方法 | ||
1.一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,分為以下步驟:
(一)編碼過程
S101、原輸入圖像;
S102、利用CNN卷積神經網絡對圖像處理和分類,輸出特征圖,通過CAM方法得到語義顯著圖;
S103、將語義顯著圖劃分為等級不同的注意力區域;
S104、利用BPG壓縮工具對上述不同注意力區域進行不同壓縮率的壓縮,生產多個.bpg中間文件;
(二)解碼過程
S201、將多個.bpg中間文件利用BPG壓縮工具進行還原,生成多個圖像區域;
S202、將圖像區域根據特征圖進行還原,形成輸出圖片。
2.根據權利要求1所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,在步驟S102中CNN卷積神經網絡定位單個圖像多個感興趣區域并捕捉場景結構,通過為圖像中一組物體中每一個進行單獨學習特征圖,對重要特征求和,從而生成一個單一不變的特征圖。
3.根據權利要求2所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,CNN卷積神經網絡是多層前饋體系結構,每一層學習的功能要應用前一層所輸出的卷積濾波器的權重,并且梯度化進行,在每層中并行學習多個過濾器過程中,卷積層輸出3-d特征圖,其中,深度表示過濾器的數量。
4.根據權利要求3所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,CNN卷積神經網絡在每次卷積之后都包括一個最大池化步驟,通過替換幾個相鄰的激活系數來減少3-d特征圖的高度和寬度,一次激活等于該窗口內的最大值,池化操作是屬于跨步的,其中,池窗口的大小大于跨步,窗口重疊;對于給定的內核大小,輸入數據的下采樣和濾波器作用于3-d特征圖上將會形成較大感受用于減少CNN卷積神經網絡模型的參數數量并訓練更深層的網絡。
5.根據權利要求1所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,步驟S102中所述的CAM類激活映射生成模糊邊界,能夠捕獲不屬于任何特定物體,只需對物體類的打上圖像級別的標簽,無需像素級注釋或邊框定位。
6.根據權利要求5所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,對于CAM的訓練,目的是最小物體之間類別真實概率分布以及預測該概率分布,通過以下公式獲得:
其中,中,c是物體的類別,d是3-d特征圖,wdc是通過學習得到。
7.根據權利要求6所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,CAM方法用于平衡多個物體的激活程度,對于L層,每層l包含dl個特征,一張圖的尺寸為n×n大小,共有C個類別,整個激活程度的結果為:k是最大池化的步長;
為了不讓改物體的識別被限制在一個最為可能的類別上,需要消除圖像中不存在類別激活程度所造成的影響,為此提出一種閾值運算,公式為所述運算用于將整張圖片中所用特征沒有足夠大的總激活量的類別所丟棄,其中Zlc是在l層對于C類別所有激活程度的總和。
8.根據權利要求7所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,使用Zlc來過濾類別,多結構區域的注意力區域計算方式為:
為生成語義顯著圖每個像素點,是通過CAM所生成的,是所有類別激活程度Zlc在閾值T的總和,T是在訓練期間所確定的超參數;
選出前五名的類別并通過等級進行加權總和,并將它們分開,形成語義顯著圖。
9.根據權利要求8所述的一種深度語義感知與BPG壓縮工具的圖像壓縮方法,其特征在于,所述語義顯著圖對整張圖片的注意力高低分為51個級別,不同區域的級別采用相應的BPG工具進行不同質量壓縮,并將所有.bpg中間文件進行整合和存儲。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東浪潮人工智能研究院有限公司,未經山東浪潮人工智能研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911404225.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:骨盆三維數據的提取方法及裝置
- 下一篇:一種硬件專用防塵防潮插槽





