[發明專利]一種圖片自動裁剪方法有效
| 申請號: | 201811255476.4 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109448001B | 公開(公告)日: | 2021-08-27 |
| 發明(設計)人: | 郭志強;閆曉葳;趙振;展麗萍;王猛 | 申請(專利權)人: | 世紀開元智印互聯科技集團股份有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/136 |
| 代理公司: | 濟南領升專利代理事務所(普通合伙) 37246 | 代理人: | 王吉勇 |
| 地址: | 250101 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖片 自動 裁剪 方法 | ||
1.一種圖片自動裁剪方法,其特征在于,具體步驟為:
利用待處理圖片的高度和寬度信息計算圖片比例;
設置待處理圖片的輸出尺寸,根據所述的輸出尺寸確定待處理圖片的輸出比例;
通過所述的圖片比例和所述的輸出比例確定計算裁切框的大小;
判斷所述待處理圖片的圖片比例與要求輸出比例是否合適,若不合適,則對待處理圖片執行縮小或放大操作,若合適,則不執行該操作;
利用已訓練好的圖片分類模型預測待處理圖片的所屬類別;
根據待處理圖片的所屬類別,利用已訓練好的顯著性預測模型檢測待處理圖片的顯著區域,提取待處理圖片的顯著特征圖;
根據所述待處理圖片的顯著特征圖區分出較重要區域和次重要區域,得到較重要區域的最小外接矩形;
判斷所述最小外接矩形是否被裁切框覆蓋,根據判斷結果執行裁剪或留白處理;若執行裁剪處理,使用裁剪框掃描圖片顯著特征圖,進一步精確調整所述裁剪框在待裁剪圖片中的位置;
輸出裁剪結果;
所述根據所述待處理圖片的顯著特征圖區分出較重要區域和次重要區域的具體方法:
設定圖像二值化閾值,大于設定的閾值的區域為較重要區域,反之為次重要區域;
所述判斷所述最小外接矩形是否被裁切框覆蓋,執行裁剪或留白處理的原則為:
若最小外接矩形不被裁切框覆蓋,則待處理的圖片不進行裁切,并通過比較圖片比例和沖洗比例判斷在待處理圖片的左右邊或上下邊填充白色區域得到輸出的尺寸,即留白操作;若最小外接矩形被裁切框覆蓋,則執行裁切操作;
構建圖片分類模型的具體方法為:
S1.選取圖片數據,人工篩選分類,構建數據集,人工確定類別數及每個類別包含的圖片種類;
S2.以VGG16模型作為基礎網絡模型分類框架,構建圖片分類模型;VGG16網絡是該領域熟知的經典分類網絡;
S3.利用構建的數據集,對構建的圖片分類模型進行訓練,使用softmax函數計算每個類別的概率,其中,softmax函數可表示為:
其中,zi表示圖片分類模型最后一層第i個神經元的輸出,K為預測類別數目,p(i)表示將待處理圖片預測為第i個類別的概率;zk表示圖片分類模型最后一層第k個神經元的輸出;
S4.待圖片分類模型的softmax函數損失降低到設定的圖像二值化閾值,停止訓練,輸出圖片分類模型;
構建顯著性預測模型的具體方法為:
步驟一.選取圖片數據,人工篩選分類,構建數據集,根據圖片所屬類別人工定義圖片的顯著區域;
步驟二.根據不同類別,對圖片人工進行像素級的標注;
步驟三.以VGG16模型作為基礎網絡模型分類框架,構建顯著性預測模型;VGG16網絡是該領域熟知的經典分類網絡;
步驟四.利用構建的數據集,對設計的顯著檢測網絡進行訓練,使用softmax函數確定圖片的顯著區域,其中,softmax函數可表示為:
其中,zi表示顯著性預測模型最后一層第i個位置神經元的輸出,K為圖像像素個數,p(i)表示待處理圖片第i個位置像素預測為顯著區域的概率;
步驟五.待顯著性預測模型的softmax函數損失降低到設定的圖像二值化閾值,停止訓練,輸出顯著性預測模型。
2.如權利要求1所述的一種圖片自動裁剪方法,其特征在于,所述判斷待處理圖片的圖片比例是否與要求輸出比例是否合適的具體方法為:
設置輸出比例的波動范圍,判斷待處理圖片的圖片比例是否在輸出比例的波動范圍內,若待處理圖片的圖片比例不在輸出比例的波動范圍內,按照待處理圖片的圖片比例將待處理圖片縮小或放大,將待處理圖片的較長邊統一縮放為固定大小,反之,不執行縮小或放大的操作。
3.如權利要求1所述的一種圖片自動裁剪方法,其特征在于,所述執行裁切操作時,進一步精確調整所述裁剪框在待裁剪圖片中的位置的方法為:
使用裁切框掃描待處理圖片的顯著特征圖;
裁切框掃描顯著特征圖的每一個位置,確保較重要區域全部包含在裁切框內;
使用公式(1)計算裁切框在每個位置的顯著性得分Score;
其中,裁切框包含較重要區域條件下,w1,w2表示裁剪框的橫向可變動范圍;h1,h2表示裁剪框的縱向可變動范圍;i,j分別表示待處理圖像的橫縱坐標位置;
確定得分最高的位置作為裁切框的最終位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于世紀開元智印互聯科技集團股份有限公司,未經世紀開元智印互聯科技集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811255476.4/1.html,轉載請聲明來源鉆瓜專利網。





