[發(fā)明專利]圖像處理方法、裝置、設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210672641.6 | 申請日: | 2022-06-14 |
| 公開(公告)號: | CN115082673A | 公開(公告)日: | 2022-09-20 |
| 發(fā)明(設(shè)計)人: | 林金鵬;周敏;葛鐵錚;姜宇寧 | 申請(專利權(quán))人: | 阿里巴巴(中國)有限公司 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/26 |
| 代理公司: | 北京太合九思知識產(chǎn)權(quán)代理有限公司 11610 | 代理人: | 孫明子;劉戈 |
| 地址: | 310023 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 處理 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
1.一種圖像處理方法,其特征在于,包括:
識別接收到的輸入圖像是否滿足預(yù)定裁剪條件;
若是,則根據(jù)所述輸入圖像中目標(biāo)元素的所處位置和所屬類別,確定與所述目標(biāo)元素中目標(biāo)主體對應(yīng)的主體包圍框,以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例;
基于所述主體包圍框和所述目標(biāo)裁剪比例對所述輸入圖像進(jìn)行裁剪,以得到目標(biāo)圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,
所述輸入圖像中的目標(biāo)元素包括:所述目標(biāo)主體和多個修飾素材;
所述預(yù)定裁剪條件用于篩選出包含所述目標(biāo)主體和預(yù)定數(shù)量的修飾素材的輸入圖像。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述識別接收到的輸入圖像是否為輸入圖像,包括:
將所述輸入圖像輸入至用于進(jìn)行圖像類別判定的第一卷積神經(jīng)網(wǎng)絡(luò)模型中,以通過所述第一卷積神經(jīng)網(wǎng)絡(luò)模型識別所述輸入圖像是否滿足所述預(yù)定裁剪條件。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述輸入圖像中的目標(biāo)元素的所處位置和所屬類別,確定與所述目標(biāo)元素中目標(biāo)主體對應(yīng)的主體包圍框,以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例,包括:
將所述輸入圖像輸入至用于進(jìn)行內(nèi)容感知識別的第二卷積神經(jīng)網(wǎng)絡(luò)模型中,以通過所述第二卷積神經(jīng)網(wǎng)絡(luò)模型識別所述目標(biāo)元素的所處位置和所屬類別,并根據(jù)所述目標(biāo)元素的所處位置和所屬類別,確定與所述目標(biāo)主體對應(yīng)的主體包圍框,以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于所述主體包圍框和所述目標(biāo)裁剪比例對所述輸入圖像進(jìn)行裁剪,以得到目標(biāo)圖像,包括:
采用多目標(biāo)約束求解算法基于所述目標(biāo)裁剪比例,對所述主體包圍框進(jìn)行迭代處理,以得到目標(biāo)裁剪框;
根據(jù)所述目標(biāo)裁剪框?qū)λ鲚斎雸D像進(jìn)行裁剪,以得到所述目標(biāo)圖像。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述采用多目標(biāo)約束求解算法基于所述目標(biāo)裁剪比例,對所述主體包圍框進(jìn)行迭代處理,以得到目標(biāo)裁剪框,包括:
采用所述多目標(biāo)約束求解算法,識別所述主體包圍框的寬高比例是否達(dá)到所述目標(biāo)裁剪比例;
若是,則將所述主體包圍框作為所述目標(biāo)裁剪框;
若否,則將所述主體包圍框作為起始框進(jìn)行迭代的擴(kuò)張和收縮,直至迭代處理后的主體包圍框的寬高比例達(dá)到所述目標(biāo)裁剪比例。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述將所述主體包圍框作為起始框進(jìn)行迭代的擴(kuò)張和收縮,包括:
若所述主體包圍框的寬高比例小于所述目標(biāo)裁剪比例,則基于預(yù)定迭代步長對所述主體包圍框進(jìn)行上下邊框的交替收縮和左右邊框的交替擴(kuò)張;
若所述主體包圍框的寬高比例大于所述目標(biāo)裁剪比例,則基于預(yù)定迭代步長對所述主體包圍框進(jìn)行上下邊框的交替擴(kuò)張和左右邊框的交替收縮。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括:
在對當(dāng)前的主體包圍框進(jìn)行迭代處理的過程中,檢測是否存在非截斷修飾素材;
若存在,則將所述非截斷修飾素材與當(dāng)前的主體包圍框融合,以得到新的主體包圍框;
返回執(zhí)行所述識別所述新的主體包圍框的寬高比例是否達(dá)到所述目標(biāo)裁剪比例,直至迭代處理后的主體包圍框的寬高比例達(dá)到所述目標(biāo)裁剪比例。
9.一種圖像處理裝置,其特征在于,包括:
識別模塊,用于識別接收到的輸入圖像是否滿足預(yù)定裁剪條件;
確定模塊,用于若是,則根據(jù)所述輸入圖像中目標(biāo)元素的所處位置和所屬類別,確定與所述目標(biāo)元素中目標(biāo)主體對應(yīng)的主體包圍框,以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例;
裁剪模塊,用于基于所述主體包圍框和所述目標(biāo)裁剪比例對所述輸入圖像進(jìn)行裁剪,以得到目標(biāo)圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴(中國)有限公司,未經(jīng)阿里巴巴(中國)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210672641.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





