[發(fā)明專利]圖像處理方法、裝置、設(shè)備和存儲介質(zhì)在審

申請?zhí)枺?/td>	202210672641.6	申請日：	2022-06-14
公開（公告）號：	CN115082673A	公開（公告）日：	2022-09-20
發(fā)明（設(shè)計）人：	林金鵬;周敏;葛鐵錚;姜宇寧	申請（專利權(quán)）人：	阿里巴巴（中國）有限公司
主分類號：	G06V10/25	分類號：	G06V10/25;G06V10/26
代理公司：	北京太合九思知識產(chǎn)權(quán)代理有限公司 11610	代理人：	孫明子;劉戈
地址：	310023 浙江省杭州市余杭***	國省代碼：	浙江;33
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	圖像處理方法裝置設(shè)備存儲介質(zhì)
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種圖像處理方法，其特征在于，包括：

識別接收到的輸入圖像是否滿足預(yù)定裁剪條件；

若是，則根據(jù)所述輸入圖像中目標(biāo)元素的所處位置和所屬類別，確定與所述目標(biāo)元素中目標(biāo)主體對應(yīng)的主體包圍框，以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例；

基于所述主體包圍框和所述目標(biāo)裁剪比例對所述輸入圖像進(jìn)行裁剪，以得到目標(biāo)圖像。

2.根據(jù)權(quán)利要求1所述的方法，其特征在于，

所述輸入圖像中的目標(biāo)元素包括：所述目標(biāo)主體和多個修飾素材；

所述預(yù)定裁剪條件用于篩選出包含所述目標(biāo)主體和預(yù)定數(shù)量的修飾素材的輸入圖像。

3.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述識別接收到的輸入圖像是否為輸入圖像，包括：

將所述輸入圖像輸入至用于進(jìn)行圖像類別判定的第一卷積神經(jīng)網(wǎng)絡(luò)模型中，以通過所述第一卷積神經(jīng)網(wǎng)絡(luò)模型識別所述輸入圖像是否滿足所述預(yù)定裁剪條件。

4.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述根據(jù)所述輸入圖像中的目標(biāo)元素的所處位置和所屬類別，確定與所述目標(biāo)元素中目標(biāo)主體對應(yīng)的主體包圍框，以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例，包括：

將所述輸入圖像輸入至用于進(jìn)行內(nèi)容感知識別的第二卷積神經(jīng)網(wǎng)絡(luò)模型中，以通過所述第二卷積神經(jīng)網(wǎng)絡(luò)模型識別所述目標(biāo)元素的所處位置和所屬類別，并根據(jù)所述目標(biāo)元素的所處位置和所屬類別，確定與所述目標(biāo)主體對應(yīng)的主體包圍框，以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例。

5.根據(jù)權(quán)利要求1所述的方法，其特征在于，所述基于所述主體包圍框和所述目標(biāo)裁剪比例對所述輸入圖像進(jìn)行裁剪，以得到目標(biāo)圖像，包括：

采用多目標(biāo)約束求解算法基于所述目標(biāo)裁剪比例，對所述主體包圍框進(jìn)行迭代處理，以得到目標(biāo)裁剪框；

根據(jù)所述目標(biāo)裁剪框?qū)λ鲚斎雸D像進(jìn)行裁剪，以得到所述目標(biāo)圖像。

6.根據(jù)權(quán)利要求5所述的方法，其特征在于，所述采用多目標(biāo)約束求解算法基于所述目標(biāo)裁剪比例，對所述主體包圍框進(jìn)行迭代處理，以得到目標(biāo)裁剪框，包括：

采用所述多目標(biāo)約束求解算法，識別所述主體包圍框的寬高比例是否達(dá)到所述目標(biāo)裁剪比例；

若是，則將所述主體包圍框作為所述目標(biāo)裁剪框；

若否，則將所述主體包圍框作為起始框進(jìn)行迭代的擴(kuò)張和收縮，直至迭代處理后的主體包圍框的寬高比例達(dá)到所述目標(biāo)裁剪比例。

7.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述將所述主體包圍框作為起始框進(jìn)行迭代的擴(kuò)張和收縮，包括：

若所述主體包圍框的寬高比例小于所述目標(biāo)裁剪比例，則基于預(yù)定迭代步長對所述主體包圍框進(jìn)行上下邊框的交替收縮和左右邊框的交替擴(kuò)張；

若所述主體包圍框的寬高比例大于所述目標(biāo)裁剪比例，則基于預(yù)定迭代步長對所述主體包圍框進(jìn)行上下邊框的交替擴(kuò)張和左右邊框的交替收縮。

8.根據(jù)權(quán)利要求6所述的方法，其特征在于，所述方法還包括：

在對當(dāng)前的主體包圍框進(jìn)行迭代處理的過程中，檢測是否存在非截斷修飾素材；

若存在，則將所述非截斷修飾素材與當(dāng)前的主體包圍框融合，以得到新的主體包圍框；

返回執(zhí)行所述識別所述新的主體包圍框的寬高比例是否達(dá)到所述目標(biāo)裁剪比例，直至迭代處理后的主體包圍框的寬高比例達(dá)到所述目標(biāo)裁剪比例。

9.一種圖像處理裝置，其特征在于，包括：

識別模塊，用于識別接收到的輸入圖像是否滿足預(yù)定裁剪條件；

確定模塊，用于若是，則根據(jù)所述輸入圖像中目標(biāo)元素的所處位置和所屬類別，確定與所述目標(biāo)元素中目標(biāo)主體對應(yīng)的主體包圍框，以及與所述輸入圖像對應(yīng)的目標(biāo)裁剪比例；

裁剪模塊，用于基于所述主體包圍框和所述目標(biāo)裁剪比例對所述輸入圖像進(jìn)行裁剪，以得到目標(biāo)圖像。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴（中國）有限公司，未經(jīng)阿里巴巴（中國）有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202210672641.6/1.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。