[發(fā)明專利]圖像處理方法、裝置、電子設(shè)備、介質(zhì)和計算機程序產(chǎn)品在審

申請?zhí)枺?/td>	202110246097.4	申請日：	2021-03-05
公開（公告）號：	CN112967197A	公開（公告）日：	2021-06-15
發(fā)明（設(shè)計）人：	王詩吟;周強	申請（專利權(quán)）人：	北京字跳網(wǎng)絡(luò)技術(shù)有限公司
主分類號：	G06T5/00	分類號：	G06T5/00;G06N3/08
代理公司：	北京開陽星知識產(chǎn)權(quán)代理有限公司 11710	代理人：	祝樂芳
地址：	100190 北京市***	國省代碼：	北京;11
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	圖像處理方法裝置電子設(shè)備介質(zhì) 計算機程序產(chǎn)品
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本公開涉及一種圖像處理方法、裝置、電子設(shè)備、介質(zhì)和計算機程序產(chǎn)品。通過獲取原始圖像中的目標對象的可見區(qū)域的第一掩碼，其中，所述原始圖像中包含目標對象，所述目標對象部分區(qū)域被遮擋物遮擋；將所述原始圖像和所述第一掩碼堆疊后輸入目標神經(jīng)網(wǎng)絡(luò)模型中，得到所述原始圖像中的目標對象的目標完整掩碼，由于目標神經(jīng)網(wǎng)絡(luò)模型基于原始圖像樣本、目標對象樣本的預(yù)設(shè)解析掩碼以及目標對象樣本的參考完整掩碼訓(xùn)練得到的，考慮了目標對象各部分的語義信息，因此，得到目標對象的目標完整掩碼的準確性更高。

技術(shù)領(lǐng)域

本公開涉及圖像處理技術(shù)領(lǐng)域，尤其涉及一種圖像處理方法、裝置、電子設(shè)備、介質(zhì)和計算機程序產(chǎn)品。

背景技術(shù)

在圖像處理領(lǐng)域，通常需要對圖像中一些被部分遮擋的目標對象進行補全，目標對象可以為人體或者其他物體，以人體為例，假設(shè)在一張圖像中，人體部分被遮擋物遮擋，則需要通過一系列的圖像處理，將人體被遮擋的部分補全，得到一個完整的人體。通常，對目標對象進行補全的過程中，通常需要預(yù)測目標對象的目標完整掩碼。

現(xiàn)有技術(shù)中，通常將原始圖像輸入到實例分割網(wǎng)絡(luò)中，通過實例分割網(wǎng)絡(luò)得到目標對象的可見區(qū)域的掩碼，然后再基于目標對象的可見區(qū)域的掩碼通過一個神經(jīng)網(wǎng)絡(luò)模型得到目標對象的目標完整掩碼。

然而，采用現(xiàn)有技術(shù)得到目標對象的目標完整掩碼的準確性不高。

發(fā)明內(nèi)容

為了解決上述技術(shù)問題，本公開提供了一種圖像處理方法、裝置、電子設(shè)備、介質(zhì)和計算機程序產(chǎn)品。

本公開第一方面提供一種圖像的處理方法，包括：

獲取原始圖像中的目標對象的可見區(qū)域的第一掩碼，其中，所述原始圖像中包含目標對象，所述目標對象部分區(qū)域被遮擋物遮擋；

將所述原始圖像和所述第一掩碼堆疊后輸入目標神經(jīng)網(wǎng)絡(luò)模型中，得到所述原始圖像中的目標對象的目標完整掩碼，其中，所述目標神經(jīng)網(wǎng)絡(luò)模型基于原始圖像樣本、目標對象樣本的預(yù)設(shè)解析掩碼以及目標對象樣本的參考完整掩碼訓(xùn)練得到的，所述原始圖像樣本中包含所述目標對象樣本，所述目標對象樣本的部分區(qū)域被遮擋物遮擋，所述預(yù)設(shè)解析掩碼包含所述目標對象樣本的各部分的語義掩碼標簽。

可選的，還包括：

將所述目標對象的目標完整掩碼減去所述第一掩碼，得到所述目標對象的不可見區(qū)域的掩碼。

可選的，所述將所述原始圖像和所述第一掩碼堆疊后輸入目標神經(jīng)網(wǎng)絡(luò)模型中之后，還包括：

輸出所述原始圖像中的目標對象的完整解析掩碼，所述完整解析掩碼包含所述目標對象的各部分的語義掩碼標簽。

可選的，還包括：

將所述目標對象的目標完整掩碼減去所述第一掩碼，得到所述目標對象的不可見區(qū)域的掩碼；

將所述目標對象的不可見區(qū)域的掩碼與所述目標對象的完整解析掩碼相乘，得到所述目標對象的不可見區(qū)域的語義掩碼標簽。

可選的，所述獲取原始圖像中的目標對象的可見區(qū)域的第一掩碼之前，還包括：

獲取所述原始圖像樣本中的目標對象樣本的第二掩碼；

將所述原始圖像樣本和所述第二掩碼輸入神經(jīng)網(wǎng)絡(luò)模型中，得到所述原始圖像樣本中的目標對象樣本的目標完整掩碼和所述目標對象樣本的完整解析掩碼；

將所述目標對象樣本的參考完整掩碼和所述目標對象樣本的預(yù)設(shè)解析掩碼作為監(jiān)督信號，利用所述監(jiān)督信號及所述目標對象樣本的目標完整掩碼和所述目標對象樣本的完整解析掩碼得到損失函數(shù)，對所述神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練，直到所述神經(jīng)網(wǎng)絡(luò)模型收斂，將收斂后的神經(jīng)網(wǎng)絡(luò)模型作為所述目標神經(jīng)網(wǎng)絡(luò)模型。

可選的，還包括：

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京字跳網(wǎng)絡(luò)技術(shù)有限公司，未經(jīng)北京字跳網(wǎng)絡(luò)技術(shù)有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110246097.4/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計算；推算；計數(shù)
G06T 一般的圖像數(shù)據(jù)處理或產(chǎn)生
G06T5-00 圖像的增強或復(fù)原，如從位像到位像地建立一個類似的圖形
G06T5-10 .利用非空間域濾波的
G06T5-20 .利用局部操作的
G06T5-40 .使用直方圖技術(shù)的
G06T5-50 .通過使用多于一幅圖像的，例如平均、減少
G06T5-30 ..侵蝕或擴張，如變薄

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】