[發明專利]數據處理方法以及計算機設備在審
| 申請號: | 202110062892.8 | 申請日: | 2021-01-18 |
| 公開(公告)號: | CN113570509A | 公開(公告)日: | 2021-10-29 |
| 發明(設計)人: | 何盛烽;任蘇成;孫子荀;鄧大付;王巨宏;劉婷婷 | 申請(專利權)人: | 華南理工大學;騰訊科技(深圳)有限公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06K9/46;G06K9/32;G06N3/04;G06N3/08 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;杜維 |
| 地址: | 510000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 以及 計算機 設備 | ||
本申請實施例提供了一種數據處理方法以及計算機設備,該方法涉及人工智能技術中的目標檢測技術,可以應用在視頻顯著性檢測領域;包括:獲取多媒體數據對應的數據結構特征,生成數據結構特征對應的激勵圖像;激勵圖像用于突出多媒體數據中的顯著對象所在的預測區域;獲取多媒體數據對應的顯著內容特征,根據激勵圖像對顯著內容特征進行特征增強,得到激勵內容特征;生成激勵內容特征對應的對象區域圖像;對象區域圖像用于檢測多媒體數據中的顯著對象。采用本申請實施例,可以提高多媒體數據的顯著性檢測準確度。
技術領域
本申請涉及互聯網技術領域,尤其涉及一種數據處理方法以及計算機設備。
背景技術
視覺顯著性檢測(Visual Saliency Detection)是指通過智能算法模擬人的視覺特點,提取圖像中的顯著性區域(即人類感興趣的區域)。互聯網技術的快速發展帶來大數據量的傳播,如何從大量的視頻數據中快速提取顯著性區域已經成為一個熱點關注問題。
現有技術中,可以將視頻劃分為多個視頻幀,分別對每個視頻幀進行特征提取,獲取每個視頻幀分別對應的特征信息,根據特征信息對視頻進行顯著性檢測。然而,由于視頻中的顯著對象存在運動,可能導致視頻中不顯著的對象在某些單個視頻幀中變得顯著,造成從視頻幀提取到的特征信息缺乏全局信息,進而導致視頻的顯著性檢測結果的準確性過低。
發明內容
本申請實施例提供一種數據處理方法以及計算機設備,可以提高多媒體數據的顯著性檢測準確度。
本申請實施例一方面提供了一種數據處理方法,包括:
獲取多媒體數據對應的數據結構特征,生成數據結構特征對應的激勵圖像;激勵圖像用于突出多媒體數據中的顯著對象所在的預測區域;
獲取多媒體數據對應的顯著內容特征,根據激勵圖像對顯著內容特征進行特征增強,得到激勵內容特征;
生成激勵內容特征對應的對象區域圖像;對象區域圖像用于檢測多媒體數據中的顯著對象。
本申請實施例一方面提供了一種數據處理方法,包括:
獲取樣本數據,在初始數據檢測模型的初始激勵預測組件中,獲取樣本數據對應的樣本數據結構特征,生成樣本數據結構特征對應的樣本激勵圖像;樣本激勵圖像用于突出樣本數據中的樣本對象所在的預測區域;
在初始數據檢測模型的初始顯著性預測組件中,獲取樣本數據對應的樣本內容特征,根據樣本激勵圖像對樣本內容特征進行特征增強,得到樣本激勵內容特征;
在初始顯著性預測組件中生成樣本數據對應的樣本區域圖像;
根據樣本激勵圖像、樣本區域圖像以及樣本數據對應的樣本標簽,對初始數據檢測模型中的網絡參數進行修正,將包含修正后的網絡參數的初始數據檢測模型確定為數據檢測模型;數據檢測模型用于檢測多媒體數據中所包含的顯著對象。
本申請實施例一方面提供了一種數據處理裝置,包括:
激勵圖像生成模塊,用于獲取多媒體數據對應的數據結構特征,生成數據結構特征對應的激勵圖像;激勵圖像用于突出多媒體數據中的顯著對象所在的預測區域;
第一激勵模塊,用于獲取多媒體數據對應的顯著內容特征,根據激勵圖像對顯著內容特征進行特征增強,得到激勵內容特征;
顯著性圖生成模塊,用于生成激勵內容特征對應的對象區域圖像;對象區域圖像用于檢測多媒體數據中的顯著對象。
其中,數據結構特征包括空間特征,激勵圖像包括空間激勵圖像;
激勵圖像生成模塊包括:
數據輸入單元,用于獲取多媒體數據,將多媒體數據輸入至數據檢測模型中的空間激勵預測組件;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學;騰訊科技(深圳)有限公司,未經華南理工大學;騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110062892.8/2.html,轉載請聲明來源鉆瓜專利網。





