[發明專利]一種視頻處理方法與裝置在審
| 申請號: | 202011022341.0 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112132750A | 公開(公告)日: | 2020-12-25 |
| 發明(設計)人: | 崔超;朱珊珊;郭常圳 | 申請(專利權)人: | 北京猿力未來科技有限公司 |
| 主分類號: | G06T3/40 | 分類號: | G06T3/40;G06T7/11 |
| 代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 劉曉楠 |
| 地址: | 100102 北京市朝陽區廣順南大*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 處理 方法 裝置 | ||
本發明提供一種視頻處理方法與裝置,其中,所述方法包括:采集對待拼接圖形的拼接視頻,從所述拼接視頻中提取關鍵幀并對所述關鍵幀進行預處理;將預處理后的所述關鍵幀輸入實例分割模型,由實例分割模型得到識別結果,其中,所述識別結果中包含識別出的圖像塊;確定所述識別結果中至少一個目標對象對應的圖像塊的相對位置,由所述相對位置確定所述至少一個目標對象的拼接結果;在所述至少一個目標對象的拼接結果與預定相對位置相同的情況下,保存所述拼接結果,給出拼接提示。本發明提供的一種視頻處理方法,通過對關鍵幀進行識別,確定所述關鍵幀中目標對象的相對位置,保證了可以對所述關鍵幀中的目標對象進行快速、準確的識別。
技術領域
本發明涉及互聯網技術領域,特別涉及一種視頻處理方法與裝置。
背景技術
隨著人工智能領域的發展,對圖像識別的需求也越來越大。
在現有技術中,對圖片處理的方法一般包括:對待識別圖像進行平滑處理 和canny算子邊沿二值化,接著使用多邊形逼近算法得到目標圖形的輪廓點集, 在HSV空間中進行顏色識別,判斷點集所屬圖像塊的類別。根據上述處理方法, 現有技術中存在著對環境光線要求較高、容易受到環境溫度影響,從而導致識 別結果不準確并且識別速度緩慢的問題。并且,如何針對待識別圖像中的遮擋 物也沒有較好的解決方法。
因此,如何解決上述問題,提高圖像識別的準確性與圖像識別的速度,成 為了技術人員亟需解決的問題。
發明內容
有鑒于此,本發明實施例提供了一種視頻處理方法與裝置、計算設備和計 算機可讀存儲介質,以解決現有技術中存在的技術缺陷。
本實施例公開了一種視頻處理方法,所述方法包括:
采集對待拼接圖形的拼接視頻,從所述拼接視頻中提取關鍵幀并對所述關 鍵幀進行預處理;
將預處理后的所述關鍵幀輸入實例分割模型,由實例分割模型得到識別結 果,其中,所述識別結果中包含識別出的圖像塊;
確定所述識別結果中至少一個目標對象對應的圖像塊的相對位置,由所述 相對位置確定所述至少一個目標對象的拼接結果;
在所述至少一個目標對象的拼接結果與預定相對位置相同的情況下,保存 所述拼接結果,給出拼接提示。
可選地,從所述拼接視頻中提取關鍵幀并對所述關鍵幀進行預處理,包括:
按照預設的時間間隔從所述拼接視頻中提取關鍵幀,并通過獲取所述關鍵 幀中的每個像素的像素值的方式對所述關鍵幀進行預處理。
可選地,所述實例分割模型包括主干網絡、候選區域網絡、興趣區域聯盟 網絡、類別層和分割層。
可選地,由實例分割模型得到識別結果,包括:
將預處理后的所述關鍵幀作為待處理圖片輸入主干網絡得到特征圖;
將所述特征圖輸入候選區域網絡進行過濾得到標示出感興趣區域的第一圖 像;
將所述第一圖像輸入興趣區域聯盟網絡對所述感興趣區域進行處理,得到 第二圖像;
將所述第二圖像輸入類別層進行處理,提取至少一個感興趣區域,通過所 述類別層確定所述感興趣區域的類型和所述感興趣區域的數量,將所述感興趣 區域的類型作為所述類別層的識別結果;
根據所述感興趣區域的數量確定所述分割層的數量,將所述感興趣區域分 別輸入對應的分割層,通過所述分割層確定至少一個目標對象的邊界和遮擋物 的外接框,得到第三圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京猿力未來科技有限公司,未經北京猿力未來科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011022341.0/2.html,轉載請聲明來源鉆瓜專利網。





