[發明專利]視頻中logo區域的標記方法、裝置及電子設備有效
| 申請號: | 201911203383.1 | 申請日: | 2019-11-29 |
| 公開(公告)號: | CN111126372B | 公開(公告)日: | 2023-07-11 |
| 發明(設計)人: | 李果;張玉梅;張文杰;賀沁雯;李虎;樊鴻飛;蔡媛 | 申請(專利權)人: | 北京金山云網絡技術有限公司;北京金山云科技有限公司 |
| 主分類號: | G06V10/22 | 分類號: | G06V10/22;G06V10/762 |
| 代理公司: | 北京博遵律師事務所 11761 | 代理人: | 馬佑平 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 logo 區域 標記 方法 裝置 電子設備 | ||
1.一種視頻中logo區域的標記方法,其特征在于,所述方法包括:
從視頻幀中識別出至少一個文字區域;
對每個所述文字區域對應的擴展區域內的像素點分別進行聚類處理,獲得聚類結果,其中,所述聚類結果包括:以所述擴展區域中的logo文字的顏色為聚類中心的第一像素點集合和以所述擴展區域中的logo背景的顏色為聚類中心的第二像素點集合,所述擴展區域包括對應的所述文字區域,所述擴展區域的面積大于對應的所述文字區域的面積;
根據所述聚類結果,確定每個所述文字區域對應的待定logo區域;其中,所述待定logo區域中包含對應的所述文字區域;
將滿足預設條件的所述待定logo區域標記為所述視頻幀中的目標logo區域;
所述預設條件包括:所述待定logo區域的面積大于預設面積;所述待定logo區域的角點數量小于預設角點數量;所述待定logo區域中的logo背景區域完全被包含在所述擴展區域內;所述待定logo區域中的logo文字區域完全被包含在所述logo背景區域內;所述待定logo區域中的logo背景區域與所述擴展區域的面積比例大于預設比例值;以及,所述待定logo區域中的logo背景區域的長寬比符合預設范圍區間。
2.根據權利要求1所述的方法,其特征在于,所述從視頻幀中識別出至少一個文字區域,包括:
通過深度學習文字檢測算法,從所述視頻幀中識別出所述至少一個文字區域。
3.根據權利要求1所述的方法,其特征在于,所述對每個所述文字區域對應的擴展區域內的像素點分別進行聚類處理,獲得聚類結果,包括:
利用聚類算法對每個所述文字區域內的像素點進行2類別聚類計算,得到對應的2個聚類中心及聚類模型;其中,所述聚類中心包括以logo文字的顏色和logo背景的顏色;
將每個所述文字區域按照預設比例擴大,得到對應的擴展區域;
通過所述聚類模型計算對應的擴展區域內,每個像素點的類別,以及每個所述像素點到相應類別的聚類中心的距離;
在所述像素點到相應類別的聚類中心的距離符合預設閾值時,確定以所述擴展區域中logo文字的顏色為聚類中心的第一像素點集合,以及確定以所述擴展區域中logo背景的顏色為聚類中心的第二像素點集合。
4.根據權利要求1所述的方法,其特征在于,所述將滿足預設條件的所述待定logo區域標記為所述視頻幀中的目標logo區域,包括:
在滿足所述預設條件的所述待定logo區域的邊緣處添加虛線框以進行標記;或者,
對滿足所述預設條件的所述待定logo區域內的像素點添加標簽以進行標記。
5.根據權利要求1所述的方法,其特征在于,在所述將滿足預設條件的所述待定logo區域標記為所述視頻幀中的目標logo區域之后,所述方法還包括:
將用于展示的目標logo圖像添加至所述目標logo區域中。
6.一種視頻中logo區域的標記裝置,其特征在于,所述裝置包括:
識別模塊,用于從視頻幀中識別出至少一個文字區域;
獲取模塊,用于對每個所述文字區域對應的擴展區域內的像素點分別進行聚類處理,獲得聚類結果,其中,所述聚類結果包括:以所述擴展區域中的logo文字的顏色為聚類中心的第一像素點集合和以所述擴展區域中的logo背景的顏色為聚類中心的第二像素點集合,所述擴展區域包括對應的所述文字區域,所述擴展區域的面積大于對應的所述文字區域的面積;
確定模塊,用于根據所述聚類結果,確定每個所述文字區域對應的待定logo區域;其中,所述待定logo區域中包含對應的所述文字區域;
標記模塊,用于將滿足預設條件的所述待定logo區域標記為所述視頻幀中的目標logo區域;所述預設條件包括:所述待定logo區域的面積大于預設面積;所述待定logo區域的角點數量小于預設角點數量;所述待定logo區域中的logo背景區域完全被包含在所述擴展區域內;所述待定logo區域中的logo文字區域完全被包含在所述logo背景區域內;所述待定logo區域中的logo背景區域與所述擴展區域的面積比例大于預設比例值;以及,所述待定logo區域中的logo背景區域的長寬比符合預設范圍區間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京金山云網絡技術有限公司;北京金山云科技有限公司,未經北京金山云網絡技術有限公司;北京金山云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911203383.1/1.html,轉載請聲明來源鉆瓜專利網。





