[發明專利]用于確定重復視頻的方法和裝置有效
| 申請號: | 201811458416.2 | 申請日: | 2018-11-30 |
| 公開(公告)號: | CN111259194B | 公開(公告)日: | 2023-06-23 |
| 發明(設計)人: | 李元朋;彭明浩 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F16/783 | 分類號: | G06F16/783;G06F16/73;G06V20/40;G06V10/74 |
| 代理公司: | 北京英賽嘉華知識產權代理有限責任公司 11204 | 代理人: | 王達佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 確定 重復 視頻 方法 裝置 | ||
本申請實施例公開了用于確定重復視頻的方法和裝置。該用于確定重復視頻的方法包括:獲取當前視頻;對比當前視頻中包括人臉的時間段與已有視頻庫中的各個已有視頻中包括人臉的時間段,得到各個已有視頻與當前視頻的相似度;響應于對比的結果指示已有視頻庫中存在與當前視頻的相似度大于預設閾值的已有視頻,確定當前視頻與該已有視頻重復。該方法可以提高確定視頻重復性的準確度。
技術領域
本申請涉及計算機技術領域,具體涉及計算機網絡技術領域,尤其涉及用于確定重復視頻的方法和裝置。
背景技術
在目前的互聯網視頻業務中,為了節省硬件資源、提高用戶體驗,在儲存視頻時需要識別出高相似度視頻,并對高相似度視頻去重。
目前的視頻去重處理方法主要包括以下幾種:第一種方法中根據視頻文件MD5值去重。第二種方法中根據視頻文本元數據信息去重,例如基于向量空間模型(VSM)在為每個視頻建立文本向量空間模型后,計算兩個向量的距離就得到了對于視頻相似度。第三種方法中根據視頻內容去重,可以通過關鍵幀的圖像匹配來計算視頻的相似度。
然而,上述的第一種方法中,視頻經過轉碼后MD5值就會變化,而且無法識別出內容高度相似的視頻。第二種方法中度量計算時間復雜度高,面對大量的互聯網視頻,計算代價太大。第三種方法中計算時間復雜度較高,而且單個相似度的計算量過于復雜,不具有實際工程應用性;并且有些視頻內容具有很高的相似性,但是由于拍攝期間或者后期處理等的差異性,使得關鍵幀不相同造成漏識別。
發明內容
本申請實施例提供了用于確定重復視頻的方法和裝置。
第一方面,本申請實施例提供了一種用于確定重復視頻的方法,包括:獲取當前視頻;對比當前視頻中包括人臉的時間段與已有視頻庫中的各個已有視頻中包括人臉的時間段,得到各個已有視頻與當前視頻的相似度;響應于對比的結果指示已有視頻庫中存在與當前視頻的相似度大于預設閾值的已有視頻,確定當前視頻與該已有視頻重復。
在一些實施例中,對比當前視頻中包括人臉的時間段與已有視頻庫中的各個已有視頻中包括人臉的時間段,得到各個已有視頻與當前視頻的相似度包括:對當前視頻中的人臉進行人臉跟蹤,確定當前視頻中的人臉出現的第一時間段集合;對各個已有視頻中的人臉進行人臉跟蹤,確定各個已有視頻中的人臉出現的第二時間段集合;對比當前視頻的第一時間段集合與已有視頻庫中的各個已有視頻的第二時間段集合,得到各個已有視頻與當前視頻的相似度。
在一些實施例中,對比當前視頻中包括人臉的時間段與已有視頻庫中的各個已有視頻中包括人臉的時間段,得到各個已有視頻與當前視頻的相似度包括:對當前視頻中的人臉進行人臉跟蹤,確定當前視頻中的人臉出現的第一時間段集合;對已有視頻庫中各個已有視頻中的人臉進行人臉跟蹤,確定各個已有視頻中的人臉出現的第二時間段集合;對比當前視頻的第一時間段集合與已有視頻庫中的各個已有視頻的第二時間段集合,得到預判相似值集合;響應于預判相似值集合中存在大于預定閾值的預判相似值,基于大于預定閾值的預判相似值對應的已有視頻,確定對應該已有視頻的各個第二時間段的第二人臉標簽集合;基于當前視頻,確定對應各個第一時間段的第一人臉標簽集合;對比當前視頻的第一人臉標簽集合中的第一人臉標簽與該已有視頻的第二人臉標簽集合中的第二人臉標簽,得到各個已有視頻與當前視頻的相似度。
在一些實施例中,基于當前視頻,確定對應各個第一時間段的第一人臉標簽集合包括:對于當前視頻的各個第一時間段中的各個視頻幀,提取每個人臉的特征形成多維向量,基于各個人臉的多維向量形成第一人臉向量矩陣;基于大于預定閾值的預判相似值對應的已有視頻,確定對應該已有視頻的各個第二時間段的第二人臉標簽集合包括:對于大于預定閾值的預判相似值對應的已有視頻的各個第二時間段中的各個視頻幀,提取每個人臉的特征形成多維向量,基于各個人臉的多維向量形成第二人臉向量矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811458416.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示面板及其制作方法
- 下一篇:半導體結構的互連方法與半導體結構





