[發(fā)明專利]確定視頻正本的方法和裝置在審

申請?zhí)枺?/td>	201610028630.9	申請日：	2016-01-15
公開（公告）號：	CN105718524A	公開（公告）日：	2016-06-29
發(fā)明（設計）人：	吳凱凱;王世強;單明輝;尹玉宗;姚鍵;顧思斌;潘柏宇;王冀	申請（專利權）人：	合一網(wǎng)絡技術（北京）有限公司
主分類號：	G06F17/30	分類號：	G06F17/30;G06K9/62
代理公司：	北京林達劉知識產權代理事務所(普通合伙) 11277	代理人：	劉新宇
地址：	100080 北京市海淀區(qū)***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	確定視頻正本方法裝置
鉆瓜網(wǎng) 技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發(fā)明涉及視頻處理領域，尤其涉及確定視頻正本的方法和裝置。

背景技術

在網(wǎng)絡上多個視頻可能具有相同或實質相同的內容，對于例如網(wǎng)絡視頻服務提供者來說，希望能夠將這些相似的視頻整理出來，并避免給用戶重復推薦相似的內容，這可大大提高用戶體驗。

當前通用的方法是先計算視頻的諸如md5摘要的標識信息，然后采用MapReduce(映射歸納)技術找到具有相同標識信息的若干視頻并從中指定將推薦給用戶的正本視頻。根據(jù)md5碼的原理可知，差異很小的兩個視頻可能產生具有很大差異的md5碼，因此通過現(xiàn)有的諸如md5摘要的標識信息可以較為準確地識別出相同視頻，但其識別雖實質相似但不相同的視頻的效果難以令人滿意。實際中，用戶可能會對已有視頻進行編輯后上傳，例如，在已有視頻開頭或結尾增加或刪除少量內容，或者在已有視頻中間部分插入廣告等。而根據(jù)目前的方法，在統(tǒng)計相似視頻時往往會遺漏這些視頻，從而導致可能會經(jīng)常給用戶推薦相似的內容，帶來非常不好的用戶體驗。

發(fā)明內容

有鑒于此，本發(fā)明要解決的技術問題是如何避免給用戶重復推薦相似的內容。

為了解決上述技術問題，本發(fā)明提供一種確定視頻正本的方法，包括：

基于視頻指紋的相似度從多個視頻中得到第一類相似視頻子集；

確定每個第一類相似視頻子集中的正本視頻。

對于上述方法，在一種可能的實現(xiàn)方式中，基于視頻指紋的相似度從多個視頻中得到第一類相似視頻子集包括：

所述多個視頻中的任意兩個視頻均構成視頻對，針對每個視頻對，如果其所包括的兩個視頻的視頻指紋的相似度大于第一閾值，則將該兩個視頻歸入同一個第一類相似視頻子集。

對于上述方法，在一種可能的實現(xiàn)方式中，基于視頻指紋的相似度從多個視頻中得到第一類相似視頻子集包括：

所述多個視頻中的任意兩個視頻均構成視頻對，針對每個視頻對，如果其所包括的兩個視頻的視頻指紋的相似度大于第一閾值，并且該兩個視頻的基本信息的相似度大于第二閾值，則將該兩個視頻歸入同一個第一類相似視頻子集，所述基本信息包括下面的元素中的部分或全部：視頻分類、視頻標題、視頻標簽、視頻質量。

對于上述方法，在一種可能的實現(xiàn)方式中，所述多個視頻包括新增視頻子集，基于視頻指紋的相似度從多個視頻中得到第一類相似視頻子集包括：

所述新增視頻子集中的任意一個視頻和所述多個視頻中除該視頻外的任意視頻均構成視頻對，所述多個視頻中均不屬于所述新增視頻子集的任意兩個視頻均不構成視頻對，針對每個視頻對，如果其所包括的兩個視頻的視頻指紋的相似度大于第一閾值，則將該兩個視頻歸入同一個第一類相似視頻子集。

對于上述方法，在一種可能的實現(xiàn)方式中，所述多個視頻包括新增視頻子集，基于視頻指紋的相似度從多個視頻中得到第一類相似視頻子集包括：

所述新增視頻子集中的任意一個視頻和所述多個視頻中除該視頻外的任意視頻均構成視頻對，所述多個視頻中均不屬于所述新增視頻子集的任意兩個視頻均不構成視頻對，針對每個視頻對，如果其所包括的兩個視頻的視頻指紋的相似度大于第一閾值，并且該兩個視頻的基本信息的相似度大于第二閾值，則將該兩個視頻歸入同一個第一類相似視頻子集，所述基本信息包括下面的元素中的部分或全部：視頻分類、視頻標題、視頻標簽、視頻質量。

對于上述方法，在一種可能的實現(xiàn)方式中，每個視頻的視頻指紋包括分別對應于該視頻中的多個幀的多個特征信息，兩個視頻的視頻指紋的相似度是基于該兩個視頻的視頻指紋中相同的特征信息的數(shù)量確定的。

對于上述方法，在一種可能的實現(xiàn)方式中，兩個視頻的基本信息的相似度是基于該兩個視頻的基本信息中的各個對應元素是否相同確定的。

對于上述方法，在一種可能的實現(xiàn)方式中，還包括：

當合并第二類相似視頻子集和第一類相似視頻子集時，將包括同一視頻的第二類和第一類相似視頻子集合并為一個合并后的相似視頻子集；

確定每個合并后的相似視頻子集中的正本視頻。

對于上述方法，在一種可能的實現(xiàn)方式中，基于相似視頻子集中各個視頻的相關信息確定該相似視頻子集中的正本視頻，所述相關信息包括下面元素中的部分或全部：視頻分類、視頻標題、視頻標簽、視頻質量、視頻播放數(shù)據(jù)、用戶互動數(shù)據(jù)。

對于上述方法，在一種可能的實現(xiàn)方式中，確定相似視頻子集中的正本視頻包括：

得到該相似視頻子集中各個視頻對應的相關信息度量值，視頻的所述相關信息度量值是基于該視頻的所述相關信息中的各個元素的狀態(tài)確定的；

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于合一網(wǎng)絡技術（北京）有限公司，未經(jīng)合一網(wǎng)絡技術（北京）有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201610028630.9/2.html，轉載請聲明來源鉆瓜專利網(wǎng)。