[發明專利]一種基于深度學習和圖論的拷貝視頻檢測方法和系統在審
| 申請號: | 201710024138.9 | 申請日: | 2017-01-12 |
| 公開(公告)號: | CN106778686A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 楊歐 | 申請(專利權)人: | 深圳職業技術學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/08;G11B20/00;G06F17/30 |
| 代理公司: | 武漢臻誠專利代理事務所(普通合伙)42233 | 代理人: | 仲暉 |
| 地址: | 518055 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 拷貝 視頻 檢測 方法 系統 | ||
1.一種基于深度學習和圖論的拷貝視頻檢測方法,其特征在于,包括以下步驟:
(1)抽取參考庫視頻中的關鍵幀,從關鍵幀中提取關鍵幀特征,并將該關鍵幀特征存儲在參考庫視頻數據庫中;
(2)抽取待檢測視頻中的關鍵幀,并從關鍵幀中提取關鍵幀特征;
(3)采用近似最近鄰搜索算法對步驟(1)中得到的參考庫視頻數據庫中的關鍵幀特征和步驟(2)中得到的待檢測視頻中的關鍵幀特征進行相似性匹配;
(4)根據圖論的方法對步驟(3)得到的相似性匹配列表進行拷貝視頻片段的判斷與定位。
2.根據權利要求1所述的拷貝視頻檢測方法,其特征在于,步驟(1)具體包括以下子步驟:
(1-1)抽取參考庫視頻中的多個關鍵幀,具體是按照時間間隔T秒抽取一個關鍵幀,其中T為自然數;
(1-2)將步驟(1-1)中獲取的多個關鍵幀進行歸一化,將歸一化的關鍵幀大小減去圖像均值,并將結果輸入到卷積神經網絡模型進行處理,并將處理得到的W維向量作為關鍵幀特征,其中W為自然數;
(1-3)將步驟(1-2)中獲得的關鍵幀特征按生成時間的先后順序保存在參考庫視頻數據庫中,并記錄每個關鍵幀特征所對應的參考庫視頻序號。
3.根據權利要求1所述的拷貝視頻檢測方法,其特征在于,步驟(1-2)中采用的是AlexNet卷積神經網絡模型FC7層輸出的的4096維向量,即W=4096。
4.根據權利要求2所述的拷貝視頻檢測方法,其特征在于,步驟(2)具體包括以下步驟:
(2-1)抽取待檢測視頻中的多個關鍵幀,具體是按照時間間隔S秒抽取一個關鍵幀,其中S為自然數;
(2-2)將步驟(2-1)中獲取的多個關鍵幀進行歸一化,將歸一化的關鍵幀大小減去圖像均值,并將結果輸入到卷積神經網絡模型中進行處理,并將處理得到的W維向量作為關鍵幀特征。
5.根據權利要求4所述的拷貝視頻檢測方法,其特征在于,步驟(3)具體包括以下步驟:
(3-1)讀取參考庫視頻數據庫中的關鍵幀特征R={r1,r2,...,rn},并將所有關鍵幀特征組合為W×n的矩陣,其中n表示參考庫視頻數據庫中關鍵幀的數量,rj為參考視頻關鍵幀,且j∈(1,n);
(3-2)讀取待檢測視頻中的關鍵幀特征Q={q1,q2,...,qm},并將所有關鍵幀特征組合為W×m的矩陣,其中,m表示待檢測視頻關鍵幀的數量,qi為按時間先后排序的待檢測視頻關鍵幀,且i∈(1,m);
(3-3)采用近似最近鄰搜索算法對獲得的W×m的矩陣和W×n的矩陣進行關鍵幀的相似性匹配,以得到關鍵幀相似性匹配結果。
6.根據權利要求5所述的拷貝視頻檢測方法,其特征在于,步驟(3-3)具體為,采用近似最近鄰搜索算法,針對步驟(3-2)得到的矩陣W×m中的每一行,在步驟(3-1)得到的矩陣W×n中搜索與其歐式距離最小的前K個行向量,并按歐式距離由小到大的順序對結果進行排序,即得到參考庫視頻數據庫關鍵幀集合R中與其距離最近的前K個關鍵幀rj,并得到待檢測視頻關鍵幀集合Q與參考庫視頻數據庫中關鍵幀集合R的相似性匹配結果,其中K為自然數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳職業技術學院,未經深圳職業技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710024138.9/1.html,轉載請聲明來源鉆瓜專利網。





