[發(fā)明專利]一種基于卷積及循環(huán)神經(jīng)網(wǎng)絡(luò)的視頻拷貝檢測系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 201810600019.8 | 申請日: | 2018-06-12 |
| 公開(公告)號: | CN108985165A | 公開(公告)日: | 2018-12-11 |
| 發(fā)明(設(shè)計(jì))人: | 路小波;胡耀聰 | 申請(專利權(quán))人: | 東南大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 循環(huán)神經(jīng)網(wǎng)絡(luò) 時空特征 訓(xùn)練模塊 視頻拷貝檢測 循環(huán)網(wǎng)絡(luò) 卷積 幀級 動態(tài)信息生成 卷積神經(jīng)網(wǎng)絡(luò) 特征提取模塊 測試模塊 建立模塊 拷貝視頻 匹配模塊 時空融合 視頻剪輯 視頻匹配 特征表示 數(shù)據(jù)集 檢測 準(zhǔn)確率 殘差 幀間 內(nèi)存 占用 融合 | ||
1.一種基于卷積及循環(huán)神經(jīng)網(wǎng)絡(luò)的視頻拷貝檢測系統(tǒng),其特征在于,該系統(tǒng)包括:
數(shù)據(jù)集建立模塊,使用公開視頻拷貝檢測數(shù)據(jù)集CC_WEB作為循環(huán)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集,使用公開視頻數(shù)據(jù)集VCDB作為測試集;
幀特征提取模塊,采用50層的殘差卷積神經(jīng)網(wǎng)絡(luò)ResNet50提取所述訓(xùn)練集視頻的圖像幀級靜態(tài)特征;
時空特征訓(xùn)練模塊,該模塊包括視頻剪輯模塊和循環(huán)網(wǎng)絡(luò)訓(xùn)練模塊,所述視頻剪輯模塊用于將所述訓(xùn)練集中的視頻剪輯成若干剪輯段,并將所述若干剪輯段組合成若干個剪輯對,所述剪輯對包括剪輯內(nèi)容相同的剪輯對和剪輯內(nèi)容不相同的剪輯對;所述循環(huán)網(wǎng)絡(luò)訓(xùn)練模塊利用所述剪輯對中的幀級靜態(tài)特征序列訓(xùn)練孿生循環(huán)神經(jīng)網(wǎng)絡(luò),生成降維的時空特征表示,并采用比較損失函數(shù)優(yōu)化所述孿生循環(huán)網(wǎng)絡(luò)的參數(shù);
循環(huán)網(wǎng)絡(luò)測試模塊,用于將所述測試集中的庫視頻和待查詢視頻生成時空特征表示,所述生成方法是采用所述循環(huán)網(wǎng)絡(luò)訓(xùn)練模塊中訓(xùn)練的孿生循環(huán)神經(jīng)網(wǎng)絡(luò);
拷貝視頻匹配模塊,用于使用基于圖的時空網(wǎng)絡(luò)算法匹配所述測試集中的庫視頻,以確定所述待查詢視頻是否為拷貝視頻。
2.根據(jù)權(quán)利要求1所述的基于卷積及循環(huán)神經(jīng)網(wǎng)絡(luò)的視頻拷貝檢測系統(tǒng),其特征在于,所述循環(huán)網(wǎng)絡(luò)訓(xùn)練模塊的孿生循環(huán)神經(jīng)網(wǎng)絡(luò)的基本神經(jīng)單元為長短期記憶胞元,所述長短期記憶胞元包括一個記憶胞元和三個控制門,所述三個控制門分別為輸入門、遺忘門和輸出門,所述控制門的輸入均為幀級靜態(tài)特征和上一個狀態(tài)的輸出值,所述輸入門、遺忘門和輸出的輸出分別通過所述剪輯對中的幀級靜態(tài)特征、權(quán)重矩陣和閾值項(xiàng)計(jì)算得到,分別將為it、ft和ot,所述輸入門的輸出值it可以調(diào)制所述長短期記憶胞元的輸入zt,所述孿生循環(huán)神經(jīng)網(wǎng)絡(luò)的輸出由所述遺忘門和所述輸出門共同決定,進(jìn)而融合出時空特征表示。
3.根據(jù)權(quán)利要求2所述的基于卷積及循環(huán)神經(jīng)網(wǎng)絡(luò)的視頻拷貝檢測系統(tǒng),其特征在于,所述輸入門、遺忘門和輸出門的輸出分別通過所述剪輯對的幀級靜態(tài)特征、權(quán)重矩陣和閾值項(xiàng)計(jì)算得到,計(jì)算公式為:
it=σ(WiXt+Riht-1+bi)
ft=σ(WfXt+Rfht-1+bf)
ot=σ(WoXt+Roht-1+bo)
zt=σ(WzXt+Rzht-1+bz)
其中,Wi,Wf,Wo和Wz分別表示當(dāng)前狀態(tài)在輸入門、遺忘門、輸出門和所述孿生循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的輸入的權(quán)重矩陣,X為經(jīng)過所述殘差卷積神經(jīng)網(wǎng)絡(luò)提取出剪輯對中單幀圖片的靜態(tài)特征,Xt∈X={X(a),X(b)},L為剪輯對的幀長,ht-1為上一個狀態(tài)的輸出值,Ri,Rf,Ro和Rz分別表示上一個狀態(tài)在輸入門、遺忘門、輸出門和所述孿生循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的輸出的權(quán)重矩陣,bi,bf,bo和bz分別表示在輸入門、遺忘門、輸出門和所述孿生循環(huán)卷積神經(jīng)網(wǎng)絡(luò)閾值項(xiàng),σ為sigmoid函數(shù),φ為雙正切函數(shù),表示元素內(nèi)積。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810600019.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于識別字跡的方法、裝置及計(jì)算機(jī)可讀介質(zhì)
- 基于層級神經(jīng)網(wǎng)絡(luò)的圖像-句子描述生成系統(tǒng)及方法
- 基于差異循環(huán)神經(jīng)網(wǎng)絡(luò)的意圖識別方法
- 一種基于深度學(xué)習(xí)大規(guī)模病歷的輔助診斷系統(tǒng)
- 一種改進(jìn)鯨魚算法的循環(huán)神經(jīng)網(wǎng)絡(luò)短期電力負(fù)荷預(yù)測方法
- 基于門控循環(huán)神經(jīng)網(wǎng)絡(luò)的非線性均衡方法
- 一種基于卷積核相似性剪枝的循環(huán)神經(jīng)網(wǎng)絡(luò)模型壓縮方法
- 一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)對動態(tài)磁滯進(jìn)行補(bǔ)償?shù)姆椒跋到y(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 一種基于循環(huán)神經(jīng)網(wǎng)絡(luò)的駕駛?cè)硕嗖僮髌谔卣魈崛》椒?/a>
- 基于時空特征點(diǎn)的互信息與時空分布熵的行為識別方法
- 一種基于時空特征融合遞歸神經(jīng)網(wǎng)絡(luò)的智能車端到端決策方法
- 規(guī)則挖掘方法和裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲介質(zhì)
- 一種用于時空數(shù)據(jù)的特征提取方法
- 一種數(shù)據(jù)比對碰撞方法和裝置
- 基于視覺時空特征的智能車預(yù)測控制方法
- 區(qū)域柵格化與時間片段化融合的長時空軌跡預(yù)測方法
- 時空數(shù)據(jù)的異常檢測方法、裝置、電子設(shè)備和存儲介質(zhì)
- 基于時空特征信息的草圖檢索三維模型的跨模態(tài)檢索方法
- 一種基于時空特征的人臉活體檢測方法、裝置、電子設(shè)備及存儲介質(zhì)





