[發(fā)明專(zhuān)利]一種基于上下文稀疏表示的恐怖視頻識(shí)別方法及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201410065197.7 | 申請(qǐng)日: | 2014-02-25 |
| 公開(kāi)(公告)號(hào): | CN103854014A | 公開(kāi)(公告)日: | 2014-06-11 |
| 發(fā)明(設(shè)計(jì))人: | 李兵;胡衛(wèi)明;丁昕苗;祝守宇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 中國(guó)科學(xué)院自動(dòng)化研究所 |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00 |
| 代理公司: | 中科專(zhuān)利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 上下文 稀疏 表示 恐怖 視頻 識(shí)別 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及模式識(shí)別和計(jì)算機(jī)網(wǎng)絡(luò)內(nèi)容安全領(lǐng)域,特別涉及一種基于上下文稀疏表示的恐怖視頻識(shí)別方法及裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)和應(yīng)用的迅速發(fā)展,互聯(lián)網(wǎng)也給人們的生活帶來(lái)便利的同時(shí),也給不良信息的傳播提供了方便。在互聯(lián)網(wǎng)高速發(fā)展的基礎(chǔ)上,色情、暴力、恐怖等有害信息的傳播也變得越來(lái)越容易。心理學(xué)和生理學(xué)研究表明,互聯(lián)網(wǎng)中的恐怖信息對(duì)青少年的身心健康產(chǎn)生的危害絕不亞于色情信息的危害。過(guò)多的恐怖信息可能使人長(zhǎng)期處于極度的焦慮和恐懼中,甚至使人身心受到損害,容易產(chǎn)生心理失衡或障礙,嚴(yán)重時(shí)出現(xiàn)病理癥狀,導(dǎo)致各種恐怖癥產(chǎn)生,甚至引發(fā)其它的精神疾病。過(guò)多恐怖信息的接觸是恐懼癥及其它心理病癥的根源所在。同時(shí),恐怖信息的過(guò)剩導(dǎo)致兒童、青少年的恐懼泛化,進(jìn)而影響他們的社會(huì)認(rèn)知及未來(lái)人格的健康發(fā)展;過(guò)多恐怖信息的接觸將左右孩子的閱讀取向,影響兒童青少年的審美情趣,可能引發(fā)學(xué)習(xí)不良問(wèn)題,甚至引發(fā)犯罪。
網(wǎng)絡(luò)不良信息的危害早已得到國(guó)際社會(huì)的廣泛關(guān)注,現(xiàn)有的研究主要關(guān)注色情信息的過(guò)濾。雖然恐怖信息的危害不亞于色情信息,但之前的研究主要關(guān)色情圖像和色情視頻的識(shí)別與過(guò)濾。目前尚未有太多的研究注恐怖信息的過(guò)濾。
發(fā)明內(nèi)容
(一)要解決的技術(shù)問(wèn)題
本發(fā)明的主要目的是提出一種可以兼顧關(guān)鍵幀之間上下文關(guān)系以及音視頻融合的恐怖視頻識(shí)別的方法。
(二)技術(shù)方案
為達(dá)到上述目的,本發(fā)明提供了一種基于上下文稀疏表示的恐怖視頻識(shí)別方法,該方法包括:
步驟1:對(duì)訓(xùn)練視頻樣本進(jìn)行鏡頭分割,然后針對(duì)每個(gè)鏡頭選取一幅關(guān)鍵幀來(lái)代表該鏡頭;
步驟2:提取每個(gè)關(guān)鍵幀的視覺(jué)特征,并提取整個(gè)訓(xùn)練視頻樣本的音頻特征;
步驟3:利用ε-graph建圖方法,建立起每一個(gè)訓(xùn)練視頻樣本內(nèi)部各個(gè)關(guān)鍵幀之間的上下文關(guān)系圖;
步驟4:對(duì)待識(shí)別視頻進(jìn)行鏡頭分割,并針對(duì)每個(gè)鏡頭選取一幅關(guān)鍵幀,提取所選取關(guān)鍵幀的視覺(jué)特征;并提取待識(shí)別視頻的音頻特征;
步驟5:構(gòu)建待識(shí)別視頻與訓(xùn)練視頻樣本之間的代價(jià)矩陣,其對(duì)角元素為待識(shí)別視頻與各個(gè)訓(xùn)練視頻樣本的音頻特征之間的距離;
步驟6:基于上下文稀疏表示模型,利用所有訓(xùn)練視頻樣本對(duì)所述待識(shí)別視頻進(jìn)行重構(gòu),重構(gòu)誤差最小的訓(xùn)練視頻樣本的類(lèi)別即為待識(shí)別視頻的類(lèi)別;其中所述上下文稀疏表示模塊以所述訓(xùn)練視頻樣本的上下文關(guān)系圖作為稀疏表示的詞典,并利用所述代價(jià)矩陣對(duì)其進(jìn)行約束。
本發(fā)明還提供了一種基于上下文稀疏表示的恐怖視頻識(shí)別裝置,包括:
鏡頭提取模塊,對(duì)訓(xùn)練視頻樣本進(jìn)行鏡頭分割,然后針對(duì)每個(gè)鏡頭選取一幅關(guān)鍵幀來(lái)代表該鏡頭;
特征提取模塊,提取每個(gè)關(guān)鍵幀的視覺(jué)特征,并提取整個(gè)訓(xùn)練視頻樣本的音頻特征;
關(guān)系建立模塊,利用ε-graph建圖方法,建立起每一個(gè)訓(xùn)練視頻樣本內(nèi)部各個(gè)關(guān)鍵幀之間的上下文關(guān)系圖;
待識(shí)別視頻特征提取模塊,對(duì)待識(shí)別視頻進(jìn)行鏡頭分割,并針對(duì)每個(gè)鏡頭選取一幅關(guān)鍵幀,提取所選取關(guān)鍵幀的視覺(jué)特征;并提取待識(shí)別視頻的音頻特征;
距離構(gòu)建模塊,構(gòu)建待識(shí)別視頻與訓(xùn)練視頻樣本之間的代價(jià)矩陣,其對(duì)角元素為待識(shí)別視頻與各個(gè)訓(xùn)練視頻樣本的音頻特征之間的距離;
識(shí)別模塊,基于上下文稀疏表示模型,利用所有訓(xùn)練視頻樣本對(duì)所述待識(shí)別視頻進(jìn)行重構(gòu),重構(gòu)誤差最小的訓(xùn)練視頻樣本的類(lèi)別即為待識(shí)別視頻的類(lèi)別;其中所述上下文稀疏表示模塊以所述訓(xùn)練視頻樣本的上下文關(guān)系圖作為稀疏表示的詞典,并利用所述代價(jià)矩陣對(duì)其進(jìn)行約束。
(三)有益效果
從上述技術(shù)方案可以看出,本發(fā)明具有以下優(yōu)點(diǎn):
1、本發(fā)明提供的這種恐怖視頻識(shí)別方法,首次將視頻幀的上下文關(guān)系考慮進(jìn)識(shí)別算法中。
2、本發(fā)明利用代價(jià)約束的方法有效地融合了音頻和視覺(jué)信息。
3、本發(fā)明所提出的恐怖視頻識(shí)別方法基于上下文稀疏表示模型,該模型無(wú)需學(xué)習(xí)過(guò)程,可擴(kuò)充性強(qiáng),能夠快捷、高效地完成視頻識(shí)別。
附圖說(shuō)明
圖1為本發(fā)明提供的基于上下文稀疏表示的恐怖視頻識(shí)別流程圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。
圖1示出了本發(fā)明提出的一種基于上下文稀疏表示的恐怖視頻識(shí)別方法的過(guò)程示意圖。如圖1所述,該方法包括以下幾方面內(nèi)容:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于中國(guó)科學(xué)院自動(dòng)化研究所,未經(jīng)中國(guó)科學(xué)院自動(dòng)化研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410065197.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 自動(dòng)創(chuàng)建上下文信息提供配置的系統(tǒng)
- 用于管理上下文的方法、系統(tǒng)和裝置
- 一種基于本體的上下文感知應(yīng)用平臺(tái)框架模型
- 一種基于上下文感知的智能家居系統(tǒng)
- 實(shí)現(xiàn)上下文感知業(yè)務(wù)應(yīng)用的方法和相關(guān)裝置
- 一種多推理引擎融合上下文感知系統(tǒng)及其工作方法
- 多個(gè)并發(fā)上下文虛擬演進(jìn)型會(huì)話管理(虛擬ESM)
- 一種基于異質(zhì)上下文感知的推薦方法
- 一種可提高上下文質(zhì)量的本體建模方法及裝置
- 微服務(wù)全局上下文控制方法及系統(tǒng)





