[發明專利]一種網絡暴力視頻的識別方法有效
| 申請號: | 201310139552.6 | 申請日: | 2013-04-19 |
| 公開(公告)號: | CN103218608B | 公開(公告)日: | 2017-05-10 |
| 發明(設計)人: | 胡衛明;鄒星宇;吳偶 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 中科專利商標代理有限責任公司11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 暴力 視頻 識別 方法 | ||
1.一種基于多示例多特征的網絡暴力視頻識別方法,該方法包括:
步驟1:從視頻共享網站上抓取暴力視頻與非暴力視頻及其評論、簡介構建一個視頻數據訓練集;
步驟2:從訓練集的文本信息中提取文本特征組成文本特征向量來訓練文本預分類器,該預分類器篩選出候選的暴力視頻;
步驟3:采用基于自適應雙閾值的鏡頭分割算法對所述候選的暴力視頻的視頻片段進行分割,對每一個鏡頭提取相關的視覺特征、音頻特征來表示該鏡頭,每一個鏡頭是多示例學習的一個示例,視頻片段是一個包括多個示例的包,該包映射到示例空間;
步驟4:使用MILES算法將所述包轉化為單示例,包由單示例的特征向量表達,采用該特征向量訓練分類器模型,采用該分類器模型對候選暴力視頻進行分類;
其中,所提取的視覺特征和音頻特征包括:運動強度特征火焰像素的變化速度特征血液像素的變化特征鏡頭長度L、音頻能量音頻能量熵Is和Mel倒譜系數Cn;
其中,步驟4中使用改進的MILES算法進行示例選擇,使多示例問題轉換為單示例監督學習問題,所述改進的MILES算法,是將每一個包只選擇與正包相似度最高的示例,即選擇包中最有用的示例來表達;
其中,步驟3中包括:
假如視頻段內相鄰p幀與q幀之間的幀間差異SDp,q的均值為μ,方差為σ,則兩個閾值可表達為:
Tb=μ+α1σ,α1∈[5,6]
Ts=μ+α2σ,α2∈[2,3]
檢測的基本流程如下:
1、假如SDp,q>Tb,p幀與q幀之間發生了鏡頭的切變;
2、假如SDp,q<Tb,p幀與q幀之間沒有發生鏡頭變換;
3、假如Tb>SDp,q>Ts,則q幀被標記為起始幀Fs,從該q幀起計算兩類不同的幀之間的差異,一類是相鄰的幀之間的差異,一類是起始幀和后續幀之間相隔幀之間的幀間差異SDp,k,當從q幀開始相隔幀之間幀間差異不斷增加時,在相鄰幀之間的幀間差異大于Ts的前提下,只要相隔幀之間的幀間差異超過Tb時,則鏡頭發生了漸變切換;當相鄰幀之間的幀間差異小于Ts,而累積幀間差SDp,k小于Tb時,原來標注的起始幀Fs就被放棄;
然后對鏡頭提取視頻特征和音頻特征,包括:
1)運動強度:運動向量的大小即運動強度M,公式如下
Mk(i)是鏡頭第k幀的第i塊的運動強度;
是鏡頭第k幀的平均運動強度;
是含有m幀的鏡頭的運動強度;
2)火焰:即火焰像素的變化速度
Mf是鏡頭中含有火焰像素的幀總數,Fi是第i幀含有的火焰像素百分比;
3)血液:
是血液像素變化特征,Mb是鏡頭中含有血液像素的幀總數,Bi是第i幀含有的血液像素百分比;
4)鏡頭長度:即幀總數L;
5)音頻能量:
xi(n)是音頻信號第n個采樣點的值,E(i)是整個音頻片段的能量;
表示鏡頭m個音頻片段的平均能量強度;
6)音頻能量熵:
是第i個音頻片段的能量強度,In是第n個音頻幀的能量熵;
Is表示鏡頭的音頻能量熵;
7)Mel倒譜系數,計算過程如下:
(1)對音頻信號進行快速傅立葉變換計算;
(2)通過濾波器組濾除雜波;
(3)Mel倒譜系數由離散余弦逆變換獲得,計算公式如下:
其中K是三角濾波器的個數,SK是信號通過第K個三角濾波器后的Mel加權頻譜,L是倒頻譜的階數;
在提取以上所述的鏡頭的視頻、音頻特征后,鏡頭x由特征向量表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310139552.6/1.html,轉載請聲明來源鉆瓜專利網。





