[發明專利]一種視頻檢測方法及裝置在審
| 申請號: | 201510764366.0 | 申請日: | 2015-11-10 |
| 公開(公告)號: | CN105389558A | 公開(公告)日: | 2016-03-09 |
| 發明(設計)人: | 李邵梅;黃海;于洪濤;王凱;高超;黃雅靜;李印海 | 申請(專利權)人: | 中國人民解放軍信息工程大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 李金;王寶筠 |
| 地址: | 450001 *** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 檢測 方法 裝置 | ||
技術領域
本發明屬于圖像識別技術領域,更具體的說,尤其涉及一種視頻檢測方法及裝置。
背景技術
不良視頻是指在傳播形式或內容上存在非法或違規行為的視頻。目前不良視頻主要有兩種類型:盜版視頻以及其他類型的不良視頻,其中其他類型的不良視頻主要包括:反動視頻、暴恐視頻、詐騙視頻和色情視頻。這些不良視頻借助公眾網絡廣泛傳播,已成為社會危害的重要誘因。
為了凈化網絡環境,研究人員提出了多種對不良視頻進行檢測的方法。其中針對盜版視頻的檢測研究相對較為成熟,針對反動視頻、暴恐視頻、詐騙視頻和色情視頻這類不良視頻來說主要的檢測方法是基于內容的檢測方法,其處理過程如下:
首先獲取不良視頻中的視覺對象,并提取所述視覺對象的特征值作為匹配模板;其次在獲得一個需要匹配的視頻后,對所述視頻中的每幀圖像進行分區,并逐區提取每個分區的特征值;然后將每個分區的特征值與上述作為匹配模板的特征值進行基于距離的相似度計算,相似度小于指定閾值則判定視頻為不良視頻。但是視頻是一個圖像、文本和話音的集合,單純通過圖像檢測來確定視頻是否為不良視頻可能會導致視頻檢測不準確。
發明內容
有鑒于此,本發明的目的在于提供一種視頻檢測方法及裝置,用于提高視頻檢測的準確度。
本發明提供一種視頻檢測方法,所述方法包括:
基于待檢測視頻中相鄰幀圖像的相似度,將所述待檢測視頻分割成多個子段視頻;
分別對各個子段視頻進行圖像檢測、文本檢測和話音關鍵詞檢測,得到各個子段視頻的圖像檢測結果、各個子段視頻的文本檢測結果和各個子段視頻的話音檢測結果,其中所述圖像檢測結果用于指示基于圖像檢測得到的子段視頻的檢測結果,所述文本檢測結果用于指示基于文本檢測得到的子段視頻的檢測結果,所述話音檢測結果用于指示基于話音關鍵詞檢測得到的子段視頻的檢測結果;
基于各個子段視頻的圖像檢測結果、各個子段視頻的文本檢測結果和各個子段視頻的話音檢測結果,得到相應子段視頻的檢測結果;
基于各個子段視頻的檢測結果,得到所述待檢測視頻的檢測結果。
優選地,所述基于各個子段視頻的圖像檢測結果、各個子段視頻的文本檢測結果和各個子段視頻的話音檢測結果,得到相應子段視頻的檢測結果,包括:
當子段視頻的圖像檢測結果、子段視頻的文本檢測結果和子段視頻的話音檢測結果中任意一項檢測結果指示檢測到目標對象,且目標對象的等級為一級時,得到指示所述子段視頻為不良視頻子段的檢測結果;
當子段視頻的圖像檢測結果、子段視頻的文本檢測結果和子段視頻的話音檢測結果中至少兩項檢測結果指示檢測到目標對象,且目標對象的等級為二級時,得到指示所述子段視頻為不良視頻子段的檢測結果,其中所述二級的重要程度小于所述一級的重要程度;
當子段視頻的圖像檢測結果、子段視頻的文本檢測結果和子段視頻的話音檢測結果中任意一項檢測結果指示檢測到目標對象,且目標對象的等級為二級時,得到指示所述子段視頻為疑似不良視頻子段的檢測結果。
優選地,所述基于各個子段視頻的檢測結果,得到所述待檢測視頻的檢測結果,包括:
基于所述檢測結果,得到為不良視頻子段的第一子段視頻數量以及疑似不良視頻字段的第二子段視頻數量;
當所述第一子段視頻數量與子段視頻總數的比例大于第一閾值時,得到指示所述待檢測視頻為不良視頻的檢測結果;
當所述第二子段視頻數量與所述子段視頻總數的比例大于第二閾值時,得到指示所述待檢測視頻為不良視頻的檢測結果,其中所述第一閾值小于第二閾值。
優選地,對子段視頻進行圖像檢測,得到子段視頻的圖像檢測結果,包括:
提取所述子段視頻中每幀圖像的檢測區域的視覺特征;
將所提取的視覺特征與預先建立的圖像對象模型進行匹配分析,以得到所述每幀圖像中的不良對象和所述不良對象的等級,其中所述圖像檢測結果包括所述每幀圖像中的不良對象和所述不良對象的等級。
優選地,對子段視頻進行文本檢測,得到子段視頻的文本檢測結果,包括:
確定所述子段視頻中每幀圖像中的文本區域;
對所確定的文本區域進行文本識別,得到所述文本區域包括的文本;
將得到的文本與預先建立的文本庫進行匹配,以得到所述每幀圖像中的不良文本和所述不良文本的等級,其中所述文本檢測結果包括所述每幀圖像中的不良文本和所述不良文本的等級。
優選地,對子段視頻進行話音檢測,得到子段視頻的話音檢測結果,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍信息工程大學,未經中國人民解放軍信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510764366.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:預應力鋼儲罐
- 下一篇:大面積被栓式瓷磚干掛施工方法





