[發明專利]一種基于用戶ID識別有害視頻的方法及其系統在審
| 申請號: | 201711500071.8 | 申請日: | 2017-12-30 |
| 公開(公告)號: | CN109993036A | 公開(公告)日: | 2019-07-09 |
| 發明(設計)人: | 蔡昭權;胡松;胡輝;蔡映雪;陳伽;黃翰;梁椅輝;羅偉;黃思博 | 申請(專利權)人: | 惠州學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 北京中濟緯天專利代理有限公司 11429 | 代理人: | 覃婧嬋 |
| 地址: | 516007 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 權重因子 視頻 圖像文件 網頁 用戶ID識別 頁面內容 頁面元素 直流系數 輸出 壓縮域 幀畫面 解壓 指向 查詢 | ||
一種識別有害視頻的方法及其系統,其方法包括:當判斷出網頁的頁面元素包含視頻的URL路徑時,獲取所述網頁的頁面內容中記載的用戶ID,依據視頻的URL路徑獲取所述URL中包含的域名或所述URL指向的IP地址,并且基于所述用戶ID、IP地址和域名的相關查詢輸出第一權重因子、第二權重因子;并且,進一步獲取視頻中的多個幀畫面的圖像文件,并在圖像文件的壓縮域中提取直流系數,以便對圖像文件進行部分解壓后識別所述圖像文件,并根據識別圖像文件的結果輸出第三權重因子;綜合第一權重因子和第二權重因子以及第三權重因子,對所述視頻是否屬于有害視頻進行識別。
技術領域
本公開屬于信息安全領域,例如涉及一種識別有害視頻的方法及其系統。
背景技術
在信息社會,到處充斥信息流,包括但不限于文本、視頻、音頻、圖片等。其中,視頻文件往往包括聽覺信息和視覺信息,表達能力更加全面。然而,隨著移動互聯網的普及,網絡上充斥大量有害視頻內容,由于視覺直觀性、沖擊性等特點,其危害性更加甚于有害文本、有害圖片和有害音頻等,因此對這些有害視頻進行識別,進而進行過濾、刪除、消除危害,是十分必要的。
對于網絡有害視頻的識別,現在的技術主要有可以分為兩大類,一種是傳統方法,其中又包括兩類:(1)基于單模態特征的識別方法。這類方法主要是提取視頻的視覺特征,根據這些特征來構造分類器。例如在暴力視頻識別上,常見的特征有視頻運動矢量、顏色、紋理以及形狀等。(2)基于多模態特征融合的識別方法,這類方法主要是提取視頻的多個模態的特征,將其融合以構造分類器。例如在暴力視頻識別上,除了視頻特征外,很多方法還提取音頻特征,包括短時能量,突發聲音等。有些方法還考慮了網絡視頻周圍的文本,從這些文本中繼續提取一些特征用于融合識別。另一種是深度學習的方法:(1)CNN 利用卷積神經網絡對資料庫中的敏感有害圖像進行識別處理,得到有害敏感視頻的內部特征,利用學習到的有害視頻框架判斷得到的視頻幀中是否有有害信息。(2)RNN循環神經網絡,直接將資料庫中的視頻序列輸入循環神經網絡中識別有害視頻信息,學習到有害視頻的框架,利用學習到的有害視頻框架判斷識別新的視頻是否為有害視頻。 (3)CNN+RNN,利用CNN學習視頻中圖像幀中的空間域信息,利用 RNN識別視頻序列中的時間域信息,最后將兩者結合進行識別判斷,利用學習到的框架對視頻進行識別。
現有的圖像處理手段主要有下面兩種方法:傳統方法和深度學習方法。其中傳統方法中經典的方法詞包模型,該模型由四個部分組成: (1)底層的特征提取階段(2)特征編碼(3)特征匯聚(4)使用合適的分類器進行分類。深度學習模型是另一種圖像處理的模型,主要有自編碼器,受限波爾茲曼機,深度信念網絡,卷積神經網絡,循環神經網絡等。隨著計算機硬件的不斷進步,數據庫的完善,使用傳統的方法運算過程相比于深度學習來說較為簡單,深度學習方法能夠學習到更有意義的數據,并根據任務不斷進行參數調整,所以對于圖像處理方面,深度學習模型有更強大的特征表達能力。
現有的識別方法在在識別效率上都有所不足,在大數據和人工智能發展的情形下,如何高效的識別有害視頻,就成為一個需要考慮的問題。
發明內容
本公開提供了一種識別有害視頻的方法,包括:
步驟a),當判斷出網頁的頁面元素包括視頻的URL路徑時,識別所述網頁的頁面內容中記載的用戶ID,在第一數據庫中查詢是否存在所述ID,并根據ID的查詢結果輸出第一權重因子;
步驟b),依據視頻的URL路徑獲取所述URL中包含的域名或所述URL指向的IP地址,基于所述URL中包含的域名,在第二數據庫中進行whois查詢,和/或基于所述URL指向的IP地址,在第二數據庫中查詢是否存在所述URL中包含的IP地址或同一網段IP地址,并根據whois查詢結果和/或IP地址的查詢結果,輸出與視頻的URL路徑相關的第二權重因子;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于惠州學院,未經惠州學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711500071.8/2.html,轉載請聲明來源鉆瓜專利網。





