[發明專利]一種鑒別垃圾信息的方法、裝置、存儲介質和設備在審
| 申請號: | 201811343360.6 | 申請日: | 2018-11-13 |
| 公開(公告)號: | CN109451447A | 公開(公告)日: | 2019-03-08 |
| 發明(設計)人: | 李佳;李強 | 申請(專利權)人: | 北京奇虎科技有限公司 |
| 主分類號: | H04W4/12 | 分類號: | H04W4/12;H04W12/12 |
| 代理公司: | 北京華沛德權律師事務所 11302 | 代理人: | 房德權 |
| 地址: | 100088 北京市西城區新*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 非文本信息 存儲介質 垃圾信息 預設規則 垃圾短信 信息鑒別 鑒別 | ||
1.一種鑒別垃圾信息的方法,其特征在于,包括:
從待鑒別的信息中提取出非文本信息;
判斷所述非文本信息是否滿足第一預設規則;
如果所述非文本信息滿足第一預設規則,將所述信息鑒別為垃圾信息。
2.如權利要求1所述的方法,其特征在于,如果所述非文本信息包括圖片,所述判斷所述非文本信息是否滿足第一預設規則,包括:
判斷所述圖片中是否包含預設特征元素;
如果所述圖片包含所述預設特征元素,表示所述非文本信息滿足所述第一預設規則。
3.如權利要求1所述的方法,其特征在于,如果所述非文本信息包括圖片,所述判斷所述非文本信息是否滿足第一預設規則,包括:
判斷所述圖片對應的特征字符串是否包含預設字符串;
如果所述圖片對應的特征字符串包含所述預設字符串,表示所述非文本信息滿足所述第一預設規則。
4.如權利要求1所述的方法,其特征在于,所述方法還包括:
從所述信息中提取出文本信息;
判斷所述文本信息是否滿足第二預設規則;
如果所述非文本信息滿足所述第一預設規則,和/或所述文本信息滿足所述第二預設規則,將所述信息鑒別為垃圾信息。
5.如權利要求4所述的方法,其特征在于,如果所述非文本信息包括音頻,所述判斷所述非文本信息是否滿足第一預設規則,包括:
將所述音頻轉化為子文本信息;
判斷所述子文本信息是否滿足所述第二預設條件;
如果所述子文本信息滿足所述第二預設條件,表示所述非文本信息滿足所述第一預設條件。
6.如權利要求1所述的方法,其特征在于,在所述從待鑒別的信息中提取出非文本信息之前,還包括:
從所述信息中提取所述信息的發送者號碼;
判斷所述發送者號碼是否為異常號碼;
如果所述發送者號碼為所述異常號碼,將所述信息鑒別為垃圾信息;如果所述發送者號碼不為所述異常號碼,則執行所述從待鑒別的信息中提取出非文本信息的步驟。
7.如權利要求6所述的方法,其特征在于,所述判斷所述發送者號碼是否為異常號碼,包括:
判斷所述發送者號碼在第一預設時間段內的發送量是否達到第一閾值,或者判斷所述發送者號碼在第二預設時間段內針對所述信息的發送量是否達到第二閾值;
如果所述發送者號碼在所述第一預設時間段內的發送量達到所述第一閾值,或者所述發送者號碼在所述第二預設時間段內針對所述信息的發送量達到所述第二閾值,表示所述發送者號碼為異常號碼。
8.一種鑒別垃圾信息的裝置,其特征在于,包括:
第一提取模塊,用于從待鑒別的信息中提取出非文本信息;
第一判斷模塊,用于判斷所述非文本信息是否滿足第一預設規則;
鑒別模塊,用于如果所述非文本信息滿足第一預設規則,將所述信息鑒別為垃圾信息。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現權利要求1-7任一項所述方法的步驟。
10.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現權利要求1-7任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇虎科技有限公司,未經北京奇虎科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811343360.6/1.html,轉載請聲明來源鉆瓜專利網。





