[發明專利]一種垃圾評論信息識別方法及裝置有效
| 申請號: | 201711481027.7 | 申請日: | 2017-12-29 |
| 公開(公告)號: | CN110020057B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 韓明清;惠友為;費菲;吳江;宋公良 | 申請(專利權)人: | 中國移動通信集團陜西有限公司;中國移動通信集團公司 |
| 主分類號: | G06F16/951 | 分類號: | G06F16/951;G06F40/216;G06F40/279 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 11291 | 代理人: | 郭潤湘 |
| 地址: | 710075*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 垃圾 評論 信息 識別 方法 裝置 | ||
本發明實施例提供一種垃圾評論信息識別方法及裝置,用于解決現有技術中服務器對垃圾評論信息的識別準確度較低的技術問題。該方法包括:包括以下步驟:獲取針對第一原文的待處理評論信息,并確定待處理評論信息對應的評論者ID以及第一原文對應的發布者ID;其中,待處理評論信息的內容具有至少一個預設特征;確定評論者ID針對發布者ID的至少一個原文發出的評論信息的總數量,以及目標評論信息的數量;其中,至少一個原文包括第一原文,目標評論信息為包含至少一個預設特征的評論信息;若確定目標評論信息的數量大于等于第一預設數量,且目標評論信息的數量與評論信息的總數量的比值大于等于預設比值,則確定待處理評論信息為垃圾評論信息。
技術領域
本發明涉及通信技術領域,特別涉及一種垃圾評論信息識別方法及裝置。
背景技術
隨著互聯網應用的普及,用戶可以通過各種方式在互聯網中發布相關內容,同時,觀看該內容的其他用戶也可以發布相關評論,甚至通過評論的方式與內容的發布者進行交互。
有些不法用戶,會在評論中插入隱含廣告或其它垃圾內容,例如qq號、微信號、超鏈接等。目前針對隱含垃圾內容的評論信息的方式中,主要是通過檢測評論信息中包括的相關的特征詞匯,如字符串、敏感詞匯等來識別垃圾評論信息。但在流行的社會化互聯網應用中,例如歌唱類具有社會化網絡特點的應用,將發布內容的用戶稱作主播,將參與評論的用戶稱作觀眾。觀眾在通過評論方式與主播進行互動時,評論的信息中可能包括了希望與主播建立聯系的訴求,例如在交互過程中,通過評論信息向主播推薦自己的字符串賬號等。如此,若按照上述的特殊詞匯的方式,該評論信息就極有可能被服務器屏蔽掉。
由此可見,現有技術中服務器對垃圾評論信息的識別準確度較低。
發明內容
本發明實施例提供一種垃圾評論信息識別方法及裝置,用于解決現有技術中服務器對垃圾評論信息的識別準確度較低的技術問題。
第一方面,本發明實施例提供一種垃圾評論信息識別方法,包括以下步驟:
獲取針對第一原文的待處理評論信息,并確定所述待處理評論信息對應的評論者ID以及所述第一原文對應的發布者ID;其中,所述待處理評論信息的內容具有至少一個預設特征;
確定所述評論者ID針對所述發布者ID的至少一個原文發出的評論信息的總數量,以及所述評論信息中目標評論信息的數量;其中,所述至少一個原文包括所述第一原文,所述目標評論信息為包含所述至少一個預設特征的評論信息;
若確定所述目標評論信息的數量大于等于第一預設數量,且所述目標評論信息的數量與所述評論信息的總數量的比值大于等于預設比值,則確定所述待處理評論信息為垃圾評論信息。
可選的,在確定所述評論者ID針對所述發布者ID的至少一個原文的評論信息的總數量,以及所述評論信息中包括的目標評論信息的數量之前,所述方法還包括:
確定所述發布者ID對應的關注者數量;
確定所述關注者數量大于等于第二預設數量。
可選的,在確定所述評論者ID針對所述發布者ID的至少一個原文發出的評論信息的總數量,以及所述評論信息中包括的目標評論信息的數量之后,所述方法還包括:
確定所述發布者ID對應的來自所述評論者ID的互動信息的數量,所述互動信息為所述評論者ID針對所述至少一個原文發出的;
根據所述評論信息的總數量及所述互動信息的數量,確定所述評論者ID對應的所述第一預設數量和所述預設比值。
可選的,根據所述評論信息的總數量及所述互動信息的數量,確定所述評論者ID對應的所述第一預設數量和所述預設比值,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國移動通信集團陜西有限公司;中國移動通信集團公司,未經中國移動通信集團陜西有限公司;中國移動通信集團公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711481027.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種股票資訊智能提取方法
- 下一篇:信息處理方法、裝置、設備及介質
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





