[發明專利]一種異常評論文本的確定方法及裝置有效
| 申請號: | 201810255066.3 | 申請日: | 2018-03-22 |
| 公開(公告)號: | CN108470065B | 公開(公告)日: | 2020-11-03 |
| 發明(設計)人: | 徐振中;肖依永;苑星龍 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 吳迪 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 異常 評論 文本 確定 方法 裝置 | ||
本申請實施例提供了一種異常評論文本的確定方法及裝置,其中,該方法包括:獲取待異常評論的多條評論文本;計算所述多條評論文本之間的相似度;基于所述相似度,對所述多條評論文本進行分類,得到分類評論文本集;對于任一分類評論文本集,將該任一分類評論文本集對應的評論文本輸入預先訓練的情感模型,得到該任一分類評論文本集對應的情感分數集;對各所述分類評論文本集對應的情感分數集進行驗證,獲取異常分類評論文本集,確定所述異常分類評論文本集中的所有評論文本為所述異常評論文本。本申請實施例提高了異常評論的檢測效率。
技術領域
本申請涉及文本檢測技術領域,具體而言,涉及一種異常評論文本的確定方法及裝置。
背景技術
商品評論網站中存在大量的異常評論。異常評論會對顧客的行為產生影響,造成商家之間的惡意競爭,形成不好的商業氛圍。異常評論主要包括虛假評論和極端評論。虛假評論是指用戶對商家產品進行惡意鼓吹或者是誹謗。極端評論是指用戶因個人情緒對商品做出不符合事實的評價。這兩種評論都會影響商家的信用評價。
現有的檢測異常評論和極端評論的手段主要是通過人工識別,但是人工識別的難度較大,準確率較低,而且效率也很低。
發明內容
有鑒于此,本申請的目的在于提供了一種異常評論文本的確定方法及裝置,以提高異常評論的檢測效率。
第一方面,本申請實施例提供了一種異常評論文本的確定方法,包括:
獲取待異常評論的多條評論文本;
計算所述多條評論文本中任意兩條評論文本之間的相似度;
基于所述相似度,對所述多條評論文本進行分類,得到分類評論文本集;
對于任一分類評論文本集,將該任一分類評論文本集對應的評論文本輸入預先訓練的情感模型,得到該任一分類評論文本集對應的情感分數集;
對各所述分類評論文本集對應的情感分數集進行驗證,獲取異常分類評論文本集,確定所述異常分類評論文本集中的所有評論文本為所述異常評論文本。
結合第一方面,本申請實施例提供了第一方面的第一種可能的實施方式,所述計算所述多條評論文本中任意兩條評論文本之間的相似度,包括:
基于預設的相似度衡量模型,對任意一條評論文本進行向量轉換,得到該任意一條評論文本的評論向量;
計算任意兩個評論向量之間的相似度。
結合第一方面的第一種可能的實施方式,本申請實施例提供了第一方面的第二種可能的實施方式,所述基于所述相似度,對所述多條評論文本進行分類,得到分類評論文本集,包括:
依據任意兩個評論向量之間的相似度,確定該任意兩個評論向量之間的向量距離;
按照所述向量距離對所述多條評論文本進行分類,得到分類評論文本集。
結合第一方面的第一種可能的實施方式,本申請實施例提供了第一方面的第三種可能的實施方式,所述基于預設的相似度衡量模型,對任意一條評論文本進行向量轉換之前,所述方法還包括:
對所述任意一條評論文本進行分詞處理;
過濾掉進行分詞處理后的所述任意一條評論文本中的停用詞,得到關鍵詞。
結合第一方面的第三種可能的實施方式,本申請實施例提供了第一方面的第四種可能的實施方式,所述基于預設的相似度衡量模型,對任意一條評論文本進行向量轉換,得到該任意一條評論文本的評論向量,包括:
對于任意一條評論文本,依次將該任意一條評論文本中的各關鍵詞轉換為對應的數字信息;
基于依次轉換得到的所述數字信息,生成該任意一條評論文本對應的評論向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810255066.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于智能機器人的新聞稿生成方法
- 下一篇:一種移動互聯網終端取證平臺





