[發明專利]一種輿情監測方法、裝置、設備及存儲介質有效
| 申請號: | 201711131841.6 | 申請日: | 2017-11-15 |
| 公開(公告)號: | CN107766577B | 公開(公告)日: | 2020-08-21 |
| 發明(設計)人: | 田植良;董大祥;于佃海 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 輿情 監測 方法 裝置 設備 存儲 介質 | ||
本發明實施例公開了一種輿情監測方法、裝置、設備及存儲介質。其中,該方法包括:依據原始樣本和原始樣本的輿情監測結果對所述原始樣本進行脫敏處理,得到所述原始樣本的對抗樣本,且將所述原始樣本的輿情監測結果作為對應的對抗樣本的輿情監測結果;依據所述對抗樣本以及所述對抗樣本的輿情監測結果進行深度神經網絡模型訓練得到輿情監測模型;采用所述輿情監測模型進行輿情監測。本發明實施例提供的技術方案,通過引入對抗學習機制,利用對抗樣本,提高了模型抗干擾能力、抗噪能力及抗迷惑能力,進而提高了輿情監控的準確率和召回率。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種輿情監測方法、裝置、設備及存儲介質。
背景技術
在信息時代,隨著互聯網技術發展,越來越多的新聞資訊進入大眾視野,信息科技相關產品與網民日常生活息息相關。越來越多的人功過通過信息化產品進行聊天,如微信等,但是很多不法分子利用通訊工具做非法的事情。論壇等場所也可能被不法分子利用。針對互聯網產品中文本的輿情監控尤為重要。輿情監控旨在監測出文本中是否有危險行為,是一個分類任務,對每一句話做分類,分類結果為:危險或不危險兩類。
目前,現有輿情監控方法主要包括:1)基于字面匹配的輿情監測,通過列出一些危險關鍵字,若命中關鍵詞則確定分類結果是危險;2)傳統機器學習任務的輿情監控,通過提取一些特征使用機器學習模型進行分類:3)傳統深度神經網絡進行輿情監控,通過自動學習特征,進行危險分類。
但是,上述輿情監控方法分別存在如下問題:1)基于字面匹配的輿情監測存在召回率低,容易被類似的關鍵詞偽裝迷惑的問題;2)傳統機器學習任務的輿情監控存在準確率和召回率不好控制,需要大量人工的特征工程的問題;3)傳統深度神經網絡進行輿情監控,雖然不需要大量人工的特征工程,但仍有些樣本容易被迷惑,導致類別識別錯誤,召回率低,但整體上準確率和召回率比傳統機器學習模型、關鍵詞匹配好。
發明內容
本發明實施例提供一種輿情監測方法、裝置、設備及存儲介質,可以提高模型抗干擾能力、抗噪能力及抗迷惑能力,進而提高輿情監控的準確率和召回率。
第一方面,本發明實施例提供了一種輿情監測方法,該方法包括:
依據原始樣本和原始樣本的輿情監測結果對所述原始樣本進行脫敏處理,得到所述原始樣本的對抗樣本,且將所述原始樣本的輿情監測結果作為對應的對抗樣本的輿情監測結果;
依據所述對抗樣本以及所述對抗樣本的輿情監測結果進行深度神經網絡模型訓練得到輿情監測模型;
采用所述輿情監測模型進行輿情監測。
第二方面,本發明實施例還提供了一種輿情監測裝置,該裝置包括:
對抗樣本生成模塊,用于依據原始樣本和原始樣本的輿情監測結果對所述原始樣本進行脫敏處理,得到所述原始樣本的對抗樣本,且將所述原始樣本的輿情監測結果作為對應的對抗樣本的輿情監測結果;
輿情監測模型生成模塊,用于依據所述對抗樣本以及所述對抗樣本的輿情監測結果進行深度神經網絡模型訓練得到輿情監測模型;
輿情監測模塊,用于采用所述輿情監測模型進行輿情監測。
第三方面,本發明實施例還提供了一種設備,該設備包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現第一方面中任意所述的輿情監測方法。
第四方面,本發明實施例還提供了一種存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現第一方面中任意所述的輿情監測方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711131841.6/2.html,轉載請聲明來源鉆瓜專利網。





