[發明專利]一種結合深度學習和關鍵詞因子的不良信息監測方法在審
| 申請號: | 202011514673.0 | 申請日: | 2020-12-21 |
| 公開(公告)號: | CN112507086A | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 何秋蕓;高寧;舒玉鳳;柯細河 | 申請(專利權)人: | 中電福富信息科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/953 |
| 代理公司: | 福州君誠知識產權代理有限公司 35211 | 代理人: | 彭東 |
| 地址: | 350000 福建省福州*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 結合 深度 學習 關鍵詞 因子 不良信息 監測 方法 | ||
1.一種結合深度學習和關鍵詞因子的不良信息監測方法,其特征在于:其包括以下步驟:
步驟1,對樣本數據進行不良信息的關鍵詞提取和特殊規則提取;
步驟2,根據關鍵詞的影響力為每個關鍵詞歸類并確定影響分值;
步驟3,對于監測常信息進行各類不良關鍵詞的影響分值的綜合分計算,
步驟4,分別判斷各類影響分值的綜合分是否超過設定閾值,并將不良信息歸入超過閾值的對應分類。
2.根據權利要求1所述的一種結合深度學習和關鍵詞因子的不良信息監測方法,步驟1中通過深度學習進行不良信息的強規則和弱規則的提取,以便根據訓練好的模型得到的規則集進行文本的不良信息檢測測試。
3.根據權利要求1所述的一種結合深度學習和關鍵詞因子的不良信息監測方法,步驟2中關鍵詞分等級的分值根據影響力由小到大分別為0.02、0.05、0.1、0.21和0.31。
4.根據權利要求1所述的一種結合深度學習和關鍵詞因子的不良信息監測方法,步驟3中信息分類包括賭博類、色情類和正常類,具體的歸類方法如下:
步驟3-1,判斷不良信息的賭博類分數是否大于賭博閾值;是則,將該不良信息歸入賭博類;否則,執行步驟3-2;
步驟3-2,判斷不良信息的色情類分數是否大于色情閾值;是則,將該不良信息歸入色情類;否則,執行步驟3-3;
步驟3-3,更新正常的置信率并將該不良信息歸入正常類。
5.根據權利要求4所述的一種結合深度學習和關鍵詞因子的不良信息監測方法,賭博閾值和色情閾值均為0.8。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中電福富信息科技有限公司,未經中電福富信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011514673.0/1.html,轉載請聲明來源鉆瓜專利網。





