[發明專利]交互過程中智能識別并處理敏感內容的方法及系統在審
| 申請號: | 201710334441.9 | 申請日: | 2017-05-12 |
| 公開(公告)號: | CN107169092A | 公開(公告)日: | 2017-09-15 |
| 發明(設計)人: | 杜洪博;樊磊;王軍;方駿達;汪鐵豐 | 申請(專利權)人: | 暴風體育(北京)有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京晟睿智杰知識產權代理事務所(特殊普通合伙)11603 | 代理人: | 于淼 |
| 地址: | 100191 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 交互 過程 智能 識別 處理 敏感 內容 方法 系統 | ||
技術領域
本發明涉及網絡交互管理的技術領域,更具體地,涉及一種交互過程中智能識別并處理敏感內容的方法及系統。
背景技術
隨著網絡技術的發展,各種社交應用程序(APP)、社交平臺的推出,社交聊天逐漸成為了人們常用的信息交互方式,但是社交過程中人員錯綜復雜,聊天內容也是各種各樣,聊天內容多,為保證聊天質量,社交系統需要屏蔽一些不文明或不合法的敏感詞匯或發廣告(即社交敏感內容,也有的稱其為黃版詞匯)。
目前,現有技術中通過將聊天詞匯與預設的黃版數據庫中詞匯對比搜索識別是否為黃版詞匯,如果發現有黃版詞匯,對其使用者的ID進行屏蔽。但是,用戶如果采用其它形式詞匯替代存在于詞庫中的黃版詞匯,如將“8”替換為“八”的形式,就能繞過屏蔽,不能達到預期的黃版詞匯屏蔽的目的。而且網絡詞匯更新換代如此之快,現有系統對新興的敏感內容的自動識別能力還不夠強,在數據庫中也不能智能地、及時地收錄這些新興的敏感詞匯內容。
再者,中英文相結合的多個詞匯的組合就能得到各種不同的詞匯含義,對于如此之多的組合形式,采用現有的敏感詞匯庫匹配對比查詢敏感詞匯的方式難道較大且準確性不高,還需要消耗較長的匹配比對時間,執行效率不高,不能夠全面地、準確地改變現有敏感詞匯的使用和傳播。而誤操作屏蔽用戶之后的申訴過程又很復雜,對用戶造成很不好的使用體驗。
因此,提供一種智能化、準確度高、操作簡便及效率高的交互過程中敏感內容處理方案是本領域亟待解決的問題。
發明內容
有鑒于此,本發明提供了一種交互過程中智能識別并處理敏感內容的方法及系統,解決了現有技術中不能智能化集中處理交互過程中敏感內容的技術問題。
為了解決上述技術問題,本發明提出一種交互過程中智能識別并處理敏感內容的方法,包括:
接收預設敏感內容,按照AC自動機的機制將所述預設敏感內容編譯成自動機;將所述自動機按照預設的關鍵字編碼的字符順序排列,并根據所述字符順序排列將所述自動機構建成自動機搜索樹,并將所述自動機搜索樹存儲至遠程網絡請求服務平臺上;
接收客戶端的交互內容,解析所述交互內容得到交互字符,通過遠程服務協議在所述自動機搜索樹中逐字讀入所述交互字符,通過所述交互字符遍歷所述自動機搜索樹得到所述交互內容中的敏感內容;
搜索所述客戶端的歷史交互記錄,得到所述敏感內容出現的次數,結合預先設置的敏感內容處理策略,對所述客戶端執行相應的處理操作;
基于當前的所述字符順序排列,根據所述敏感內容更新所述自動機搜索樹;
將更新后的所述自動機搜索樹及所述敏感內容對應的處理策略存儲至所述遠程網絡請求服務平臺上;
統計所述交互字符在交互過程中出現的次數,在所述交互字符在交互過程中出現的次數大于或等于敏感次數時,將所述交互字符反饋至管理端口;
接收所述管理端口的敏感內容指令,并根據所述敏感內容指令將所述交互字符更新至所述自動機搜索樹中。
進一步地,其中,所述敏感內容處理策略,為:
所述敏感內容出現次數小于或等于設定次數時,在交互界面中屏蔽該敏感內容,并向所述客戶端發送警示消息;
所述敏感內容出現次數大于設定次數且小于或等于設定次數閾值時,在交互界面中屏蔽該敏感內容,并將所述客戶端屏蔽預設時間;
所述敏感內容出現次數大于所述設定次數閾值時,在交互界面中屏蔽該敏感內容,并屏蔽所述客戶端。
進一步地,其中,所述設定次數,為一到三次;所述設定次數閾值,為三到五次。
進一步地,其中,將所述自動機按照預設的關鍵字編碼的字符順序排列,并根據所述字符順序排列將所述自動機構建成自動機搜索樹,為:
根據預設的自動機擴展策略獲取所述自動機對應的擴展自動機;
將所述自動機及其擴展自動機按照預設的關鍵字編碼的字符順序排列,并根據所述字符順序排列將所述自動機構建成自動機搜索樹。
另一方面,本發明還提供一種交互過程中智能識別并處理敏感內容的系統,包括:自動機搜索樹創建模塊、敏感內容獲取模塊、敏感內容處理模塊、自動機搜索樹更新模塊及敏感內容處理策略存儲模塊;其中,
所述自動機搜索樹創建模塊,用于與所述敏感內容獲取模塊相連接,接收預設敏感內容,按照AC自動機的機制將所述預設敏感內容編譯成自動機;將所述自動機按照預設的關鍵字編碼的字符順序排列,并根據所述字符順序排列將所述自動機構建成自動機搜索樹,并將所述自動機搜索樹存儲至遠程網絡請求服務平臺上;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于暴風體育(北京)有限責任公司,未經暴風體育(北京)有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710334441.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據分析方法及裝置
- 下一篇:一種目標圖像的獲取方法及裝置





