[發明專利]適于多個中文敏感詞句的識別處理方法及裝置有效

申請號：	201710072161.5	申請日：	2017-02-08
公開（公告）號：	CN106951437B	公開（公告）日：	2019-11-01
發明（設計）人：	喻民;劉超;盧越;李敏;姜建國	申請（專利權）人：	中國科學院信息工程研究所
主分類號：	G06F16/332	分類號：	G06F16/332
代理公司：	北京路浩知識產權代理有限公司 11002	代理人：	李相雨
地址：	100093 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	適于中文敏感詞句識別處理方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種適于多個中文敏感詞句的識別處理方法，其特征在于，包括：

獲取多個預設的敏感詞句；

根據所述敏感詞句建立后綴樹；

獲取待識別中文文本；

根據所述后綴樹對所述待識別中文文本進行匹配；

若匹配成功后，獲取所述待識別中文本中的敏感詞句并輸出顯示；

其中，所述根據所述敏感詞句建立后綴樹，包括：

S21、根據多個預設的敏感詞句，建立模式串集合P(P₁,P₂,P₃,P₄,P₅...P_n)；

S22、設置一根節點，所述根節點的屬性值為第一預設值，所述第一預設值為任一拼音字母的排列值；

S23、選取所述模式串集合中的任一敏感詞句P_i，所述敏感詞句P_i的字符串長度為m；

S24、獲取所述敏感詞句P_i的第m個字符，對第m個字符解析得到對應拼音的頭字母，根據所述頭字母和預設的拼音字母與排列值的對應關系獲得所述頭字母的排列值；

S25、判斷所述頭字母的排列值是否小于第一預設值，若小于，則將第m個字符對應的節點設置在所述根節點的左側，反之，則設置在所述根節點的右側；

S25、依次獲取所述敏感詞句P_i的第m-1，m-2，……，2，1個字符，循環步驟S24-S25將第m-1，m-2，……，2，1個字符對應的節點設置在第m，m-1，……，2個字符節點的孩子節點上。

2.根據權利要求1所述的方法，其特征在于，根據所述后綴樹對所述待識別中文文本進行匹配，包括：根據所述后綴樹采用BM算法對所述待識別中文文本進行匹配。

3.根據權利要求1所述的方法，其特征在于，所述敏感詞句包括單字、詞組和語句。

4.根據權利要求1所述的方法，其特征在于，若匹配未成功后，發出提示信息。

5.一種適于多個中文敏感詞句的識別處理裝置，其特征在于，包括：

第一獲取模塊，用于獲取多個預設的敏感詞句；

處理模塊，用于根據所述敏感詞句建立后綴樹；

第二獲取模塊，用于獲取待識別中文文本；

匹配模塊，用于根據所述后綴樹對所述待識別中文文本進行匹配；

顯示模塊，用于在匹配成功后，獲取所述待識別中文本中的敏感詞句并輸出顯示；

其中，所述處理模塊具體用于：

S21、根據多個預設的敏感詞句，建立模式串集合P(P₁,P₂,P₃,P₄,P₅...P_n)；

S22、設置一根節點，所述根節點的屬性值為第一預設值，所述第一預設值為任一拼音字母的排列值；

S23、選取所述模式串集合中的任一敏感詞句P_i，所述敏感詞句P_i的字符串長度為m；

S25、判斷所述頭字母的排列值是否小于第一預設值，若小于，則將第m個字符對應的節點設置在所述根節點的左側，反之，則設置在所述根節點的右側；

6.根據權利要求5所述的裝置，其特征在于，所述匹配模塊具體用于：根據所述后綴樹采用BM算法對所述待識別中文文本進行匹配。

7.根據權利要求5所述的裝置，其特征在于，所述敏感詞句包括單字、詞組和語句。

8.根據權利要求5所述的裝置，其特征在于，所述顯示模塊還用于：在匹配未成功后，發出提示信息。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于中國科學院信息工程研究所，未經中國科學院信息工程研究所許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710072161.5/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06F 電數字數據處理

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】