[發明專利]敏感關鍵詞組處理方法、裝置、設備及介質在審
| 申請號: | 202210675022.2 | 申請日: | 2022-06-15 |
| 公開(公告)號: | CN114943218A | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 李曉林;楊旭東;趙睿;王大慶;辛偉平;邸宴龍;張艦 | 申請(專利權)人: | 中網華信科技股份有限公司 |
| 主分類號: | G06F40/232 | 分類號: | G06F40/232;G06F40/284;G06F40/143;G06F21/62;G06F21/60 |
| 代理公司: | 北京維正專利代理有限公司 11508 | 代理人: | 張偉 |
| 地址: | 030082 山西省太原市山西綜改示范區太*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 敏感 關鍵 詞組 處理 方法 裝置 設備 介質 | ||
1.一種敏感關鍵詞組處理方法,其特征在于,包括:
獲取文本信息,提取所述文本信息中的所有文字;
基于預設敏感關鍵詞組確定所述所有文字中的待檢驗文字組,其中所述待檢驗文字中包括與所述預設敏感關鍵詞組中讀音相同的文字;
若所述待檢驗文字組與所述預設敏感關鍵詞組不一致,則判斷所述待檢驗文字組中是否包含錯別字;
若是,則對所述錯別字進行更改。
2.根據權利要求1所述的方法,其特征在于,所述基于預設敏感關鍵詞組確定所述所有文字中的待檢驗文字組,包括:
將所述所有文字轉換為第一拼音組;
將每個所述敏感關鍵詞組均轉換為一個第二拼音組;
判斷所述第一拼音組中是否存在所述第二拼音組;
若所述第一拼音組中存在所述第二拼音組,則獲取所述文本信息中與所述第二拼音組對應的文字組,并將所述文字組作為所述待檢驗文字組。
3.根據權利要求1或2所述的方法,其特征在于,所述判斷所述待檢驗文字組中是否包含錯別字,包括:
獲取所述待檢驗文字組在所述文本信息的第一標記位置;
獲取歷史文本信息,在所述歷史文本信息查找與所述第一標記位置對應第二標記位置;
基于所述第二標記位置確定對所述歷史文本信息的文字搜索范圍;
若所述文字搜索范圍內不包含所述待檢驗文字組,則判定所述待檢驗文字組包含錯別字;
所述對所述錯別字進行更改,包括:
將所述待檢驗文字組更新為所述預設敏感關鍵詞組。
4.根據權利要求1或2所述的方法,其特征在于,所述判斷所述待檢驗文字組中是否包含錯別字,包括:
將所述待檢驗文字組在所述文本信息中進行標記,將標記后的文本信息發送給輸入所述文本信息對應的賬號,以使用戶對標記的待檢驗文字組進行核查;
所述對所述錯別字進行更改,包括:
響應于用戶對所述標記后的文本信息的修改操作,將所述待檢驗文字組更新為所述預設敏感關鍵詞組。
5.根據權利要求3所述的方法,其特征在于,所述判斷所述第一拼音組中是否存在所述第二拼音組,包括:
獲取每個所述第二拼音組中每個字的拼音對應的首字母,并將多個所述首字母按照每個字在所述預設敏感關鍵詞組的順序進行排序,得到字母序列;
在所述第一拼音組中查找多個所述首字母,并對多個所述首字母進行標記;
對多個標記的所述首字母進行遍歷,得到與所述字母序列一致且連續的字母序列組;
提取第一拼音組中與所述字母序列組中的多個所述首字母對應的字的所有字母,并將所述多個字母作為第三字拼音組;
判斷所述第三拼音組與所述第二拼音組中的所有字母是否一致;
若是,則判定所述第一拼音組中包含所述第二拼音組。
6.根據權利要求3所述的方法,其特征在于,在將所述待檢驗文字組更新為所述預設敏感關鍵詞組之后,還包括:
對更新后的待檢驗文字組進行標記,以使用戶對所述更新后的待檢驗文字組進行核查。
7.根據權利要求2所述的方法,其特征在于,在所述將所述所有文字轉換為第一拼音組之后,還包括:
獲取相鄰兩個文字對應的拼音的首字母和尾字母,在不同字的相鄰的所述首字母和所述尾字母之間做標記;
在所述將每個所述敏感關鍵詞組均轉換為一個第二拼音組之后,還包括:
獲取所述敏感關鍵詞組的相鄰兩個文字對應的拼音的首字母和尾字母,在不同字的相鄰的所述首字母和所述尾字母之間做標記。
8.一種敏感關鍵詞組處理裝置,其特征在于,包括:
獲取模塊,用于獲取文本信息,提取所述文本信息中的所有文字;
確定模塊,用于基于預設敏感關鍵詞組確定所述所有文字中的待檢驗文字組,其中所述待檢驗文字中包括與所述預設敏感關鍵詞組中讀音相同的文字;
判斷模塊,用于若所述待檢驗文字組與所述預設敏感關鍵詞組不一致,則判斷所述待檢驗文字組中是否包含錯別字,若是,則對所述錯別字進行更改。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中網華信科技股份有限公司,未經中網華信科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210675022.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:陣列基板、顯示面板及顯示裝置
- 下一篇:一種可三維展開的圓錐狀充氣薄膜遮光罩





