[發明專利]錯別字檢測方法、裝置及計算機可讀存儲介質、終端設備有效
| 申請號: | 201810500259.0 | 申請日: | 2018-05-22 |
| 公開(公告)號: | CN108874770B | 公開(公告)日: | 2022-04-22 |
| 發明(設計)人: | 李賢 | 申請(專利權)人: | 廣州視源電子科技股份有限公司 |
| 主分類號: | G06F40/232 | 分類號: | G06F40/232;G06F40/289 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 梁順宜;郝傳鑫 |
| 地址: | 510530 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 錯別字 檢測 方法 裝置 計算機 可讀 存儲 介質 終端設備 | ||
本發明公開了一種錯別字檢測方法、裝置及計算機可讀存儲介質、終端設備,所述方法包括:接收待檢測語句;獲得待檢測語句中的待檢測文字的相鄰文字以及相鄰文字的第一混淆集;根據待檢測語句中的每個文字,獲得每個相鄰混淆文字的文字概率,并將文字概率最大的相鄰混淆文字作為目標相鄰混淆文字;將待檢測語句中的相鄰文字替換為目標相鄰混淆文字,獲得對應的相鄰混淆語句;根據相鄰混淆語句中的每個文字,分別獲得目標相鄰混淆文字的文字概率和待檢測文字的文字概率;根據目標相鄰混淆文字的文字概率和待檢測文字的文字概率,判斷待檢測文字是否為錯別字。本發明能夠提高錯別字檢測的準確率。
技術領域
本發明涉及文本處理技術領域,尤其涉及一種錯別字檢測方法、裝置及計算機可讀存儲介質、終端設備。
背景技術
文本是記載信息的重要載體,隨著信息處理技術和互聯網技術的高速發展,傳統的文本工作已逐漸被計算機等電子設備所取代,文本的生成方式也相應的由人工書寫變成了人工編輯,而人工編輯在實際操作時可能會出現操作失誤的情況,導致人工編輯的文本中出現錯別字,從而影響文本質量,因此,對錯別字的檢測具有十分重要的意義。
現有技術提供的錯別字檢測方法大都在接收到用戶輸入的文字后,對用戶輸入的文字進行一定的處理,然后計算得到處理之后的文字的概率并與預設的概率閾值進行比較,最后根據比較結果確定用戶輸入的文字是否為錯別字,當計算得到文字的概率小于預設的概率閾值時,判定用戶輸入的文字為錯別字,當計算得到文字的概率不小于預設的概率閾值時,判定用戶輸入的文字為正確字;由此可見,現有技術提供的技術方案在計算得到文字的概率之后往往只根據一個概率閾值來判斷文字的正確性,判斷方式較為簡單,且沒有考慮到文字所處的語句語境,因此,錯別字的檢測結果可能與實際情況不符,檢測準確率低。
發明內容
本發明實施例所要解決的技術問題在于,提供一種錯別字檢測方法、裝置及計算機可讀存儲介質、終端設備,能夠提高錯別字檢測的準確率。
為了解決上述技術問題,本發明實施例提供了一種錯別字檢測方法,包括:
接收待檢測語句;
獲得所述待檢測語句中的待檢測文字的相鄰文字以及所述相鄰文字的第一混淆集;其中,所述第一混淆集中包含M個相鄰混淆文字,M≥1;
根據所述待檢測語句中的每個文字,獲得每個所述相鄰混淆文字的文字概率,并將所述文字概率最大的相鄰混淆文字作為目標相鄰混淆文字;
將所述待檢測語句中的所述相鄰文字替換為所述目標相鄰混淆文字,獲得對應的相鄰混淆語句;
根據所述相鄰混淆語句中的每個文字,分別獲得所述目標相鄰混淆文字的文字概率和所述待檢測文字的文字概率;
根據所述目標相鄰混淆文字的文字概率和所述待檢測文字的文字概率,判斷所述待檢測文字是否為錯別字。
與現有技術相比,本發明實施例提供了一種錯別字檢測方法,根據待檢測文字的相鄰文字的混淆集對應獲得目標混淆語句,根據目標混淆語句計算獲得目標相鄰混淆文字的文字概率和待檢測文字的文字概率,并根據目標相鄰混淆文字的文字概率和待檢測文字的文字概率判斷待檢測文字是否為錯別字,可以解決現有技術中判斷方式簡單,且沒有考慮文字所處的語句語境,導致檢測準確率低的問題,能夠提高錯別字檢測的準確率。
進一步地,在所述接收待檢測語句之后,所述獲得所述待檢測語句中的待檢測文字的相鄰文字以及所述相鄰文字的第一混淆集之前,還包括:
判斷所述相鄰文字是否為錯別字且所述相鄰文字的文字概率是否小于0.00002;
則所述獲得所述待檢測語句中的待檢測文字的相鄰文字以及所述相鄰文字的第一混淆集,具體包括:
當所述相鄰文字為錯別字且所述相鄰文字的文字概率小于0.00002時,獲得與所述相鄰文字相對應的所述第一混淆集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州視源電子科技股份有限公司,未經廣州視源電子科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810500259.0/2.html,轉載請聲明來源鉆瓜專利網。





