[發明專利]文本內容檢測方式確定方法、裝置、設備和存儲介質在審
| 申請號: | 202011216570.6 | 申請日: | 2020-11-04 |
| 公開(公告)號: | CN112395853A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 田育珅;程紅兵;沈瑞;舒樂樂;朱勤章 | 申請(專利權)人: | 蘇寧云計算有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06K9/62 |
| 代理公司: | 北京市萬慧達律師事務所 11111 | 代理人: | 喬長潔 |
| 地址: | 210000 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 內容 檢測 方式 確定 方法 裝置 設備 存儲 介質 | ||
本申請涉及一種文本內容檢測方式確定方法、裝置、計算機設備和存儲介質。該方法包括:獲取待檢測文本內容;從待檢測文本內容中確定當前檢測對象;根據當前檢測對象對待檢測文本內容進行特征處理,得到與待檢測文本內容對應的當前位置距離特征集合;獲取候選文本內容,根據當前檢測對象對候選文本內容進行特征處理,得到與候選文本內容對應的候選位置距離特征集合;根據當前位置距離特征集合和候選位置距離特征集合確定待檢測文本內容的檢測方式。采用本方法能夠減少文本內容的無效檢測,從而提高文本內容的檢測效率。
技術領域
本申請涉及計算機技術領域,特別是涉及一種文本內容檢測方式確定方法、裝置、計算機設備和存儲介質。
背景技術
在目前文本內容的檢測過程中,通常都是通過逐個對待檢測的文本內容中的字符進行檢測,最終得到檢測結果。然而,在遇到文本內容較多重復的字符時,通過逐個字符的檢測這種方式需要花費更多的時間進行檢測,出現重復字符的無效檢測,從而造成文本內容檢測效率低。
發明內容
基于此,有必要針對上述技術問題,提供一種文本內容檢測方式確定方法、裝置、計算機設備和存儲介質,在待檢測文本內容進行檢測之前,通過待檢測文本內容中的當前檢測對象的位置距離特征來確定待檢測文本內容相應的檢測方式,可以減少文本內容的無效檢測,從而提高文本內容的檢測效率。
一種文本內容檢測方式確定方法,該方法包括:
獲取待檢測文本內容;
從待檢測文本內容中確定當前檢測對象;
根據當前檢測對象對待檢測文本內容進行特征處理,得到與待檢測文本內容對應的當前位置距離特征集合;
獲取候選文本內容,根據當前檢測對象對候選文本內容進行特征處理,得到與候選文本內容對應的候選位置距離特征集合;
根據當前位置距離特征集合和候選位置距離特征集合確定待檢測文本內容的檢測方式。
在其中一個實施例中,根據當前檢測對象對待檢測文本內容進行特征處理,得到與待檢測文本內容對應的當前位置距離特征集合,包括:獲取當前檢測對象在待檢測文本內容中的第一位置;根據指定順序遍歷待檢測文本內容,獲取待檢測文本內容中的上一個當前檢測對象;獲取上一個當前檢測對象在待檢測文本內容中的第二位置;根據第一位置和第二位置計算得到當前檢測對象在待檢測文本內容的當前位置距離特征;獲取下一個當前檢測對象,將下一個當前檢測對象確定為當前檢測對象,返回步驟根據指定順序遍歷待檢測文本內容,直至得到各個當前待檢測對象對應的當前位置距離特征;根據各個當前待檢測對象對應的當前位置距離特征生成待檢測文本內容對應的當前位置距離特征集合。
在其中一個實施例中,根據當前檢測對象對候選文本內容進行特征處理,得到與候選文本內容對應的候選位置距離特征集合,包括:獲取當前檢測對象在候選文本內容中的第三位置;根據指定順序遍歷候選文本內容,獲取候選文本內容中的上一個當前檢測對象;獲取上一個當前檢測對象在候選文本內容中的第四位置;根據第三位置和第四位置計算得到當前檢測對象在候選文本內容的當前候選位置距離特征;獲取下一個當前檢測對象,將下一個當前檢測對象確定為當前檢測對象,返回步驟根據指定順序遍歷候選文本內容,直至得到各個當前待檢測對象對應的當前候選位置距離特征;根據各個當前待檢測對象對應的當前位置距離特征生成與候選文本內容對應的候選位置距離特征集合。
在其中一個實施例中,根據當前位置距離特征集合和候選位置距離特征集合確定待檢測文本內容的檢測方式,包括:在當前位置距離特征集合與候選位置距離特征集合匹配時,確定待檢測文本內容的檢測方式為待檢測文本內容中各個檢測對象進行逐個檢測;在當前位置距離特征集合與候選位置距離特征集合不匹配時,確定待檢測文本內容的檢測方式為不進行待檢測文本內容的檢測。
在其中一個實施例中,待檢測文本內容為待檢測中文文本內容,待檢測英文文本內容,待檢測字符串中的至少一個。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇寧云計算有限公司,未經蘇寧云計算有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011216570.6/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





