[發明專利]文本比較方法、裝置、計算機設備和存儲介質有效
| 申請號: | 201910297625.1 | 申請日: | 2019-04-15 |
| 公開(公告)號: | CN110147429B | 公開(公告)日: | 2023-08-15 |
| 發明(設計)人: | 余寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/194 | 分類號: | G06F40/194;G06F40/216;G06F16/33 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 于亭 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 比較 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種文本比較方法,其特征在于,包括以下步驟:
獲取第一文本及第二文本,將所述第一文本及所述第二文本分別轉換成單行文字,并將轉換后的所述第一文本及所述第二文本分別映射到X軸和Y軸;
對在X軸上的所述第一文本及在Y軸上的所述第二文本進行遍歷查詢,獲取所述第一文本與所述第二文本中相同文字的匹配點信息;
根據所述第一文本與所述第二文本中相同文字的匹配點信息進行統計,獲取文本比較結果;
所述對在X軸上的所述第一文本及在Y軸上的所述第二文本進行遍歷查詢,獲取所述第一文本與所述第二文本中相同文字的匹配點信息,包括:
對在X軸上的所述第一文本及在Y軸上的所述第二文本進行遍歷查詢,獲取第一匹配點信息;
根據所述第一匹配點信息獲取遍歷區域,并在所述遍歷區域上對所述第一文本及所述第二文本進行遍歷查詢,獲取其余匹配點信息;
所述對在X軸上的所述第一文本及在Y軸上的所述第二文本進行遍歷查詢,獲取第一匹配點信息,包括:
對在X軸上的所述第一文本及在Y軸上的所述第二文本進行遍歷查詢,獲取所述第一文本與所述第二文本中相同文字對應的坐標點;
在所述相同文字對應的坐標點中查詢與原點距離最近的坐標點,將所述與原點距離最近的坐標點標記為第一匹配點;
所述根據所述第一匹配點信息獲取遍歷區域,并在所述遍歷區域上對所述第一文本及所述第二文本進行遍歷查詢,獲取其余匹配點信息,包括:
獲取所述第一文本及所述第二文本中最后一個文字對應的坐標點,將所述坐標點與所述第一匹配點對應的坐標點之間的矩形區域作為遍歷區域,在所述遍歷區域上對所述第一文本及所述第二文本進行遍歷查詢;
當獲取到新的匹配點時,更新所述遍歷區域,并在新的遍歷區域上繼續進行遍歷查詢,直至沒有下一個匹配點出現為止;
所述當獲取到新的匹配點時,更新所述遍歷區域,并在所述新的遍歷區域上繼續進行遍歷查詢,直至沒有下一個匹配點出現為止,包括:
當獲取到新的匹配點時,將所述第一文本及所述第二文本中最后一個文字對應的坐標點與所述新的匹配點對應的坐標點之間的矩形區域作為新的遍歷區域;
在所述新的遍歷區域上對除所述新的匹配點之外的區域進行遍歷查詢,直至沒有下一個匹配點出現為止;
所述根據所述第一文本與所述第二文本中相同文字的匹配點信息進行統計,獲取文本比較結果,包括:
根據所述第一文本與所述第二文本中相同文字的匹配點信息統計匹配點的數目;
獲取所述第一文本及所述第二文本的文字長度,并根據所述文字長度中的較短文字長度與所述匹配點的數目獲得文本比較結果;
所述獲取所述第一文本及所述第二文本的文字長度,并根據所述文字長度中的較短文字長度與所述匹配點的數目獲得文本比較結果包括:
將所述第一文本的文字長度和第二文本的文字長度進行比較;
若兩個文本的文字長度不同,則將所述兩個文本長度中較短的文字長度確定為目標文字長度;
若所述兩個文本的文字長度相同,則將任意一個文本的文字長度確定為目標文字長度;
將所有匹配點的數目除以目標文字長度就可以獲得兩個文本的相似度。
2.如權利要求1所述的文本比較方法,其特征在于,所述將轉換后的所述第一文本及所述第二文本分別映射到X軸和Y軸,包括:
將轉換后的所述第一文本映射到X軸的任一象限,將轉換后的所述第二文本映射到Y軸的與所述第一文本相同的象限;
將轉換后的所述第一文本的第一個文字對應X軸所屬象限上的任一個坐標點,將轉換后的所述第二文本的第一個文字對應Y軸所屬象限上的任一個坐標點。
3.一種文本比較裝置,其特征在于,所述文本比較裝置執行如權利要求1或權利要求2所述文本比較方法,所述文本比較裝置包括:
文本映射模塊:設置為獲取第一文本及第二文本,將所述第一文本及所述第二文本分別轉換成單行文字,并將轉換后的所述第一文本及所述第二文本分別映射到X軸和Y軸;
匹配點查詢模塊:設置為對在X軸上的所述第一文本及在Y軸上的所述第二文本進行遍歷查詢,獲取所述第一文本與所述第二文本中相同文字的匹配點信息;
文本比較模塊:設置為根據所述第一文本與所述第二文本中相同文字的匹配點信息進行統計,獲取文本比較結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910297625.1/1.html,轉載請聲明來源鉆瓜專利網。





