[發明專利]數據處理方法及裝置有效
| 申請號: | 202011044074.7 | 申請日: | 2020-09-28 |
| 公開(公告)號: | CN112269904B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 何旭;王國賽 | 申請(專利權)人: | 華控清交信息科技(北京)有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F21/60;G06F21/62 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100084 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 方法 裝置 | ||
本發明提供了一種數據處理方法及裝置,通過獲取密文的目標字符串和字符串數組;基于密文計算目標字符串與字符串數組中的每個待匹配字符串的相似度值,得到相似度數組;通過密文比較操作,確定相似度數組中相似度值大于預設的密文相似度閾值的字符串的索引;將根據索引從字符串數組中提取到的字符串,作為目標字符串匹配到的字符串,本發明中,確定密文的字符串數組中與密文的目標字符串匹配的字符串的整個過程都是在密文的形式下處理的,并不會暴露目標字符串在字符串數組中匹配到的字符串的索引和真實值,提高了匹配過程中的數據安全性。
技術領域
本發明屬于計算機技術領域,特別是涉及一種數據處理方法及裝置。
背景技術
在日常生活中很多場景都會涉及到模糊匹配,例如,搜索引擎在互聯網絡中尋找和搜索詞相近的詞條,以供用戶獲取與搜索詞相同或類似的其他詞條。
在目前,匹配詞和待匹配詞都是在明文形式下進行模糊匹配的,并得到明文的匹配結果。發明人在實現本發明過程中,發現當前的模糊匹配至少存在以下問題:在明文形式下進行模糊匹配,會導致匹配過程中的數據安全性得不到保障,從而產生數據安全隱患。
發明內容
本發明提供一種數據處理方法及裝置,以便解決現有技術中產生數據安全隱患的問題。
為了解決上述技術問題,本發明是這樣實現的:
第一方面,本發明實施例提供了一種數據處理方法,用于確定密文的字符串數組包括的所有字符串中,與密文的目標字符串匹配的字符串,所述方法包括:
獲取密文的目標字符串和字符串數組;
基于密文計算所述目標字符串與所述字符串數組中的每個待匹配字符串的相似度值,得到相似度數組;
通過密文比較操作,確定所述相似度數組中相似度值大于預設的密文相似度閾值的字符串的索引;
將根據所述索引從所述字符串數組中提取到的字符串,作為所述目標字符串匹配到的字符串。
第二方面,本發明實施例提供了一種數據處理方法,用于確定字符串數組包括的所有字符串中,與目標字符串匹配的字符串,所述方法包括:
獲取密文的目標向量和向量數組,所述向量數組中的待匹配向量和所述目標向量的長度相同;其中,所述密文的目標向量為所述目標字符串按照預設編碼操作編碼后得到的向量進行密文化處理所得,所述向量數組為所述字符串數組按照預設編碼操作編碼后得到的向量進行密文化處理所得;
計算所述目標向量與所述向量數組中的待匹配向量的密文相似度值,得到相似度數組;
通過密文比較操作,確定所述相似度數組中相似度值大于預設的密文相似度閾值的向量的索引;
將根據所述索引從所述向量數組中提取到的向量對應的字符串,作為所述目標向量對應的目標字符串匹配到的字符串。
第三方面,本發明實施例提供了一種數據處理裝置,用于確定密文的字符串數組包括的所有字符串中,與密文的目標字符串匹配的字符串,所述裝置包括:
第一獲取模塊,用于獲取密文的目標字符串和字符串數組;
第一計算模塊,用于基于密文計算所述目標字符串與所述字符串數組中的每個待匹配字符串的相似度值,得到相似度數組;
第一比較模塊,用于通過密文比較操作,確定所述相似度數組中相似度值大于預設的密文相似度閾值的字符串的索引;
第一匹配模塊,用于將根據所述索引從所述字符串數組中提取到的字符串,作為所述目標字符串匹配到的字符串。
第四方面,本發明實施例提供了一種數據處理裝置,用于確定字符串數組包括的所有字符串中,與目標字符串匹配的字符串,所述裝置包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華控清交信息科技(北京)有限公司,未經華控清交信息科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011044074.7/2.html,轉載請聲明來源鉆瓜專利網。





