[發明專利]字符串集合的相似度確定方法、裝置、終端及可讀介質有效
| 申請號: | 201910073002.6 | 申請日: | 2019-01-25 |
| 公開(公告)號: | CN111488497B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 安旭;安偉佳 | 申請(專利權)人: | 北京沃東天駿信息技術有限公司 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F18/22 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100176 北京市大興區北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符串 集合 相似 確定 方法 裝置 終端 可讀 介質 | ||
本發明實施例公開了一種字符串集合的相似度確定方法、裝置、終端及可讀介質,其中該方法包括:根據預設規則確定獲取的兩個字符串集合中的第一字符串集合和第二字符串集合;遍歷第一字符串集合,根據遍歷的當前第一字符串與第二字符串集合中的各第二字符串的編輯距離,確定與當前第一字符串匹配的第二字符串,計算當前第一字符串與相匹配的第二字符串的相似度;根據各第一字符串與相匹配的第二字符串的相似度,確定第一字符串集合和第二字符串集合的相似度。本發明實施例提供的一種字符串集合的相似度確定方法、裝置、終端及可讀介質,實現了字符串集合的相似度確定。
技術領域
本發明實施例涉及計算機技術,尤其涉及一種字符串集合的相似度確定方?法、裝置、終端及可讀介質。
背景技術
現如今常將兩字符串間的編輯距離作為兩字符串間的相似度。字符串為數?字、字母和/或符號構成的一串字符。
在實現本發明過程中,發明人發現現有技術中至少存在如下問題:
現有技術只能對字符串間進行相似度確定,而不能對字符串集合之間進行?相似度確定。例如,當進行商品標題匹配的過程中,可以將兩商品標題的各維?度(如品牌詞、產品詞、規格詞和/或型號詞等)進行匹配,以確定商品間的匹?配關系。由于商品標題中型號詞可包括至少一個字符串,因此需要對字符串構?成的集合進行相似度分析,而現有技術沒有提供字符串集合的相似度確定方法。
發明內容
有鑒于此,本發明實施例提供了一種字符串集合的相似度確定方法、裝置、?終端及可讀介質,實現了字符串集合的相似度確定。
第一方面,本發明實施例提供了一種字符串集合的相似度確定方法,包括:
獲取兩個字符串集合,根據預設規則確定所述兩個字符串集合中的第一字?符串集合和第二字符串集合,其中所述第一字符串集合包括至少一個第一字符?串,所述第二字符串集合包括至少一個第二字符串;
遍歷所述第一字符串集合,根據遍歷的當前第一字符串與所述第二字符串?集合中的各第二字符串的編輯距離,確定與當前第一字符串匹配的第二字符串,?并計算當前第一字符串與相匹配的第二字符串的相似度;
根據所述第一字符串集合中各第一字符串與相匹配的第二字符串的相似?度,確定第一字符串集合和第二字符串集合的相似度。
第二方面,本發明實施例提供了一種字符串集合的相似度確定裝置,包括:
字符串集合獲取模塊,用于獲取兩個字符串集合,根據預設規則確定所述?兩個字符串集合中的第一字符串集合和第二字符串集合,其中所述第一字符串?集合包括至少一個第一字符串,所述第二字符串集合包括至少一個第二字符串;
字符串相似度確定模塊,用于遍歷所述第一字符串集合,根據遍歷的當前?第一字符串與所述第二字符串集合中的各第二字符串的編輯距離,確定與當前?第一字符串匹配的第二字符串,并計算當前第一字符串與相匹配的第二字符串?的相似度;
字符串集合相似度確定模塊,用于根據所述第一字符串集合中各第一字符?串與相匹配的第二字符串的相似度,確定第一字符串集合和第二字符串集合的?相似度。
第三方面,本發明實施例提供了一種終端,包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序;
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多?個處理器實現如本發明任一實施例所述的字符串集合的相似度確定方法。
第四方面,本發明實施例提供了一種計算機可讀存儲介質,其上存儲有計?算機程序,該程序被處理器執行時實現如本發明任一實施例所述的字符串集合?的相似度確定方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃東天駿信息技術有限公司,未經北京沃東天駿信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910073002.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種短距離單向通訊器
- 下一篇:測距裝置及自主機器人





