[發(fā)明專利]一種商品自動化匹配方法有效
| 申請?zhí)枺?/td> | 202111284296.0 | 申請日: | 2021-11-01 |
| 公開(公告)號: | CN113742487B | 公開(公告)日: | 2022-03-29 |
| 發(fā)明(設計)人: | 劉峰;王鵬翔;隋國棟;劉超 | 申請(專利權(quán))人: | 北京值得買科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/194;G06F40/258;G06K9/62;G06Q30/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100071 北京市豐臺區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 商品 自動化 匹配 方法 | ||
本發(fā)明是關于一種商品自動化匹配方法。該方法包括:根據(jù)電商不同分類的行業(yè)知識,建立關于各類商品屬性的知識庫;根據(jù)知識庫,將商品庫中的商品及待匹配商品的屬性值轉(zhuǎn)換為標準屬性值;對商品庫中的商品及待匹配商品,構(gòu)建其特征;根據(jù)構(gòu)建的特征將待匹配的商品與商品庫中的商品進行匹配。本發(fā)明提供的技術(shù)方案,通過建立一個完善而標準的電商商品庫與知識庫,能夠?qū)⑺枰男畔⒂成錇闃藴驶男畔ⅲS著商品庫與知識庫建設的不斷完善,匹配效果會越來愈好。這種匹配方式與傳統(tǒng)的模糊匹配相比,準確性更高。另外,文本相似度與圖片相似度作為補充方案與屬性精準匹配方案相互配合相互補充,使得商品匹配的結(jié)果更加多元化。
技術(shù)領域
本發(fā)明涉及數(shù)據(jù)處理領域,尤其涉及一種商品自動化匹配方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)與電商行業(yè)的蓬勃發(fā)展,人們已經(jīng)習慣于在互聯(lián)網(wǎng)上進行商品的選購與比較,因此商品之間的識別成為了非常重要的一個環(huán)節(jié)。而商品有spu與sku的維度,兩個維度都需要進行商品的識別與匹配。
現(xiàn)有實現(xiàn)商品匹配與識別的技術(shù)方法主要是基于圖片相似度匹配與關鍵詞搜索的技術(shù),用商品圖片找尋相似的圖片對應的商品,或者輸入商品的品牌、特征等信息,來搜索庫內(nèi)相關信息一致的商品。
上述方式中,由于主要是用于用戶的搜索需求,因此很難滿足spu與sku細分維度的商品識別,尤其是sku,同一個spu下有若干款sku,而上述方式更像一種模糊匹配,難以將不同的sku進行更深層次、更細粒度的區(qū)分與識別。
發(fā)明內(nèi)容
為克服相關技術(shù)中存在的問題,本發(fā)明提供一種更精準、更細顆粒度的商品匹配,包括spu的匹配與sku的匹配,首先能夠建立一套標準的商品庫,之后任意款商品都能匹配到庫內(nèi)對應的標準商品,能夠更好更準確的將同一款商品識別出來。
本發(fā)明提供一種商品自動化匹配方法,包括:
根據(jù)電商不同分類的行業(yè)知識,建立關于各類商品屬性的知識庫;
根據(jù)所述知識庫,將商品庫中的商品及待匹配商品的屬性值轉(zhuǎn)換為標準屬性值;
對所述商品庫中的商品及所述待匹配商品,構(gòu)建其特征;
根據(jù)構(gòu)建的特征將所述待匹配的商品與所述商品庫中的商品進行匹配。
進一步,所述根據(jù)電商不同分類的行業(yè)知識,建立關于各類商品屬性的知識庫,具體包括:
梳理電商所有細分行業(yè)的具體分類,包括多級分類的所屬關系;
根據(jù)不同的分類線條,梳理具體線條上的末級分類其spu行業(yè)區(qū)分標準與sku行業(yè)區(qū)分標準,行業(yè)區(qū)分標準即為能夠唯一確定屬于同一spu或者sku的商品屬性的組合,進一步,依據(jù)spu行業(yè)區(qū)分標準,得到多個sku聚合至所屬spu的標準與依據(jù);
收集與整理各個分類的商品屬性,建立知識庫。
進一步,所述特征包括文本特征和圖像特征,其中,所述文本特征包括能夠區(qū)分具體spu與sku的屬性的標準屬性值構(gòu)成的文本鍵值對和商品標題文本向量,所述圖像特征為從圖片提取的全局特征向量。
進一步,所述商品標題的文本向量的建立過程,具體包括:
建立電商行業(yè)的干擾詞庫,將所述電商行業(yè)的干擾詞庫作為停止詞從標題文本中剔除,然后依據(jù)剩下的文本,通過bert預訓練模型輸出向量,建立商品標題文本向量。
進一步,所述圖像特征的構(gòu)建過程,具體包括:
將圖片進行去背景操作,保留白底商品圖,然后通過Resnet或者vgg模型進行圖片全局特征的提取,構(gòu)成spu或者sku的圖像特征。
進一步,所述將所述待匹配的商品與所述商品庫中的商品進行匹配,具體包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京值得買科技股份有限公司,未經(jīng)北京值得買科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111284296.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





