[發明專利]一種商品自動化匹配方法有效
| 申請號: | 202111284296.0 | 申請日: | 2021-11-01 |
| 公開(公告)號: | CN113742487B | 公開(公告)日: | 2022-03-29 |
| 發明(設計)人: | 劉峰;王鵬翔;隋國棟;劉超 | 申請(專利權)人: | 北京值得買科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/194;G06F40/258;G06K9/62;G06Q30/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100071 北京市豐臺區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 商品 自動化 匹配 方法 | ||
1.一種商品自動化匹配方法,其特征在于,包括:
根據電商不同分類的行業知識,建立關于各類商品屬性的知識庫;
根據所述知識庫,將商品庫中的商品及待匹配商品的屬性值轉換為標準屬性值;
對所述商品庫中的商品及所述待匹配商品,構建其特征;
根據構建的特征將所述待匹配的商品與所述商品庫中的商品進行匹配;
所述根據電商不同分類的行業知識,建立關于各類商品屬性的知識庫,具體包括:
梳理電商所有細分行業的具體分類,包括多級分類的所屬關系;
根據不同的分類線條,梳理具體線條上的末級分類其spu行業區分標準與sku行業區分標準,行業區分標準即為能夠唯一確定屬于同一spu或者sku的商品屬性的組合,進一步,依據spu行業區分標準,得到多個sku聚合至所屬spu的標準與依據;
收集與整理各個分類的商品屬性,建立知識庫;
所述特征包括文本特征和圖像特征,其中,所述文本特征包括能夠區分具體spu與sku的屬性的標準屬性值構成的文本鍵值對和商品標題文本向量,所述圖像特征為從圖片提取的全局特征向量;
所述圖像特征的構建過程,具體包括:
將圖片進行去背景操作,保留白底商品圖,然后通過Resnet或者vgg模型進行圖片全局特征的提取,構成spu或者sku的圖像特征。
2.根據權利要求1所述的方法,其特征在于,所述商品標題的文本向量的建立過程,具體包括:
建立電商行業的干擾詞庫,將所述電商行業的干擾詞庫作為停止詞從標題文本中剔除,然后依據剩下的文本,通過bert預訓練模型輸出向量,建立商品標題文本向量。
3.根據權利要求1所述的方法,其特征在于,所述將所述待匹配的商品與所述商品庫中的商品進行匹配,具體包括:
如果所述待匹配商品的型號和屬性值齊全,直接采用文本精準匹配的方法,找到商品庫內型號和屬性值一致的商品作為其精準匹配的結果;如果精準匹配沒有匹配到,則根據型號相似度從大到小得到結果召回集,在召回集中取屬性值能匹配一致的第一個結果作為最終模糊匹配的結果。
4.根據權利要求1所述的方法,其特征在于,所述將所述待匹配的商品與所述商品庫中的商品進行匹配,具體包括:
如果所述待匹配商品的型號有缺失,并且有屬性值,則根據圖片相似度從大到小得到結果召回集,在召回集中取屬性值能匹配一致的第一個結果作為最終模糊匹配的結果。
5.根據權利要求1所述的方法,其特征在于,所述將所述待匹配的商品與所述商品庫中的商品進行匹配,具體包括:
如果所述待匹配商品的屬性值有缺失,并且型號不缺失,則根據型號相似度從大到小得到結果召回集,在召回集中取屬性值能匹配一致的第一個結果作為最終模糊匹配的結果。
6.根據權利要求1所述的方法,其特征在于,所述將所述待匹配的商品與所述商品庫中的商品進行匹配,具體包括:
如果所述待匹配商品沒有屬性值,并且型號不缺失,直接采用文本精準匹配的方法,找到庫內型號一致的商品作為其精準匹配的結果;如果精準匹配沒有匹配到,則根據型號相似度從大到小得到最相似的結果作為召回集,若召回集中只有一個結果,則直接作為最終模糊匹配的結果;若召回集中有多個結果,則在召回集中取圖片相似度最大的結果作為最終模糊匹配的結果。
7.根據權利要求1所述的方法,其特征在于,所述將所述待匹配的商品與所述商品庫中的商品進行匹配,具體包括:
如果所述待匹配商品沒有屬性值和型號,則根據圖片相似度從大到小得到結果召回集,若召回集中只有一個結果,則直接作為最終模糊匹配的結果;若召回集中有多個結果,則在召回集中取標題文本相似度最大的結果作為最終模糊匹配的結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京值得買科技股份有限公司,未經北京值得買科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111284296.0/1.html,轉載請聲明來源鉆瓜專利網。





