[發明專利]統一商品信息的方法、裝置、系統及存儲介質在審
| 申請號: | 202011054227.6 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112181968A | 公開(公告)日: | 2021-01-05 |
| 發明(設計)人: | 施建文 | 申請(專利權)人: | 京東數字科技控股股份有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06Q30/06 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 盧萬騰;杜欣 |
| 地址: | 100176 北京市大興區北京經*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 統一 商品信息 方法 裝置 系統 存儲 介質 | ||
本發明實施例涉及一種統一商品信息的方法、裝置、系統及存儲介質,該方法包括:獲取供應方提供的商品數據信息;從至少兩級商品信息中提取第一級商品信息;匹配第一級商品信息與第一基準商品信息之間的相似度;當確定相似度大于或者等于第一預設閾值時,建立第一級商品信息與第一基準商品信息之間的映射關系;直至當至少兩級商品信息中每一級商品信息均與與之對應的基準商品信息完成映射操作后,確定完成商品數據信息的統一。將不同供應方提供的商品數據信息按照統一規格完成歸類和統一。保證用戶按照任一供應方提供的商品信息在系統中進行搜索時,系統都可以進行精準展示,而且還可以全面展示所有供應方提供的該類商品。
技術領域
本發明實施例涉及計算機技術領域,尤其涉及一種統一商品信息的方法、裝置、系統及存儲介質。
背景技術
數據更新過程中,數據統一對于商品售賣方而言,是至關重要的。因為當用戶期望看到某種商品時,售賣方可以將用戶期望看到的與該商品有關的所有信息展示給用戶。例如用戶要購買某種汽車,由于在前期錄入的有關該種汽車信息不夠統一,比如生產該種汽車的商家包括多個,每個商家對于車輛的名稱、車型信息等說明都不統一,售賣方自身數據庫中對于該種汽車也有自身的一套表示信息。
因此當用戶按照供應方提供的信息搜索某種汽車時,由于系統不能完全匹配到用戶搜索內容,進而不能對其進行準確展示。
發明內容
鑒于此,為解決現有技術中上述技術問題,本發明實施例提供一種統一商品信息的方法、裝置、系統及存儲介質。
第一方面,本發明實施例提供一種統一商品信息的方法,該方法包括:
獲取供應方提供的商品數據信息,商品數據信息中包括至少兩級商品信息;
從至少兩級商品信息中提取第一級商品信息;
匹配第一級商品信息與第一基準商品信息之間的相似度;
當確定相似度大于或者等于第一預設閾值時,建立第一級商品信息與第一基準商品信息之間的映射關系,其中,第一級商品信息為至少兩級商品信息中任一級商品信息,第一基準商品信息為預設定的與第一級商品信息對應的基準商品信息;
直至當至少兩級商品信息中每一級商品信息均與與之對應的基準商品信息完成映射操作后,確定完成商品數據信息的統一。
在一個可能的實施方式中,當確定第一級商品信息與第一基準商品信息之間的相似度小于第一預設閾值時,舍棄商品數據信息。
在一個可能的實施方式中,從至少兩級商品信息中提取第一級商品信息,具體包括:
對商品數據信息進行分詞操作,獲取分詞結果;
從分詞結果中獲取第一級商品信息。
在一個可能的實施方式中,匹配第一級商品信息與第一基準商品信息之間的相似度,具體包括:
統計第一級商品信息在分詞結果中的出現頻率;
根據出現頻率,生成與第一級商品信息對應的詞頻向量;
根據第一級商品信息對應的詞頻向量,以及預獲取的與第一基準商品信息對應的詞頻向量,確定相似度。
在一個可能的實施方式中,比較相似度與第一預設閾值之間的大小之前,方法還包括:
根據相似度,從多個候選閾值中選取第一預設閾值。
在一個可能的實施方式中,商品數據信息包括至少兩條,根據相似度,從多個候選閾值中選取第一預設閾值,具體包括:
遍歷每一個候選閾值,分別將每一個候選閾值與相似度進行比較;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東數字科技控股股份有限公司,未經京東數字科技控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011054227.6/2.html,轉載請聲明來源鉆瓜專利網。





