[發明專利]一種商品聚類方法及裝置在審
| 申請號: | 201810067423.3 | 申請日: | 2018-01-23 |
| 公開(公告)號: | CN108171586A | 公開(公告)日: | 2018-06-15 |
| 發明(設計)人: | 孫勇 | 申請(專利權)人: | 北京值得買科技股份有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 周放;趙景平 |
| 地址: | 100068 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類 目標商品 商品庫 唯一標識 預設 匹配 數據處理技術 電子商務 購物網站 人工手動 自動聚類 比對 存儲 應用 | ||
本發明實施例提供一種商品聚類方法及裝置,涉及電子商務和數據處理技術領域,該商品聚類方法包括:獲取待聚類商品的目標商品標題;根據所述目標商品標題,生成與所述待聚類商品對應的目標唯一標識;將預設商品庫中與所述目標唯一標識相匹配的目標商品聚為一類;其中,所述預設商品庫中存儲有來自于不同購物網站的各個商品的商品標題。可見,應用本發明進行商品聚類時,先獲得待聚類商品的目標商品標題,然后生成與該待聚類商品對應的目標唯一標識,進而從預設商品庫中匹配出目標商品,無需人工手動比對,實現了對商品庫中對商品的自動聚類。
技術領域
本發明涉及電子商務和數據處理技術領域,特別涉及一種商品聚類方法及裝置。
背景技術
導購網站,是一個向用戶提供網購商品推薦的消費決策平臺。為了向用戶推薦高性價比的商品,現有技術中,網站運營人員往往需要人工手動比對某一商品在不同購物網站的價格。雖然,利用現有技術提供的方案可以得到具有高性價比的商品,但是,人工手動比對的方式,需要網站運營人員進行大量的重復且繁瑣的工作,需要耗費較長時間。
發明內容
本發明實施例的目的在于提供一種商品聚類方法及裝置,以實現對商品庫中對商品的自動聚類。
為達到上述目的,本發明實施例公開了一種商品聚類方法,所述商品聚類方法包括:
獲取待聚類商品的目標商品標題;
根據所述目標商品標題,生成與所述待聚類商品對應的目標唯一標識;
將預設商品庫中與所述目標唯一標識相匹配的目標商品聚為一類;其中,所述預設商品庫中存儲有來自于不同購物網站的各個商品的商品標題。
優選的,所述目標商品標題中至少包括:由待聚類商品的型號和/或關鍵字信息,以及品牌共同構成的屬性信息,所述關鍵字信息至少包括待聚類商品的類別關鍵字。
優選的,所述將預設商品庫中與所述目標唯一標識相匹配的目標商品聚為一類,包括:
基于預設正則表達式,從預設商品庫中粗選出與所述待聚類商品的類別關鍵字相匹配的候選商品集;
將所述候選商品集中與所述目標唯一標識相匹配的目標商品聚為一類。
優選的,所述根據所述目標商品標題,生成與所述待聚類商品對應的目標唯一標識,包括:
根據所述目標商品標題,確定所述待聚類商品所屬的目標商品類別;
基于預設的商品類別和聚類策略之間的對應關系,確定與所述目標商品類別對應的目標聚類策略,其中,所述聚類策略中至少包括:獲取型號子策略和/或獲取關鍵字子策略,以及獲取品牌子策略;
按照所述目標聚類策略,獲取所述待聚類商品的屬性信息;
根據所述待聚類商品的屬性信息,生成與所述待聚類商品對應的目標唯一標識。
優選的,所述根據所述目標商品標題,確定所述待聚類商品所屬的目標商品類別,包括:
按照預設的分詞算法,對所述目標商品標題進行分詞處理;
從分詞結果中提取出所述待聚類商品的類別關鍵字;
根據所述類別關鍵字確定所述待聚類商品所屬的目標商品類別。
優選的,所述聚類策略還包括:統一單位子策略;
所述按照所述目標聚類策略,獲取所述待聚類商品的屬性信息,包括:
按照所述獲取型號子策略和/或所述獲取關鍵字子策略,以及所述獲取品牌子策略,分別獲取所述待聚類商品的型號和/或關鍵字信息,以及品牌;其中,所述關鍵字信息中還包含所述待聚類商品的數量信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京值得買科技股份有限公司,未經北京值得買科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810067423.3/2.html,轉載請聲明來源鉆瓜專利網。





