[發明專利]識別雜貨鋪的方法、裝置及搜索店鋪的方法、系統有效
| 申請號: | 201310019559.4 | 申請日: | 2013-01-18 |
| 公開(公告)號: | CN103942693B | 公開(公告)日: | 2017-11-14 |
| 發明(設計)人: | 宋超;馮景華;張一楠;陳超 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/06 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 雜貨鋪 方法 裝置 搜索 店鋪 系統 | ||
技術領域
本申請涉及搜索技術,特別是涉及一種識別雜貨鋪的方法、裝置及搜索店鋪的方法、系統。
背景技術
目前電子商務網站(簡稱電商網站)提供了便利的產品信息以及供應商獲取途徑,但是這些電商網站提供的供應商實力良莠不齊,用戶無法快速從海量的信息中找到有實力、專業性強的供應商。而這類專業性強的供應商往往經營領域比較集中,專注于做某個特定領域的產品,而不是從事多個領域、每個領域做的都不夠專業的雜貨鋪。因此,需要將這些從事多個領域、不夠專業的雜貨鋪從大量的店鋪信息中識別出來,以提高搜索準確率。
電子商務網站發布的產品信息中包含產品所屬的類目,現有的雜貨鋪識別方法是直接統計電子商務網站發布的類目信息,以類目代表行業,根據每個行業的占比識別出雜貨鋪。
但是,如果發布的產品信息沒有填寫準確的類目,或者進行類目作弊,例如:在發布的時候將店鋪中涉及多個行業的產品類目全部設置為某個行業,上述識別方法將不能準確識別出雜貨鋪店鋪。
發明內容
本申請提供了一種識別雜貨鋪的方法及裝置,以實現準確識別雜貨鋪的目的,避免因行業信息填寫不準確或類目作弊導致的識別不準確的問題。
相應的,本申請還提供了一種搜索店鋪的方法及系統,在搜索的時候降低雜貨鋪的排序,從而提高搜索準確率。
為了解決上述問題,本申請公開了一種識別雜貨鋪的方法,包括:
獲取指定店鋪的產品信息,并從所述產品信息中提取出所述指定店鋪的核心產品詞;
統計所述指定店鋪的核心產品詞在所述指定店鋪的產品信息中出現的頻率,作為核心產品詞對應的產品詞頻率;
識別所述指定店鋪的核心產品詞所屬的行業,并根據屬于同一行業的核心產品詞對應的產品詞頻率,計算所述行業在所述指定店鋪中出現的頻率,作為行業頻率;
根據所述行業頻率計算所述指定店鋪所屬的各個行業的產品占比,并依據各個行業的產品占比判定所述指定店鋪是否為雜貨鋪。
可選地,所述從所述產品信息中提取出所述指定店鋪的核心產品詞,包括:
從所述產品信息中提取出標題,并對所述標題進行切詞,得到切詞結果;
將所述切詞結果與核心產品詞表進行匹配,匹配到的核心產品詞作為所述指定店鋪的核心產品詞。
可選地,所述識別所述指定店鋪的核心產品詞所屬的行業包括:
統計核心產品詞的行業點擊率;
將所述核心產品詞的行業點擊率與各行業的行業閾值進行匹配,判斷所述核心產品詞的行業點擊率是否達到行業閾值;
若所述核心產品詞的行業點擊率達到行業閾值,則判定該核心產品詞屬于該行業。
可選地,所述根據屬于同一行業的核心產品詞對應的產品詞頻率,計算所述行業在所述指定店鋪中出現的頻率,包括:
將所述屬于同一行業的核心產品詞對應的產品詞頻率進行加和,作為該行業在所述指定店鋪中出現的頻率。
可選地,所述根據所述行業頻率計算所述指定店鋪所屬的各個行業的產品占比包括:
將所述行業的行業頻率相加作為行業總頻率;
將所述行業的行業頻率與所述行業總頻率相除,相除的商作為該行業的產品占比。
可選地,所述依據各個行業的產品占比判定所述指定店鋪是否為雜貨鋪包括:
當指定店鋪中有兩個行業的產品占比超過閾值時,判定該店鋪為雜貨鋪。
本申請還公開了一種搜索店鋪的方法,包括:
接收搜索關鍵詞;
查找與所述搜索關鍵詞相匹配的店鋪,得到候選店鋪;
將所述候選店鋪中識別為雜貨鋪的候選店鋪排在未識別為雜貨鋪的候選店鋪之后并輸出;
所述雜貨鋪通過以下步驟識別:
將所述候選店鋪作為指定店鋪,獲取指定店鋪的產品信息,并從所述產品信息中提取出所述指定店鋪的核心產品詞;
統計所述指定店鋪的核心產品詞在所述指定店鋪的產品信息中出現的頻率,作為核心產品詞對應的產品詞頻率;
識別所述指定店鋪的核心產品詞所屬的行業,并根據屬于同一行業的核心產品詞對應的產品詞頻率,計算所述行業在所述指定店鋪中出現的頻率,作為行業頻率;
根據所述行業頻率計算所述指定店鋪所屬的各個行業的產品占比,并依據各個行業的產品占比判定所述指定店鋪是否為雜貨鋪。
本申請還公開了一種識別雜貨鋪的裝置,包括:
提取模塊,用于獲取指定店鋪的產品信息,并從所述產品信息中提取出所述指定店鋪的核心產品詞;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310019559.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種矩形鋼管混凝土預制件
- 下一篇:一種高韌性彈簧絲





