[發明專利]商品匹配方法及系統無效
| 申請號: | 201110288717.7 | 申請日: | 2011-09-23 |
| 公開(公告)號: | CN102332137A | 公開(公告)日: | 2012-01-25 |
| 發明(設計)人: | 黃哲鏗 | 申請(專利權)人: | 紐海信息技術(上海)有限公司 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00 |
| 代理公司: | 上海智信專利代理有限公司 31002 | 代理人: | 薛琦;王婧荷 |
| 地址: | 201203 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 商品 匹配 方法 系統 | ||
1.一種商品匹配方法,其特征在于,其包括以下步驟:
先針對每件商品:
根據商品的商品描述確定商品類別,并根據商品類別調用與該商品類別相應的詞庫;
將商品描述分為至少兩個要素并為每個要素分配要素權值,其中以Pi來表示第i個要素的要素權值,以n表示要素的個數,所有要素的要素權值之和為1;
利用該詞庫并按照每個要素將商品描述切詞成至少一個要素關鍵詞,以及格式化該至少一個要素關鍵詞以統一要素關鍵詞的格式;
再針對每兩件商品:
為每個要素建立分組映射,該分組映射為該兩件商品的同一要素的要素關鍵詞的集合;
計算每個分組映射的相似度,該相似度表示該分組映射中相同的要素關鍵詞占所有要素關鍵詞的比例,其中以Fi來表示第i個要素的分組映射的相似度;
計算該兩件商品的匹配分值,
將該匹配分值與一閾值比較,若該匹配分值大于等于該閾值,則該兩件商品相匹配,確定該兩件商品為同一商品;若該匹配分值小于該閾值,則該兩件商品不相匹配,確定該兩件商品為不同商品。
2.如權利要求1所述的商品匹配方法,其特征在于,當第i個要素的分組映射的相似度Fi為0時,將該第i個要素的要素權值Pi轉移至其他要素的要素權值上。
3.如權利要求1所述的商品匹配方法,其特征在于,采用一同義詞詞庫統一同義詞的方式、采用統一大小寫的方式和采用替換半全角字符的方式中的一種或多種來格式化該至少一個要素關鍵詞以統一要素關鍵詞的格式。
4.如權利要求1-3中任意一項所述的商品匹配方法,其特征在于,該詞庫為品牌詞庫、商品通用名稱詞庫、單位詞庫、屬性詞庫、型號詞庫和常規詞詞庫中的一種或多種。
5.如權利要求4所述的商品匹配方法,其特征在于,該利用該詞庫并按照每個要素將商品描述切詞成至少一個要素關鍵詞的步驟之前還包括以下步驟:采用常規詞詞庫切除商品描述中的介詞和/或助詞。
6.如權利要求4所述的商品匹配方法,其特征在于,該至少兩個要素選自以下要素:品牌要素、商品通用名稱要素、單位要素、屬性要素和型號要素。
7.一種商品匹配系統,其特征在于,其包括:
根據商品的商品描述確定商品類別的商品類別識別模塊;
根據商品類別調用與該商品類別相應的詞庫的詞庫調用模塊;
將商品描述分為至少兩個要素并為每個要素分配要素權值的要素形成模塊,其中以Pi來表示第i個要素的要素權值,以n表示要素的個數,所有要素的要素權值之和為1;
利用該詞庫并按照每個要素將商品描述切詞成至少一個要素關鍵詞、以及格式化該至少一個要素關鍵詞以統一要素關鍵詞的格式的切詞模塊;以及,
一針對每兩件商品的子系統,其中該子系統還包括:
為每個要素建立分組映射的分組映射建立模塊,該分組映射為該兩件商品的同一要素的要素關鍵詞的集合;
計算每個分組映射的相似度的相似度計算模塊,該相似度表示該分組映射中相同的要素關鍵詞占所有要素關鍵詞的比例,其中以Fi來表示第i個要素的分組映射的相似度;
計算該兩件商品的匹配分值的匹配分值計算模塊,
將該匹配分值與一閾值比較的比較模塊,其中,若該匹配分值大于等于該閾值,則該兩件商品相匹配,確定該兩件商品為同一商品;若該匹配分值小于該閾值,則該兩件商品不相匹配,確定該兩件商品為不同商品。
8.如權利要求7所述的商品匹配系統,其特征在于,該子系統還包括一要素權值轉移模塊,用于當第i個要素的分組映射的相似度Fi為0時,將該第i個要素的要素權值Pi轉移至其他要素的要素權值上。
9.如權利要求7所述的商品匹配系統,其特征在于,該切詞模塊還用于采用一同義詞詞庫統一同義詞的方式、采用統一大小寫的方式和采用替換半全角字符的方式中的一種或多種來格式化該至少一個要素關鍵詞以統一要素關鍵詞的格式。
10.如權利要求7-9中任意一項所述的商品匹配系統,其特征在于,該詞庫為品牌詞庫、商品通用名稱詞庫、單位詞庫、屬性詞庫、型號詞庫和常規詞詞庫中的一種或多種。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于紐海信息技術(上海)有限公司,未經紐海信息技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110288717.7/1.html,轉載請聲明來源鉆瓜專利網。





