[發明專利]快遞商品畫像生成方法、生成裝置、設備及存儲介質在審
| 申請號: | 202010918378.5 | 申請日: | 2020-09-03 |
| 公開(公告)號: | CN112560473A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 陳玉芬;夏揚;李培吉 | 申請(專利權)人: | 上海東普信息科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06F40/242;G06F16/2458;G06Q10/08;G06Q30/02 |
| 代理公司: | 上海漢聲知識產權代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 201707 上海市青浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 快遞 商品 畫像 生成 方法 裝置 設備 存儲 介質 | ||
1.一種快遞商品畫像生成方法,其特征在于,包括步驟:
對預先存儲的若干條文本備注數據信息進行結巴分詞處理并提取分詞數據信息,所述文本備注數據信息至少包括快遞商品的商品屬性信息和與所述快遞商品匹配的消費者屬性信息;
將提取的分詞數據信息轉換成符合關聯規則挖掘的存儲格式并存儲于事務數據庫中;
對所述事務數據庫進行關聯規則挖掘生成關聯規則;
根據所述關聯規則生成快遞商品畫像。
2.如權利要求1所述的快遞商品畫像生成方法,其特征在于,所述對預先存儲的文本備注數據信息進行結巴分詞處理,具體包括步驟:
對每一條文本備注數據信息構造前綴詞典生成有向無環圖;
采用動態規劃計算所述有向無環圖中由起點到終點的概率最大的路徑;
根據概率最大的路徑對所述文本備注數據信息進行分詞。
3.如權利要求1所述的快遞商品畫像生成方法,其特征在于,采用MADlib的關聯規則函數對所述事務數據庫進行關聯規則挖掘生成關聯規則。
4.如權利要求3所述的快遞商品畫像生成方法,其特征在于,所述采用MADlib的關聯規則函數對所述事務數據庫進行關聯規則挖掘生成關聯規則,具體包括步驟:
設定最小支持度和最小置信度;
根據所述最小支持度在所述事務數據庫中搜索頻繁項集;
根據所述最小置信度搜索所述頻繁項集,產生關聯規則。
5.如權利要求1所述的快遞商品畫像生成方法,其特征在于,所述分詞數據信息包括快遞商品的名詞信息,進一步還包括對所述名詞信息進行統計的步驟,并根據統計結果篩選滿足預設條件的名詞信息。
6.如權利要求5所述的快遞商品畫像生成方法,其特征在于,還包括根據篩選的名詞信息對所述快遞商品建立商品類目的步驟。
7.一種快遞商品畫像生成裝置,其特征在于,包括:
分詞模塊,用于對預先存儲的若干條文本備注數據信息進行結巴分詞處理并提取分詞數據信息,所述文本備注數據信息至少包括快遞商品的商品屬性信息和與所述快遞商品匹配的消費者屬性信息;
存儲模塊,用于將提取的分詞數據信息轉換成符合關聯規則挖掘的存儲格式并存儲于事務數據庫中;
關聯規則生成模塊,用于對所述事務數據庫進行關聯規則挖掘生成關聯規則;
快遞商品畫像生成模塊,用于根據所述關聯規則生成快遞商品畫像。
8.如權利要求7所述的快遞商品畫像生成裝置,其特征在于,還包括:
統計模塊,用于對所述分詞數據信息中的快遞商品的名詞信息進行統計,并根據統計結果篩選滿足預設條件的名詞信息;
商品類目建立模塊,用于根據篩選的名詞信息對所述快遞商品建立商品類目。
9.一種快遞商品畫像終端設備,其特征在于,包括處理器和存儲器,所述存儲器中存儲有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或所述指令集由所述處理器加載并執行以實現如權利要求1至6中任一項所述的快遞商品畫像生成方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至6中任一項所述的快遞商品畫像生成方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海東普信息科技有限公司,未經上海東普信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010918378.5/1.html,轉載請聲明來源鉆瓜專利網。





