[發(fā)明專利]快遞商品畫像生成方法、生成裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請?zhí)枺?/td> | 202010918378.5 | 申請日: | 2020-09-03 |
| 公開(公告)號(hào): | CN112560473A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設(shè)計(jì))人: | 陳玉芬;夏揚(yáng);李培吉 | 申請(專利權(quán))人: | 上海東普信息科技有限公司 |
| 主分類號(hào): | G06F40/289 | 分類號(hào): | G06F40/289;G06F40/216;G06F40/242;G06F16/2458;G06Q10/08;G06Q30/02 |
| 代理公司: | 上海漢聲知識(shí)產(chǎn)權(quán)代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 201707 上海市青浦區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 快遞 商品 畫像 生成 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
1.一種快遞商品畫像生成方法,其特征在于,包括步驟:
對預(yù)先存儲(chǔ)的若干條文本備注數(shù)據(jù)信息進(jìn)行結(jié)巴分詞處理并提取分詞數(shù)據(jù)信息,所述文本備注數(shù)據(jù)信息至少包括快遞商品的商品屬性信息和與所述快遞商品匹配的消費(fèi)者屬性信息;
將提取的分詞數(shù)據(jù)信息轉(zhuǎn)換成符合關(guān)聯(lián)規(guī)則挖掘的存儲(chǔ)格式并存儲(chǔ)于事務(wù)數(shù)據(jù)庫中;
對所述事務(wù)數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)規(guī)則挖掘生成關(guān)聯(lián)規(guī)則;
根據(jù)所述關(guān)聯(lián)規(guī)則生成快遞商品畫像。
2.如權(quán)利要求1所述的快遞商品畫像生成方法,其特征在于,所述對預(yù)先存儲(chǔ)的文本備注數(shù)據(jù)信息進(jìn)行結(jié)巴分詞處理,具體包括步驟:
對每一條文本備注數(shù)據(jù)信息構(gòu)造前綴詞典生成有向無環(huán)圖;
采用動(dòng)態(tài)規(guī)劃計(jì)算所述有向無環(huán)圖中由起點(diǎn)到終點(diǎn)的概率最大的路徑;
根據(jù)概率最大的路徑對所述文本備注數(shù)據(jù)信息進(jìn)行分詞。
3.如權(quán)利要求1所述的快遞商品畫像生成方法,其特征在于,采用MADlib的關(guān)聯(lián)規(guī)則函數(shù)對所述事務(wù)數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)規(guī)則挖掘生成關(guān)聯(lián)規(guī)則。
4.如權(quán)利要求3所述的快遞商品畫像生成方法,其特征在于,所述采用MADlib的關(guān)聯(lián)規(guī)則函數(shù)對所述事務(wù)數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)規(guī)則挖掘生成關(guān)聯(lián)規(guī)則,具體包括步驟:
設(shè)定最小支持度和最小置信度;
根據(jù)所述最小支持度在所述事務(wù)數(shù)據(jù)庫中搜索頻繁項(xiàng)集;
根據(jù)所述最小置信度搜索所述頻繁項(xiàng)集,產(chǎn)生關(guān)聯(lián)規(guī)則。
5.如權(quán)利要求1所述的快遞商品畫像生成方法,其特征在于,所述分詞數(shù)據(jù)信息包括快遞商品的名詞信息,進(jìn)一步還包括對所述名詞信息進(jìn)行統(tǒng)計(jì)的步驟,并根據(jù)統(tǒng)計(jì)結(jié)果篩選滿足預(yù)設(shè)條件的名詞信息。
6.如權(quán)利要求5所述的快遞商品畫像生成方法,其特征在于,還包括根據(jù)篩選的名詞信息對所述快遞商品建立商品類目的步驟。
7.一種快遞商品畫像生成裝置,其特征在于,包括:
分詞模塊,用于對預(yù)先存儲(chǔ)的若干條文本備注數(shù)據(jù)信息進(jìn)行結(jié)巴分詞處理并提取分詞數(shù)據(jù)信息,所述文本備注數(shù)據(jù)信息至少包括快遞商品的商品屬性信息和與所述快遞商品匹配的消費(fèi)者屬性信息;
存儲(chǔ)模塊,用于將提取的分詞數(shù)據(jù)信息轉(zhuǎn)換成符合關(guān)聯(lián)規(guī)則挖掘的存儲(chǔ)格式并存儲(chǔ)于事務(wù)數(shù)據(jù)庫中;
關(guān)聯(lián)規(guī)則生成模塊,用于對所述事務(wù)數(shù)據(jù)庫進(jìn)行關(guān)聯(lián)規(guī)則挖掘生成關(guān)聯(lián)規(guī)則;
快遞商品畫像生成模塊,用于根據(jù)所述關(guān)聯(lián)規(guī)則生成快遞商品畫像。
8.如權(quán)利要求7所述的快遞商品畫像生成裝置,其特征在于,還包括:
統(tǒng)計(jì)模塊,用于對所述分詞數(shù)據(jù)信息中的快遞商品的名詞信息進(jìn)行統(tǒng)計(jì),并根據(jù)統(tǒng)計(jì)結(jié)果篩選滿足預(yù)設(shè)條件的名詞信息;
商品類目建立模塊,用于根據(jù)篩選的名詞信息對所述快遞商品建立商品類目。
9.一種快遞商品畫像終端設(shè)備,其特征在于,包括處理器和存儲(chǔ)器,所述存儲(chǔ)器中存儲(chǔ)有至少一條指令、至少一段程序、代碼集或指令集,所述至少一條指令、所述至少一段程序、所述代碼集或所述指令集由所述處理器加載并執(zhí)行以實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的快遞商品畫像生成方法。
10.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至6中任一項(xiàng)所述的快遞商品畫像生成方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海東普信息科技有限公司,未經(jīng)上海東普信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010918378.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用戶畫像標(biāo)簽查詢方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 廣告投放方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種主體畫像生成的方法、裝置和存儲(chǔ)介質(zhì)
- 基于流平臺(tái)的智能全景客戶畫像聯(lián)動(dòng)方法及系統(tǒng)
- 畫像構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 畫像構(gòu)建方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種適用于城市軌道交通的乘客畫像系統(tǒng)及其構(gòu)建方法
- 用戶畫像方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備
- 一種跨境場景畫像構(gòu)建方法和裝置
- 一種用戶畫像方法與裝置





