[發明專利]快遞行業畫像的生成方法、裝置、設備及存儲介質在審
| 申請號: | 202010944984.4 | 申請日: | 2020-09-10 |
| 公開(公告)號: | CN112560474A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 陳玉芬;夏揚;李培吉 | 申請(專利權)人: | 上海東普信息科技有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/216;G06F40/242;G06F16/35;G06Q10/08;G06Q30/02 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 姚維 |
| 地址: | 201700 上海市青浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 快遞 行業 畫像 生成 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能領域,公開了一種快遞行業畫像的生成方法、裝置、設備及存儲介質,用于提高通過用戶數據生成用戶畫像的準確率與效率。快遞行業畫像的生成方法包括:基于預置的分詞器將原始快遞數據中的語段進行切分,得到詞語語料,通過對詞語語料進行計算處理,得到處理數據;利用預置的特征提取器對處理數據進行特征提取,得到特征向量,根據特征向量確定處理數據對應的特征標簽;通過預置的聚類算法對特征標簽進行分類分析,得到多維度的權重標簽,權重標簽至少包括平臺標簽、地址標簽、時間標簽、商品標簽、用戶標簽和商戶標簽;采用預置畫像生成器對權重標簽進行預測,得到預測標簽,通過特征標簽、權重標簽和預測標簽構建快遞行業畫像。
技術領域
本發明涉及人工智能領域,尤其涉及一種快遞行業畫像的生成方法、裝置、設備及存儲介質。
背景技術
隨著經濟的快速發展,越來越多的用戶利用網絡平臺進行商品的購買,因此快遞行業的發展也越來越迅猛。一般的,快遞行業中存在海量的用戶數據,在進行數據處理時,用戶數據會產生規模巨大的數據量難以管理,但隨著云計算技術的推廣與普及,使得海量用戶的實時動態管理以及智能分析變得可能,其中以用戶畫像技術為例,用戶畫像技術通過對海量數據進行分析,進而挖掘出數據背后潛在的商業價值。
用戶畫像通過收集分析用戶的社會屬性、生活習性、消費行為等數據,進而分析抽象出一個用戶的信息全貌。用戶畫像系統通過分析用戶消費習慣和歷史數據,可以總結用戶的購物特點,也可以通過賣家和用戶的交流,獲取用戶的需求信息,有了買家用戶畫像,在商業服務推廣方面有助于實施精準營銷、精準定位。
由于快遞行業中的原始快遞數據分散、數據利用率不高,導致通過原始快遞數據生成的快遞行業畫像準確率不高且效率低下。
發明內容
本發明提供了一種快遞行業畫像的生成方法、裝置、設備及存儲介質,用于提高通過原始快遞數據生成快遞行業畫像的準確率與效率。
本發明第一方面提供了一種快遞行業畫像的生成方法,包括:獲取原始快遞數據,基于預置的分詞器將所述原始快遞數據中的語段進行切分,得到詞語語料,通過對所述詞語語料進行計算處理,得到處理數據;利用所述預置的特征提取器對所述處理數據進行特征提取,得到所述處理數據的特征向量,根據所述特征向量確定所述處理數據對應的特征標簽;通過預置的聚類算法對特征標簽進行分類分析,得到多維度的權重標簽,所述權重標簽至少包括平臺標簽、地址標簽、時間標簽、商品標簽、用戶標簽和商戶標簽;將所述權重標簽輸入至預置畫像生成器中,采用所述預置畫像生成器對所述權重標簽進行預測,得到預測標簽,通過所述特征標簽、所述權重標簽和所述預測標簽構建快遞行業畫像。
可選的,在本發明第一方面的第一種實現方式中,所述獲取原始快遞數據,基于預置的分詞器將所述原始快遞數據中的語段進行切分,得到詞語語料,通過對所述詞語語料進行計算處理,得到處理數據包括:獲取原始快遞數據,并將所述原始快遞數據傳輸至預置的分詞器中;在所述預置的分詞器中將所述原始快遞數據中的語段切分成多個詞語語料,并統計所述多個詞語語料的數量,所述詞語語料為標準詞典中存在的詞或詞組;采用預置統計函數統計每個詞語語料在所述原始快遞數據中出現的頻次,得到多個基礎頻次;通過每個基礎頻次計算對應詞語語料在所述語段中出現的次數,得到多個詞頻,并計算每個詞語語料的逆向語料頻率,得到多個逆向語料頻率,根據所述多個詞頻以及所述多個逆向語料頻率確定多個目標詞語語料,得到處理數據。
可選的,在本發明第一方面的第二種實現方式中,所述通過每個基礎頻次計算對應詞語語料在所述語段中出現的次數,得到多個詞頻,并計算每個詞語語料的逆向語料頻率,得到多個逆向語料頻率,根據所述多個詞頻以及所述多個逆向語料頻率確定多個目標詞語語料,得到處理數據包括:獲取詞語語料中的候選語料,通過所述候選語料對應的基礎頻次與預置的第一計算公式計算候選語料在所述語段中出現的次數,得到目標詞頻,所述預置的第一計算公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海東普信息科技有限公司,未經上海東普信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010944984.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:便于采血的導管系統及相關方法
- 下一篇:促進血液采集的導管系統以及相關方法





