[發明專利]商品品牌特征獲取方法、銷量預測方法、裝置及電子設備有效
| 申請號: | 202010122140.1 | 申請日: | 2020-02-28 |
| 公開(公告)號: | CN111401409B | 公開(公告)日: | 2023-04-18 |
| 發明(設計)人: | 黃澤;王夢秋;胡太祥 | 申請(專利權)人: | 創新奇智(青島)科技有限公司 |
| 主分類號: | G06F18/214 | 分類號: | G06F18/214;G06Q30/0202;G06F18/23 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 蔣姍 |
| 地址: | 266200 山東省青島市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 商品 品牌 特征 獲取 方法 銷量 預測 裝置 電子設備 | ||
本申請涉及一種商品品牌特征獲取方法、銷量預測方法、裝置及電子設備,屬于人工智能技術領域。該方法包括:獲取包括目標商品品牌在內的多個商品品牌各自對應的歷史日均銷量序列;將每個商品品牌各自對應的歷史日均銷量序列轉換為句子字符串;基于所有的句子字符串組成矩陣陣列,矩陣陣列中的每一行對應一個句子字符串;基于詞向量模型將矩陣陣列中的每一個句子字符串轉換為對應的句向量,得到語義向量矩陣;對語義向量矩陣中的每個句向量進行聚類,得到聚類后的目標商品品牌所在的類對應的標簽,標簽為目標商品品牌對應的品牌特征。避免采用獨熱編碼帶來的高維稀疏特征矩陣,以降低銷量預測模型訓練時的所需的時間以及空間并提高其預測精度。
技術領域
本申請屬于人工智能技術領域,具體涉及一種商品品牌特征獲取方法、銷量預測方法、裝置及電子設備。
背景技術
對于商場、超市而言,精確的商品銷量預測可助其制定利益最大化的供補貨策略,從而提升周轉率,降低缺貨率。在工業界,一般可以通過從店鋪地理位置,客流量以及商品相關屬性等構造特征,具體一般為對數值型特征進行不同周期的滑窗,對類別特征進行獨熱編碼,然后使用集成樹模型對商品未來銷量進行預測。
但與商品屬性相關的離散型特征如商品種類以及品牌信息等,數量繁多,一旦進行獨熱編碼,會直接給集成樹模型帶來數以千記的高維且稀疏的特征維度,令其分裂節點時不得不遍歷每一個由獨熱編碼新生成的特征維度,這無論是對訓練時所需內存空間還是時間,都帶來了更大的開銷,除此之外,獨熱編碼后新生成的特征變得相互獨立,且每個特征只有0或1兩個取值,意味著分裂時采用的是one-vs-rest的切分方式,當特征維度高時,每個類別上的數據會較少,這時切分會不平衡,其能為模型帶來的增益也會銳減,因此模型會更傾向于選擇那些沒有經過獨熱編碼處理過的特征。
發明內容
鑒于此,本申請的目的在于提供一種商品品牌特征獲取方法、銷量預測方法、裝置及電子設備,以改善目前采用獨熱編碼來獲取與商品屬性相關的離散型特征時帶來的高維稀疏特征矩陣,進而導致訓練銷量預測模型時需要額外的時間開銷的問題。
本申請的實施例是這樣實現的:
第一方面,本申請實施例提供了一種商品品牌特征獲取方法,包括:獲取包括目標商品品牌在內的多個商品品牌各自對應的歷史日均銷量序列;將每個商品品牌各自對應的歷史日均銷量序列轉換為句子字符串;基于所有的句子字符串組成矩陣陣列,所述矩陣陣列中的每一行對應一個句子字符串;基于詞向量模型將所述矩陣陣列中的每一個句子字符串轉換為對應的句向量,得到語義向量矩陣;對所述語義向量矩陣中的每個句向量進行聚類,得到聚類后的所述目標商品品牌所在的類對應的標簽,所述標簽為所述目標商品品牌對應的品牌特征。本申請實施例中,將商品品牌特征相關性高的連續型變量特征序列-商品品牌歷史日均銷量序列,作為每個商品品牌自身的一種向量表示,并將其轉換為句子字符串,然后基于所有的句子字符串組成矩陣陣列,并通過詞向量模型將該矩陣陣列中的每一個句子字符串轉換為對應的句向量,得到語義向量矩陣,然后對轉換后的句向量進行聚類,并將聚類后的結果標簽賦予對應序列的商品品牌,成為品牌特征新的特征取值,避免直接對數以千計的品牌作獨熱編碼,從而避免采用獨熱編碼帶來的高維稀疏特征矩陣,以降低銷量預測模型訓練時的所需的時間以及空間并提高其預測精度。
結合第一方面實施例的一種可能的實施方式,基于詞向量模型將所述矩陣陣列中的每一個句子字符串轉換為對應的句向量,包括:基于doc2vector模型將所述矩陣陣列中的每一個句子字符串轉換為對應的句向量。本申請實施例中,利用doc2vector模型可以直接從語義上下文學習到矩陣陣列中的每一個句子字符串對應的句向量,進而提高了轉換效率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新奇智(青島)科技有限公司,未經創新奇智(青島)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010122140.1/2.html,轉載請聲明來源鉆瓜專利網。





