[發明專利]一種基于產品評論觀點挖掘的銷量預測方法在審
| 申請號: | 202010017679.0 | 申請日: | 2020-01-08 | 
| 公開(公告)號: | CN111242679A | 公開(公告)日: | 2020-06-05 | 
| 發明(設計)人: | 張濤;劉華培 | 申請(專利權)人: | 北京工業大學 | 
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F16/33;G06F16/35;G06F16/36;G06F16/951 | 
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 | 
| 地址: | 100124 *** | 國省代碼: | 北京;11 | 
| 權利要求書: | 查看更多 | 說明書: | 查看更多 | 
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 產品 評論 觀點 挖掘 銷量 預測 方法 | ||
1.一種基于產品評論觀點挖掘的銷量預測方法,其特征在于:該方法包括以下幾個步驟:
步驟(1)數據采集:在電商網站上爬取產品評論,包括初次評論和追加評論;
步驟(2)數據預處理:首先,對采集的評論剔除重復和過短評論;其次,加載初次評論和追加評論到分詞工具包,使用分詞工具對文本分詞;然后,加載停用詞表去除停用詞;最后,用處理后的分詞語料庫訓練詞向量,將文本轉成向量表示;
步驟(3)提取產品屬性觀點對:在評論文本轉成向量表示后,利用序列標注模型抽取每條初次評論和追加評論的產品屬性及對應的情感強度和情感詞,表達成三元組形式,并構建產品屬性觀點共現矩陣;
步驟(4)對提取的產品屬性聚類:不同消費者對同一個產品屬性會有不同的表達方式,因此需要對步驟(3)中提取的產品屬性進行同義詞聚類,選取同義詞中的一個屬性作為被評價的產品屬性即可;
步驟(5)產品屬性的情感極性判別:將轉成向量的文本輸入到情感分類模型中識別出初次評論和追加評論中每個產品屬性的情感極性,情感極性分為正向、中立、負向三類,分別用1,0,-1表示,模型預測結果存儲為二元組形式,其中產品屬性就是步驟(4)中提取的產品屬性;
步驟(6)計算產品屬性評分值:根據步驟(5)中識別出的產品屬性情感極性計算產品屬性的情感值,再通過產品屬性的情感值計算產品屬性的評分值;產品屬性情感值的取值范圍為[-1,1],產品屬性評分值的取值范圍為[1,5],為了對應產品屬性評分值的取值范圍,可通過映射函數y=2x+3將產品屬性情感值x轉化為產品屬性評分值y;
步驟(7)計算產品總評分值:獲取步驟(3)中的共現矩陣中產品各個屬性出現的次數,根據次數計算產品屬性的權重,將產品屬性的權重和步驟(6)中計算的產品屬性評分值線性相加得到產品總體評分值;
步驟(8)銷量預測:根據步驟(1)到步驟(7)的操作,將初次評論計算出的產品總評分值、追加評論計算出的產品總評分值結合前期的歷史銷量作為銷量預測模型的輸入,訓練銷量預測模型,預測未來銷量。
2.根據權利要求1所述的一種基于產品評論觀點挖掘的銷量預測方法,其特征在于:三元組形式包括產品屬性、情感詞、程度副詞。
3.根據權利要求1所述的一種基于產品評論觀點挖掘的銷量預測方法,其特征在于:二元組形式包括產品屬性、情感極性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010017679.0/1.html,轉載請聲明來源鉆瓜專利網。





