[發明專利]用戶偏好趨勢挖掘方法有效
| 申請號: | 201811395964.5 | 申請日: | 2018-11-22 |
| 公開(公告)號: | CN109460474B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 王安寧;張強;楊善林;趙爽耀;陸效農;彭張林 | 申請(專利權)人: | 合肥工業大學 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 北京久誠知識產權代理事務所(特殊普通合伙) 11542 | 代理人: | 翟姝紅 |
| 地址: | 230009 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 偏好 趨勢 挖掘 方法 | ||
1.一種用戶偏好趨勢挖掘方法,其特征在于,包括:
S1、從評論數據中獲取多個產品屬性;
S2、將所述評論數據劃分為多個時間階段,分別計算所述多個時間階段中所述多個產品屬性的重要性;
S3、根據決策樹分類模型識別出所述多個時間階段的關鍵產品屬性及非關鍵產品屬性;
S4、對所述關鍵產品屬性的觀點進行識別;
S5、對所述非關鍵產品屬性的重要性變化趨勢進行分類;
所述S2包括:
將在所述評論數據包含的滿意評論中的產品屬性的情感類別標示為正面,將在所述評論數據包含的不滿意評論中的產品屬性的情感類別標示為負面,得到所述多個產品屬性情感類別;
獲取用戶打分評價,并將所述用戶打分評價劃分為高、中、低三個類別;
根據所述打分評價的類別及所述多個產品屬性情感類別,確定所述多個產品屬性中每個產品屬性對于客戶滿意的影響;
所述根據所述打分評價的類別及所述產品屬性情感類別,確定每個所述產品屬性對于客戶滿意的影響包括:
初始信息熵如下:
其中,表示所述評論數據集S中的類變量的概率,k表示類變量值的個數,從所述多個產品屬性選取一個特定產品屬性,根據屬性變量的取值劃分為n個子數據集,該特定產品屬性的每個唯一值的信息熵的總和,如下所示:
;
其中,表示訓練數據S的子集,包含屬性的互斥結果值,將信息增益作為屬性選擇的度量,屬性提供的類變量不確定性的減少量,屬性的越低,增益越高,如下公式:
;
所述S5包括:
根據Mann-Kendall檢測判斷屬性重要性變化趨勢,將所述多個產品屬性分為增值屬性、過時屬性和穩定屬性。
2.根據權利要求1所述的方法,其特征在于,所述S1包括:
采用POS詞性標記方法從所述評論數據中提取產品屬性關聯詞語;
從所述產品屬性關聯詞語中去除非屬性后,進行同義詞合并,生成產品屬性詞典;
依據生成的屬性詞典,識別所述評論數據中每條評論提及的產品屬性,得到所述多個產品屬性。
3.根據權利要求1至2中任一項所述的方法,其特征在于,所述多個時間階段包括下一時間段,所述分別計算所述多個時間階段中所述多個產品屬性的重要性包括:
預測下一時間階段產品屬性的重要性。
4.根據權利要求3所述的方法,其特征在于,所述預測下一時間階段產品屬性的重要性包括:
采用Holt-Winters指數平滑模型預測所述下一時間階段的客戶偏好,根據加權平均及時間序列中數據趨勢和季節性成分,將具有線性趨勢、季節變動和隨機變動的時間序列進行分解,并結合指數平滑法對屬性重要性進行第k步預測,分別對長期趨勢、趨勢增量和季節變動做出估計,k步提前預測模型定義為:
其中,水平成分表示為:
趨勢成分表示為:
季節性成分表示為:
其中,表示近期時間段t時刻的數據點,表示超過的第k節時間段的預測值,有,s表示季節性頻率,平滑參數,和都在[0,1]范圍內,并通過最小化前一個時間段步長的誤差平方和來估計。
5.根據權利要求1所述的方法,其特征在于,所述S3包括:
根據產品屬性的信息增益,根據決策樹模型迭代生成分類規則,出現在所述分類規則中的產品屬性為關鍵產品屬性,未出現在所述分類規則中的產品屬性為非關鍵產品屬性。
6.根據權利要求1所述的方法,其特征在于,所述S4中對所述關鍵產品屬性的觀點進行識別包括:
根據點互信息PMI挖掘所述多個產品屬性的觀點,PMI用于衡量兩個變量之間的相關性,計算公式如下:
其中,表示產品屬性與屬性觀點共同出現的概率,表示產品屬性出現的概率,表示觀點出現的概率;
根據PMI值的大小從所述評論數據中識別出所述多個產品屬性中每個產品屬性的客戶觀點。
7.根據權利要求1所述的方法,其特征在于,所述根據Mann-Kendall檢測判斷屬性重要性變化趨勢,將所述多個產品屬性分為增值屬性、過時屬性和穩定屬性包括:
統計量S計算如下:
其中,n表示時間序列數據點的總數,表示前一時刻數據得到的信息增益,表示當前數據得到的信息增益;
標準化統計量S,按照如下公式:
統計量Z服從標準正態分布,如果p值小于顯著性水平,則存在變化趨勢,如果Z為負值則為增值屬性,如果Z為正值則為過時屬性,如果p值大于顯著性水平則為穩定屬性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥工業大學,未經合肥工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811395964.5/1.html,轉載請聲明來源鉆瓜專利網。





