[發明專利]基于典型性的評論大數據挖掘方法有效
| 申請號: | 201410796566.X | 申請日: | 2014-12-18 |
| 公開(公告)號: | CN104462480B | 公開(公告)日: | 2017-11-10 |
| 發明(設計)人: | 劉耀強 | 申請(專利權)人: | 劉耀強 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 廣州市華學知識產權代理有限公司44245 | 代理人: | 黃磊 |
| 地址: | 511400 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 典型性 評論 數據 挖掘 方法 | ||
1.基于典型性的評論大數據挖掘方法,其特征在于,包括下述步驟:
(1)評論典型性挖掘建模,對評論典型性計算和最小代表評論集合挖掘問題進行建模和形式化定義;
(2)典型性評論原型自動構建,基于認知心理學的“基層概念”理論和多原型理論來設計評論典型性計算方法,用“基層概念”理論中的類別效用來指導評論原型的生成;
(3)最小評論集合挖掘,采用最小評論集合挖掘算法,篩選出一個最小評論集合,該集合具有如下特點:集合里的每一條評論都不同且都能代表相當一部分用戶的觀點,該最小評論集合里的所有評論能涵蓋和代表某一個商品所有評論的觀點,用戶只需要瀏覽該最小評論集合里的評論,就可以了解所有該商品評論的用戶觀點;
(4)采用BigSimDet并行計算方法,通過調用分布式集群中的計算節點以并行的方式處理相似性評論檢測任務。
2.根據權利要求1所述基于典型性的評論大數據挖掘方法,其特征在于,步驟(1)中,評論典型性挖掘建模的具體步驟為:
(1-1)把某個商品x的所有評論看成是一個“概念”,所述“概念”即商品x的評論,每一條評論則是這個“概念”的一個“實例”,則每條評論在該“概念”中都有不同的典型性,另外,在商品x的評論的所有評論中,抽取出一個最小代表評論集合,該評論集合有以下兩個屬性:
(1-1-1)集合所包含的所有n條評論能最大程度上代表所有用戶的不同類型的觀點;
(1-1-2)集合里的評論數量n為盡可能小;用戶只需瀏覽為數不多的n條評論就可以較全面地了解針對商品x的所有觀點和意見;
(1-2)采用“方面”來對商品評論進行形式化表示;
其中sa,i是一個屬于商品a的“方面”,va,i是評論中對于sa,i的情感極性值,即某一個方面的情感傾向值;
(1-3)對于評論典型性計算問題,可以看成是一個如下函數:
χ:Ri→Ti
其中,Ri是屬于商品i的評論集合,Ti是根據評論典型性排序后的評論集合;
對于最小代表性評論集合挖掘問題,根據多原型理論,首先對商品評論進行聚類,然后從每一個評論類別中抽取出一個評論原型來代表這類評論,因此,商品x的所有評論可以由n個評論原型來表示,即:
其中,是一個評論原型,可以表示為:
(1-4)最小代表性評論集合挖掘問題可以表示為一個函數:
θ:Ri→Li
其中,Ri是屬于商品i的評論集合,Li是商品i的最小代表性評論集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于劉耀強,未經劉耀強許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410796566.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種文件系統評估方法及系統
- 下一篇:一種高光譜目標探測的方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





