[發明專利]數據分析方法及其系統在審
| 申請號: | 201210371691.7 | 申請日: | 2012-09-28 |
| 公開(公告)號: | CN103714063A | 公開(公告)日: | 2014-04-09 |
| 發明(設計)人: | 趙石頑;吳賢;袁泉 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 于靜;張亞非 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 分析 方法 及其 系統 | ||
1.一種數據分析方法,包括:
獲取樣本數據,其中所述樣本數據包含正樣本數據和負樣本數據,所述正樣本數據包括用戶所偏好的項目,并且所述負樣本數據包含用戶非偏好的項目;
選擇所述樣本數據的判別性特征,其中所述判別性特征包括對區分正樣本數據和負樣本數據中的項目具有區分度的特征;
對至少一個目標分析項目,確定其是否具有至少一個所述判別性特征;以及
響應于具有至少一個所述判別性特征,將所述至少一個目標分析項目與至少一個所述判別性特征相關聯。
2.如權利要求1所述的方法,其中所述獲取樣本數據進一步包括:
根據下列各項中的至少一項獲取樣本數據:所述用戶的操作歷史、推薦系統為所述用戶產生的推薦結果。
3.如權利要求2所述的方法,其中所述操作歷史包括下列各項中的至少一項:
所述用戶對項目的打分、所述用戶對項目的操作、所述用戶對項目的評論。
4.如權利要求1所述的方法,其中所述選擇所述樣本數據的判別性特征進一步包括:
確定所述樣本數據中的待選特征,以及
從所述待選特征中選擇判別性特征。
5.如權利要求4所述的方法,其中所述待選特征進一步包括下列各項中的至少一項:結構化特征、非結構化特征,
其中所述結構化特征包括下列各項中的至少一項:屬性以及所述屬性的值、屬性,并且
其中所述非結構化特征包括所述樣本數據中的關鍵詞。
6.如權利要求4所述的方法,其中所述待選特征進一步包括下列各項中的至少一項:
原始特征,所述原始特征包括所述樣本數據中項目原有的特征;
組合特征,所述組合特征包括多個所述原始特征的組合;
概括特征,所述概括特征包括對多個所述原始特征的進行概括所形成的特征。
7.如權利要求4-6中任意一個所述的方法,其中從所述待選特征中選擇判別性特征進一步包括:
計算所述待選特征的區分度值;
根據所述區分度值從所述待選特征中篩選出判別性特征。
8.如權利要求7所述的方法,其中所述計算所述待選特征的區分度值進一步包括:
根據所述待選特征在所述正樣本數據中出現的次數與所述待選特征在所述樣本數據中出現的次數之比計算所述區分度值。
9.如權利要求7所述的方法,其中所述計算所述待選特征的區分度值進一步包括:
根據所述待選特征在所述正樣本數據和所述負樣本數據中分布的熵以及所述待選特征在樣本數據中出現的次數占總樣本數據的比重計算所述區分度值。
10.如權利要求1所述的方法,其中所述至少一個目標分析項目為至少一個推薦項目,所述選擇所述樣本數據的判別性特征進一步包括:
選擇具有正面區分度的待選特征作為判別性特征。
11.一種數據分析系統,包括:
獲取裝置,被配置為獲取樣本數據,其中所述樣本數據包含正樣本數據和負樣本數據,所述正樣本數據包括用戶所偏好的項目,并且所述負樣本數據包含用戶非偏好的項目;
選擇裝置,被配置為選擇所述樣本數據的判別性特征,其中所述判別性特征包括對區分正樣本數據和負樣本數據中的項目具有區分度的特征;
確定裝置,被配置為對至少一個目標分析項目,確定其是否具有至少一個所述判別性特征;以及
關聯裝置,被配置為響應于具有至少一個所述判別性特征,將所述至少一個目標分析項目與至少一個所述判別性特征相關聯。
12.如權利要求11所述的系統,其中所述獲取裝置進一步被配置為:
根據下列各項中的至少一項獲取樣本數據:所述用戶的操作歷史、推薦系統為所述用戶產生的推薦結果。
13.如權利要求12所述的系統,其中所述操作歷史包括下列各項中的至少一項:
所述用戶對項目的打分、所述用戶對項目的操作、所述用戶對項目的評論。
14.如權利要求11所述的系統,其中所述選擇裝置進一步包括:
確定子裝置,被配置為確定所述樣本數據中的待選特征,以及
選擇子裝置,被配置為從所述待選特征中選擇判別性特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210371691.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光電信號接收電路
- 下一篇:家兔局部給藥、染毒保定帶
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





