[發明專利]數據分析方法及其系統在審
| 申請號: | 201210371691.7 | 申請日: | 2012-09-28 |
| 公開(公告)號: | CN103714063A | 公開(公告)日: | 2014-04-09 |
| 發明(設計)人: | 趙石頑;吳賢;袁泉 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京市中咨律師事務所 11247 | 代理人: | 于靜;張亞非 |
| 地址: | 美國*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 分析 方法 及其 系統 | ||
技術領域
本發明的實施方式總體上涉及數據處理,進一步本發明的實施方式涉及數據分析及其系統。
背景技術
數據分析已經在很多重要領域發揮重要作用。很多網絡應用都向用戶推薦商品(包括圖書、電影等各種商品)以及推薦好友。比如在在線書店中,當用戶購買或瀏覽圖書時,在線書店可能向用戶推薦他/她可能感興趣的圖書。再比如在在線社交網絡中,用戶可能被推薦好友。在線應用往往根據用戶的個人數據和之前的網絡行為進行推薦。借助于所述推薦系統,用戶能夠容易的獲得更多的信息。但是很多推薦算法過于復雜(比如矩陣分解模型Matrix?Factorization,某些基于概率的模型,基于圖的模型等)導致推薦應用本身都無法解釋為何向用戶推薦某個項目而不是其它項目。此外,有些推薦系統即便給出推薦的理由,但是所述理由也不是個性化的,而是使用通用的理由進行推薦,比如當用戶瀏覽一個在線書店的書A時,該在線書店將書B推薦給用戶,其理由是購買了書A的其它用戶也購買了書B。
發明內容
為了提供一種個性化的數據分析方法從而找到目標分析項目中有區別度的特征,發明提供一種數據分析方案。
具體而言,本發明提供一種數據分析方法,包括:獲取樣本數據,其中所述樣本數據包含正樣本數據和負樣本數據,所述正樣本數據包括用戶所偏好的項目,并且所述負樣本數據包含用戶非偏好的項目;選擇所述樣本數據的判別性特征,其中所述判別性特征包括對區分正樣本數據和負樣本數據中的項目具有區分度的特征;對至少一個目標分析項目,確定其是否具有至少一個所述判別性特征;以及響應于具有至少一個所述判別性特征,將所述至少一個目標分析項目與至少一個所述判別性特征相關聯。
本發明還提供一種數據分析系統,包括:獲取裝置,被配置為獲取樣本數據,其中所述樣本數據包含正樣本數據和負樣本數據,所述正樣本數據包括用戶所偏好的項目,并且所述負樣本數據包含用戶非偏好的項目;選擇裝置,被配置為選擇所述樣本數據的判別性特征,其中所述判別性特征包括對區分正樣本數據和負樣本數據中的項目具有區分度的特征;確定裝置,被配置為對至少一個目標分析項目,確定其是否具有至少一個所述判別性特征;以及關聯裝置,被配置為響應于具有至少一個所述判別性特征,將所述至少一個目標分析項目與至少一個所述判別性特征相關聯。
通過本發明的數據分析方案可以個性化的識別目標分析項目中有區分度的特征,從而使得數據分析結果更加詳盡、充實。
附圖說明
通過結合附圖對本公開示例性實施方式進行更詳細的描述,本公開的上述以及其它目的、特征和優勢將變得更加明顯,其中,在本公開示例性實施方式中,相同的參考標號通常代表相同部件。
圖1示出了適于用來實現本發明實施方式的示例性計算系統100的框圖。
圖2示出了按照本發明的一個實施例的數據分析方法的流程圖。
圖3示出了按照本發明的一個實施例的選擇判別性特征的流程圖。
圖4A示出了按照本發明的一個實施例的樣本數據示意圖。
圖4B示出了按照本發明的另一個實施例的樣本數據示意圖。
圖4C示出了按照本發明的又一個實施例的樣本數據示意圖。
圖5示出了按照本發明的一個實施例的數據分析系統示意圖。
圖6示出了按照本發明的一個實施例的選擇裝置的示意圖。
具體實施方式
下面將參照附圖更詳細地描述本公開的優選實施方式。雖然附圖中顯示了本公開的優選實施方式,然而應該理解,可以以各種形式實現本公開而不應被這里闡述的實施方式所限制。相反,提供這些實施方式是為了使本公開更加透徹和完整,并且能夠將本公開的范圍完整的傳達給本領域的技術人員。通過結合附圖對本公開示例性實施方式進行更詳細的描述,本公開的上述以及其它目的、特征和優勢將變得更加明顯,其中,在本公開示例性實施方式中,相同的參考標號通常代表相同部件。
圖1示出了適于用來實現本發明實施方式的示例性計算機系統/服務器12的框圖。
下面將參照附圖更詳細地描述本公開的優選實施方式。雖然附圖中顯示了本公開的優選實施方式,然而應該理解,可以以各種形式實現本公開而不應被這里闡述的實施方式所限制。相反,提供這些實施方式是為了使本公開更加透徹和完整,并且能夠將本公開的范圍完整地傳達給本領域的技術人員。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210371691.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光電信號接收電路
- 下一篇:家兔局部給藥、染毒保定帶
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





