[發明專利]學習裝置和方法、信息處理裝置和方法以及程序無效
| 申請號: | 201010105793.5 | 申請日: | 2010-01-28 |
| 公開(公告)號: | CN101840410A | 公開(公告)日: | 2010-09-22 |
| 發明(設計)人: | 高松慎吾 | 申請(專利權)人: | 索尼公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 宋鶴;南霆 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 學習 裝置 方法 信息處理 以及 程序 | ||
技術領域
本發明涉及學習裝置、學習方法、信息處理裝置、數據選擇方法、數據累積方法、數據轉換方法和程序。
背景技術
近年來,隨著信息技術的進步,已經由諸如因特網之類的網絡向用戶提供諸如音樂、視頻、書本和新聞報道之類的各種內容。由于在這種內容提供服務中管理著龐大的內容量,所以用戶難以通過其自身找到適合各個用戶的適當內容。因此,已利用稱為推薦的技術來例如基于用戶的諸如購買或觀看之類的行動歷史來獲取用戶的喜好,并且選擇和提議適合于各個用戶的內容。
許多現有推薦技術的共同點之一是根據用戶的行動歷史來利用通過數字等來指示出用戶喜好的用戶喜好數據(UP)以執行推薦。例如,在稱為協同過濾(collaborative?filtering)的推薦算法中,在不同用戶之間對用戶喜好數據進行比較以便指定具有相似喜好的用戶,然后該用戶在過去使用的內容將成為推薦對象。在日本專利申請早期公布No.2006-215867和No.2008-077386中公開了該推薦算法的示例。與此同時,例如,在稱為基于內容的過濾的推薦算法中,對在共同數據空間中的用戶喜好數據和指示出內容屬性的內容屬性數據進行比較,然后被確定為適合用戶喜好的內容可以成為推薦對象。
發明內容
但是,存在如下情況:其中,用戶喜好數據或者內容屬性數據的數據空間由于例如在要成為推薦對象的內容的領域、生成用戶喜好數據的設備類型、供應設備的銷售商等方面的差異而彼此不同。當數據空間不同時,能夠基于用戶喜好數據或內容屬性數據而被推薦的內容的范圍將受限。另外,存在如下情況:其中,例如由于行動歷史累積不充分而使得難以推薦適當內容。
鑒于以上情形,希望提供新穎且改進的學習裝置、學習方法、信息處理裝置、數據選擇方法、數據累積方法、數據轉換方法和程序,它們能夠在各領域的不同數據空間之間共同管理用戶喜好或內容屬性。
根據本發明一個實施例,提供了一種學習裝置,該學習裝置包括:第一數據獲取單元,獲取屬于第一數據空間的第一用戶喜好數據;第二數據獲取單元,獲取與第一用戶喜好數據共同的用戶的第二用戶喜好數據,第二用戶喜好數據屬于與第一數據空間不同的第二數據空間;壓縮單元,利用第一參數集合從第一用戶喜好數據生成具有較少數據項目數的第一經壓縮用戶喜好數據;以及學習單元,學習第二參數集合,該第二參數集合被利用來從第二用戶喜好數據生成具有與第一經壓縮用戶喜好數據相同的數據項目數的第二經壓縮用戶喜好數據,以使得第一經壓縮用戶喜好數據和第二經壓縮用戶喜好數據之間的差異在多個用戶間較小。
學習單元可以以由壓縮單元生成的第一經壓縮用戶喜好數據作為第二經壓縮用戶喜好數據的訓練數據來學習第二參數集合。
壓縮單元可以根據多主題模型來生成第一經壓縮用戶喜好數據。
第一參數集合和第二參數集合可以是與多主題模型的主題的固有分布相對應的參數集合。
第一數據空間和第二數據空間可以是與相互不同的內容領域相對應的數據空間。
第一數據空間和第二數據空間可以是由相互不同的設備生成的用戶喜好數據的數據空間。
根據本發明另一實施例,提供了一種學習方法,該方法包括以下步驟:獲取屬于第一數據空間的第一用戶喜好數據;獲取與第一用戶喜好數據共同的用戶的第二用戶喜好數據,第二用戶喜好數據屬于與第一數據空間不同的第二數據空間;通過利用第一參數集合來從第一用戶喜好數據生成具有較少數據項目數的第一經壓縮用戶喜好數據;以及學習第二參數集合,該第二參數集合被利用來從第二用戶喜好數據生成具有與第一經壓縮用戶喜好數據相同的數據項目數的第二經壓縮用戶喜好數據,以使得第一經壓縮用戶喜好數據和第二經壓縮用戶喜好數據之間的差異在多個用戶間較小。
根據本發明另一實施例,提供了一種程序,該程序使得對信息處理裝置進行控制的計算機執行如下功能:第一數據獲取單元,獲取屬于第一數據空間的第一用戶喜好數據;第二數據獲取單元,獲取與所述第一用戶喜好數據共同的用戶的第二用戶喜好數據,所述第二用戶喜好數據屬于與所述第一數據空間不同的第二數據空間;壓縮單元,通過利用第一參數集合從所述第一用戶喜好數據生成具有較少數據項目數的第一經壓縮用戶喜好數據;以及學習單元,學習第二參數集合,所述第二參數集合被利用來從所述第二用戶喜好數據生成具有與所述第一經壓縮用戶喜好數據相同的數據項目數的第二經壓縮用戶喜好數據,以使得所述第一經壓縮用戶喜好數據和所述第二經壓縮用戶喜好數據之間的差異在多個用戶間較小。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼公司,未經索尼公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010105793.5/2.html,轉載請聲明來源鉆瓜專利網。





