[發明專利]節目推薦裝置以及節目推薦方法無效
| 申請號: | 200910004535.5 | 申請日: | 2009-03-06 |
| 公開(公告)號: | CN101527815A | 公開(公告)日: | 2009-09-09 |
| 發明(設計)人: | 森纮一郎;村上知子;折原良平 | 申請(專利權)人: | 株式會社東芝 |
| 主分類號: | H04N7/173 | 分類號: | H04N7/173;G06F17/30;H04N7/08 |
| 代理公司: | 北京市中咨律師事務所 | 代理人: | 楊曉光;李 崢 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 節目 推薦 裝置 以及 方法 | ||
相關申請的交叉引用
本發明涉及于2008年3月3日提交的第2008-056540號日本專利申請中包含的主題,其通過引用完全合并到此。
技術領域
本發明涉及一種用于將TV節目推薦給用戶的節目推薦裝置和節目推薦方法。
背景技術
因為近年來節目數量已經增加,所以對于用戶,搜索喜愛的節目已經變得更困難。鑒于這種情況,對于節目推薦系統存在日益增加的需求。該系統從用戶觀看的節目的歷史中學習用戶偏好,并且推薦用戶喜愛的節目。
節目信息已經被數字化為電子節目指南(EPG)。已經提議了一種系統,其通過使用文本信息(例如EPG中包含的類別、演員和節目摘要)來推薦節目。該系統通常通過形態分析將節目摘要分割為詞,對詞進行計數,并且學習用戶喜愛的詞。JP-B2-3351058中公開了這種技術的示例。通過該技術,用戶觀看的節目中更頻繁地出現的詞被確定為用戶更偏愛的詞。相應地,實現了一種推薦包含與用戶偏好匹配的較大數量的詞的節目的方法。
另一方面,存在一種通常使用基于矢量空間模型的方法,其中,使用詞的加權值作為元素以矢量來表示用戶偏好和節目數據。JP-A-2007-202181中公開了這種方法的示例。例如,節目中的詞的出現頻率被用作詞的加權值。在矢量空間模型中,由內積或余弦相似度來定義用戶偏好矢量與節目矢量之間的相似度。實現了一種推薦具有對于用戶偏好矢量的高相似度的節目的方法。
在前述矢量空間模型中,存在這樣的缺陷,即沒能考慮關聯詞或同步詞。例如,當觀看頻繁包含詞“魔術戲法”的節目時,詞“魔術戲法”的加權值變高,但被看作與詞“魔術戲法”關聯的詞的詞“魔法”或“魔法師A(人名)”的加權值不變高。
為了解決該問題,已經提議了一種被稱為潛在語義分析(LSA)或潛在語義索引(LSI)的方法。在JP-A-2006-048287或以下列出的文獻中公開了采用該方法的技術的示例。當使用LSA時,可以根據從EPG數據生成的索引詞-節目矩陣來生成表示關聯詞的矩陣(下文中稱為“關聯詞模型”)。當使用關聯詞模型時,頻繁并置在一個相同節目中的詞被看作關聯詞,從而可以將詞縮減為新的詞。當通過關聯詞模型在維度上縮減矢量時,可以鑒于關聯詞而計算偏好矢量與每一節目矢量之間的相似度。
S.Deerwester,S.T.Dumais,G.W.Furnas,T.K.Landauer?and?R.Harshman,Indexing?by?Latent?Semantic?Analysis,Journal?of?theAmerican?Society?for?Information?Science,Vol.41,pp.391-407,1990
然而,在如上所述的技術中,存在以下問題。
第一個問題是,因為普通詞在大量節目中出現的頻率往往很高,所以用于指定節目的能力較低的詞的加權值變高。例如,因為詞“新聞”或“資訊”被包含在很多節目中,所以該詞將被頻繁地包含在用戶觀看的節目中。為此,“新聞”或“資訊”的加權值變高,從而使得“新聞”或“資訊”被看作與用戶偏好更匹配的詞。雖然推薦包含詞“新聞”或“資訊”的節目,但因為該詞被包含在很多節目中,所以難以指定推薦節目。推薦包含詞“新聞”或“資訊”的所有節目導致很低的推薦準確度。
第二個問題是,在背景技術方法中一點也沒有考慮詞出現的上下文。例如,當用戶頻繁觀看韓國電視劇時,因為詞“韓國”被頻繁包含在節目摘要字段中,所以詞“韓國”的加權值變高。為此,韓國電視劇被頻繁推薦,但涉及韓國總統選舉的新聞節目也同時被推薦。
作為另一示例,設想用戶頻繁觀看英語對話節目。由于“英語”被頻繁包含在英語對話節目的節目摘要字段中,因此詞“英語”的加權值變高。為此,包含詞“英語”的節目被頻繁推薦。然而,即使學前教育節目、中學教育節目和語言綜藝節目中的每一個都包含詞“英語”,這些節目也大不相同。也就是說,在電視節目中,即使使用相同的詞,根據詞的上下文意義節目內容也變化極大。引起的問題在于,當直接使用詞時,無法區分上下文。
與前述問題有關的第三個問題是,通過直接使用詞而不考慮詞的上下文意義的方法無法生成在潛在語義分析中使用的準確的關聯詞模型。例如,設想根據以下兩個節目(a)和(b)的摘要生成關聯詞模型。節目(a)是動畫節目,而節目(b)是旅游綜藝節目。
節目(a)的摘要:用于開始搜索七顆寶石的旅行以拯救邪惡國王控制下的王國的冒險幻想。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于株式會社東芝,未經株式會社東芝許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910004535.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:白平衡控制裝置及其控制方法
- 下一篇:模式轉換方法以及利用此方法的顯示裝置





