[發(fā)明專利]視頻終端的新用戶推薦方法有效
| 申請?zhí)枺?/td> | 201410531149.2 | 申請日: | 2014-10-10 |
| 公開(公告)號: | CN104317835B | 公開(公告)日: | 2018-01-16 |
| 發(fā)明(設(shè)計)人: | 陳春;寧立;張涌 | 申請(專利權(quán))人: | 中國科學(xué)院深圳先進技術(shù)研究院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 深圳市銘粵知識產(chǎn)權(quán)代理有限公司44304 | 代理人: | 孫偉峰 |
| 地址: | 518055 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 視頻 終端 新用戶 推薦 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計算機中視頻推薦技術(shù)領(lǐng)域,尤其涉及一種基于決策樹的視頻終端的新用戶推薦方法。
背景技術(shù)
互聯(lián)網(wǎng)和計算機技術(shù)的迅猛發(fā)展把人類帶到了前所未有的一個信息爆炸的時代,海量的數(shù)據(jù)在帶給我們便利的同時,也使得信息的發(fā)現(xiàn)越來越難,在這樣的情形下,搜索引擎(Google,百度等等)成為大家快速找到目標信息的最好途徑。在用戶對自己需求相對明確的時候,用搜索引擎很方便的通過關(guān)鍵字搜索很快的找到自己需要的信息。但搜索引擎并不能完全滿足用戶對信息發(fā)現(xiàn)的需求,那是因為在很多情況下,用戶其實并不明確自己的需要,或者他們的需求很難用簡單的關(guān)鍵字來表述。又或者他們需要更加符合他們個人口味和喜好的結(jié)果,因此出現(xiàn)了推薦系統(tǒng)。如今,隨著推薦技術(shù)的不斷發(fā)展,推薦引擎已經(jīng)在電子商務(wù)(E-commerce,例如Amazon,當當網(wǎng))和一些基于social的社會化站點(包括音樂,電影和圖書分享,例如豆瓣,Mtime等)都取得很大的成功。這也進一步的說明了,Web2.0環(huán)境下,在面對海量的數(shù)據(jù),用戶需要這種更加智能的,更加了解他們需求,口味和喜好的信息發(fā)現(xiàn)機制。
一般情況下,推薦系統(tǒng)所需要的數(shù)據(jù)源包括:要推薦物品或內(nèi)容的元數(shù)據(jù),例如關(guān)鍵字,基因描述等;系統(tǒng)用戶的基本信息,例如性別,年齡等;用戶對物品或者信息的偏好,根據(jù)應(yīng)用本身的不同,可能包括用戶對物品的評分,用戶查看物品的記錄,用戶的購買記錄等。其實這些用戶的偏好信息可以分為兩類:
1.顯式的用戶反饋:這類是用戶在網(wǎng)站上自然瀏覽或者使用網(wǎng)站以外,顯式的提供反饋信息,例如用戶對物品的評分,或者對物品的評論。
2.隱式的用戶反饋:這類是用戶在使用網(wǎng)站是產(chǎn)生的數(shù)據(jù),隱式的反應(yīng)了用戶對物品的喜好,例如用戶購買了某物品,用戶查看了某物品的信息等等。
顯式的用戶反饋能準確的反應(yīng)用戶對物品的真實喜好,但需要用戶付出額外的代價,而隱式的用戶行為,通過一些分析和處理,也能反映用戶的喜好,只是數(shù)據(jù)不是很精確,有些行為的分析存在較大的噪音。但只要選擇正確的行為特征,隱式的用戶反饋也能得到很好的效果,只是行為特征的選擇可能在不同的應(yīng)用中有很大的不同,例如在電子商務(wù)的網(wǎng)站上,購買行為其實就是一個能很好表現(xiàn)用戶喜好的隱式反饋。
1.根據(jù)推薦引擎的數(shù)據(jù)源
其實這里講的是如何發(fā)現(xiàn)數(shù)據(jù)的相關(guān)性,根據(jù)不同的數(shù)據(jù)源發(fā)現(xiàn)數(shù)據(jù)相關(guān)性的方法可以分以下幾種:
1).根據(jù)系統(tǒng)用戶的基本信息發(fā)現(xiàn)用戶的相關(guān)程度,這種被稱為基于人口統(tǒng)計學(xué)的推薦(Demographic-based Recommendation)。
2).根據(jù)推薦物品或內(nèi)容的元數(shù)據(jù),發(fā)現(xiàn)物品或者內(nèi)容的相關(guān)性,這種被稱為基于內(nèi)容的推薦(Content-based Recommendation)。
3).根據(jù)用戶對物品或者信息的偏好,發(fā)現(xiàn)物品或者內(nèi)容本身的相關(guān)性,或者是發(fā)現(xiàn)用戶的相關(guān)性,這種被稱為基于協(xié)同過濾的推薦(Collaborative Filtering-based Recommendation)。
2.根據(jù)推薦模型的建立方式
可以想象在海量物品和用戶的系統(tǒng)中,推薦引擎的計算量是相當大的,要實現(xiàn)實時的推薦務(wù)必需要建立一個推薦模型,關(guān)于推薦模型的建立方式可以分為以下幾種:
1).基于物品和用戶本身的,這種推薦引擎將每個用戶和每個物品都當作獨立的實體,預(yù)測每個用戶對于每個物品的喜好程度,這些信息往往是用一個二維矩陣描述的。由于用戶感興趣的物品遠遠小于總物品的數(shù)目,這樣的模型導(dǎo)致大量的數(shù)據(jù)空置,即我們得到的二維矩陣往往是一個很大的稀疏矩陣。同時為了減小計算量,我們可以對物品和用戶進行聚類,然后記錄和計算一類用戶對一類物品的喜好程度,但這樣的模型又會在推薦的準確性上有損失。
2).基于關(guān)聯(lián)規(guī)則的推薦(Rule-based Recommendation):關(guān)聯(lián)規(guī)則的挖掘已經(jīng)是數(shù)據(jù)挖掘中的一個經(jīng)典的問題,主要是挖掘一些數(shù)據(jù)的依賴關(guān)系,典型的場景就是“購物籃問題”,通過關(guān)聯(lián)規(guī)則的挖掘,我們可以找到哪些物品經(jīng)常被同時購買,或者用戶購買了一些物品后通常會購買哪些其他的物品,當我們挖掘出這些關(guān)聯(lián)規(guī)則之后,我們可以基于這些規(guī)則給用戶進行推薦。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院深圳先進技術(shù)研究院,未經(jīng)中國科學(xué)院深圳先進技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410531149.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 資源處理方法及裝置
- 根據(jù)聯(lián)系人的信用狀況判斷用戶信用等級的方法
- 基于網(wǎng)站的關(guān)聯(lián)推廣者和新用戶的方法
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計算機可讀介質(zhì)
- 一種金融產(chǎn)品的邀請獎勵方法和系統(tǒng)
- 一種識別新用戶的性別的方法及設(shè)備
- 用于驗證設(shè)備在線市場平臺上的用戶的身份的系統(tǒng)和方法
- 一種提示預(yù)警風險的方法和裝置
- 基于歐氏對齊和Procrustes分析的EEG分類的遷移學(xué)習(xí)方法和系統(tǒng)
- 新用戶的授信方法及裝置、電子設(shè)備、存儲介質(zhì)





