[發(fā)明專利]數(shù)據(jù)推薦方法及系統(tǒng)無效
| 申請?zhí)枺?/td> | 201210525924.4 | 申請日: | 2012-12-07 |
| 公開(公告)號: | CN103870972A | 公開(公告)日: | 2014-06-18 |
| 發(fā)明(設(shè)計)人: | 王文廣;陳運文 | 申請(專利權(quán))人: | 盛樂信息技術(shù)(上海)有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 上海思微知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 31237 | 代理人: | 菅秀君 |
| 地址: | 201203 上海市浦東新區(qū)*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 推薦 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種數(shù)據(jù)推薦方法及系統(tǒng)。
背景技術(shù)
在當(dāng)今互聯(lián)網(wǎng)中,海量數(shù)據(jù)已經(jīng)不是新聞。據(jù)悉,人類有史以來的所有印刷信息是200PB(1PB=1024TB=1048576GB),而目前單個大型網(wǎng)站的信息處理,也已經(jīng)進(jìn)入PB時代,并將往EB(1EB=1024PB)時代前行。如此浩瀚的信息,如果沒有一個合適的獲取信息的途徑和方法,則不僅會使得人們在信息面前束手無策,甚至?xí)斐扇藗兊膲阂指校怪蔀橐粋€負(fù)擔(dān)。人類為了解決信息獲取的便捷和舒適,不斷在進(jìn)行著探索。互聯(lián)網(wǎng)上信息獲取方式逐漸由原始階段分門別類按圖索驥的門戶時代,過渡到通過搜索為各類信息進(jìn)行網(wǎng)狀關(guān)聯(lián)篩選的搜索引擎時代,進(jìn)而進(jìn)入大規(guī)模數(shù)據(jù)分析和挖掘的推薦系統(tǒng)時代。
推薦系統(tǒng)就是根據(jù)對用戶和對內(nèi)容的理解為用戶推薦其可能感興趣的內(nèi)容,這種推薦方案是從人類社會交往中抽象出來的,在人類的社會交往中,一個常見的場景是,小莉買了一件衣服,穿著很舒服很得體很漂亮,有一天,她遇到了她的好朋友小敏,小莉就可能對小敏說“我知道有一家店,店家很好,價格合理,質(zhì)量一流,他家賣的連衣裙很適合你”。小莉的行為便是一個典型的推薦行為。如果小莉是一個推薦系統(tǒng),那么她要給小敏推薦,則需要有如下幾個條件:
1)小敏需要成為推薦系統(tǒng)“小莉”的用戶,以讓小敏有機(jī)會向小莉推薦,就如同上面這個例子,小莉和小敏是朋友關(guān)系,他們碰上了就會進(jìn)行交流;
2)小敏需要在“小莉”的系統(tǒng)上留下一些行為和資料,以讓小莉可以理解小敏,在上面這個例子中,小莉和小敏是好朋友,小莉很了解小敏,知道小敏喜歡穿連衣裙,并且知道她的品味;
3)推薦系統(tǒng)“小莉”需要對內(nèi)容進(jìn)行理解,以便給用戶推薦內(nèi)容,如上例,小莉去某個店買過衣服,知道這個店不錯,并且有適合小敏的連衣裙。
因此,為了使得推薦系統(tǒng)的效果更好,需要更好的理解用戶的行為。傳統(tǒng)的做法是記錄用戶在網(wǎng)站上的各種點擊、購買、瀏覽、觀看等用戶正反饋的行為。并用這些正反饋行為,以及用戶資料,為用戶建立模型,以便理解用戶喜歡什么,關(guān)注什么。這樣如果推薦系統(tǒng)中出現(xiàn)了合適的內(nèi)容時,則會把這些內(nèi)容推薦給用戶。這種推薦系統(tǒng)中,當(dāng)用戶行為足夠豐富,推薦系統(tǒng)所理解的內(nèi)容也足夠豐富的話,其效果會表現(xiàn)的很好。比如,小莉和小敏兩人是閨蜜,互相之間無話不說,而小莉恰好又是逛街狂人,基本上一天一大逛,兩天一小逛。這樣小莉給小敏推薦的連衣裙,就會深得小敏的喜歡;反過來如果哪天小敏想買衣服,也一定會征詢小莉的意見。
然而,當(dāng)今互聯(lián)網(wǎng)的一個推薦系統(tǒng)的用戶會成萬上億,這其中大部分的用戶在系統(tǒng)上的歷史行為會很稀疏。當(dāng)行為稀疏,不能很好的理解用戶時,就無法為其推薦合適的內(nèi)容,現(xiàn)有的推薦系統(tǒng)中常見的問題如下:
1)由于用戶行為的稀疏導(dǎo)致無法理解用戶喜歡哪些數(shù)據(jù),無法推薦給用戶他所喜歡的數(shù)據(jù);
2)由于用戶行為過少,只了解該用戶小部分的喜好,為其推薦的內(nèi)容就會局限在一個很小的范圍向用戶,導(dǎo)致推薦給該用戶的數(shù)據(jù)與推薦給其他用戶的數(shù)據(jù)太過近似或者雷同;
3)會向用戶推薦超出理解范圍內(nèi)的數(shù)據(jù),通常只會隨機(jī)或按照熱點向用戶進(jìn)行推薦,導(dǎo)致推薦給用戶的是大量其不感興趣的內(nèi)容,造成用戶對推薦系統(tǒng)產(chǎn)生負(fù)面情緒;
4)由于對用戶喜好的理解的敏感度較低,無法及時捕獲到用戶興趣的變化,導(dǎo)致推薦給用戶的是其過去喜歡而現(xiàn)在已經(jīng)不喜歡了的數(shù)據(jù),造成過擬合問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種數(shù)據(jù)推薦方法及系統(tǒng),能夠解決采用單向絕對興趣建模的過擬合問題和用戶數(shù)據(jù)稀疏性的問題,增強(qiáng)用戶對推薦系統(tǒng)的粘性和系統(tǒng)的魯棒性。
為解決上述問題,本發(fā)明提供一種數(shù)據(jù)推薦方法,包括:
從用戶對數(shù)據(jù)的歷史行為中獲取正反饋數(shù)據(jù)和負(fù)反饋數(shù)據(jù);
根據(jù)每個數(shù)據(jù)的特點和預(yù)設(shè)的數(shù)據(jù)特征生成該數(shù)據(jù)相對于每個數(shù)據(jù)特征的特征值;
將正反饋數(shù)據(jù)和負(fù)反饋數(shù)據(jù)隨機(jī)結(jié)對,根據(jù)正反饋數(shù)據(jù)和負(fù)反饋數(shù)據(jù)的特征值和結(jié)對后的正反饋數(shù)據(jù)和負(fù)反饋數(shù)據(jù)獲取該用戶對每個數(shù)據(jù)特征的興趣權(quán)值;
根據(jù)每個數(shù)據(jù)的特征值和用戶對每個數(shù)據(jù)特征的興趣權(quán)值獲取該用戶對該數(shù)據(jù)的興趣值;
將所述興趣值從大到小排序,并獲取前K個興趣值最高的數(shù)據(jù)推薦給該用戶,K為正整數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于盛樂信息技術(shù)(上海)有限公司,未經(jīng)盛樂信息技術(shù)(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210525924.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





