[發(fā)明專利]一種個性化推薦方法及系統(tǒng)有效
申請?zhí)枺?/td> | 201110365030.9 | 申請日: | 2011-11-17 |
公開(公告)號: | CN103116588B | 公開(公告)日: | 2017-07-04 |
發(fā)明(設(shè)計)人: | 劉懷軍;劉玉璇 | 申請(專利權(quán))人: | 深圳市世紀光速信息技術(shù)有限公司 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 北京華沛德權(quán)律師事務(wù)所11302 | 代理人: | 劉杰 |
地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 一種 個性化 推薦 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,尤其涉及一種個性化推薦方法及系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)搜索引擎技術(shù)的迅猛發(fā)展以及社會性網(wǎng)絡(luò)服務(wù)(social networking service,SNS)的迅速普及,個性化推薦已成為了人們網(wǎng)絡(luò)生活中不可或缺的網(wǎng)絡(luò)服務(wù)之一,也成為了互聯(lián)網(wǎng)產(chǎn)品未來發(fā)展的一個重點。
現(xiàn)有的個性化推薦方案如下:1、用戶根據(jù)自身興趣自行設(shè)定喜好的興趣標簽,系統(tǒng)根據(jù)推薦內(nèi)容與用戶興趣標簽的匹配程度為用戶進行個性化推薦。例如,在新浪微博中,用戶自行設(shè)定自己的興趣標簽,系統(tǒng)根據(jù)推薦微博與用戶興趣標簽的匹配程度,為用戶進行微博的個性化推薦;2、用戶根據(jù)自身興趣,在已經(jīng)設(shè)定好的分類中選擇感興趣的類別標簽,系統(tǒng)根據(jù)推薦內(nèi)容與用戶類別標簽的匹配程度為用戶進行個性化推薦。例如,在百度知道中,用戶自行選擇自己擅長領(lǐng)域的類別標簽,系統(tǒng)根據(jù)待解答問題與用戶類別標簽的匹配程度,為用戶進行待解答問題的個性化推薦。
然而,由于用戶自行選擇標簽的時間及精力有限,或者鑒于個人隱私不愿意去配置相應(yīng)的標簽,導(dǎo)致標簽描述不準確且覆蓋率低,使得現(xiàn)有技術(shù)無法將標簽與推薦內(nèi)容進行精確匹配。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種個性化推薦方法,旨在解決現(xiàn)有的個性化推薦必須由用戶自行設(shè)定標簽,導(dǎo)致推薦內(nèi)容與標簽匹配的準確度和覆蓋率均不高的問題。
本發(fā)明實施例是這樣實現(xiàn)的,一種個性化推薦方法,所述方法包括下述步驟:
分別提取用戶數(shù)據(jù)和推薦內(nèi)容的特征詞,所述特征詞用于表征其所處數(shù)據(jù)的領(lǐng)域;
根據(jù)提取出的特征詞,通過在預(yù)設(shè)的領(lǐng)域分類體系中分別針對用戶數(shù)據(jù)和推薦內(nèi)容為每個級別生成相應(yīng)的分類模型,獲取用戶數(shù)據(jù)和推薦內(nèi)容歸屬于每個類別的分類概率;
根據(jù)相應(yīng)的分類概率生成用戶興趣標簽樹和推薦內(nèi)容標簽樹,計算所述用戶興趣標簽樹和所述推薦內(nèi)容標簽樹的相關(guān)性,當(dāng)所述相關(guān)性大于第一預(yù)設(shè)閾值時,為用戶推薦相應(yīng)的推薦內(nèi)容。
本發(fā)明實施例的另一目的在于提供一種個性化推薦系統(tǒng),所述系統(tǒng)包括:
特征詞提取模塊,用于分別提取用戶數(shù)據(jù)和推薦內(nèi)容的特征詞;
分類概率獲取模塊,用于根據(jù)提取出的特征詞,通過在預(yù)設(shè)的領(lǐng)域分類體系中分別針對用戶數(shù)據(jù)和推薦內(nèi)容為每個級別生成相應(yīng)的分類模型,獲取用戶數(shù)據(jù)和推薦內(nèi)容歸屬于每個類別的分類概率;
推薦模塊,用于根據(jù)相應(yīng)的分類概率生成用戶興趣標簽樹和推薦內(nèi)容標簽樹,計算所述用戶興趣標簽樹和所述推薦內(nèi)容標簽樹的相關(guān)性,當(dāng)所述相關(guān)性大于第一預(yù)設(shè)閾值時,為用戶推薦相應(yīng)的推薦內(nèi)容。
在本發(fā)明實施例中,基于從用戶數(shù)據(jù)和推薦內(nèi)容中提取出的特征詞,對領(lǐng)域分類體系的每一級均生成不同的分類模型,來分別對用戶數(shù)據(jù)及推薦內(nèi)容進行自動分類,從而生成相應(yīng)的標簽樹,以進一步通過相關(guān)性匹配來實現(xiàn)對用戶的個性化推薦,提高了標簽描述的準確性和覆蓋率,也由此提高了用戶數(shù)據(jù)與推薦內(nèi)容匹配的精確性。
附圖說明
圖1是本發(fā)明第一實施例提供的個性化推薦方法的實現(xiàn)流程圖;
圖2A是詞匯“JUMPSQ”的類間分布和類先驗分布的對比情況圖;
圖2B是詞匯“招股”的類間分布和類先驗分布的對比情況圖;
圖2C是詞匯“始端”的類間分布和類先驗分布的對比情況圖;
圖3是本發(fā)明實施例提供的領(lǐng)域分類體系示例圖;
圖4是本發(fā)明第二實施例提供的個性化推薦方法自動分類的具體實現(xiàn)流程圖;
圖5是本發(fā)明第三實施例提供的個性化推薦方法相關(guān)性計算的具體實現(xiàn)流程圖;
圖6A是本發(fā)明實現(xiàn)示例提供的用戶興趣標簽樹示例圖;
圖6B是本發(fā)明實現(xiàn)示例提供的推薦內(nèi)容標簽樹示例圖;
圖7是本發(fā)明第四實施例提供的個性化推薦系統(tǒng)的結(jié)構(gòu)圖。
具體實施方式
為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點更加清楚明白,以下結(jié)合附圖及實施例,對本發(fā)明進行進一步詳細說明。應(yīng)當(dāng)理解,此處所描述的具體實施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
在本發(fā)明實施例中,基于從用戶數(shù)據(jù)和推薦內(nèi)容中提取出的特征詞,并根據(jù)改進的貝葉斯(Bayes)分類算法來分別對用戶數(shù)據(jù)及推薦內(nèi)容進行自動分類,從而生成相應(yīng)的標簽樹,以進一步通過相關(guān)性匹配來實現(xiàn)對用戶的個性化推薦,提高了標簽描述的準確性和覆蓋率,也由此提高了用戶數(shù)據(jù)與推薦內(nèi)容匹配的精確性。
圖1示出了本發(fā)明第一實施例提供的個性化推薦方法的實現(xiàn)流程,詳述如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市世紀光速信息技術(shù)有限公司,未經(jīng)深圳市世紀光速信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110365030.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種具有外徑檢測功能的磨床
- 下一篇:帶有旋轉(zhuǎn)平臺的高速穿孔機