[發(fā)明專利]一種基于推薦系統(tǒng)的推薦模型生成方法及相關(guān)裝置在審
| 申請?zhí)枺?/td> | 201711007965.3 | 申請日: | 2017-10-25 |
| 公開(公告)號: | CN107609201A | 公開(公告)日: | 2018-01-19 |
| 發(fā)明(設(shè)計)人: | 楊海龍;李松林;李衛(wèi)軍 | 申請(專利權(quán))人: | 廣東工業(yè)大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司11227 | 代理人: | 羅滿 |
| 地址: | 510006 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 推薦 系統(tǒng) 模型 生成 方法 相關(guān) 裝置 | ||
技術(shù)領(lǐng)域
本申請涉及計算機技術(shù)領(lǐng)域,特別涉及一種基于推薦系統(tǒng)的推薦模型生成方法、生成裝置、計算機可讀存儲介質(zhì)及計算機終端。
背景技術(shù)
隨著互聯(lián)網(wǎng)的快速發(fā)展,為人們的生活帶來了許多便利,同時也帶了海量的數(shù)據(jù)信息,不夸張的說人類已經(jīng)進入了一個數(shù)據(jù)大爆炸的時代。消費者在數(shù)據(jù)的海洋中,面臨眾多的選擇、種類繁多的新領(lǐng)域以及過載的信息,在這些新選擇中,消費者往往無所適從。另一方面,內(nèi)容的生產(chǎn)者面對平臺中的眾多用戶,往往也是找不到合適的用戶,也就無法尋找到最便捷的渠道來展示自己的優(yōu)勢信息。
因此,出現(xiàn)了推薦系統(tǒng)來解決上述的問題。推薦系統(tǒng)的核心是推薦算法,推薦算法的好壞就決定了推薦系統(tǒng)的好壞,而評判一個推薦算法主要通過準(zhǔn)確率和召回率來判斷。準(zhǔn)確率是指預(yù)測為正的樣本中有多少是真正的正樣本,也就是通過模型進行預(yù)測的結(jié)果中有多少是對的;召回率是指樣本中的正例有多少被預(yù)測正確了,也就是模型的預(yù)測結(jié)果覆蓋了樣本中的多少正確的例子。
目前,常用的推薦算法主要包括協(xié)同過濾算法和基于內(nèi)容的推薦算法。在協(xié)同過濾算法中用戶對于物品的喜好被量化為用戶對物品的評分,并以一個用戶關(guān)聯(lián)一個物品的評分矩陣進行表示。協(xié)同過濾算法具有較好的自動化程度,以及個性化程度較高,但是具有一定的數(shù)據(jù)稀疏性問題。對于基于內(nèi)容的推薦算法其推薦結(jié)果直觀,容易解釋,但也存在數(shù)據(jù)稀疏性的問題。
進一步的,研究者推出了GLSLIM模型,該模型在一定程度上優(yōu)化了數(shù)據(jù)稀疏性的問題,而且具有較高的準(zhǔn)確率,但是該算法的召回率較低,不利于推薦系統(tǒng)使用。
因此,如何使推薦算法在準(zhǔn)確率和召回率中取得一個平衡,是本領(lǐng)域技術(shù)人員所關(guān)注的重點問題。
發(fā)明內(nèi)容
本申請的目的是提供一種基于推薦系統(tǒng)的推薦模型生成方法、生成裝置、計算機可讀存儲介質(zhì)及計算機終端,通過將GLSLIM模型和PLSA模型進行調(diào)整參數(shù)達到最優(yōu)的模型狀態(tài),再將這兩個模型通過目標(biāo)函數(shù)進行融合得到目標(biāo)函數(shù),最后把目標(biāo)函數(shù)通過調(diào)整參數(shù)得到最優(yōu)的推薦模型,解決了GLSLIM模型的召回率較低的問題,使推薦結(jié)果能滿足不同用戶的個性化需求。
為解決上述技術(shù)問題,本申請?zhí)峁┮环N基于推薦系統(tǒng)的推薦模型生成方法,包括:
將GLSLIM模型根據(jù)數(shù)據(jù)集進行準(zhǔn)確率調(diào)參處理得到第一推薦模型,進行推薦結(jié)果計算得到第一結(jié)果目標(biāo)函數(shù);
將PLSA模型根據(jù)所述數(shù)據(jù)集進行召回率調(diào)參處理得到第二推薦模型,進行推薦結(jié)果計算得到第二結(jié)果目標(biāo)函數(shù);
將所述第一結(jié)果目標(biāo)函數(shù)與所述第二結(jié)果目標(biāo)函數(shù)進行融合處理得到融合目標(biāo)函數(shù),根據(jù)所述數(shù)據(jù)集進行平衡調(diào)參處理得到推薦模型。
可選的,所述將GLSLIM模型根據(jù)數(shù)據(jù)集進行準(zhǔn)確率調(diào)參處理得到第一推薦模型,進行推薦結(jié)果計算得到第一結(jié)果目標(biāo)函數(shù)包括:
在第一預(yù)設(shè)范圍內(nèi)取多個用戶個性化權(quán)重參數(shù);
將每個所述用戶個性化權(quán)重參數(shù)帶入到所述GLSLIM模型中,根據(jù)所述數(shù)據(jù)集進行計算得到多個第一推薦結(jié)果;
將每個所述第一推薦結(jié)果進行計算得到多個準(zhǔn)確率,選取所述準(zhǔn)確率最大的所述用戶個性化權(quán)重參數(shù)設(shè)置為所述GLSLIM模型的最終用戶個性化權(quán)重參數(shù),得到所述第一推薦模型;
將所述第一推薦模型進行推薦結(jié)果計算得到所述第一結(jié)果目標(biāo)函數(shù)。
可選的,所述將PLSA模型根據(jù)所述數(shù)據(jù)集進行召回率調(diào)參處理得到第二推薦模型,進行推薦結(jié)果計算得到第二結(jié)果目標(biāo)函數(shù)包括:
在第二預(yù)設(shè)范圍內(nèi)取多個類別參數(shù);
將每個所述類別參數(shù)帶入到所述PLSA模型中,根據(jù)所述數(shù)據(jù)集進行計算得到多個第二推薦結(jié)果;
將每個所述第二推薦結(jié)果進行計算得到多個召回率,選取所述召回率最大的所述類別參數(shù)設(shè)置為所述PLSA模型的最終類別參數(shù),得到所述第二推薦模型;
將所述第二推薦模型進行推薦結(jié)果計算得到所述第二結(jié)果目標(biāo)函數(shù)。
可選的,所述將所述第一結(jié)果目標(biāo)函數(shù)與所述第二結(jié)果目標(biāo)函數(shù)進行融合處理得到融合目標(biāo)函數(shù),根據(jù)所述數(shù)據(jù)集進行平衡調(diào)參處理得到推薦模型包括:
將所述第一結(jié)果目標(biāo)函數(shù)與所述第二結(jié)果目標(biāo)函數(shù)通過r=α*r1+(1-α)*r2進行融合得到融合目標(biāo)函數(shù)r;其中,所述第一結(jié)果目標(biāo)函數(shù)為r1,所述第二結(jié)果目標(biāo)函數(shù)為r2;
在第三預(yù)設(shè)范圍內(nèi)取多個推薦結(jié)果占比參數(shù)α;
將每個所述推薦結(jié)果占比參數(shù)α帶入到所述融合目標(biāo)函數(shù)r中進行計算得到多個目標(biāo)函數(shù)值;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東工業(yè)大學(xué),未經(jīng)廣東工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711007965.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





