[發(fā)明專利]基于用戶畫像聚類的協(xié)同過濾推薦方法、系統(tǒng)及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202011114490.X | 申請(qǐng)日: | 2020-10-16 |
| 公開(公告)號(hào): | CN112307332B | 公開(公告)日: | 2021-08-24 |
| 發(fā)明(設(shè)計(jì))人: | 尚天淇;彭德中 | 申請(qǐng)(專利權(quán))人: | 四川大學(xué) |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06F16/9536;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 重慶智慧之源知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 50234 | 代理人: | 高彬 |
| 地址: | 610044 四川*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 用戶 畫像 協(xié)同 過濾 推薦 方法 系統(tǒng) 存儲(chǔ) 介質(zhì) | ||
本發(fā)明提供的基于用戶畫像聚類的協(xié)同過濾推薦方法、系統(tǒng)及存儲(chǔ)介質(zhì),通過獲取用戶數(shù)據(jù),包括屬性數(shù)據(jù)和行為數(shù)據(jù);對(duì)用戶數(shù)據(jù)進(jìn)行表征,形成用戶表征信息;對(duì)用戶表征信息進(jìn)行降維壓縮,形成低維用戶畫像;采用聚類方法對(duì)低維用戶畫像進(jìn)行聚類,形成用戶興趣簇;對(duì)目標(biāo)用戶,在其所在的興趣簇內(nèi)采用基于用戶的協(xié)同過濾方法對(duì)其進(jìn)行推薦。考慮了用戶行為隨時(shí)間信息的變化,對(duì)用戶的固有屬性信息、用戶過往行為和用戶短期行為進(jìn)行了自適應(yīng)融合,并將用戶按照低維用戶畫像進(jìn)行聚類,根據(jù)聚類后的類別對(duì)用戶進(jìn)行基于用戶的協(xié)同過濾推薦,能夠兼顧效率和精度,降低了計(jì)算復(fù)雜度,保證了更高的推薦速度和準(zhǔn)確率,實(shí)現(xiàn)了應(yīng)對(duì)用戶行為變化的自適應(yīng)推薦。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)人工智能技術(shù)領(lǐng)域,尤其涉及一種基于用戶畫像聚類的協(xié)同過濾推薦方法、系統(tǒng)及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著互聯(lián)網(wǎng)和自動(dòng)技術(shù)的飛速發(fā)展,現(xiàn)在越來越多的人都擁有智能手機(jī),平板電腦和其他智能終端,這使得生產(chǎn)、生活的數(shù)據(jù)信息呈爆炸式增長(zhǎng),這就導(dǎo)致了信息超載問題。當(dāng)用戶在搜索其感興趣的信息時(shí),會(huì)花費(fèi)大量的時(shí)間和精力去過濾掉無用的信息,然而結(jié)果往往無法讓用戶滿意,于是,個(gè)性化推薦技術(shù)應(yīng)時(shí)而生。個(gè)性化推薦技術(shù)是指利用用戶某種興趣點(diǎn)和購(gòu)買特點(diǎn),向用戶推薦感興趣的內(nèi)容,是解決信息超載問題的有效途徑。在個(gè)性化推薦技術(shù)中,協(xié)同過濾推薦技術(shù)是最成熟,也是應(yīng)用最廣泛的一種技術(shù)。協(xié)同過濾簡(jiǎn)單來說是根據(jù)興趣相投的用戶群體來預(yù)測(cè)用戶感興趣的信息,并將其推薦給目標(biāo)用戶。但是由于用戶和商品數(shù)的快速增長(zhǎng),傳統(tǒng)的協(xié)同過濾推薦方法出現(xiàn)了冷啟動(dòng)、數(shù)據(jù)稀疏性、效率低下等問題。
為了改善傳統(tǒng)協(xié)同推薦方法的性能,研究人員從以上問題出發(fā)對(duì)其進(jìn)行研究。
針對(duì)數(shù)據(jù)稀疏性問題,通常對(duì)用戶評(píng)分稀疏矩陣進(jìn)行填充,并引入了相似性計(jì)算因子計(jì)算用戶相似性;還可以采用矩陣分解算法對(duì)高維稀疏數(shù)據(jù)進(jìn)行預(yù)處理,降低數(shù)據(jù)稀疏性。
針對(duì)冷啟動(dòng)問題,通常采用擴(kuò)展用戶本身固有屬性的信息(如社交信息、屬性信息等)融合入用戶行為的協(xié)同過濾算法,有效緩解了用戶冷啟動(dòng)問題。
針對(duì)效率低下問題,通過對(duì)用戶評(píng)價(jià)矩陣進(jìn)行分析,采用K-means聚類算法把興趣和偏好相似程度較高的用戶分到同一個(gè)簇中,以減少搜索最近鄰的時(shí)間。
上述方法雖然在很大程度上解決部分問題,但是缺乏整體性,片面的追求效率或者準(zhǔn)確性。
如專利公開號(hào)為CN106548255A提出的一種基于海量用戶行為的商品推薦方法,該專利申請(qǐng)雖采用了聚類方法,但通常海量行為的超高維度,會(huì)造成聚類方法的相似度計(jì)算失效;而部分基于降維和聚類的協(xié)同過濾推薦算法,例如采用PCA和K-means相結(jié)合的方式對(duì)用戶評(píng)分矩陣進(jìn)行分析,雖然考慮了效率,但仍然存在冷啟動(dòng)問題,未考慮到用戶行為變化問題。
對(duì)用戶進(jìn)行很好地表征是協(xié)同過濾推薦算法的關(guān)鍵和前提。盡可能多地利用用戶數(shù)據(jù)是廣為認(rèn)可的思路,然而如何利用好這些數(shù)據(jù)是困難的。一方面,對(duì)不同的數(shù)據(jù)進(jìn)行區(qū)別對(duì)待,特別是由于用戶興趣可能存在的變化,需要區(qū)分?jǐn)?shù)據(jù)類型并進(jìn)行恰當(dāng)?shù)奶幚恚涣硪环矫妫瑢?duì)數(shù)據(jù)進(jìn)行融合也不能簡(jiǎn)單地用數(shù)據(jù)拼接或者簡(jiǎn)單的加權(quán)算法來實(shí)現(xiàn);此外,不恰當(dāng)?shù)臄?shù)據(jù)融合可能導(dǎo)致更高維度的用戶數(shù)據(jù),不僅導(dǎo)致可能的維數(shù)詛咒問題使得計(jì)算失效,可能還會(huì)使得精妙設(shè)計(jì)的算法效率低下。
發(fā)明內(nèi)容
本發(fā)明提供的基于用戶畫像聚類的協(xié)同過濾推薦方法、系統(tǒng)及存儲(chǔ)介質(zhì),主要解決的技術(shù)問題是:如何對(duì)用戶數(shù)據(jù)進(jìn)行處理,以降低數(shù)據(jù)處理復(fù)雜度,且提升推薦的準(zhǔn)確性。
為解決上述技術(shù)問題,本發(fā)明提供一種基于用戶畫像聚類的協(xié)同過濾推薦方法,包括:
S1:獲取用戶數(shù)據(jù),包括屬性數(shù)據(jù)和行為數(shù)據(jù);
S2:對(duì)用戶數(shù)據(jù)進(jìn)行表征,形成用戶表征信息;
S3:對(duì)所述用戶表征信息進(jìn)行降維壓縮,形成低維用戶畫像;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川大學(xué),未經(jīng)四川大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011114490.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用戶畫像標(biāo)簽查詢方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 廣告投放方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種主體畫像生成的方法、裝置和存儲(chǔ)介質(zhì)
- 基于流平臺(tái)的智能全景客戶畫像聯(lián)動(dòng)方法及系統(tǒng)
- 畫像構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 畫像構(gòu)建方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種適用于城市軌道交通的乘客畫像系統(tǒng)及其構(gòu)建方法
- 用戶畫像方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備
- 一種跨境場(chǎng)景畫像構(gòu)建方法和裝置
- 一種用戶畫像方法與裝置
- 移動(dòng)通信終端的協(xié)同方法及其界面系統(tǒng)
- 業(yè)務(wù)協(xié)同流程配置、業(yè)務(wù)協(xié)同方法及裝置
- 一種基于健康檔案共享平臺(tái)的跨醫(yī)院協(xié)同檢查信息系統(tǒng)
- 一種協(xié)同控制方法、協(xié)同控制系統(tǒng)及變頻器
- 基于協(xié)同網(wǎng)關(guān)的跨域協(xié)同交互方法
- 一種生產(chǎn)協(xié)同管理方法及系統(tǒng)
- 云邊協(xié)同方法、裝置、系統(tǒng)、設(shè)備和介質(zhì)
- 一種智能辦公協(xié)同操作方法及系統(tǒng)
- 一種用于無人裝備的時(shí)間協(xié)同航跡規(guī)劃方法
- 基于大數(shù)據(jù)的智慧辦公協(xié)同方法及系統(tǒng)





