[發(fā)明專利]基于偽本體的用戶畫(huà)像-項(xiàng)目推薦系統(tǒng)及方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810563501.9 | 申請(qǐng)日: | 2018-06-04 |
| 公開(kāi)(公告)號(hào): | CN108920521B | 公開(kāi)(公告)日: | 2021-07-09 |
| 發(fā)明(設(shè)計(jì))人: | 張濤;鄧悅;翁康年;張濱 | 申請(qǐng)(專利權(quán))人: | 上海財(cái)經(jīng)大學(xué) |
| 主分類號(hào): | G06F16/9535 | 分類號(hào): | G06F16/9535;G06F16/906 |
| 代理公司: | 上海盈盛知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 31294 | 代理人: | 孫佳胤 |
| 地址: | 200433 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 本體 用戶 畫(huà)像 項(xiàng)目 推薦 系統(tǒng) 方法 | ||
本發(fā)明提供基于偽本體的用戶畫(huà)像?項(xiàng)目推薦系統(tǒng)及方法,本發(fā)明提供的基于偽本體的用戶畫(huà)像?項(xiàng)目推薦系統(tǒng)包括:偽本體模塊、用戶畫(huà)像模塊、項(xiàng)目畫(huà)像模塊、基于偏好度的推薦模塊;所述偽本體模塊獲取領(lǐng)域相關(guān)文本,生成領(lǐng)域偽本體,并輸出到用戶畫(huà)像模塊和項(xiàng)目畫(huà)像模塊;所述用戶畫(huà)像模塊獲取用戶的網(wǎng)絡(luò)瀏覽行為,根據(jù)所述領(lǐng)域偽本體,向基于偏好度的推薦模塊輸出優(yōu)化的用戶特征向量;所述項(xiàng)目畫(huà)像模塊獲取項(xiàng)目相關(guān)描述文本,根據(jù)所述領(lǐng)域偽本體,向基于偏好度模塊的推薦輸出優(yōu)化的項(xiàng)目特征向量;所述基于偏好度的推薦模塊根據(jù)所述優(yōu)化的用戶特征向量和優(yōu)化的項(xiàng)目特征向量輸出用戶對(duì)應(yīng)的項(xiàng)目偏好度排名。
技術(shù)領(lǐng)域
本發(fā)明屬于用戶畫(huà)像生成技術(shù)領(lǐng)域,具體涉及基于偽本體的用戶畫(huà)像-項(xiàng)目推薦系統(tǒng)及方法。
背景技術(shù)
基于用戶畫(huà)像的推薦屬于推薦領(lǐng)域中基于內(nèi)容的推薦方法。該方法的定義為根據(jù)用戶選擇的物品或選擇物品時(shí)進(jìn)行的相關(guān)行為中提取出能反映用戶興趣的特征,如物品的特性(顏色,形狀)或用戶對(duì)物品的評(píng)論等,將提取出的用戶興趣特征作為用戶畫(huà)像,同時(shí)把待推薦的物品也用同樣維度的特征表示,通過(guò)將用戶畫(huà)像與物品畫(huà)像進(jìn)行計(jì)算來(lái)進(jìn)行推薦,推薦的結(jié)果極大的依賴于用戶畫(huà)像與物品畫(huà)像的準(zhǔn)確性。用戶畫(huà)像的結(jié)果依據(jù)數(shù)據(jù)的不同而異,目前研究用到的數(shù)據(jù)主要有三種類型:一類是用戶的交易數(shù)據(jù),第二類是用戶發(fā)表的文本數(shù)據(jù),主要來(lái)自于電商網(wǎng)站用戶的評(píng)論和社交網(wǎng)站用戶自發(fā)的狀態(tài)等,第三類數(shù)據(jù)為用戶瀏覽網(wǎng)頁(yè)的行為數(shù)據(jù)。第一類數(shù)據(jù)的特點(diǎn)是只包含數(shù)值型數(shù)據(jù),不包含文本數(shù)據(jù),僅能獲取用戶的購(gòu)買習(xí)慣為特征,刻畫(huà)的畫(huà)像維度有限。第二類數(shù)據(jù)能刻畫(huà)用戶的主觀情緒和情感值,但受限于用戶通常會(huì)有不同的文本表達(dá)習(xí)慣這一實(shí)際情況,且只能收集到網(wǎng)絡(luò)上活躍用戶的信息。第三類數(shù)據(jù)主要描述了用戶在何時(shí)瀏覽了哪些網(wǎng)頁(yè)。不管用戶是否喜歡在網(wǎng)絡(luò)上發(fā)表評(píng)論或狀態(tài),網(wǎng)頁(yè)瀏覽已經(jīng)成為了用戶獲取信息最直接的方式,因此用戶的網(wǎng)頁(yè)瀏覽行為數(shù)據(jù)中蘊(yùn)含了大量客觀的關(guān)于用戶興趣的信息,較前兩類數(shù)據(jù)刻畫(huà)用戶畫(huà)像更具有優(yōu)勢(shì),因此本系統(tǒng)采用用戶的網(wǎng)絡(luò)瀏覽行為刻畫(huà)用戶畫(huà)像。
盡管網(wǎng)絡(luò)瀏覽行為中蘊(yùn)含了大量關(guān)于用戶的興趣信息,但從中提取出有效特征并不容易。早期的研究工作通常會(huì)將用戶瀏覽頻繁的網(wǎng)頁(yè)域名或網(wǎng)頁(yè)關(guān)鍵詞作為特征集,將瀏覽的頻率經(jīng)過(guò)一定變換后作為特征值,然而如果將該方法應(yīng)用到用戶群,則會(huì)因?yàn)橛脩羧旱念l繁興趣網(wǎng)站不同而使得各用戶畫(huà)像的維度不統(tǒng)一。在近幾年,基于本體的用戶畫(huà)像建模方法逐漸發(fā)展并取得成效。由于本體天然的優(yōu)勢(shì):各概念之間有明確的關(guān)系定義,使得基于本體的方法刻畫(huà)的用戶畫(huà)像能客觀清晰地描述用戶的特征,且對(duì)于不同的用戶,基于本體的方法生成的特征集具有固定不變的特點(diǎn)。
用本體進(jìn)行基于網(wǎng)絡(luò)瀏覽行為的用戶畫(huà)像建模的關(guān)鍵技術(shù)之一在于如何將網(wǎng)絡(luò)瀏覽行為用本體來(lái)表示。比較典型的工作有Domen等根據(jù)其研究的問(wèn)題采用了專家映射法。借助其團(tuán)隊(duì)在其研究領(lǐng)域有深厚的基礎(chǔ),有能力通過(guò)專家識(shí)別的方法對(duì)固定領(lǐng)域的網(wǎng)頁(yè)進(jìn)行主題識(shí)別和分類,但該方法不能擴(kuò)展到其他領(lǐng)域,且專家映射雖然精確度高,但會(huì)耗費(fèi)大量的時(shí)間和人力成本。Hawalah等提出了tf-idf映射法,即通過(guò)tf-idf法將網(wǎng)頁(yè)文本內(nèi)容和本體概念的解釋文本內(nèi)容分別表示成詞袋向量,再度量?jī)蓚€(gè)文本之間相似性,最后將該相似度作為網(wǎng)頁(yè)到本體的映射值。該方法基本解決了各個(gè)領(lǐng)域的網(wǎng)頁(yè)難以映射到本體的問(wèn)題,但這是基于本體已經(jīng)存在,并且本體內(nèi)的概念有完整的說(shuō)明文檔的情況。但實(shí)際情況是只有極少數(shù)領(lǐng)域有本體。
網(wǎng)絡(luò)瀏覽行為在蘊(yùn)含海量與用戶有關(guān)的信息的同時(shí),也蘊(yùn)含著大量干擾信息,如何從這些海量而雜亂的數(shù)據(jù)中提取出真實(shí)有效的信息是這類研究的關(guān)注點(diǎn)。解決這類問(wèn)題的研究普遍認(rèn)同的假設(shè)為:如果用戶對(duì)某一主題感興趣,則會(huì)多次瀏覽相關(guān)主題的網(wǎng)頁(yè)。基于該假設(shè),有學(xué)者提出了the Contextual Concept Clusteringalgorithm(3C)算法,從網(wǎng)頁(yè)中識(shí)別出的主題進(jìn)行基于相似度權(quán)重的地聚類,將權(quán)重最大的概念用來(lái)代表網(wǎng)頁(yè)的主題,并使用參數(shù)β來(lái)控制參與聚類的候選概念個(gè)數(shù)。該方法能有效的排除掉網(wǎng)頁(yè)中的干擾信息,但當(dāng)網(wǎng)頁(yè)原本就含有多個(gè)主題時(shí),由于該算法最終只選擇權(quán)重最高的概念來(lái)代表網(wǎng)頁(yè)主題,使得最終的映射結(jié)果會(huì)漏掉網(wǎng)頁(yè)中包含的其他主題,當(dāng)用戶瀏覽該網(wǎng)頁(yè)是出于對(duì)多個(gè)主題的興趣時(shí),該算法又會(huì)使得畫(huà)像刻畫(huà)的用戶興趣不完整。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海財(cái)經(jīng)大學(xué),未經(jīng)上海財(cái)經(jīng)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810563501.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用戶畫(huà)像標(biāo)簽查詢方法、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 廣告投放方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種主體畫(huà)像生成的方法、裝置和存儲(chǔ)介質(zhì)
- 基于流平臺(tái)的智能全景客戶畫(huà)像聯(lián)動(dòng)方法及系統(tǒng)
- 畫(huà)像構(gòu)建方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 畫(huà)像構(gòu)建方法、裝置、終端及存儲(chǔ)介質(zhì)
- 一種適用于城市軌道交通的乘客畫(huà)像系統(tǒng)及其構(gòu)建方法
- 用戶畫(huà)像方法、裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)及終端設(shè)備
- 一種跨境場(chǎng)景畫(huà)像構(gòu)建方法和裝置
- 一種用戶畫(huà)像方法與裝置





