[發明專利]基于本體的用戶模型構建方法在審
| 申請號: | 201710117737.5 | 申請日: | 2017-03-01 |
| 公開(公告)號: | CN107016566A | 公開(公告)日: | 2017-08-04 |
| 發明(設計)人: | 王國軍;唐凱;張強;邢蕭飛 | 申請(專利權)人: | 廣州大學 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06Q50/14 |
| 代理公司: | 廣州三環專利商標代理有限公司44202 | 代理人: | 郝傳鑫 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 本體 用戶 模型 構建 方法 | ||
技術領域
本發明涉及旅游領域的建模方法,更具體地說,涉及一種基于本體的用戶模型構建方法。
背景技術
旅游業是一個集中了交通、游覽、住宿、餐飲、購物、文娛等環節的綜合性產業。隨著網絡技術的飛速發展,人們在網絡上可獲取的旅游信息呈現出一種爆炸式的增長態勢,這些網絡信息資源在給人們帶來豐富知識和極大便利的同時,也會給個人造成了信息疲勞和信息壓力。為了快速準確地定位到需要的旅游信息,給人們個性化地推送信息,對用戶興趣模型的研究已經成為當下的熱點與難點。目前,已經出現了一些常見的用戶模型構建方式:基于關鍵詞的、基于向量空間模型的、神經網絡的、評價矩陣的等,但是這些用戶模型都存在一定的缺陷。基于向量空間的方式穩定性較差,結果常常有許多偏差;基于神經網絡的方法則不易理解,適用范圍較小;基于評價矩陣的適應能力差,很難做到對興趣更新;因此,這些模型不能準確的描述用戶的個人興趣。
由于本體在用戶興趣描述上具有一定的優勢,逐漸被很多學者研究。研究方向包括:(1)如何利用本體形式化描述用戶的認識結構,為用戶構建基于領域本體的用戶模型,提高個性化檢索的質量;(2)基于用戶知識本體和概念向量構建用戶模型,實現用戶興趣的個性化語義描述;(3)構建集成用戶興趣信息和語義信息的加權本體,并基于該加權本體提出了一個個性化語義搜索框架; (4)通過用戶個性本體、校正本體和本體更新實現用戶模型的構建,在以上研究中,領域知識只是一個領域分類體系,用戶興趣對每個概念主題的興趣仍采用了加權關鍵詞的描述形式;(5)用本體抽取Web社區用戶會話的類、屬性和實例作為特征項,基于特征項出現頻度、在領域本體中語義位置及興趣模型更新算法計算特征項權重;(6)將本體表示為節點和邊組成的概念層次,每個節點與代表其內容的文檔集相關聯,通過tf-idf法計算文檔集權重生成節點向量,通過索引項預先算出所有向量;(7)三元組表示法:本體概念的描述、興趣度及最近一次更新時間;(8)提出四元組表示法:用戶屬性集、領域本體、領域本體中概念集及用戶對各概念的訪問量、用戶間關系集;(9)提出六元組表示法:用戶個性化信息(興趣模型標識)、用戶興趣本體概念集、用戶興趣度集、概念集中成對概念語義相似度、概念創建時間、概念所含項目最近一次被訪問時間。
但是,在用戶興趣模型的學習和更新的過程中對于資源仍采用了關鍵詞向量的描述形式。雖然應用了領域知識,但是基本的技術仍然是基于關鍵詞的描述方式和傳統的機器學習算法的應用,而且所建立的用戶模型大多數只是一個概念層次結構,用戶模型是靜態的,不能隨著用戶興趣的變化而動態及時更新,用戶模型的穩定性較低。用戶模型不能隨著用戶興趣的變化(含內容變化、舊興趣衰減、新興趣生成)而及時地經行適應性的改善,從而不能很好的反映興趣變化的過程。
發明內容
針對現有技術的缺點,本發明的目的在于提供一種基于本體的用戶模型構建方法,能更好地給資源進行定位,改善旅游信息檢索性能。
為了實現上述目的,本發明的技術方案為:一種基于本體的用戶模型構建方法,包括如下步驟:(1)獲取能夠反映用戶特征、偏好和需求的相關信息;(2) 構建旅游領域本體;(3)利用相似度算法對用戶進行分類;(4)對每一個用戶構建模型,利用本體來表示用戶模型;(5)利用興趣度傳遞調整的方式對用戶模型進行更新。
作為本發明的一種改進,在步驟(1)中,所述信息的獲取方式包括顯式采集和隱式采集,顯式采集通過用戶的注冊信息,直接收集用戶的基本信息;隱式采集通過分析用戶web使用日志記錄,獲取用戶的基本信息inf、用戶對葉子節點的偏好程度v以及訪問本體概念層次樹中葉子節點的訪問量V,其中,用戶的偏好程度如式(a)所示,訪問量如式(b)所示:
V=vi(1<=i<=n)表示用戶對第i個葉子節點感興趣的程度,fi,r表示用戶訪問葉子節點Li的人資源的次數,n表示本體概念層次樹中葉子節點的個數,根據葉子節點的訪問量計算非葉子節點的訪問量,使用戶的偏好信息補充完整。
作為本發明的一種改進,在步驟(2)中,構建旅游領域本體的過程包括:建立文件、建立類及其類層次、建立屬性及屬性的允許值、添加實例。
作為本發明的一種改進,步驟(3)中,所述相似度算法的公式為:
sim(i,j)=w×rij/es(i,j)+(1-w)×S(i,j) 0<w<1
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州大學,未經廣州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710117737.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種立式電機裝配臺架
- 下一篇:一種緊固型電機端蓋





