[發明專利]用于構建用戶模型的改進的GuTao法無效
申請號: | 201110361047.7 | 申請日: | 2011-11-15 |
公開(公告)號: | CN102495844A | 公開(公告)日: | 2012-06-13 |
發明(設計)人: | 許國艷;于天樞 | 申請(專利權)人: | 河海大學 |
主分類號: | G06F17/30 | 分類號: | G06F17/30 |
代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 艾中蘭 |
地址: | 210098 *** | 國省代碼: | 江蘇;32 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 用于 構建 用戶 模型 改進 gutao | ||
技術領域
本發明涉及一種改進的GuTao法,用于構建用戶模型,屬于個性化信息服務領域。
背景技術
個性化信息服務包括用戶建模、項目匹配和個性化推薦輸出三個部分。構建用戶模型是個性化信息服務的基礎。在個性化信息服務研究早期,用戶建模技術并未得到重視。研究工作重點在于個性化信息服務的具體技術上,如用戶聚類技術、推薦技術、信息檢索技術等,用戶建模技術只是這些研究中的附屬。隨著研究的深入,研究者逐漸意識到:個性化信息服務的質量不僅取決于具體的實現技術,還取決于用戶興趣和偏好的可計算描述,即構建用戶模型的質量。
傳統的用戶模型構建方法主要是基于統計學的,采用主題詞或加權的關鍵詞向量等表示用戶模型。通過對用戶瀏覽記錄、訪問歷史進行概率分析,獲得用戶的興趣模型。這種方法理論成熟,使用相對簡單,但存在缺乏語義、興趣度粒度大的缺點。
隨著語義技術地發展,本體作為概念化的模型,具有強大的語義擴展和推理能力。利用本體語義上的優勢,將用戶建模技術和本體結合起來構建基于本體的用戶模型是用戶建模技術的主要發展趨勢。
發明內容
本發明基于本體構建用戶模型,在具體的構建方法上提出了改進的GuTao法。GuTao法能夠半自動的構建領域本體,自動生成形式背景并消除概念間的冗余,但存在著不能處理多值屬性的缺陷。本發明提出了以興趣度為權值,作為多種屬性向單值屬性轉換的依據,解決了GuTao法不能處理多值屬性的問題,實現了對GuTao法的改進。
本發明提出了將興趣度作為多值屬性向單值屬性的轉換依據,在基本興趣度公式的基礎上推導出復合的興趣度公式。下面將介紹興趣度的基本公式以及根據需要的推導的公式。
1.興趣度的概念
興趣度(Interestingness)是用來衡量用戶對本體中的某概念的感興趣程度的一個度量指標。它主要是面向用戶模型的使用者的,用戶的興趣描述越具體,越有實際價值。
2.基本的興趣度公式
興趣度計算公式主要有以下三種:
(1)I(Ci):表示對于概念Ci感興趣程度,形如公式1。
其中,time表示一個用戶用于瀏覽一個給定網頁的時間。length指網頁的長度(如字節數等)。以r(d,Ci)表示網頁與概念的匹配強度,該值是一個頁面特征化過程的一個結果。
(2)Frequency(Ci):通過用戶檢索過程中與概念Ci相關的檢索數Q(Ci)與檢索總次數Q的比值來反映用戶對概念的感興趣程度。
其中Frequency(Ci)反映用戶對本體中某個概念Ci的感興趣程度。Q(Ci)是用戶對概念Ci檢索的次數,Q表示用戶檢索的總次數。
(3)Clarity(Ci):通過清晰度反映了用戶提出的檢索反映其自身興趣的準確性,通常當用戶對于自己要查詢的事物越是不了解,他就越傾向于使用較為抽象的概念。具體公式為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河海大學,未經河海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110361047.7/2.html,轉載請聲明來源鉆瓜專利網。