[發明專利]一種基于領域本體的語義信息檢索系統及方法在審
| 申請號: | 201410329258.6 | 申請日: | 2014-07-04 |
| 公開(公告)號: | CN104090958A | 公開(公告)日: | 2014-10-08 |
| 發明(設計)人: | 姬朝陽;姚林;陳雪 | 申請(專利權)人: | 許昌學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 461000 河南省許*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 領域 本體 語義 信息 檢索系統 方法 | ||
1.一種基于領域本體的語義信息檢索系統,其特征在于,包括:
用戶界面代理模塊,用于接收用戶輸入的初始信息查詢請求;
個性化需求分析模塊,用于對所述用戶界面代理模塊接收的所述初始信息查詢請求進行詞法分析,獲得關鍵詞級的內容,然后基于領域本體庫并結合用戶興趣本體庫預測所述用戶感興趣的內容,形成最終查詢請求,并將所述最終查詢請求提交信息搜索代理模塊;其中,所述領域本體庫中的包括:各個領域中最基本的概念、概念的定義以及各個概念之間的語義關系網絡;所述用戶興趣本體庫中包括:用戶感興趣的信息以及根據用戶興趣點挖掘出來的其有潛在興趣的信息;
所述信息搜索代理模塊,用于從資源庫中搜索與所述最終查詢請求相關的網絡信息文檔,所述資源庫包括:本地信息資源、異地共享資源;
文檔分析與語義過濾模塊,用于針對所述信息搜索代理模塊搜索到的網絡信息文檔,基于所述領域本體庫,根據抽取的關鍵詞判斷所述網絡信息文檔所屬領域,然后將所述網絡信息文檔轉換成所述領域本體庫中的術語,獲得轉換后的網絡信息文檔,同時根據所述最終查詢請求與所述轉換后的網絡信息文檔之間的語義相關度,過濾掉所述網絡信息文檔中與用戶查詢請求不相關的信息,獲得語義過濾后的結果文檔;
個性化處理模塊,用于結合所述用戶興趣本體庫中存儲的用戶知識,對所述結果文檔進行評估,給出所述結果文檔與用戶興趣的關聯度;
排序模塊,用于根據所述文檔分析與語義過濾模塊得到的所述語義相關度,以及所述個性化處理模塊得到的所述關聯度,對所述結果文檔按照頻繁序列樹的增量式語義序列模式挖掘算法進行優化,最后把符合用戶請求和興趣的查詢結果通過用戶界面代理模塊返回給用戶;
所述用戶界面代理模塊,還用于將所述查詢結果顯示給所述用戶;
所述用戶興趣本體庫,用于根據用戶對所述查詢結果的反饋信息,更新所述用戶對應在用戶興趣本體庫中的內容。
2.根據權利要求1所述的系統,其特征在于,
所述個性化需求分析模塊,具體用于將所述關鍵詞級的內容與所述用戶興趣本體庫進行映射,查驗是否已有相似的查詢請求;若有則將所述用戶興趣本體庫的中映射到的內容作為最終查詢請求,否則查詢所述領域本體庫,從中找出出現所述關鍵詞級的內容的各個相應領域,將所述相應領域的相關概念通過所述用戶界面代理模塊羅列給用戶,以使得所述用戶根據自己的查詢意圖,確定所需查找的領域和含義,進而獲得最終查詢請求;
所述用戶興趣本體庫,還用于記錄所述用戶的這一新的需求信息。
3.一種基于領域本體的語義信息檢索方法,其特征在于,包括以下步驟:
101、接收用戶輸入的初始信息查詢請求;
102、對接收的所述初始信息查詢請求進行詞法分析,獲得關鍵詞級的內容,然后基于領域本體庫并結合用戶興趣本體庫預測所述用戶感興趣的內容,形成最終查詢請求;其中,所述領域本體庫中的包括:各個領域中最基本的概念、概念的定義以及各個概念之間的語義關系網絡;所述用戶興趣本體庫中包括:用戶感興趣的信息以及根據用戶興趣點挖掘出來的其有潛在興趣的信息;
103、從資源庫中搜索與所述最終查詢請求相關的網絡信息文檔,所述資源庫包括:本地信息資源、異地共享資源;
104、針對所述網絡信息文檔,基于所述領域本體庫,根據抽取的關鍵詞判斷所述網絡信息文檔所屬領域,然后將所述網絡信息文檔轉換成所述領域本體庫中的術語,獲得轉換后的網絡信息文檔,同時根據所述最終查詢請求與所述轉換后的網絡信息文檔之間的語義相關度,過濾掉所述網絡信息文檔中與用戶查詢請求不相關的信息,獲得語義過濾后的結果文檔;
105、結合所述用戶興趣本體庫中存儲的用戶知識,對所述結果文檔進行評估,給出所述結果文檔與用戶興趣的關聯度;
106、根據所述語義相關度以及所述關聯度,對所述結果文檔按照頻繁序列樹的增量式語義序列模式挖掘算法進行優化,最后把符合用戶請求和興趣的查詢結果返回給用戶;
107、根據用戶對所述查詢結果的反饋信息,更新所述用戶對應在用戶興趣本體庫中的內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于許昌學院,未經許昌學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410329258.6/1.html,轉載請聲明來源鉆瓜專利網。





