[發明專利]一種基于領域本體的語義信息檢索系統及方法在審
| 申請號: | 201410329258.6 | 申請日: | 2014-07-04 |
| 公開(公告)號: | CN104090958A | 公開(公告)日: | 2014-10-08 |
| 發明(設計)人: | 姬朝陽;姚林;陳雪 | 申請(專利權)人: | 許昌學院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 461000 河南省許*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 領域 本體 語義 信息 檢索系統 方法 | ||
技術領域
本發明涉及智能信息檢索領域,尤其涉及一種基于領域本體的語義信息檢索系統及方法。
背景技術
隨著Internet和移動通信技術的迅猛發展,Web已成為全球的信息源,如何快速、準確地從浩瀚的信息資源中尋找自己所需的信息,成為困擾用戶的一個難題。傳統的信息檢索提供給用戶的檢索方式是以用戶輸入的關鍵詞進行匹配的檢索方式,但是大多數的情況下這種簡單的關鍵詞匹配很難理解用戶真正的檢索目的,因此導致目前這種信息檢索方式的精確度不高。
如何快捷、有效地獲取所需信息,是具有現實意義的研究課題。隨著網絡資源的增長、用戶信息需求的個性化及復雜化,基于關鍵詞的信息檢索技術逐漸顯示出了“信息過載”和“信息迷向”等問題。采用現有的語義檢索技術多得到的檢索結果,可能包含有與用戶興趣度不一致的大量無關信息,增加了用戶從這些無關的檢索結果中篩選自己感興趣信息的工作量。
發明內容
本發明的實施例提供一種基于領域本體的語義信息檢索系統及方法,可以實現用戶檢索需求的個性化推薦,優化檢索結果及提高查準率。
為達到上述目的,本發明的實施例采用如下技術方案:
一種基于領域本體的語義信息檢索系統,包括:
用戶界面代理模塊,用于接收用戶輸入的初始信息查詢請求;
個性化需求分析模塊,用于對所述用戶界面代理模塊接收的所述初始信息查詢請求進行詞法分析,獲得關鍵詞級的內容,然后基于領域本體庫并結合用戶興趣本體庫預測所述用戶感興趣的內容,形成最終查詢請求,并將所述最終查詢請求提交信息搜索代理模塊;其中,所述領域本體庫中的包括:各個領域中最基本的概念、概念的定義以及各個概念之間的語義關系網絡;所述用戶興趣本體庫中包括:用戶感興趣的信息以及根據用戶興趣點挖掘出來的其有潛在興趣的信息;
所述信息搜索代理模塊,用于從資源庫中搜索與所述最終查詢請求相關的網絡信息文檔,所述資源庫包括:本地信息資源、異地共享資源;
文檔分析與語義過濾模塊,用于針對所述信息搜索代理模塊搜索到的網絡信息文檔,基于所述領域本體庫,根據抽取的關鍵詞判斷所述網絡信息文檔所屬領域,然后將所述網絡信息文檔轉換成所述領域本體庫中的術語,獲得轉換后的網絡信息文檔,同時根據所述最終查詢請求與所述轉換后的網絡信息文檔之間的語義相關度,過濾掉所述網絡信息文檔中與用戶查詢請求不相關的信息,獲得語義過濾后的結果文檔;
個性化處理模塊,用于結合所述用戶興趣本體庫中存儲的用戶知識,對所述結果文檔進行評估,給出所述結果文檔與用戶興趣的關聯度;
排序模塊,用于根據所述文檔分析與語義過濾模塊得到的所述語義相關度,以及所述個性化處理模塊得到的所述關聯度,對所述結果文檔按照頻繁序列樹的增量式語義序列模式挖掘算法進行優化,最后把符合用戶請求和興趣的查詢結果通過用戶界面代理模塊返回給用戶;
所述用戶界面代理模塊,還用于將所述查詢結果顯示給所述用戶;
所述用戶興趣本體庫,用于根據用戶對所述查詢結果的反饋信息,更新所述用戶對應在用戶興趣本體庫中的內容。
一種基于領域本體的語義信息檢索方法,包括以下步驟:
101、接收用戶輸入的初始信息查詢請求;
102、對接收的所述初始信息查詢請求進行詞法分析,獲得關鍵詞級的內容,然后基于領域本體庫并結合用戶興趣本體庫預測所述用戶感興趣的內容,形成最終查詢請求;其中,其中,所述領域本體庫中的包括:各個領域中最基本的概念、概念的定義以及各個概念之間的語義關系網絡;所述用戶興趣本體庫中包括:用戶感興趣的信息以及根據用戶興趣點挖掘出來的其有潛在興趣的信息;
103、從資源庫中搜索與所述最終查詢請求相關的網絡信息文檔,所述資源庫包括:本地信息資源、異地共享資源;
104、針對所述網絡信息文檔,基于所述領域本體庫,根據抽取的關鍵詞判斷所述網絡信息文檔所屬領域,然后將所述網絡信息文檔轉換成所述領域本體庫中的術語,獲得轉換后的網絡信息文檔,同時根據所述最終查詢請求與所述轉換后的網絡信息文檔之間的語義相關度,過濾掉所述網絡信息文檔中與用戶查詢請求不相關的信息,獲得語義過濾后的結果文檔;
105、結合所述用戶興趣本體庫中存儲的用戶知識,對所述結果文檔進行評估,給出所述結果文檔與用戶興趣的關聯度;
106、根據所述語義相關度以及所述關聯度,對所述結果文檔按照頻繁序列樹的增量式語義序列模式挖掘算法進行優化,最后把符合用戶請求和興趣的查詢結果返回給用戶;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于許昌學院,未經許昌學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410329258.6/2.html,轉載請聲明來源鉆瓜專利網。





