[發明專利]一種基于領域本體的智能檢索系統及方法無效
| 申請號: | 200810306721.X | 申請日: | 2008-12-31 |
| 公開(公告)號: | CN101582073A | 公開(公告)日: | 2009-11-18 |
| 發明(設計)人: | 吳來;劉鵬;李春梅;黃道雄;范書德 | 申請(專利權)人: | 北京中機科海科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100044北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 領域 本體 智能 檢索系統 方法 | ||
1.一種基于領域本體的智能檢索系統,包括用于分析用戶輸入自然查詢語句的本體推理模塊,用于創建索引庫的索引處理模塊,用于進行特定查詢的查詢處理模塊,以及用于查詢結果處理的結果優化排序模塊,其特征在于,所述的系統還包括數據資源庫、領域本體庫和索引數據庫;
2.根據權利要求1所述的基于領域本體的智能檢索系統,其特征在于,所述的本體推理模塊包括分詞預處理單元和句型模式匹配單元;
所述分詞預處理單元,用于接收用戶輸入的自然查詢語句,對查詢語句進行分詞、詞性標注、領域本體角色標注等預處理,去除弱語義詞匯,得到強語義詞匯集合;
所述句型模式匹配單元,用于將強語義詞匯集合與事先定義的句型模式進行匹配處理,得到新的檢索式;
3.根據權利要求1所述的基于領域本體的智能檢索系統,其特征在于,所述的索引處理模塊包括本體語義索引處理單元和全文索引處理單元;
所述本體語義索引處理單元,用于獲取數據資源文檔,解析、處理并提取文檔主體內容信息,基于領域本體庫合成語義向量,建立語義本體索引庫;
所述全文索引處理單元,用于獲取數據資源文檔,提取文檔信息,建立全文索引庫;
4.根據權利要求1所述的基于領域本體的智能檢索系統,其特征在于,所述的查詢處理模塊包括語義查詢處理單元、擴展查詢處理單元和全文檢索處理單元;
所述語義查詢處理單元,用于基于領域本體概念及概念間關聯進行專業領域信息的智能查詢處理;
所述擴展查詢處理單元,用于基于領域本體概念及概念間關聯進行擴展查詢處理;
全文檢索處理單元,用于按照傳統的檢索方式,即按照關鍵字匹配原理進行全文檢索的處理。
5.根據權利要求1所述的基于領域本體的智能檢索系統,其特征在于,所述的數據資源庫包括本地領域數據庫內的資源或從網上抓取的領域內的資源數據;
6.根據權利要求1所述的基于領域本體的智能檢索系統,其特征在于,所述的索引數據庫包括由索引處理模塊建立的本體語義索引庫和全文索引庫。
7.一種如權利要求1所述基于領域本體的智能檢索方法,其特征在于,所述的方法包括以下步驟:
A.對用戶輸入的自然查詢語句進行分詞、詞性標注、并基于領域本體進行角色標注;
B.分析、判斷上述步驟A中的詞匯集,進行本體角色非空項的判斷,并按照一定的規則進行相應的查詢;
C.對查詢結果進行語義距離測量,按照語義距離值進行結果的優化,并將結果排序輸出,返回給用戶。
8.根據權利要求7所述的方法,其特征在于,步驟B中所述的本體角色非空項的判斷進一步包括:
B1.如果用戶輸入的自然查詢語句中不包括本體概念,則進行全文檢索;
B2.如果用戶輸入的自然查詢語句中包括本體概念,則進行本體模式的匹配判斷。
9.根據權利要求8所述的方法,其特征在于,步驟B2進一步包括:
B21.如果本體模式匹配成功,則形成語義查詢檢索式;
B22.如果本體模式匹配成功,則訪問領域本體庫,進行語義擴展處理,并形成擴展查詢檢索式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中機科海科技發展有限公司,未經北京中機科海科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810306721.X/1.html,轉載請聲明來源鉆瓜專利網。





