[發明專利]一種基于Ontology的語義檢索方法無效
| 申請號: | 201310378833.7 | 申請日: | 2013-08-27 |
| 公開(公告)號: | CN103440314A | 公開(公告)日: | 2013-12-11 |
| 發明(設計)人: | 沈琦;張猛;湯艷;宋清明 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ontology 語義 檢索 方法 | ||
技術領域
本發明屬于自然語言處理和機器智能的交叉領域,就是借助Ontology(本體)技術,把目前信息檢索技術從關鍵字匹配方式提高到計算機可理解的語義檢索方式,把這項技術應用到旅游信息檢索上,實現了智能化的旅游檢索服務。
技術背景
隨著Internet和移動通信技術的迅猛發展,Web已成為全球的信息源,如何快速、準確地從浩瀚的信息資源中尋找自己所需的信息,成為困擾用戶的一個難題。傳統的信息檢索提供給用戶的檢索方式是以用戶輸入的關鍵詞進行匹配的檢索方式,但是大多數的情況下這種簡單的關鍵詞匹配很難理解用戶真正的檢索目的,因此導致目前這種信息檢索方式的精確度不高。
國外的一些專家已經在本體方面進行了實踐性的操作,例如Ontoseek黃頁系統,是一個基于內容檢索的系統,該系統集成了產品樹型結構和在線黃頁。它把具有表示形式化能力的系統與本體內容匹配機制結合起來,并把本體庫與數據庫詞典整合在一起,提供用戶一個可以通過輸入自然語言,然后轉化為領域本體中的詞匯,實現語義層面的檢索系統。從Ontoseek黃頁系統中可得知,其中的概念詞匯和詞匯之間的關系是不受任何約束的,所以詞匯之間關系圖也許是不起任何作用的,因此會發生檢索到的結果不是用戶所需的。目前的旅游黃頁服務系統,如“攜程網”、“途牛網”,在檢索上對用戶輸入的關鍵詞信息只是進行了字詞的簡單匹配,不能在語義上理解用戶輸入的信息,也就不能很好地檢索出用戶真正需要的信息。因此,必須將信息檢索方式從現有的基于關鍵詞匹配級別提升到基于知識理解級別、基于語義級別來對信息進行組織和表達,從而設計一種可以理解用戶語義的信息檢索模型。
發明內容
針對現有技術中存在的上述問題,本發明提出了一種基于Ontology的語義檢索方法,目的是實現計算機對用戶輸入內容的理解,實現語義層面的檢索。
為實現上述目的,本發明采用的技術方案是:首先,構建本體庫,完成本體規則的建立。用戶輸入的檢索關鍵字,在本體的支持下,通過概念相似度計算得到相似度的大小。然后根據設定的閾值,把相似度的值高于閾值的概念添加到原始的檢索關鍵字集合中,擴展為新的概念集。把新的概念集作為源輸入詞到本體庫中進行檢索。最后把檢索到的結果返回給用戶。
一種基于Ontology的語義檢索方法,包括以下步驟:
步驟一,借助本體開發工具完成本體庫的構建,通過人工方式,分析旅游領域的概念或核心詞匯。構建的本體庫形成樹型的數據結構。
步驟二,根據領域概念之間的關系,利用Jena規則語法格式,完成本體規則庫的建立。
步驟三,用戶輸入檢索詞匯或者語句,分詞搜索引擎進行分詞處理。
步驟四,根據概念相似度的計算進行語義檢索擴展,形成新的概念集合。
步驟五,用新的集合作為原始詞,進行檢索,并在本體規則的支持下,對本體進行推理,檢索出本體庫中隱含的信息。
步驟六,檢索到的結果按相似度大小進行排序。
步驟七,將檢索結果返回給用戶。
與現有技術相比,本發明具有以下優點:
(1)本發明在本體推理技術的支持下,通過對本體中屬性的應用實現了實例的準確查找,使信息檢索的查全率、查準率比現有技術都有所提高。
(2)本發明所述方法將關鍵字簡單匹配的語法層次提高到計算機可以理解的語義層次,使計算機能夠讀懂輸入的關鍵詞,從而實現了檢索的智能化。
附圖說明
圖1為本發明所涉及的方法流程圖;
圖2為本發明實施例公交檢索結果;
圖3為本發明實施例酒店檢索結果;
圖4為本發明實施例景點檢索結果。
具體實施方式
下面結合附圖和實施例對本發明做進一步說明。
本發明的需要的軟件環境:Windows操作系統,Myeclipse開發工具,WEB服務器:Tomcat,數據庫:Mysql,Spring+Struts+Hibernate框架。
本發明所述方法流程圖如圖1所示,包括以下步驟:
步驟一,借助本體開發工具Protégé完成本體庫的構建,通過人工方式,分析旅游領域的概念或核心詞匯。構建的本體庫形成樹型的數據結構。
步驟二,根據領域概念之間的關系,例如:公交和車站之間的關系,可以用“經過”或者“到達”這樣的屬性建立聯系,利用Jena規則語法格式,完成本體規則庫的建立。
步驟三,用戶輸入檢索請求:用戶通過檢索界面輸入檢索請求,提交給后臺處理程序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310378833.7/2.html,轉載請聲明來源鉆瓜專利網。





