[發明專利]一種基于Ontology的語義檢索方法無效
| 申請號: | 201310378833.7 | 申請日: | 2013-08-27 |
| 公開(公告)號: | CN103440314A | 公開(公告)日: | 2013-12-11 |
| 發明(設計)人: | 沈琦;張猛;湯艷;宋清明 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ontology 語義 檢索 方法 | ||
1.一種基于Ontology的語義檢索方法,其特征在于將信息檢索從傳統的關鍵詞檢索提高到語義檢索,包括以下步驟:
步驟一,借助本體開發工具完成本體庫的構建,通過人工方式,分析旅游領域的概念或核心詞匯;
步驟二,根據領域概念之間的關系,利用Jena規則語法格式,完成本體規則庫的建立;
步驟三,用戶輸入檢索詞匯或者語句,分詞搜索引擎進行分詞處理;
步驟四,根據概念相似度的計算進行語義檢索擴展,形成新的概念集合;
步驟五,用新的集合作為原始詞,進行檢索,并在本體規則的支持下,對本體進行推理,檢索出本體庫中隱含的信息;
步驟六,檢索到的結果按相似度大小進行排序;
步驟七,將檢索結果返回給用戶。
2.根據權利要求1所述的一種基于Ontology的語義檢索方法,其特征在于步驟四進行語義檢索擴展的方法還包括以下步驟:
(1)把用戶輸入的關鍵詞進行分詞處理,形成初始化的集合;
(2)擴展出整個本體庫中與初始化集合中的詞語語義相同或相似的領域概念,形成新的概念集合;
(3)計算本體概念相似度;
概念距離的計算公式為:
Distance(a,b)=N[a,Ancestor(a,b)]+N[b,Ancestor(a,b)]
式中,Distance(a,b)表示在樹型結構中概念結點a和概念結點b的距離,Ancestor(a,b)表示在樹型結構中概念結點a和概念結點b的最近共同祖先結點,path(a,b)表示結點a和b在領域本體構成的樹型結構中的最短路徑上所有概念結點所構成的集合,Distance(x,Parent(x))是子結點與父結點之間的距離,weight(x,Parent(x))是該結點和它父結點之間的邊上的權值,α是可調節因子;
在已知領域本體樹型結構中任意兩個概念結點的距離的前提下,任意兩個概念的相似度為:
式中,θ為調節參數;
分母越小,相似度越大;當Distance(a,b)=0時,分母取最小值θ,概念相似度取最大值1,概念結點a與概念結點b是相似的;當Distance(a,b)=∞時,概念相似度取最小值0,概念結點a和概念結點b幾乎沒任何關系;
(4)把相似度大于預定閾值的概念加入到初始化的集合中,重新擴展為新的檢索詞集合;所述閾值是在多次用戶輸入、多次通過相似度計算得出的一個值,閾值過大,很難擴展出新的概念;閾值太小,擴展進來的概念和用戶輸入關鍵詞語義差距太大;本發明實施例的閾值取0.7。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310378833.7/1.html,轉載請聲明來源鉆瓜專利網。





