[發明專利]一種基于場論的本體中概念相似度計算方法有效
| 申請號: | 201410490635.4 | 申請日: | 2014-09-23 |
| 公開(公告)號: | CN104239546B | 公開(公告)日: | 2021-11-23 |
| 發明(設計)人: | 王國新;王祎楠;閻艷;師鑫 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/36;G06K9/62 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;黃燦 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 場論 本體 概念 相似 計算方法 | ||
本發明提供了一種基于場論的本體中概念相似度計算方法,基于場論,采用場的特性描述本體,把本體定義的語義結構轉化為語義場以構建語義場模型;對本體包含的概念間語義關系進行規范化;本體利用信息量對概念的特征進行描述,得到概念的語義引力元和語義距離;最后應用所述語義場模型得到概念相似度。本發明全面考慮了概念相似與差異兩方面對概念相似度計算的影響,改進了現有方法孤立考慮兩者之一的缺陷。
技術領域
本發明屬于檢索技術領域,尤其涉及一種基于場論的本體中概念相似度計算方法。
背景技術
利用關鍵字的檢索從字符的表現形式上進行匹配,只能檢索用戶所表達的顯性信息,無法對用戶表示的隱性信息進行處理。語言學的分類結構就可以很好的解決這一問題,而語言學分類結構的一個應用最廣泛的應用就是本體。本體就可以通過概念及概念間的關系,有效地理解用戶輸入的信息,從而達到語義檢索的目的。這一過程中最核心的步驟就是依據本體中概念相似度對用戶輸入概念進行拓展。
本體中概念相似度的計算方式主要分為兩種,分別是基于概念間關系的邊方法和基于節點的方法,基于節點的方法又可以分為基于節點信息量的方法和基于節點的特征的方法。
以上兩種類型的方法,都只考慮了概念相似度的一種角度。節點的方法從概念相同的部分去分析概念的相似度,邊的方法從概念差異的角度衡量相似度,兩種方法都沒有綜合考慮概念中相同和差異部分對相似度的影響。使用邊的方法時,主要是采用權重衡量概念的差異,主要由密度權重、深度(層次)權重、類型權重、信息量權重,前三種權重因子不能準確的反映關系所連接概念的實際差異,并且這四類權值差異的根本原因在于本體內概念信息量的分布。所以,無論是邊方法還是節點的方法,都依據不同概念的信息量之間的關系。綜合考慮概念共享和差異的信息量,就能準確的得到概念的相似度。
以本體中某一概念為參考點,其他概念依據與該概念信息量中的差異得到與參考點的距離,分布在以參考點為原點的一維空間中。當分別以本體內每一概念為參考點后,既可以把本體中的概念分布在一個N維空間內,N為本體中概念的數量,進而得到任意兩概念的幾何距離。
發明內容
本發明的目的在于提供一種基于場論的本體中概念相似度計算方法,旨在解決現有基于本體語義分析中的對概念特征描述不完整和對關系的作用描述不準確的問題。
本發明是這樣實現的,一種基于場論的本體中概念相似度計算方法,包括以下步驟:
S1、基于場論,采用場的特性描述本體,把本體定義的語義結構轉化為語義場以構建語義場模型;
S2、對本體包含的概念間語義關系進行規范化;
S3、本體利用信息量對概念的特征進行描述,得到概念的語義引力元和語義距離;
S4、應用所述語義場模型得到概念相似度。
優選地,在步驟S1中,所述語義場模型用函數定義為:
式中,m(c1)、m(c2)為概念C1、C2的引力元,對于語義場,引力元m1=m2;r為概念C1、C2間的語義距離,f為引力常數。
優選地,在步驟S2中,所述語義關系包括上下位關系、等同關系、與關系和交叉關系、或關系、非關系、矛盾關系和互補關系。
優選地,在步驟S3中,所述信息量為根據某一概念的父類和子類的信息量共同決定,且用概念在本體中發生的頻數來表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410490635.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:色漿的分散研磨系統
- 下一篇:一種光伏背板及光伏背板的制備方法





