[發明專利]一種改進的基于信息論的概念語義相似度計算方法在審
| 申請號: | 201610833571.2 | 申請日: | 2016-09-20 |
| 公開(公告)號: | CN106610941A | 公開(公告)日: | 2017-05-03 |
| 發明(設計)人: | 金平艷 | 申請(專利權)人: | 四川用聯信息技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 610054 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 改進 基于 信息論 概念 語義 相似 計算方法 | ||
1.一種改進的基于信息論的概念語義相似度計算方法,本發明涉及語義網絡技術領域,具體涉及一種改進的基于信息論的概念語義相似度計算方法,其特征是,包括如下步驟:
步驟1:初始化本體概念領域模塊
步驟2:求解其共同父節點在在樹狀層次結構中的信息量值
步驟3:分別求解兩本體概念在樹狀層次結構中的信息量值
步驟4:基于信息量,可以得出兩本體概念間的語義相似度。
2.根據權利要求1中所述的一種改進的基于信息論的概念語義相似度計算方法,其特征是,以上所述步驟2中的具體計算過程如下:
步驟2:分別求解其共同父節點在在樹狀層次結構中的信息量值,其具體計算過程如下:
基于信息內容的計算相似度方法主要是通過衡量概念所包含的信息量來計算相似度,概念是對其祖先節點的繼承,是祖先節點的又一次細化,所以可通過祖先節點包含的信息量來衡量兩個概念的共享信息
求解其共同父節點在樹狀層次結構中的信息量值
兩本體概念共同父節點在樹狀層次結構中每層出現的概率值
上式k為兩本體概念共同父節點在樹狀層次結構中的層數
為兩本體概念共同父節點在樹狀層次結構中的概率均值
。
3.根據權利要求1中所述的一種改進的基于信息論的概念語義相似度計算方法,其特征是,以上所述步驟3中的具體計算過程如下:
步驟3:分別求解兩本體概念在樹狀層次結構中的信息量值其具體求解過程如下:
求解兩本體概念的在樹狀層次結構中的信息量值
兩本體概念在樹狀層次結構中每層的概率值
上式i為本體概念在樹狀層次結構中的層數,同理,j為本體概念在樹狀層次結構中的層數
上式分別為兩本體概念在樹狀層次結構中的概率均值
由此可得兩本體概念的在樹狀層次結構中的信息量值
。
4.根據權利要求1中所述的一種改進的基于信息論的概念語義相似度計算方法,其特征是,以上所述步驟4中的具體計算過程如下:
步驟4:基于信息量,可以得出兩本體概念間的語義相似度其具體計算過程如下:
兩本體概念的共同父節點包含的信息量僅僅只能表示兩概念包含的相同信息,根據經驗可得兩本體概念間的語義相似度
。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川用聯信息技術有限公司,未經四川用聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610833571.2/1.html,轉載請聲明來源鉆瓜專利網。





