[發明專利]一種基于本體的密度自適應概念語義相似度計算方法有效
| 申請號: | 201810025611.X | 申請日: | 2018-01-11 |
| 公開(公告)號: | CN108256030B | 公開(公告)日: | 2020-10-23 |
| 發明(設計)人: | 李飛;廖樂健;何景 | 申請(專利權)人: | 北京理工大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/33;G06F40/30;G06F40/247 |
| 代理公司: | 北京正陽理工知識產權代理事務所(普通合伙) 11639 | 代理人: | 王民盛 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 本體 密度 自適應 概念 語義 相似 計算方法 | ||
1.一種基于本體的密度自適應概念語義相似度計算方法,簡稱相似度計算方法,其特征在于:包括以下步驟:
步驟1:輸入兩個概念以及給定的本體,通過在本體中分別查詢這兩個概念,得到每個概念對應的義項;
步驟2:判斷任意一個概念查詢的義項是否為空,并進行相應操作:
2.1:若是,說明本體中不包含輸入的概念,不能計算這兩個概念的語義相似度,則計算步驟結束,即結束本相似度計算方法;
2.2:若否,執行步驟3;
步驟3:將步驟1中兩個概念對應的義項按順序排列構成義項笛卡爾集;
步驟4:判斷所有結點是否在一個根結點中,并進行相應操作;
其中,一個結點,即為某一個概念對應的其中的一個義項;
4.1:若是,執行步驟5;
4.2:若否,為所有結點虛構一個根結點,使本體只具有一個根結點;
步驟5:從義項笛卡爾集中取出一個元素,并將取出的元素從義項笛卡爾集中刪除,查詢本體,分別得到取出的元素中每個義項通過“上下位”關系連接形成的到根結點的路徑,將每個義項到根結點的路徑作為一個集合構成兩個路徑集合;
步驟6:將步驟5中兩個路徑集合按順序排列構成路徑笛卡爾集;
步驟7:從路徑笛卡爾集中取出一個元素,并將取出的元素從路徑笛卡爾集中刪除,找出取出的元素中兩條路徑最末端的兩個結點的最近公共上位結點;
步驟8:從步驟7取出的元素中得到最近公共上位結點到根結點的路徑以及兩個義項結點到最近公共上位結點的路徑;
步驟9:計算兩個義項結點的最近公共上位結點的深度權重以及兩個義項結點間的最短路徑權重,包括如下子步驟:
9.1計算兩個義項結點的最近公共上位結點的深度權重,計算方式如公式(1)所示:
其中,s1和s2表示任意兩個義項結點,LCS(s1,s2)表示義項結點s1和s2的最近公共上位,depthweight(LCS(s1,s2))表示LCS(s1,s2)的深度權重,root表示根結點,edge(LCS(s1,s2),root)表示最近公共上位結點通過“上下位”關系連接到根結點的路徑上邊的集合,es→p表示任意相鄰結點s與p通過“上下位”關系連接的邊,且結點p是結點s的直接上位結點,directhypon(p)表示結點p的直接下位結點組成的集合,直接下位結點包含結點p本身,|directhypon(p)|表示結點p的直接下位結點的個數;
9.2計算兩個義項結點間的最短路徑權重,計算公式如式(2)所示:
其中,s1和s2表示任意兩個義項結點,pathLenweight(s1,s2)表示義項結點s1和s2之間的最短路徑權重,edge(s1,s2)表示義項結點s1和s2通過“上下位”關系連接的最短路徑上邊的集合,es→p表示任意相鄰結點s與p通過“上下位”關系連接的邊,且結點p是結點s的直接上位結點,directhypon(p)表示結點p的直接下位結點組成的集合,直接下位結點包含結點p本身,|directhypon(p)|表示結點p的直接下位結點的個數;
步驟10:用步驟9中的最短路徑權重和深度權重替換目前基于邊的方法中的最短路徑和深度計算方式,計算出兩個義項之間的語義相似度,并保存得到的語義相似度;
步驟11:判斷在步驟6中構成的路徑笛卡爾集目前是否為空,并執行相應操作:
11.1若是,說明從義項笛卡爾集中取出的義項對之間的語義相似度計算完成,執行步驟12;
11.2若否,則跳至步驟7;
步驟12:從步驟10保存的義項語義相似度中得到兩個義項語義相似度結果的最大值,即為兩個義項的語義相似度,并將結果保存;
步驟13:判斷在步驟3中構成的義項笛卡爾集目前是否為空,并執行相應操作:
13.1若是,說明兩個概念的語義相似度計算完成,執行步驟14;
13.2若否,則跳至步驟5;
步驟14:從步驟12保存的義項對的語義相似度中得到所有義項對語義相似度的最大值,即為兩個概念的語義相似度;
至此,經過步驟1到步驟14,完成了一種基于本體的密度自適應概念語義相似度計算方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京理工大學,未經北京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810025611.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種臺燈控制系統的控制方法
- 下一篇:印刷電路板結構及其形成方法





