[發明專利]一種基于敘詞表構建領域本體的方法及裝置在審
| 申請號: | 202211558216.0 | 申請日: | 2022-12-06 |
| 公開(公告)號: | CN115934959A | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 刁薪予;喬盛;齊戰勝;倪艷玉;周新波;陳坤 | 申請(專利權)人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/247 |
| 代理公司: | 廈門福貝知識產權代理事務所(普通合伙) 35235 | 代理人: | 郭涵煒 |
| 地址: | 361000 福建省廈門市思明*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 詞表 構建 領域 本體 方法 裝置 | ||
1.一種基于敘詞表構建領域本體的方法,其特征在于,包括以下步驟:
S1、遍歷敘詞表,提取所述敘詞表中所有詞條的關聯文件集合;
S2、構建敘詞向量:所述敘詞表包括N級敘詞,遍歷所述N級敘詞,并且以對應的上一級敘詞為原點,重復構建N-1級敘詞向量;
S3、構建詞條向量:從第一級敘詞指向第N-1級敘詞,構建XY平面向量;
S4、構建關聯文件向量:從所述第一級敘詞,以所述詞條向量為點積,生成由所述關聯文件集合決定的頂層本體三維模型;以及
S5、根據所述頂層本體三維模型和輸入的領域主題生成領域本體模型。
2.根據權利要求1所述的基于敘詞表構建領域本體的方法,其特征在于,在步驟S2中,所述敘詞表采用GB/T?13190-1991標志的敘詞表構成,所述敘詞表包括N級敘詞,第一級敘詞為同級關系的敘詞名和定義內容,第二級敘詞到第N-1級敘詞為屬分關系的敘詞和定義內容集合,第N級敘詞為類緣關系的相關內容詞條。
3.根據權利要求1所述的基于敘詞表構建領域本體的方法,其特征在于,在步驟S2中,還包括遍歷所述敘詞表的第一級敘詞,生成一級敘詞熱引用表并根據已用次數逆序排序,去除所述一級敘詞熱引用表中的重復敘詞,生成離散X軸數據集合,每個敘詞坐標為(X,Y=0,Z=0)。
4.根據權利要求1所述的基于敘詞表構建領域本體的方法,其特征在于,在步驟S2中,還包括遍歷所述敘詞表的所有第二級敘詞,以對應的第一級敘詞(X,0,0)為原點構建向量;判斷是否有重復的敘詞,若有,則所述重復的敘詞不計入節點數,生成從所述第一級敘詞(X,0,0)為原點,以重復敘詞頂點為終端的向量。
5.根據權利要求1所述的基于敘詞表構建領域本體的方法,其特征在于,在步驟S1中,遍歷敘詞表,提取所述敘詞表中所有詞條的關聯文件集合,生成關聯文件熱引用表并根據已用次數逆序排序;將所述關聯文件熱引用表按照引用次數標注相對距離,生成離散Z軸數據集合。
6.根據權利要求1所述的基于敘詞表構建領域本體的方法,其特征在于,在步驟S5中,所述領域主題為用戶隨機輸入的關鍵詞或搜索關鍵字集合。
7.根據權利要求1所述的基于敘詞表構建領域本體的方法,其特征在于,在步驟S5中,根據所述頂層本體三維模型和輸入的領域主題生成領域本體模型,具體包括以下子步驟:
S51、檢測所述領域主題中包含的敘詞,由檢測到的所述敘詞拓撲獲得第一關聯文件;
S52、全文搜索已知關聯文件中是否包含所述領域主題,若包含,則將所述已知關聯文件視為第二關聯文件;
S53、通過所述頂層本體三維模型,檢索出所述第一關聯文件和所述第二關聯文件對應的詞條向量;
S54、去除所有無關的詞條向量,生成領域本體模型;以及
S55、通過三維漫游,構建清晰的領域本體主題圖。
8.一種基于敘詞表構建領域本體的裝置,其特征在于,所述裝置包括:
關聯文件獲取模塊,用于遍歷敘詞表,提取所述敘詞表中所有詞條的關聯文件集合;
敘詞向量構建模塊,用于構建敘詞向量:所述敘詞表包括N級敘詞,遍歷所述N級敘詞,并且以對應的上一級敘詞為原點,重復構建N-1級敘詞向量;
詞條向量構建模塊,用于構建詞條向量:從第一級敘詞指向第N-1級敘詞,構建XY平面向量;
關聯文件向量構建模塊,用于構建關聯文件向量:從所述第一級敘詞,以所述詞條向量為點積,生成由所述關聯文件集合決定的頂層本體三維模型;以及
模型生成模塊,用于根據所述頂層本體三維模型和輸入的領域主題生成領域本體模型。
9.一種電子設備,其特征在于,包括:
至少一個處理器;
以及與所述至少一個處理器通信連接的存儲器;
其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求1-7中任一項所述的方法。
10.一種計算機可讀存儲介質,所述介質中存儲有計算機程序,在所述計算機程序被處理器執行時,實施如權利要求1-7中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市美亞柏科信息股份有限公司,未經廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211558216.0/1.html,轉載請聲明來源鉆瓜專利網。





