[發明專利]一種知識圖譜構建方法、裝置及存儲介質有效
| 申請號: | 202211505747.3 | 申請日: | 2022-11-28 |
| 公開(公告)號: | CN115936114B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 王寅達;彭玲;李瑋超;張雯悅;楊麗娜 | 申請(專利權)人: | 中國科學院空天信息創新研究院 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02 |
| 代理公司: | 北京派特恩知識產權代理有限公司 11270 | 代理人: | 王軍紅;王黎延 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 知識 圖譜 構建 方法 裝置 存儲 介質 | ||
1.一種知識圖譜構建方法,其特征在于,包括:
以地方名品通用本體為核心節點構建本體層,所述地方名品通用本體,其下包括:環境對象實體,用于表征特定地理范圍內的環境條件,生長條件對象實體:用于表征地方農產物的適宜生長條件,地方產物對象實體:用于表征地方產物自身的通用屬性特點;版本管理對象實體:用于表征存在歧義的三元組;
獲取產物數據,基于所述產物數據提取三元組;
基于所提取的三元組和所述本體層,構建實例層;所述本體層和所述實例層表征所述知識圖譜。
2.根據權利要求1所述的知識圖譜構建方法,其特征在于,
所述地方名品通用本體,其下還包括:
時間對象本體:用于表征三元組的時間屬性;空間對象本體:用于表征產物的空間屬性;
所述版本管理對象實體,其下包括:
源實體:用于表征三元組的信息來源;
審核實體:用于表征三元組是否被審核;
計數實體:用于表征同一三元組的入庫次數。
3.根據權利要求1中所述的知識圖譜構建方法,其特征在于,所述產物數據包括地理信息數據和非地理信息數據;
所述基于所述產物數據提取三元組,包括:
從所述地理信息數據中和/或所述非地理信息數據中提取三元組;其中,所述非地理信息包括以下數據至少之一:文本信息數據、圖片信息數據、視頻信息數據和音頻信息數據;
其中,從所述地理信息數據中提取三元組,包括:
將所述地理信息數據中的非結構化數據、半結構化數據或結構化數據轉化為GeoJSON格式的結構化地理信息數據,基于所述本體層中的實體和屬性定義,從所述GeoJSON的結構化地理信息數據中提取三元組;
所述從所述非地理信息數據中提取三元組,包括:
基于所述本體層中的實體、屬性和關系定義,從所述非地理信息數據中抽取三元組;其中,當所述非地理信息數據為圖片信息數據、視頻信息數據或音頻信息數據時,在從所述非地理信息數據中抽取三元組前將其轉換為對應的文本信息數據。
4.根據權利要求3所述的知識圖譜構建方法,其特征在于,基于所述本體層中的實體、屬性和關系定義,從所述非地理信息數據中抽取三元組,包括:
基于所述本體層中的實體、屬性和關系定義,通過預設的規則從所述非地理信息數據中的結構化數據中提取三元組;
基于所述本體層中的實體、屬性和關系定義,通過三元組事件抽取的方法抽取非地理信息數據中的半結構化數據和/或非結構化數據中的實體、屬性和關系,基于所抽取的實體、屬性和關系提取三元組;
刪除從所述非地理信息數據中的半結構化數據和/或非結構化數據中提取的三元組中置信度小于或等于第一預設閾值的三元組;保留置信度大于第一預設閾值的三元組;
通過相似度算法計算所述置信度大于第一預設閾值的三元組中的各個三元組的謂詞與所述本體層中屬性的相似度;
刪除所述置信度大于第一預設閾值的三元組中謂詞與所述本體中的所有屬性都不相似的的三元組,保留謂詞與所述本體中的屬性相似的三元組。
5.根據權利要求1-4中任一項所述的知識圖譜構建方法,其特征在于,所述基于所提取的三元組和所述本體層構建實例層,包括:
基于所提取的三元組和所述本體層的匹配關系,將所提取的三元組存儲在數據庫中,得到所述實例層。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院空天信息創新研究院,未經中國科學院空天信息創新研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211505747.3/1.html,轉載請聲明來源鉆瓜專利網。





