[發明專利]氣象海洋非結構化文本知識構建方法、裝置及電子設備有效
| 申請號: | 202310722007.3 | 申請日: | 2023-06-19 |
| 公開(公告)號: | CN116450856B | 公開(公告)日: | 2023-09-12 |
| 發明(設計)人: | 徐焱;王宇翔;孫萬有;何思遠 | 申請(專利權)人: | 航天宏圖信息技術股份有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/211;G06F40/242;G06F40/289 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 丁銀澤 |
| 地址: | 100094 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 氣象 海洋 結構 文本 知識 構建 方法 裝置 電子設備 | ||
本發明提供了一種氣象海洋非結構化文本知識構建方法、裝置及電子設備,包括:獲取待構建的氣象海洋非結構化文本集;根據氣象海洋非結構化文本集確定氣象海洋環境領域的目標核心概念;基于目標核心概念對氣象海洋非結構化文本集進行知識實體抽取,以確定目標知識實體;通過關系識別模型基于氣象海洋非結構化文本集和目標知識實體,識別目標知識實體之間的實體關系;基于目標知識實體和目標知識實體之間的實體關系,構建氣象海洋環境領域的知識圖譜。本發明可以智能化抽取龐雜非結構化文本中的關鍵知識信息,構建圖譜關系,進而提高目標信息獲取的能力和檢索速度,有助于實現氣象海洋環境領域的知識共享,以便于更加全面地研究氣象海洋環境知識。
技術領域
本發明涉及知識圖譜技術領域,尤其是涉及一種氣象海洋非結構化文本知識構建方法、裝置及電子設備。
背景技術
隨著科學技術的發展,知識圖譜的應用越來越廣泛。知識圖譜具有強大的數據描述能力,為智能化信息應用提供了技術基礎,其可以以圖形化的方式向用戶呈現結構化知識。然而,氣象海洋環境知識具有非結構化、多源異構、時空復雜、語義復雜等特性,目前還尚未有成熟、全面的氣象海洋環境領域知識圖譜應用,如此導致氣象海洋環境領域相關知識的檢索速度較慢,阻礙了氣象海洋環境領域的知識共享,不能更加全面的研究氣象海洋環境知識。
發明內容
有鑒于此,本發明的目的在于提供一種氣象海洋非結構化文本知識構建方法、裝置及電子設備,可以智能化抽取龐雜非結構化文本中的關鍵知識信息,構建圖譜關系,進而提高目標信息獲取的能力和檢索速度,有助于實現氣象海洋環境領域的知識共享,以便于更加全面地研究氣象海洋環境知識。
第一方面,本發明實施例提供了一種氣象海洋非結構化文本知識構建方法,包括:
獲取待構建的氣象海洋非結構化文本集;
根據所述氣象海洋非結構化文本集確定氣象海洋環境領域的目標核心概念;
基于所述目標核心概念對所述氣象海洋非結構化文本集進行知識實體抽取,以確定目標知識實體;
通過預先訓練的關系識別模型,基于所述氣象海洋非結構化文本集和所述目標知識實體,識別所述目標知識實體之間的實體關系;
基于所述目標知識實體和所述目標知識實體之間的所述實體關系,構建所述氣象海洋環境領域的知識圖譜。
在一種實施方式中,根據所述氣象海洋非結構化文本集確定氣象海洋環境領域的目標核心概念,包括:
按照氣象海洋環境領域中的多個子領域,將所述氣象海洋非結構化文本集劃分為每個所述子領域對應的非結構化文本子集;
基于每個所述子領域對應的所述非結構化文本子集,獲取初始核心概念;其中,所述初始核心概念是通過對每個所述子領域對應的所述非結構化文本子集進行專家初步提取和專家交叉提取得到的;
爬取每個所述初始核心概念匹配的目標解釋頁面中的解釋文本;
對每個所述解釋文本進行分詞處理得到第一分詞數據集,并確定所述第一分詞數據集中的每個第一分詞對應的第一詞頻;
如果所述第一分詞對應的所述第一詞頻大于預設詞頻閾值,將所述第一分詞補入所述初始核心概念,以得到所述氣象海洋環境領域的目標核心概念。
在一種實施方式中,基于所述目標核心概念對所述氣象海洋非結構化文本集進行知識實體抽取,以確定目標知識實體,包括:
以所述目標核心概念作為自定義詞典,對所述氣象海洋非結構化文本集進行分詞處理,得到第二分詞數據集;其中,所述第二分詞數據集包括分詞列表和句法關系,所述句法關系包括至少一個謂詞和每個所述謂詞對應的若干個論元;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天宏圖信息技術股份有限公司,未經航天宏圖信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310722007.3/2.html,轉載請聲明來源鉆瓜專利網。





