[發明專利]一種基于開放域的生態文明地理知識的抽取方法在審
| 申請號: | 202110632026.8 | 申請日: | 2021-06-07 |
| 公開(公告)號: | CN113505233A | 公開(公告)日: | 2021-10-15 |
| 發明(設計)人: | 袁文;袁武 | 申請(專利權)人: | 中國科學院地理科學與資源研究所 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/9537;G06F16/29;G06F16/27;G06F40/30 |
| 代理公司: | 成都宏田知識產權代理事務所(普通合伙) 51337 | 代理人: | 常利敏 |
| 地址: | 100101 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 開放 生態 文明 地理知識 抽取 方法 | ||
本發明涉及生態文明領域,提出了一種基于開放域的生態文明地理知識的抽取方法,該方法通過采用分布式網絡數據采集技術獲取多源異構網絡數據;基于時空場景事件顆粒對所述多源異構網絡數據進行文本時空分析,抽取生態文明地理時空場景事件、對應的時間和位置屬性;基于潛在語義分析檢測生態文明地理主題;構建基于眾包方式的標注語料庫;根據所述生態文明地理時空場景事件、對應的時間和位置屬性、主題以及語料庫構建生態文明地理時空事件數據庫。本發明主要解決生態文明地理領域知識實體抽取的隱含關系抽取性能低下的問題,實施本發明有利于提高隱含關系抽取性能以及抽取結果準確度。
技術領域
本發明涉及生態文明建設技術領域,尤其涉及一種基于開放域的生態文明地理知識的抽取方法。
背景技術
知識圖譜(knowledge graph)是人工智能領域的分支,是大數據時代知識表示最重要的一種方式。目前,知識圖譜已在智能搜索、深度問答、社交網絡以及一些垂直行業中有所應用,成為支撐這些應用發展的動力源泉。例如谷歌的知識圖譜相繼融入了維基百科、CIA世界概覽等公共資源以及從其他網站搜集、整理的大量語義數據,微軟的Bing Search和Facebook、Twitter等大型社交服務站點達成了合作協議,在用戶個性化內容的搜集、定制化方面具有顯著的優勢。社交網站Facebook于2013年推出了Graph Search產品,其核心技術就是通過知識圖譜將人、地點、事情等聯系在一起,并以直觀的方式支持精確的自然語言查詢,例如輸入查詢式:“我朋友喜歡的餐廳”“住在紐約并且喜歡籃球和中國電影的朋友”等,知識圖譜會幫助用戶在龐大的社交網絡中找到與自己最具相關性的人、照片、地點和興趣等。
知識圖譜核心技術包括知識抽取、知識表示、知識融合以及知識推理技術。知識抽取主要是面向開放的鏈接數據,通過自動化或者半自動化的技術抽取出可用的知識單元,并以此為基礎,形成一系列高質量的事實表達存入到知識圖譜。知識單元主要包括實體、關系以及屬性3個知識要素,因此,知識抽取主要包括實體抽取、關系抽取以及屬性抽取3個過程。實體抽取指的是從原始數據語料中自動識別出命名實體,是知識抽取中最為基礎與關鍵的一步。實體抽取方法分為 3種,包括基于規則與詞典的方法、基于統計機器學習的方法以及面向開放域的抽取方法。關系抽取目標是解決實體間語義鏈接的問題。面向開放域的信息抽取框架(open information extraction,OIE),具有開創性,但OIE方法實體的隱含關系抽取性能低下。楊博等(2014)提出了基于馬爾可夫邏輯網、基于本體推理的深層隱含關系抽取方法,但抽取結果準確度較低。屬性抽取主要是針對實體而言的,通過屬性可形成對實體的完整勾畫。基于規則與啟發式算法的屬性抽取方法能夠從Wikipedia及WordNet的半結構化網頁中自動抽取相應的屬性名稱與屬性值,還可擴展為一套本體知識庫。
發明內容
因此,為了提高隱含關系抽取性能以及抽取結果準確度,本發明提出了一種基于開放域的生態文明地理知識的抽取方法。
具體的,主要通過以下技術方案來實現:
一種基于開放域的生態文明地理知識的抽取方法,包括:
采用分布式網絡數據采集技術獲取多源異構網絡數據;
基于時空場景事件顆粒對所述多源異構網絡數據進行文本時空分析,抽取生態文明地理時空場景事件、對應的時間和位置屬性;
基于潛在語義分析檢測生態文明地理主題;
構建基于眾包方式的標注語料庫;
根據所述生態文明地理時空場景事件、對應的時間和位置屬性、主題以及語料庫構建生態文明地理時空事件數據庫。
優選地,所述生態文明地理主題包括:地形地貌、氣候、水文、土壤、生態環境、自然災害、社會經濟、人口及民俗文化、重大工程建設和生態文明治理。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院地理科學與資源研究所,未經中國科學院地理科學與資源研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110632026.8/2.html,轉載請聲明來源鉆瓜專利網。





