[發明專利]知識圖譜標簽松散場景下地理信息索引系統及檢索方法有效
| 申請號: | 202011048405.4 | 申請日: | 2020-09-29 |
| 公開(公告)號: | CN112214612B | 公開(公告)日: | 2022-09-30 |
| 發明(設計)人: | 龍萬成;王麗蘋 | 申請(專利權)人: | 華東師范大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/31;G06F16/29;G06F16/9537 |
| 代理公司: | 上海藍迪專利商標事務所(普通合伙) 31215 | 代理人: | 徐筱梅;張翔 |
| 地址: | 200241 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 知識 圖譜 標簽 松散 場景 地理信息 索引 系統 檢索 方法 | ||
本發明公開了一種知識圖譜標簽松散場景下地理信息索引系統及檢索方法,該地理信息索引系統在存儲地理信息的同時額外存儲了知識圖譜中每一個地理節點所關聯的標簽的集合,其對應的檢索方法可以利用索引系統中存儲的標簽集合信息直接查詢出所有與對應地理節點所關聯的標簽并檢測出這些標簽是否滿足檢索需求,從而提前規避對不滿足檢索需求的地理節點的檢索,減小了無效檢索的范圍。本發明提出的地理信息索引系統及對應檢索方法在知識圖譜標簽松散場景下可以表現出高效的檢索效率。
技術領域
本發明涉及計算機科學技術領域,尤其是一種知識圖譜標簽松散場景下地理信息索引系統及對應檢索方法。
背景技術
國際標準化組織W3C提出了針對RDF知識圖譜的標準化查詢語言SPARQL。作為一種圖數據,SPARQL查詢的執行可以通過圖匹配的方式實現。然而圖匹配的計算復雜度較高,關于查詢的執行和實現,核心問題是在保證接口正確性的同時,如何有效地提高時間效率和空間效率;針對這些核心問題,合理的模型和算法的設計,對于知識圖譜的高效查詢來說,是必不可少的。
針對時空數據和文本關鍵詞的查詢,目前已經取得了較好的進展,如IR-Tree,BR-Tree等;它們的主要思想都是在空間索引中維護其他額外的關鍵信息(如文本關鍵詞信息等),以此在基于空間索引的空間剪枝的能力的基礎上,增加額外的剪枝能力(如文本剪枝能力),最終有效地提高查詢的效率;但是,正是由于在空間索引中維護了額外的信息,所以為了維護這些額外的信息而導致的空間上的開銷,也是需要考慮和權衡的。除此之外,由于在知識圖譜中數據是以節點(圖數據)的形式存在,其時空信息和文件關鍵詞信息是以節點的屬性或獨立的節點的形式存在,所以對于如何厘清不同粒度的空間實體和文本等非空間實體的邏輯關聯關系、如何有效地利用地理關聯技術去關聯知識圖譜中實體的語義信息和空間信息、如何有效地將時空數據和文本關鍵詞的查詢相關的高效算法應用于知識圖譜中等等難點,仍具有一定的思考和研究的空間。
基礎地理信息數據具有空間載體和知識庫兩大功能。過去人們主要關注其空間載體的作用,開發并提供各種基礎地理數據服務和信息服務,但對其知識存量的挖掘不夠,提供的地理空間知識服務很少。近年來,“海量數據、信息爆炸、知識難求”的現象越來越突出,以在知識圖譜中對地理信息進行額外的處理以獲得更好的知識服務為起點,將地理數據信息服務向知識服務轉型是大勢所趨。如果能夠在知識圖譜中以結構化的方式描述伴隨著地理空間信息的高維度數據及其間的關系并實現高效的查詢,則對于在認知計算、知識表示與推理、信息檢索與抽取、數據挖掘與機器學習等大數據技術對地理信息進行處理與分析以及地理信息知識服務方面將會大有裨益。由此,知識圖譜中地理信息的存儲與高效查詢的實現,對于地理信息的分析與應用來說,具有重要的研究和實用價值。
此外,從流行病防治的需求出發,可以結合圖數據與時空數據等大數據管理技術,利用知識圖譜全面刻畫疫情中涉及的醫療、社會、人群等復雜信息,用軌跡數據刻畫用戶隨時間變化的位置信息,并建立時空數據與知識圖譜中文本數據的關聯,進而構建融合知識圖譜和時空數據的新穎有效的存儲、處理和分析技術,實現疫情的全方位、細粒度、多視角的監控,并為現有的人工管理和直報系統提供有力補充。
發明內容
本發明的目的是提供一種知識圖譜標簽松散場景下地理信息索引系統及檢索方法,該地理信息索引系統在存儲地理信息的同時額外存儲了知識圖譜中每一個地理節點所關聯的標簽的集合,其對應的檢索方法可以利用索引系統中存儲的標簽集合信息直接查詢出所有與對應地理節點所關聯的標簽并檢測出這些標簽是否滿足檢索需求,從而提前規避對不滿足檢索需求的地理節點的檢索,減小了無效檢索的范圍。
實現本發明目的的具體技術方案是:
一種知識圖譜標簽松散場景下地理信息索引系統,特點是所述索引系統為LR樹;所述LR樹以R樹為基礎,在存儲空間信息的同時,再存儲每個節點的可達標簽集合,以增強檢索時剪枝效力;
其中可達標簽集合具體為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東師范大學,未經華東師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011048405.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于人體行走的發電裝置
- 下一篇:一種多功能螺絲刀





