[發(fā)明專利]時空多模態(tài)混合數(shù)據(jù)處理方法、關(guān)聯(lián)方法與索引方法有效
| 申請?zhí)枺?/td> | 202110770050.8 | 申請日: | 2021-07-08 |
| 公開(公告)號: | CN113297395B | 公開(公告)日: | 2021-09-24 |
| 發(fā)明(設(shè)計)人: | 張翀;葛斌;何春輝 | 申請(專利權(quán))人: | 中國人民解放軍國防科技大學(xué) |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F40/295;G06F40/30;G06F16/31;G06N5/02 |
| 代理公司: | 長沙國科天河知識產(chǎn)權(quán)代理有限公司 43225 | 代理人: | 邱軼 |
| 地址: | 410073 湖*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 時空 多模態(tài) 混合 數(shù)據(jù)處理 方法 關(guān)聯(lián) 索引 | ||
本申請涉及一種時空多模態(tài)混合數(shù)據(jù)處理方法、關(guān)聯(lián)方法與索引方法。所述方法包括:獲取時空多模態(tài)混合數(shù)據(jù);確認知識圖譜的知識圖譜描述信息;確認非結(jié)構(gòu)化文本的文本描述信息;確認關(guān)系數(shù)據(jù)庫記錄的記錄描述信息;當時空多模態(tài)混合數(shù)據(jù)分別為知識圖譜、非結(jié)構(gòu)化文本以及關(guān)系數(shù)據(jù)庫記錄時,針對具有時空特性知識圖譜、非結(jié)構(gòu)化文本和關(guān)系數(shù)據(jù)庫中記錄的數(shù)據(jù)以時空特點,形成具備將原始數(shù)據(jù)中具有時間和空間的屬性提煉出來的能力,并且針對這3種不同類型的數(shù)據(jù)進行設(shè)計時空屬性。采用本方法能夠?qū)崿F(xiàn)對時空多模態(tài)混合數(shù)據(jù)的統(tǒng)一設(shè)計處理。
技術(shù)領(lǐng)域
本申請涉及時空數(shù)據(jù)處理技術(shù)領(lǐng)域,特別是涉及一種時空多模態(tài)混合數(shù)據(jù)處理方法、關(guān)聯(lián)方法與索引方法。
背景技術(shù)
隨著信息獲取與處理手段的多樣化發(fā)展,來自不同源頭、不同模態(tài)的數(shù)據(jù)不斷被積累,這些數(shù)據(jù)都是從業(yè)務(wù)、描述、知識等不同方面對客觀對象的刻畫,在進行決策分析時都需要進行參考,時空多模態(tài)混合數(shù)據(jù)包括時間、空間、知識圖譜、非結(jié)構(gòu)化文本以及關(guān)系數(shù)據(jù)庫記錄的數(shù)據(jù),如何面向這5種模態(tài)數(shù)據(jù)進行統(tǒng)一組織與快速、智能化的查詢是數(shù)據(jù)分析的重要前提手段。
然而,常規(guī)的數(shù)據(jù)組織與處理技術(shù)中,無法直接應(yīng)用于時空多模態(tài)混合數(shù)據(jù),并且常規(guī)的數(shù)據(jù)處理要么就是單純的知識圖譜+文本類數(shù)據(jù),要么就是數(shù)據(jù)庫記錄的數(shù)據(jù)+文本類數(shù)據(jù),沒有進行統(tǒng)籌規(guī)劃管理,從而導(dǎo)致數(shù)據(jù)管理和檢索效率低下。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種時空多模態(tài)混合數(shù)據(jù)處理方法、關(guān)聯(lián)方法與索引方法。
一種時空多模態(tài)混合數(shù)據(jù)處理方法,所述方法包括:
獲取時空多模態(tài)混合數(shù)據(jù);所述時空多模態(tài)混合數(shù)據(jù)包括:知識圖譜、非結(jié)構(gòu)化文本以及關(guān)系數(shù)據(jù)庫記錄;所述知識圖譜中包括:時空數(shù)據(jù)對應(yīng)的實體和關(guān)系;
確認所述知識圖譜的知識圖譜描述信息;所述知識圖譜描述信息包括:中心實體、輔助實體、地理坐標、產(chǎn)生時間以及節(jié)點關(guān)系;
確認非結(jié)構(gòu)化文本的文本描述信息;所述文本描述信息包括:文本內(nèi)容、地理坐標集合以及時間集合;
確認關(guān)系數(shù)據(jù)庫記錄的記錄描述信息;所述記錄描述信息包括:記錄、地理坐標以及主題時間;
當時空多模態(tài)混合數(shù)據(jù)為知識圖譜時,根據(jù)預(yù)先設(shè)置的核心主題詞列表,判斷節(jié)點的類型為中心實體或輔助實體,根據(jù)兩個相連節(jié)點的類型,確定節(jié)點關(guān)系的類型,以及針對每一個中心實體,利用自然語言處理所述中心實體連接的輔助實體,確定中心實體對應(yīng)的產(chǎn)生時間和地理坐標,根據(jù)中心實體、輔助實體、地理坐標、產(chǎn)生時間以及節(jié)點關(guān)系,得到時空知識圖譜;
當時空多模態(tài)混合數(shù)據(jù)為非結(jié)構(gòu)化文本時,利用自然語言處理對所述非結(jié)構(gòu)化文本進行處理,得到地點類實體和時間類實體,根據(jù)所述地點類實體得到地理坐標集合以及根據(jù)所述時間類實體得到時間集合,根據(jù)所述文本內(nèi)容、地理坐標集合以及時間集合,得到時空文本;
當時空多模態(tài)混合數(shù)據(jù)為關(guān)系數(shù)據(jù)庫記錄時,獲取關(guān)系數(shù)據(jù)庫記錄中字段名稱列表和元組記錄列表,根據(jù)所述字段名稱列表的屬性和所述元組記錄列表中的值,構(gòu)建鍵值對,采用語義識別的方式識別所述鍵值對,得到地理坐標以及主題時間,根據(jù)記錄、地理坐標以及主題時間,得到時空記錄文本。
在其中一個實施例中,還包括:當節(jié)點在預(yù)先設(shè)置的核心主題詞列表中,則將該節(jié)點確定為中心實體,當節(jié)點不在預(yù)先設(shè)置的核心主題詞列表中,則將該節(jié)點確定為輔助實體;
若兩個相連節(jié)點的節(jié)點類型均為中心實體,則確定節(jié)點關(guān)系為中心關(guān)系;若兩個相連節(jié)點的一個為中心實體,另一個是輔助實體,則確定節(jié)點關(guān)系為輔助關(guān)系;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍國防科技大學(xué),未經(jīng)中國人民解放軍國防科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110770050.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種時空地理大數(shù)據(jù)的檢索方法及系統(tǒng)
- 一種泛知識化時空對象表達數(shù)據(jù)庫建立方法
- 一種基于時空密度波與同步的大型時空數(shù)據(jù)聚類算法GRIDWAVE
- 時空數(shù)據(jù)的存儲方法、查詢方法及存儲裝置、查詢裝置
- 一種云環(huán)境下時空索引的構(gòu)建方法、裝置及電子設(shè)備
- 面向工業(yè)4.0的時空大數(shù)據(jù)分布式存儲檢索方法及系統(tǒng)
- 一種數(shù)據(jù)比對碰撞方法和裝置
- 時空數(shù)據(jù)的異常檢測方法、裝置、電子設(shè)備和存儲介質(zhì)
- 一種可直接捕獲時空相關(guān)性的時空數(shù)據(jù)預(yù)測方法
- 多維時空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲介質(zhì)
- 用于智能機器人系統(tǒng)多模態(tài)輸出的方法及裝置
- 一種基于深度學(xué)習(xí)的多模態(tài)醫(yī)學(xué)影像識別方法及裝置
- 一種基于多模態(tài)生成式對抗網(wǎng)絡(luò)的云圖分類方法
- 一種基于多模態(tài)信息的食道功能性疾病診斷系統(tǒng)
- 一種有監(jiān)督的快速離散多模態(tài)哈希檢索方法和系統(tǒng)
- 一種多模態(tài)數(shù)據(jù)處理方法及系統(tǒng)
- 一種基于多模態(tài)學(xué)習(xí)的電力攻擊識別方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種基于門機制多模態(tài)融合的情感分析方法
- 面向?qū)捰蝻w行的多模態(tài)精確劃分方法
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計算機可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序





