[發明專利]結構化數據解析和管理的系統、方法、設備、介質及終端在審
| 申請號: | 202211087111.1 | 申請日: | 2022-09-07 |
| 公開(公告)號: | CN115345151A | 公開(公告)日: | 2022-11-15 |
| 發明(設計)人: | 林超群;江文濤;盧天發;李仁杰 | 申請(專利權)人: | 羅普特科技集團股份有限公司;羅普特(上海)科技有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/186;G06F40/284;G06F40/30;G06F40/151;G06F16/31;G06F16/21 |
| 代理公司: | 北京京萬通知識產權代理有限公司 11440 | 代理人: | 萬學堂 |
| 地址: | 361000 福建省廈門市軟件園三期集*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 結構 數據 解析 管理 系統 方法 設備 介質 終端 | ||
1.一種結構化數據解析和管理方法,其特征在于,所述結構化數據解析和管理方法包括:
通過詞庫升級庫解析自然語言,將自然語言分詞為數組、遍歷數組,并與詞庫匹配,替換為結構化數據;
通過模板態結構化元數據節點和普通文本節點構成結構化模板并進行編輯,通過插入刪除修改節點,創建和更改結構化模板;
通過賦值態結構化元數據節點和普通文本節點構成結構化數據并進行編輯,通過插入刪除修改節點,創建和更改結構化數據;
對于結構化模板轉換為結構化數據中,給結構化模板中的所有的模板態結構化元數據節點賦值后,生成結構化數據;
結構化模板編輯器或結構化數據編輯器中的文本解析為結構化模板或者結構化數據的節點數組,通過正則表達式將文本解析生成結構化元數據和普通文本組成的節點數組;
通過語義化的模板和數據展示規則作為結構化數據和模板的展示形式。
2.如權利要求1所述的結構化數據解析和管理方法,其特征在于,所述結構化數據解析和管理方法具體包括以下步驟:
S1:將自然語言文本通過自然語言文本解析器解析為結構化數據,以及將結構化數據通過結構化數據編譯器解析為自然語言文本;
S2:結構化數據通過結構化數據編輯器可以插入、刪除、修改結構化數據中的元數據,或者更換元數據的詞條;
S3:將結構化詞庫中的結構化元數據構建結構化模板;
S4:結構化模板編輯器對結構化模板進行編輯;
S5:結構化數據數據編輯器對結構化模板中的結構化插入、刪除、修改結構化數據中的元數據,以及更換元數據的詞條。
3.如權利要求1所述的結構化數據解析和管理方法,其特征在于,所述自然語言文本解析器工作流程具體包括:
S11、通過jieba庫實現自然語言文本的分詞,生成分詞列表;
S12、通過結構化詞庫,實現對jieba庫的針對詞庫擴展;
S13、通過遍歷分詞列表,匹配遍歷詞庫,如果匹配到詞庫詞條則將該詞條替換為元數據,最終將替換后的分詞列表拼接為結構化文本。
4.如權利要求1所述的結構化數據解析和管理方法,其特征在于,所述結構化元數據的數據結構的設計,包含如下步驟:
(1)通過設計數據結構,包含元數據名、相應詞庫、實例態詞條信息;
(2)擁有兩種狀態:模板態、實例態。使得其支持解析器、兩種編輯器的需求;
在步驟(1)中所述設計數據結構包括:
設計普通文本節點的數據結構,用于存儲非結構化節點的數據;其中索引是value,值是字符串類型的值;
設計模板態元數據的數據結構:模板態是元數據未被賦值時的狀態,用于結構化模板的編寫;所述模板態元數據的數據結構包括名為metadataId的元數據唯一ID,以及名為name的元數據名稱;其中名稱用于結構化模板編輯器和數據編輯器中展示;而唯一ID用于關聯元數據的詞庫功能;
設計元數據所屬詞庫/詞條的數據結構,詞庫用于關聯元數據,賦予元數據真實含義;詞庫的數據結構由數量不等的詞條組成的數組;詞條的數據結構由詞條所屬元數據的ID、詞條ID、值組成;其中值是該詞條所對應的自然語言的詞語;
設計實例態元數據的數據結構,實例態元數據是模板態元數據賦值后的產物,繼承模板態元數據的metadataId、name,另外擁有賦值的詞條ID,以及詞條值,實例態元數據用于結構化數據編輯器中的賦值詞條后的形態載體;
設計結構化模板的數據結構,結構化模板是模板態元數據節點和普通數據節點組成的JSON數組,結構化模板用于結構化模板編輯器的編輯產物的載體。
5.如權利要求1所述的結構化數據解析和管理的系統與方法,其特征在于,所述結構化數據編譯器的設計,包含如下步驟:
(1)獲取的結構化數據;
(2)遍歷結構化數據,將結構化數據的元數據的值拼接為一個字符串,該字符串即是自然語言文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于羅普特科技集團股份有限公司;羅普特(上海)科技有限公司,未經羅普特科技集團股份有限公司;羅普特(上海)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211087111.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于聲發射技術的橋梁結構監測系統
- 下一篇:差速無級變矩變速器
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





