[發(fā)明專利]結(jié)構(gòu)化數(shù)據(jù)解析和管理的系統(tǒng)、方法、設(shè)備、介質(zhì)及終端在審
| 申請(qǐng)?zhí)枺?/td> | 202211087111.1 | 申請(qǐng)日: | 2022-09-07 |
| 公開(kāi)(公告)號(hào): | CN115345151A | 公開(kāi)(公告)日: | 2022-11-15 |
| 發(fā)明(設(shè)計(jì))人: | 林超群;江文濤;盧天發(fā);李仁杰 | 申請(qǐng)(專利權(quán))人: | 羅普特科技集團(tuán)股份有限公司;羅普特(上海)科技有限公司 |
| 主分類號(hào): | G06F40/205 | 分類號(hào): | G06F40/205;G06F40/186;G06F40/284;G06F40/30;G06F40/151;G06F16/31;G06F16/21 |
| 代理公司: | 北京京萬(wàn)通知識(shí)產(chǎn)權(quán)代理有限公司 11440 | 代理人: | 萬(wàn)學(xué)堂 |
| 地址: | 361000 福建省廈門市軟件園三期集*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)構(gòu) 數(shù)據(jù) 解析 管理 系統(tǒng) 方法 設(shè)備 介質(zhì) 終端 | ||
本發(fā)明屬于數(shù)據(jù)應(yīng)用技術(shù)領(lǐng)域,公開(kāi)了結(jié)構(gòu)化數(shù)據(jù)解析和管理的系統(tǒng)、方法、設(shè)備、介質(zhì)及終端,所述方法具體包括:將自然語(yǔ)言文本通過(guò)自然語(yǔ)言文本解析器解析為結(jié)構(gòu)化數(shù)據(jù),也可以將結(jié)構(gòu)化數(shù)據(jù)通過(guò)結(jié)構(gòu)化數(shù)據(jù)編譯器解析為自然語(yǔ)言文本;結(jié)構(gòu)化數(shù)據(jù)可以通過(guò)結(jié)構(gòu)化數(shù)據(jù)編輯器可以插入、刪除、修改結(jié)構(gòu)化數(shù)據(jù)中的元數(shù)據(jù),或者更換元數(shù)據(jù)的詞條;將結(jié)構(gòu)化詞庫(kù)中的結(jié)構(gòu)化元數(shù)據(jù)構(gòu)建結(jié)構(gòu)化模板;結(jié)構(gòu)化模板編輯器對(duì)結(jié)構(gòu)化模板進(jìn)行編輯。本發(fā)明通過(guò)自然語(yǔ)言文本解析器和結(jié)構(gòu)化數(shù)據(jù)編譯器實(shí)現(xiàn)了結(jié)構(gòu)化數(shù)據(jù)與自然語(yǔ)言的雙向解析。通過(guò)結(jié)構(gòu)化模板編輯器實(shí)現(xiàn)了結(jié)構(gòu)化模板的編輯。通過(guò)結(jié)構(gòu)化數(shù)據(jù)編輯器實(shí)現(xiàn)了結(jié)構(gòu)化數(shù)據(jù)的編輯。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)據(jù)應(yīng)用技術(shù)領(lǐng)域,特別是涉及一種結(jié)構(gòu)化數(shù)據(jù)解析和管理的系統(tǒng)、方法、設(shè)備、介質(zhì)及終端。
背景技術(shù)
結(jié)構(gòu)化數(shù)據(jù),是指符合一定數(shù)據(jù)結(jié)構(gòu),能被形式化描述的數(shù)據(jù),如JSON數(shù)據(jù),XML數(shù)據(jù)等。目前,在解析結(jié)構(gòu)化數(shù)據(jù)文件時(shí),通常采用的方案是:將結(jié)構(gòu)化數(shù)據(jù)文件直接按字節(jié)讀取到內(nèi)存,在內(nèi)存中形成結(jié)構(gòu)化數(shù)據(jù)對(duì)象,然后訪問(wèn)需要的數(shù)據(jù)子項(xiàng)并解析。
因此目前結(jié)構(gòu)化數(shù)據(jù)解析的方法中僅僅實(shí)現(xiàn)了自然語(yǔ)言到結(jié)構(gòu)化數(shù)據(jù)解析。并沒(méi)有實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)與自然語(yǔ)言的雙向解析、并沒(méi)有實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)的模板管理、結(jié)構(gòu)化數(shù)據(jù)的編輯功能,并且缺少一體化的技術(shù)方案。本發(fā)明解決了以上的問(wèn)題。
通過(guò)上述分析,現(xiàn)有技術(shù)存在的問(wèn)題及缺陷為:
目前結(jié)構(gòu)化數(shù)據(jù)解析的方法中僅僅實(shí)現(xiàn)了自然語(yǔ)言到結(jié)構(gòu)化數(shù)據(jù)解析,并沒(méi)有實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)與自然語(yǔ)言的雙向解析、并沒(méi)有實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)的模板管理、結(jié)構(gòu)化數(shù)據(jù)的編輯功能,并且缺少一體化的技術(shù)方案。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)存在的問(wèn)題,本發(fā)明提供了一種結(jié)構(gòu)化數(shù)據(jù)解析和管理的系統(tǒng)、方法、設(shè)備、介質(zhì)及終端。
本發(fā)明是這樣實(shí)現(xiàn)的,一種結(jié)構(gòu)化數(shù)據(jù)解析和管理方法具體包括:
通過(guò)詞庫(kù)升級(jí)jieba庫(kù)解析自然語(yǔ)言,將自然語(yǔ)言分詞為數(shù)組、遍歷數(shù)組,并與詞庫(kù)匹配,替換為結(jié)構(gòu)化數(shù)據(jù);
通過(guò)模板態(tài)結(jié)構(gòu)化元數(shù)據(jù)節(jié)點(diǎn)和普通文本節(jié)點(diǎn)構(gòu)成結(jié)構(gòu)化模板并進(jìn)行編輯,通過(guò)插入刪除修改節(jié)點(diǎn),創(chuàng)建和更改結(jié)構(gòu)化模板;
通過(guò)賦值態(tài)結(jié)構(gòu)化元數(shù)據(jù)節(jié)點(diǎn)和普通文本節(jié)點(diǎn)構(gòu)成結(jié)構(gòu)化數(shù)據(jù)并進(jìn)行編輯,通過(guò)插入刪除修改節(jié)點(diǎn),創(chuàng)建和更改結(jié)構(gòu)化數(shù)據(jù);
對(duì)于結(jié)構(gòu)化模板轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)中,給結(jié)構(gòu)化模板中的所有的模板態(tài)結(jié)構(gòu)化元數(shù)據(jù)節(jié)點(diǎn)賦值后,生成結(jié)構(gòu)化數(shù)據(jù);
結(jié)構(gòu)化模板編輯器或結(jié)構(gòu)化數(shù)據(jù)編輯器中的文本解析為結(jié)構(gòu)化模板或者結(jié)構(gòu)化數(shù)據(jù)的節(jié)點(diǎn)數(shù)組,通過(guò)正則表達(dá)式將文本解析生成結(jié)構(gòu)化元數(shù)據(jù)和普通文本組成的節(jié)點(diǎn)數(shù)組。
通過(guò)語(yǔ)義化的模板和數(shù)據(jù)展示規(guī)則作為結(jié)構(gòu)化數(shù)據(jù)和模板的展示形式。
具體包括以下步驟:
S1:將自然語(yǔ)言文本通過(guò)自然語(yǔ)言文本解析器解析為結(jié)構(gòu)化數(shù)據(jù),也可以將結(jié)構(gòu)化數(shù)據(jù)通過(guò)結(jié)構(gòu)化數(shù)據(jù)編譯器解析為自然語(yǔ)言文本;
S2:結(jié)構(gòu)化數(shù)據(jù)可以通過(guò)結(jié)構(gòu)化數(shù)據(jù)編輯器可以插入、刪除、修改結(jié)構(gòu)化數(shù)據(jù)中的元數(shù)據(jù),或者更換元數(shù)據(jù)的詞條;
S3:將結(jié)構(gòu)化詞庫(kù)中的結(jié)構(gòu)化元數(shù)據(jù)構(gòu)建結(jié)構(gòu)化模板;
S4:結(jié)構(gòu)化模板編輯器對(duì)結(jié)構(gòu)化模板進(jìn)行編輯;
S5:結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)編輯器對(duì)結(jié)構(gòu)化模板中的結(jié)構(gòu)化可以插入、刪除、修改結(jié)構(gòu)化數(shù)據(jù)中的元數(shù)據(jù),或者更換元數(shù)據(jù)的詞條。
進(jìn)一步,所述自然語(yǔ)言文本解析器工作流程具體包括:
S11、通過(guò)jieba庫(kù)實(shí)現(xiàn)自然語(yǔ)言文本的分詞,生成分詞列表;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于羅普特科技集團(tuán)股份有限公司;羅普特(上海)科技有限公司,未經(jīng)羅普特科技集團(tuán)股份有限公司;羅普特(上海)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211087111.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





