[發(fā)明專(zhuān)利]非結(jié)構(gòu)化源數(shù)據(jù)的云端自主邏輯歸檔方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811273991.5 | 申請(qǐng)日: | 2018-10-30 |
| 公開(kāi)(公告)號(hào): | CN109582756B | 公開(kāi)(公告)日: | 2022-10-14 |
| 發(fā)明(設(shè)計(jì))人: | 張超;韓成;蔣振剛;于翠紅;薛耀紅;李華;權(quán)巍;胡漢平;耿雪娜 | 申請(qǐng)(專(zhuān)利權(quán))人: | 長(zhǎng)春理工大學(xué) |
| 主分類(lèi)號(hào): | G06F16/31 | 分類(lèi)號(hào): | G06F16/31;G06F16/35 |
| 代理公司: | 吉林長(zhǎng)春新紀(jì)元專(zhuān)利代理有限責(zé)任公司 22100 | 代理人: | 王薇 |
| 地址: | 130022 吉林省長(zhǎng)春市*** | 國(guó)省代碼: | 吉林;22 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)構(gòu) 數(shù)據(jù) 云端 自主 邏輯 歸檔 方法 | ||
1.非結(jié)構(gòu)化源數(shù)據(jù)的云端自主邏輯歸檔方法,其特征在于:根據(jù)非結(jié)構(gòu)化數(shù)據(jù)的自然語(yǔ)言描述內(nèi)容,云端存儲(chǔ)系統(tǒng)即可對(duì)其作出自主邏輯歸檔處理,并自動(dòng)為其分配相關(guān)的分詞標(biāo)簽、簡(jiǎn)短摘要;該方法的具體實(shí)現(xiàn)步驟如下:
步驟S1、云端存儲(chǔ)過(guò)程按原有存儲(chǔ)策略對(duì)非結(jié)構(gòu)化數(shù)據(jù)UD進(jìn)行物理存放,且非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)表DST自動(dòng)生成非結(jié)構(gòu)化數(shù)據(jù)索引值UID;
步驟S2、云端存儲(chǔ)過(guò)程將非結(jié)構(gòu)化數(shù)據(jù)UD的自然語(yǔ)言描述內(nèi)容DESC傳遞給邏輯歸檔處理過(guò)程,并在邏輯歸檔表LST中新添記錄LNM,將記錄LNM的非結(jié)構(gòu)化數(shù)據(jù)ID字段賦值為非結(jié)構(gòu)化數(shù)據(jù)索引值UID,將記錄LNM的數(shù)據(jù)內(nèi)容描述字段賦值為自然語(yǔ)言描述內(nèi)容DESC;
步驟S3、邏輯歸檔處理過(guò)程將自然語(yǔ)言描述內(nèi)容DESC和句子數(shù)N作為參數(shù)傳遞給HanLP的過(guò)程函數(shù)extractSummary;
步驟S4、過(guò)程函數(shù)extractSummary根據(jù)TextRank算法對(duì)自然語(yǔ)言描述內(nèi)容DESC進(jìn)行抽取式摘要提取,從而得到自然語(yǔ)言描述內(nèi)容DESC的抽取式摘要ABS,將記錄LNM的數(shù)據(jù)描述摘要字段賦值為抽取式摘要ABS;
步驟S5、利用數(shù)組結(jié)構(gòu),將邏輯分類(lèi)表LCT的全部M個(gè)邏輯分類(lèi)描述信息組織成邏輯分類(lèi)描述數(shù)組LCDA,LCDA = { LCD1, LCD2, ……, LCDM },并將邏輯分類(lèi)描述數(shù)組LCDA的所有邏輯分類(lèi)描述信息LCD1、LCD2、……、LCDM添加至HanLP的Suggester容器;
步驟S6、使用Suggester容器的過(guò)程函數(shù)suggest進(jìn)行最佳邏輯分類(lèi)描述的選取,將抽取式摘要ABS作為參數(shù)傳遞給過(guò)程函數(shù)suggest,從而得到與抽取式摘要ABS相似度最大的邏輯分類(lèi)描述LCA;
步驟S7、把抽取式摘要ABS和關(guān)鍵詞個(gè)數(shù)P作為過(guò)程函數(shù)的調(diào)用參數(shù),傳遞給HanLP的過(guò)程函數(shù)extractKeyword對(duì)抽取式摘要ABS進(jìn)行提取操作,得到抽取式摘要ABS的關(guān)鍵詞序列AKW,AKW = { AKW1, AKW2, ……, AKWP },將記錄LNM的描述分詞標(biāo)簽字段賦值為關(guān)鍵詞序列AKW;
步驟S8、把邏輯分類(lèi)描述LCA和關(guān)鍵詞個(gè)數(shù)P作為過(guò)程函數(shù)的調(diào)用參數(shù),傳遞給HanLP的過(guò)程函數(shù)extractKeyword對(duì)邏輯分類(lèi)描述LCA進(jìn)行提取操作,得到邏輯分類(lèi)描述LCA的關(guān)鍵詞序列LKW,LKW = { LKW1, LKW2, ……, LKWP };
步驟S9、使用HanLP中CoreSynonymDictionary的過(guò)程函數(shù)similarity,分別計(jì)算關(guān)鍵詞序列AKW中每一個(gè)關(guān)鍵詞與關(guān)鍵詞序列LKW中所有關(guān)鍵詞的相似度,選取關(guān)鍵詞序列AKW中每一個(gè)關(guān)鍵詞相似度的最大值構(gòu)成相似度序列ALV,ALV = { ALV1, ALV2, ……, ALVP };
步驟S10、設(shè)定相似度匹配容差范圍為e,相似度匹配誤差SMD表達(dá)式由EQ1表示,如果SMD e,則跳轉(zhuǎn)到步驟S12執(zhí)行,否則繼續(xù)執(zhí)行步驟S11;
表達(dá)式EQ1:SMD = P2 - ( ALV1 + ALV2 + …… + ALVP )2
步驟S11、在邏輯分類(lèi)表LCT中新添記錄CNM,則邏輯分類(lèi)表LCT自動(dòng)為記錄CNM分配一個(gè)邏輯分類(lèi)索引值LCID,將記錄CNM的邏輯分類(lèi)描述字段賦值為抽取式摘要ABS,將記錄LNM的邏輯分類(lèi)ID字段賦值為邏輯分類(lèi)索引值LCID,跳轉(zhuǎn)到步驟S13繼續(xù)執(zhí)行;
步驟S12、在邏輯分類(lèi)表LCT中,根據(jù)邏輯分類(lèi)描述LCA查找其對(duì)應(yīng)的邏輯分類(lèi)索引值LSID,將記錄LNM的邏輯分類(lèi)ID字段賦值為邏輯分類(lèi)索引值LSID;
步驟S13、至此便可完成單個(gè)非結(jié)構(gòu)化數(shù)據(jù)的云端自主邏輯歸檔,若要對(duì)其他非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行自主邏輯歸檔,則返回至步驟S1重新執(zhí)行即可。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于長(zhǎng)春理工大學(xué),未經(jīng)長(zhǎng)春理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811273991.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





