[發(fā)明專利]一種電力知識庫構(gòu)建方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 202010630117.3 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111831792B | 公開(公告)日: | 2021-08-27 |
| 發(fā)明(設(shè)計(jì))人: | 田然;蘇楊;龐淵源;陳軒;顧彬;王磊;吳子辰;李霽軒;陳鑫;朱曉鴻;王鑫;于廣榮 | 申請(專利權(quán))人: | 國網(wǎng)江蘇省電力有限公司信息通信分公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F40/151;G06F40/289;G06F40/295;G06K9/62 |
| 代理公司: | 南京縱橫知識產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 史俊軍 |
| 地址: | 210024 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電力 知識庫 構(gòu)建 方法 系統(tǒng) | ||
本發(fā)明公開了一種電力知識庫構(gòu)建方法,包括對語料進(jìn)行預(yù)處理,獲得語料文本;響應(yīng)于語料文本為非結(jié)構(gòu)化文本,將語料文本輸入預(yù)先訓(xùn)練的命名實(shí)體識別模型,對語料文本中命名實(shí)體進(jìn)行識別;將命名實(shí)體識別后的語料文本輸入預(yù)先訓(xùn)練的命名實(shí)體關(guān)系抽取模型,獲得命名實(shí)體關(guān)系數(shù)據(jù);將命名實(shí)體關(guān)系數(shù)據(jù)進(jìn)行存儲(chǔ),構(gòu)建電力知識庫。同時(shí)公開了相應(yīng)的系統(tǒng)。本發(fā)明增加了非結(jié)構(gòu)化數(shù)據(jù),構(gòu)建的知識庫知識更加豐富,同時(shí)本發(fā)明通過命名實(shí)體識別模型和命名實(shí)體關(guān)系抽取模型抽取命名實(shí)體關(guān)系數(shù)據(jù),知識庫構(gòu)建不需要自頂向下的建模,降低了構(gòu)建的門檻,大大減少人工成本,無需大量的、長期的人工干預(yù)與校正。
技術(shù)領(lǐng)域
本發(fā)明涉及一種電力知識庫構(gòu)建方法及系統(tǒng),屬于知識庫構(gòu)建領(lǐng)域。
背景技術(shù)
領(lǐng)域知識庫又叫行業(yè)知識庫或垂直知識庫,電力知識庫是基于電力數(shù)據(jù)構(gòu)建,而現(xiàn)在電力知識庫的構(gòu)建技術(shù)還不成熟。目前結(jié)構(gòu)化數(shù)據(jù)在知識庫的構(gòu)建中仍然占據(jù)較大比重,對于非結(jié)構(gòu)化的數(shù)據(jù)無法有效利用,同時(shí)該知識庫目前一般由專家通過自頂向下的方式建模,從中提取知識需要大量的、長期的人工干預(yù)與校正。
發(fā)明內(nèi)容
本發(fā)明提供了一種電力知識庫構(gòu)建方法及系統(tǒng),解決了背景技術(shù)中披露的問題。
為了解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:
一種電力知識庫構(gòu)建方法,包括,
對語料進(jìn)行預(yù)處理,獲得語料文本;
響應(yīng)于語料文本為非結(jié)構(gòu)化文本,將語料文本輸入預(yù)先訓(xùn)練的命名實(shí)體識別模型,對語料文本中命名實(shí)體進(jìn)行識別;
將命名實(shí)體識別后的語料文本輸入預(yù)先訓(xùn)練的命名實(shí)體關(guān)系抽取模型,獲得命名實(shí)體關(guān)系數(shù)據(jù);
將命名實(shí)體關(guān)系數(shù)據(jù)進(jìn)行存儲(chǔ),構(gòu)建電力知識庫。
響應(yīng)于語料文本為非結(jié)構(gòu)化文本,將語料文本輸入預(yù)先訓(xùn)練的命名實(shí)體識別模型,對語料文本中命名實(shí)體進(jìn)行識別;響應(yīng)于語料文本為結(jié)構(gòu)化文本,根據(jù)結(jié)構(gòu)信息,獲得語料文本中的命名實(shí)體關(guān)系數(shù)據(jù)。
對原始語料進(jìn)行預(yù)處理,獲得語料文本的過程為,
對語料進(jìn)行編碼轉(zhuǎn)換;
將編碼轉(zhuǎn)換后的語料進(jìn)行繁簡轉(zhuǎn)換;
響應(yīng)于繁簡轉(zhuǎn)換后的語料為結(jié)構(gòu)化數(shù)據(jù),繁簡轉(zhuǎn)換后的語料為語料文本;
響應(yīng)于繁簡轉(zhuǎn)換后的語料為非結(jié)構(gòu)化數(shù)據(jù),對繁簡轉(zhuǎn)換后的語料依次進(jìn)行分句、去重、中文分詞,獲得語料文本。
命名實(shí)體關(guān)系數(shù)據(jù)包括存在關(guān)系的命名實(shí)體對、命名實(shí)體間的關(guān)系詞。
命名實(shí)體關(guān)系抽取模型包括第一抽取模型和第二抽取模型,第一抽取模型從語料文本中抽取命名實(shí)體間的關(guān)系詞,第二抽取模型根據(jù)命名實(shí)體間的關(guān)系詞抽取存在關(guān)系的命名實(shí)體對。
將命名實(shí)體關(guān)系數(shù)據(jù)進(jìn)行存儲(chǔ),構(gòu)建電力知識庫的過程為,
將命名實(shí)體關(guān)系數(shù)據(jù)存儲(chǔ)至圖數(shù)據(jù)庫;
基于圖的機(jī)器學(xué)習(xí)方法對存儲(chǔ)的圖譜進(jìn)行補(bǔ)全,得到電力知識庫。
一種電力知識庫構(gòu)建系統(tǒng),包括,
預(yù)處理模塊:對語料進(jìn)行預(yù)處理,獲得語料文本;
實(shí)體識別模塊:響應(yīng)于語料文本為非結(jié)構(gòu)化文本,將語料文本輸入預(yù)先訓(xùn)練的命名實(shí)體識別模型,對語料文本中命名實(shí)體進(jìn)行識別;
實(shí)體關(guān)系抽取模塊:將命名實(shí)體識別后的語料文本輸入預(yù)先訓(xùn)練的命名實(shí)體關(guān)系抽取模型,獲得命名實(shí)體關(guān)系數(shù)據(jù);
存儲(chǔ)模塊:將命名實(shí)體關(guān)系數(shù)據(jù)進(jìn)行存儲(chǔ),構(gòu)建電力知識庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于國網(wǎng)江蘇省電力有限公司信息通信分公司,未經(jīng)國網(wǎng)江蘇省電力有限公司信息通信分公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010630117.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無線電力傳輸系統(tǒng)、無線電力發(fā)送裝置和無線電力接收裝置
- 一種電力監(jiān)控平臺數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線圈無線傳輸電力的無線電力傳輸系統(tǒng)
- 一種電力運(yùn)行數(shù)據(jù)監(jiān)控系統(tǒng)
- 構(gòu)建墊、實(shí)體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實(shí)現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實(shí)例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項(xiàng)目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





