[發(fā)明專利]一種面向電力的領(lǐng)域?qū)嶓w識(shí)別方法、系統(tǒng)及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010625052.3 | 申請(qǐng)日: | 2020-07-01 |
| 公開(公告)號(hào): | CN111783464A | 公開(公告)日: | 2020-10-16 |
| 發(fā)明(設(shè)計(jì))人: | 季知祥;施貴榮;藍(lán)海波;蒲天驕;張銳;王曉輝;閔睿;劉鵬;劉劍青;肖凱;蔡常雨 | 申請(qǐng)(專利權(quán))人: | 中國(guó)電力科學(xué)研究院有限公司;國(guó)網(wǎng)冀北電力有限公司;國(guó)家電網(wǎng)有限公司 |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06F40/211;G06F16/35;G06F16/36;G06N3/04;G06N3/08;G06Q50/06 |
| 代理公司: | 北京中巡通大知識(shí)產(chǎn)權(quán)代理有限公司 11703 | 代理人: | 李宏德 |
| 地址: | 100192 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 電力 領(lǐng)域 實(shí)體 識(shí)別 方法 系統(tǒng) 存儲(chǔ) 介質(zhì) | ||
1.一種面向電力的領(lǐng)域?qū)嶓w識(shí)別方法,其特征在于:包括以下步驟:
S1、對(duì)獲取的電網(wǎng)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取形成數(shù)據(jù)集,并進(jìn)行訓(xùn)練數(shù)據(jù)的語料標(biāo)注;
S2、將標(biāo)注后的語料,劃分出測(cè)試集,將測(cè)試集輸入構(gòu)建好的電力領(lǐng)域?qū)嶓w識(shí)別模型中進(jìn)行識(shí)別,將識(shí)別結(jié)果進(jìn)行反向解碼,得出所識(shí)別的領(lǐng)域?qū)嶓w;
S3、根據(jù)識(shí)別的領(lǐng)域?qū)嶓w計(jì)算正確率和召回率的加權(quán)調(diào)和平均值,利用加權(quán)調(diào)和平均值,對(duì)實(shí)體識(shí)別算法模型進(jìn)行評(píng)價(jià),當(dāng)?shù)贸龅脑u(píng)價(jià)得分滿足業(yè)務(wù)需求時(shí),輸出識(shí)別的領(lǐng)域?qū)嶓w;
當(dāng)?shù)贸龅脑u(píng)價(jià)得分不滿足業(yè)務(wù)需求時(shí),對(duì)電力領(lǐng)域?qū)嶓w識(shí)別模型進(jìn)行修正后,重復(fù)上述步驟S2-S3。
2.根據(jù)權(quán)利要求1所述的面向電力的領(lǐng)域?qū)嶓w識(shí)別方法,其特征在于:在S1中,采用BIE進(jìn)行訓(xùn)練數(shù)據(jù)的語料標(biāo)注,其中,字母B代表電力實(shí)體的首位字符,字母I代表電力實(shí)體的內(nèi)部字符,字母E代表電力實(shí)體的結(jié)尾字符,字母O代表不屬于命名實(shí)體的其他字符。
3.根據(jù)權(quán)利要求1所述的面向電力的領(lǐng)域?qū)嶓w識(shí)別方法,其特征在于:利用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)與條件隨機(jī)場(chǎng)結(jié)合的方法構(gòu)建電力領(lǐng)域?qū)嶓w識(shí)別模型;在S2中,將標(biāo)注的語料,劃分為測(cè)試集和訓(xùn)練集,利用訓(xùn)練集對(duì)構(gòu)建的領(lǐng)域?qū)嶓w識(shí)別算法模型,進(jìn)行訓(xùn)練。
4.根據(jù)權(quán)利要求3所述的面向電力的領(lǐng)域?qū)嶓w識(shí)別方法,其特征在于,所述電力領(lǐng)域?qū)嶓w識(shí)別算法模型包括:
第一層,用于將句子中的每個(gè)字由one-hot向量映射為低維稠密的字向量;
第二層,雙向LSTM層,用于從第一層的字向量中自動(dòng)提取句子特征;
第三層,CRF層,用于將提取出的句子特征,進(jìn)行句子級(jí)的序列標(biāo)注;將標(biāo)注形成的句子標(biāo)簽進(jìn)行分類。
5.根據(jù)權(quán)利要求4所述的面向電力領(lǐng)域的實(shí)體識(shí)別方法,其特征在于:在CRF層中,采用如下公式,對(duì)句子標(biāo)簽進(jìn)行分類:
其中,score(x,y)表示句子x的標(biāo)簽為y的得分。
6.根據(jù)權(quán)利要求5所述的面向電力領(lǐng)域的實(shí)體識(shí)別方法,其特征在于:所述電力領(lǐng)域?qū)嶓w識(shí)別算法模型在訓(xùn)練時(shí),通過最大化對(duì)數(shù)似然函數(shù)對(duì)訓(xùn)練樣本求解對(duì)數(shù)似然值;
log P(yx|x)=score(x,yx)-log(Σy′exp(score(x,y′)));
式中,score(x,yx)表示句子x的標(biāo)簽為yx的得分;(x,yx)為訓(xùn)練樣本。
7.根據(jù)權(quán)利要求1所述的面向電力領(lǐng)域的實(shí)體識(shí)別方法,其特征在于:在步驟S3中,所述電力領(lǐng)域?qū)嶓w識(shí)別算法模型在求解對(duì)數(shù)似然值時(shí)預(yù)測(cè)過程中使用Viterbi算法求解最優(yōu)路徑,求解得出識(shí)別的實(shí)體對(duì)應(yīng)的位置。
8.根據(jù)權(quán)利要求1所述的面向電力領(lǐng)域的實(shí)體識(shí)別方法,其特征在于:在S3中,
正確率通過如下公式計(jì)算得出:
所述召回率用如下公式計(jì)算得出:
對(duì)領(lǐng)域?qū)嶓w識(shí)別算法模型進(jìn)行評(píng)價(jià)時(shí),采用計(jì)算正確率和召回率的加權(quán)調(diào)和平均值F值用如下公式計(jì)算:
9.一種面向電力的領(lǐng)域?qū)嶓w識(shí)別系統(tǒng),其特征在于,包括,
數(shù)據(jù)獲取模塊,用于對(duì)獲取的電網(wǎng)數(shù)據(jù)進(jìn)行數(shù)據(jù)抽取形成數(shù)據(jù)集,并進(jìn)行訓(xùn)練數(shù)據(jù)的語料標(biāo)注;
領(lǐng)域?qū)嶓w識(shí)別模塊,用于將標(biāo)注后的語料,劃分出測(cè)試集,將測(cè)試集輸入構(gòu)建好的電力領(lǐng)域?qū)嶓w識(shí)別模型中進(jìn)行識(shí)別,將識(shí)別結(jié)果進(jìn)行反向解碼,得出所識(shí)別的領(lǐng)域?qū)嶓w;
評(píng)價(jià)模塊,根據(jù)識(shí)別的領(lǐng)域?qū)嶓w計(jì)算正確率和召回率的加權(quán)調(diào)和平均值,利用加權(quán)調(diào)和平均值,對(duì)實(shí)體識(shí)別算法模型進(jìn)行評(píng)價(jià),當(dāng)?shù)贸龅脑u(píng)價(jià)得分滿足業(yè)務(wù)需求時(shí),輸出識(shí)別的領(lǐng)域?qū)嶓w;當(dāng)?shù)贸龅脑u(píng)價(jià)得分不滿足業(yè)務(wù)需求時(shí),對(duì)電力領(lǐng)域?qū)嶓w識(shí)別模型進(jìn)行修正后,再次識(shí)別。
10.一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其特征在于,所述計(jì)算機(jī)存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至8任一項(xiàng)所述一種電力領(lǐng)域?qū)嶓w識(shí)別方法的步驟。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)電力科學(xué)研究院有限公司;國(guó)網(wǎng)冀北電力有限公司;國(guó)家電網(wǎng)有限公司,未經(jīng)中國(guó)電力科學(xué)研究院有限公司;國(guó)網(wǎng)冀北電力有限公司;國(guó)家電網(wǎng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010625052.3/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無線電力傳輸系統(tǒng)、無線電力發(fā)送裝置和無線電力接收裝置
- 一種電力監(jiān)控平臺(tái)數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線圈無線傳輸電力的無線電力傳輸系統(tǒng)
- 一種電力運(yùn)行數(shù)據(jù)監(jiān)控系統(tǒng)
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體關(guān)系識(shí)別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于實(shí)體對(duì)齊的屬性融合方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲(chǔ)介質(zhì)





