[發(fā)明專利]一種電力知識(shí)實(shí)體識(shí)別方法、裝置、設(shè)備和介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202110981956.4 | 申請(qǐng)日: | 2021-08-25 |
| 公開(kāi)(公告)號(hào): | CN113486668A | 公開(kāi)(公告)日: | 2021-10-08 |
| 發(fā)明(設(shè)計(jì))人: | 江疆;彭偉峰;楊秋勇;黃聲勇;王海明;梁盈威 | 申請(qǐng)(專利權(quán))人: | 廣東電網(wǎng)有限責(zé)任公司 |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06F40/242;G06F40/216;G06F16/35;G06Q50/06 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 彭東威 |
| 地址: | 510600 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電力 知識(shí) 實(shí)體 識(shí)別 方法 裝置 設(shè)備 介質(zhì) | ||
本發(fā)明公開(kāi)了一種電力知識(shí)實(shí)體識(shí)別方法、裝置、設(shè)備和介質(zhì),方法包括:獲取初始電力知識(shí)序列;根據(jù)所述初始電力知識(shí)序列的當(dāng)前字符長(zhǎng)度與預(yù)設(shè)字符長(zhǎng)度的比較結(jié)果,對(duì)所述初始電力知識(shí)序列進(jìn)行調(diào)整,生成標(biāo)準(zhǔn)電力知識(shí)序列;按照預(yù)設(shè)的文本字符字典,將所述標(biāo)準(zhǔn)電力知識(shí)序列內(nèi)的每個(gè)字符分別轉(zhuǎn)換為文本特征向量;將所述文本特征向量輸入預(yù)設(shè)的目標(biāo)命名實(shí)體識(shí)別模型,生成對(duì)應(yīng)的實(shí)體標(biāo)簽;根據(jù)所述實(shí)體標(biāo)簽與所述字符的映射關(guān)系,從所述標(biāo)準(zhǔn)電力知識(shí)序列提取電力知識(shí)實(shí)體,從而提高知識(shí)實(shí)體識(shí)別的可移植性與識(shí)別效率。
技術(shù)領(lǐng)域
本發(fā)明涉及實(shí)體識(shí)別技術(shù)領(lǐng)域,尤其涉及一種電力知識(shí)實(shí)體識(shí)別方法、裝置、設(shè)備和介質(zhì)。
背景技術(shù)
隨著科技的不斷發(fā)展,電力知識(shí)也隨之增多,且涉及面廣,來(lái)源復(fù)雜。變電站的電力從業(yè)人員除了需要掌握傳統(tǒng)教科書(shū)的基本知識(shí)外,更多的是從日常工作中根據(jù)接觸到的法規(guī)、技術(shù)文件和建設(shè)方案進(jìn)行學(xué)習(xí)。
而該類知識(shí)實(shí)體的提取,實(shí)際上是電力領(lǐng)域的文本挖掘。但與一般的文本挖掘不同的是,由于電力行業(yè)涉及的文本類型多種多樣,可能來(lái)自不同的部門、不同的職位、不同的設(shè)備等,因此在考慮確定問(wèn)題需求的初始階段時(shí),需要基于電力知識(shí)專家對(duì)文本類型進(jìn)行內(nèi)容分析。
現(xiàn)有的知識(shí)實(shí)體的提取或識(shí)別方法通常是基于規(guī)則和字典的方法,通過(guò)依賴于專業(yè)語(yǔ)言學(xué)家預(yù)先設(shè)計(jì)的規(guī)則模式,通過(guò)字符串搜索和匹配來(lái)實(shí)現(xiàn)實(shí)體識(shí)別。但上述方法容易受到手工規(guī)則的限制,需要龐大的知識(shí)庫(kù)進(jìn)行支持,可移植性較差,無(wú)法對(duì)未加入到知識(shí)庫(kù)的生詞進(jìn)行有效識(shí)別。
發(fā)明內(nèi)容
本發(fā)明提供了一種電力知識(shí)實(shí)體識(shí)別方法、裝置、設(shè)備和介質(zhì),解決了現(xiàn)有的知識(shí)命名實(shí)體識(shí)別容易受到手工規(guī)則的限制,需要龐大的知識(shí)庫(kù)進(jìn)行支持,可移植性較差,無(wú)法對(duì)未加入到知識(shí)庫(kù)的生詞進(jìn)行有效識(shí)別的技術(shù)問(wèn)題。
本發(fā)明第一方面提供的一種電力知識(shí)實(shí)體識(shí)別方法,包括:
獲取初始電力知識(shí)序列;
根據(jù)所述初始電力知識(shí)序列的當(dāng)前字符長(zhǎng)度與預(yù)設(shè)字符長(zhǎng)度的比較結(jié)果,對(duì)所述初始電力知識(shí)序列進(jìn)行調(diào)整,生成標(biāo)準(zhǔn)電力知識(shí)序列;
按照預(yù)設(shè)的文本字符字典,將所述標(biāo)準(zhǔn)電力知識(shí)序列內(nèi)的每個(gè)字符分別轉(zhuǎn)換為文本特征向量;
將所述文本特征向量輸入預(yù)設(shè)的目標(biāo)命名實(shí)體識(shí)別模型,生成對(duì)應(yīng)的實(shí)體標(biāo)簽;
根據(jù)所述實(shí)體標(biāo)簽與所述字符的映射關(guān)系,從所述標(biāo)準(zhǔn)電力知識(shí)序列提取電力知識(shí)實(shí)體。
可選地,所述根據(jù)所述初始電力知識(shí)序列的當(dāng)前字符長(zhǎng)度與預(yù)設(shè)字符長(zhǎng)度的比較結(jié)果,對(duì)所述初始電力知識(shí)序列進(jìn)行調(diào)整,生成標(biāo)準(zhǔn)電力知識(shí)序列的步驟,包括:
比較所述初始電力知識(shí)序列的當(dāng)前字符長(zhǎng)度和預(yù)設(shè)字符長(zhǎng)度;
若所述當(dāng)前字符長(zhǎng)度大于所述預(yù)設(shè)字符長(zhǎng)度,則以所述初始電力知識(shí)序列內(nèi)的預(yù)定標(biāo)識(shí)為起點(diǎn)增加空白字符;
若所述當(dāng)前字符長(zhǎng)度小于所述預(yù)設(shè)字符長(zhǎng)度,則在所述初始電力知識(shí)序列的最后增加所述空白字符;
當(dāng)所述當(dāng)前字符長(zhǎng)度等于所述預(yù)設(shè)字符長(zhǎng)度時(shí),將當(dāng)前時(shí)刻的所述初始電力知識(shí)序列確定為標(biāo)準(zhǔn)電力知識(shí)序列。
可選地,所述文本字符字典存有多組字符-數(shù)值映射關(guān)系;所述按照預(yù)設(shè)的文本字符字典,將所述標(biāo)準(zhǔn)電力知識(shí)序列內(nèi)的每個(gè)字符分別轉(zhuǎn)換為文本特征向量的步驟,包括:
遍歷所述標(biāo)準(zhǔn)電力知識(shí)序列,得到多個(gè)字符;
按照所述字符-數(shù)值映射關(guān)系,確定每個(gè)所述字符所對(duì)應(yīng)的字符數(shù)值;
采用一位有效編碼方式對(duì)每個(gè)字符數(shù)值進(jìn)行編碼,得到各個(gè)所述字符對(duì)應(yīng)的文本特征向量。
可選地,所述將所述文本特征向量輸入預(yù)設(shè)的命名實(shí)體識(shí)別模型,生成對(duì)應(yīng)的實(shí)體標(biāo)簽的步驟,包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東電網(wǎng)有限責(zé)任公司,未經(jīng)廣東電網(wǎng)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110981956.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無(wú)線電力傳輸系統(tǒng)、無(wú)線電力發(fā)送裝置和無(wú)線電力接收裝置
- 一種電力監(jiān)控平臺(tái)數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線圈無(wú)線傳輸電力的無(wú)線電力傳輸系統(tǒng)
- 一種電力運(yùn)行數(shù)據(jù)監(jiān)控系統(tǒng)
- 基于本體的知識(shí)地圖繪制系統(tǒng)
- 基于知識(shí)地圖的領(lǐng)域知識(shí)瀏覽方法
- 一種基于知識(shí)本體的知識(shí)體系的建模方法
- 一種知識(shí)工程系統(tǒng)
- 知識(shí)自動(dòng)化系統(tǒng)和方法以及存儲(chǔ)器
- 基于SOLR的知識(shí)管理系統(tǒng)
- 基于知識(shí)節(jié)點(diǎn)所屬度的知識(shí)圖譜構(gòu)建方法和裝置
- 一種基于知識(shí)圖譜的稅務(wù)知識(shí)庫(kù)系統(tǒng)
- 一種智聯(lián)網(wǎng)中的網(wǎng)絡(luò)知識(shí)統(tǒng)一表征架構(gòu)及實(shí)現(xiàn)方法
- 知識(shí)點(diǎn)存儲(chǔ)方法、裝置、服務(wù)器及介質(zhì)
- 網(wǎng)絡(luò)實(shí)體監(jiān)控方法及裝置
- 一種實(shí)體鏈接方法及裝置
- 一種基于深度學(xué)習(xí)的實(shí)體鏈接方法
- 實(shí)體發(fā)現(xiàn)方法及裝置
- 一種數(shù)據(jù)處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體關(guān)系識(shí)別方法、裝置及設(shè)備
- 尾實(shí)體鏈接方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 基于實(shí)體對(duì)齊的屬性融合方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種實(shí)體召回方法及相關(guān)裝置
- 實(shí)體表征模型的訓(xùn)練和表征方法、電子設(shè)備和存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





