[發(fā)明專利]基于深度學(xué)習(xí)的電網(wǎng)項(xiàng)目特征屬性識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111194442.0 | 申請(qǐng)日: | 2021-10-13 |
| 公開(公告)號(hào): | CN113869055A | 公開(公告)日: | 2021-12-31 |
| 發(fā)明(設(shè)計(jì))人: | 賈博森;張宇熙;彭國(guó)政;黃少遠(yuǎn);張恒;王曉飛;趙娟;朱克平;謝穎捷 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué);國(guó)網(wǎng)經(jīng)濟(jì)技術(shù)研究院有限公司;國(guó)網(wǎng)浙江省電力有限公司經(jīng)濟(jì)技術(shù)研究院 |
| 主分類號(hào): | G06F40/295 | 分類號(hào): | G06F40/295;G06F40/30;G06F40/211;G06F40/151;G06F16/35;G06Q10/10;G06Q50/06;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 濟(jì)南光啟專利代理事務(wù)所(普通合伙) 37292 | 代理人: | 張瑜 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 深度 學(xué)習(xí) 電網(wǎng) 項(xiàng)目 特征 屬性 識(shí)別 方法 | ||
1.一種基于深度學(xué)習(xí)的電網(wǎng)項(xiàng)目特征屬性識(shí)別方法,其特征在于,包括如下步驟:
S1,根據(jù)電網(wǎng)項(xiàng)目文檔的類別和項(xiàng)目業(yè)務(wù)管理需求總結(jié)項(xiàng)目業(yè)務(wù)特征,基于項(xiàng)目業(yè)務(wù)特征建立項(xiàng)目標(biāo)簽體系;
S2,基于項(xiàng)目標(biāo)簽體系對(duì)電網(wǎng)項(xiàng)目文檔進(jìn)行分類;
S3,對(duì)分類后的電網(wǎng)項(xiàng)目文檔進(jìn)行文本預(yù)處理;
S4,借助開源文本標(biāo)注工具對(duì)預(yù)處理后的電網(wǎng)項(xiàng)目文檔進(jìn)行實(shí)體標(biāo)注,生成電網(wǎng)項(xiàng)目文檔所對(duì)應(yīng)的BIO格式數(shù)據(jù)集;
S5,利用BERT模型、Bi-GRU神經(jīng)網(wǎng)絡(luò)和CRF模型建立網(wǎng)絡(luò)學(xué)習(xí)模型,將BIO格式數(shù)據(jù)集輸入網(wǎng)絡(luò)學(xué)習(xí)模型進(jìn)行訓(xùn)練得到實(shí)體識(shí)別模型;
S6,利用實(shí)體識(shí)別模型對(duì)新的電網(wǎng)項(xiàng)目文檔進(jìn)行特征識(shí)別。
2.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的電網(wǎng)項(xiàng)目特征屬性識(shí)別方法,其特征在于,在步驟S1中,所述項(xiàng)目標(biāo)簽體系包括一級(jí)類別標(biāo)簽和二級(jí)實(shí)體標(biāo)簽,一級(jí)類別標(biāo)簽包括電網(wǎng)基建、產(chǎn)業(yè)基建、電網(wǎng)小型基建、生產(chǎn)技改、產(chǎn)業(yè)技改、生產(chǎn)輔助技改、零星購(gòu)置、生產(chǎn)大修、產(chǎn)業(yè)大修、生產(chǎn)輔助大修、電力市場(chǎng)營(yíng)銷、電網(wǎng)數(shù)字化、研究開發(fā)、管理咨詢、教育培訓(xùn)和股權(quán)投資,二級(jí)實(shí)體標(biāo)簽包括機(jī)構(gòu)、電網(wǎng)信息化和金額。
3.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的電網(wǎng)項(xiàng)目特征屬性識(shí)別方法,其特征在于,在步驟S3中,所述文本預(yù)處理的方法為:利用格式轉(zhuǎn)換工具將電網(wǎng)項(xiàng)目文檔的PDF文件轉(zhuǎn)換為EXCEL格式后,剔除包括空白頁(yè)、目錄及參考文獻(xiàn)的輔助信息,再將剔除后的文件轉(zhuǎn)換為TXT文件。
4.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的電網(wǎng)項(xiàng)目特征屬性識(shí)別方法,其特征在于,在步驟S4中,所述BIO格式數(shù)據(jù)集包括語(yǔ)句和每行語(yǔ)句所對(duì)應(yīng)的標(biāo)簽,所述標(biāo)簽包括通用標(biāo)簽、分隔符和標(biāo)簽具體類別,通用標(biāo)簽即BIO標(biāo)注,B表示實(shí)體起始位置,I表示實(shí)體的非第一個(gè)字符,O表示非實(shí)體,標(biāo)簽具體類別與二級(jí)實(shí)體標(biāo)簽相對(duì)應(yīng),采用O代表機(jī)構(gòu),E代表電網(wǎng)信息化,M代表金額。
5.根據(jù)權(quán)利要求1所述的基于深度學(xué)習(xí)的電網(wǎng)項(xiàng)目特征屬性識(shí)別方法,其特征在于,所述步驟S5包括如下步驟:
S5.1,將步驟S4得到的BIO格式數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集;
S5.2,利用Bert模型、Bi-GRU神經(jīng)網(wǎng)絡(luò)和CRF模型建立網(wǎng)絡(luò)學(xué)習(xí)模型;
S5.3,設(shè)置驗(yàn)證準(zhǔn)確率閾值和預(yù)測(cè)準(zhǔn)確率閾值;
S5.4,利用訓(xùn)練集數(shù)據(jù)對(duì)網(wǎng)絡(luò)學(xué)習(xí)模型進(jìn)行訓(xùn)練得到實(shí)體識(shí)別模型;
S5.5,利用驗(yàn)證集數(shù)據(jù)對(duì)實(shí)體識(shí)別模型進(jìn)行評(píng)估,若實(shí)體識(shí)別模型的識(shí)別準(zhǔn)確率大于驗(yàn)證準(zhǔn)確率,執(zhí)行步驟S5.6,否則返回步驟S5.4;
S5.6,利用測(cè)試集數(shù)據(jù)對(duì)實(shí)體識(shí)別模型進(jìn)行測(cè)試,若實(shí)體識(shí)別模型的準(zhǔn)確率小于預(yù)測(cè)準(zhǔn)確率閾值,返回步驟S5.4并對(duì)網(wǎng)絡(luò)學(xué)習(xí)模型的超參數(shù)進(jìn)行調(diào)整,否則執(zhí)行步驟S6。
6.根據(jù)權(quán)利要求5所述的基于深度學(xué)習(xí)的電網(wǎng)項(xiàng)目特征屬性識(shí)別方法,其特征在于,在步驟S5.2中,所述網(wǎng)絡(luò)學(xué)習(xí)模型包括BERT模型、Bi-GRU神經(jīng)網(wǎng)絡(luò)和CRF模型,BERT模型的輸入端與開源文本標(biāo)注工具的輸出端連接,BERT模型的輸出端與Bi-GRU神經(jīng)網(wǎng)絡(luò)的輸入端連接,Bi-GRU神經(jīng)網(wǎng)絡(luò)的輸出端與CRF模型的輸入端連接。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué);國(guó)網(wǎng)經(jīng)濟(jì)技術(shù)研究院有限公司;國(guó)網(wǎng)浙江省電力有限公司經(jīng)濟(jì)技術(shù)研究院,未經(jīng)天津大學(xué);國(guó)網(wǎng)經(jīng)濟(jì)技術(shù)研究院有限公司;國(guó)網(wǎng)浙江省電力有限公司經(jīng)濟(jì)技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111194442.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 基于終端用戶的分級(jí)微電網(wǎng)組網(wǎng)系統(tǒng)
- 一種基于終端用戶的分級(jí)微電網(wǎng)組網(wǎng)裝置
- 實(shí)現(xiàn)電網(wǎng)可視化控制的方法及系統(tǒng)
- 一種基于電力電能交換子微電網(wǎng)的并網(wǎng)型微電網(wǎng)系統(tǒng)
- 一種基于電力電能交換子微電網(wǎng)的并網(wǎng)型微電網(wǎng)系統(tǒng)
- 一種高效的電網(wǎng)風(fēng)險(xiǎn)管理系統(tǒng)
- 微電網(wǎng)系統(tǒng)
- 一種智能電網(wǎng)系統(tǒng)
- 一種智能電網(wǎng)系統(tǒng)
- 一種電網(wǎng)負(fù)載余量計(jì)算系統(tǒng)和方法及充電樁接入配電方法





