[發(fā)明專(zhuān)利]一種電力領(lǐng)域文本分類(lèi)的方法和存儲(chǔ)設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 202011070721.1 | 申請(qǐng)日: | 2020-10-09 |
| 公開(kāi)(公告)號(hào): | CN112328785A | 公開(kāi)(公告)日: | 2021-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 陳江海;梁懿;蘇江文;宋立華 | 申請(qǐng)(專(zhuān)利權(quán))人: | 福建億榕信息技術(shù)有限公司;國(guó)網(wǎng)信息通信產(chǎn)業(yè)集團(tuán)有限公司;國(guó)網(wǎng)信通億力科技有限責(zé)任公司 |
| 主分類(lèi)號(hào): | G06F16/35 | 分類(lèi)號(hào): | G06F16/35;G06N3/04;G06N3/08;G06K9/62;G06Q50/06 |
| 代理公司: | 福州市景弘專(zhuān)利代理事務(wù)所(普通合伙) 35219 | 代理人: | 林祥翔;魏小霞 |
| 地址: | 350000 福建省福*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電力 領(lǐng)域 文本 分類(lèi) 方法 存儲(chǔ) 設(shè)備 | ||
1.一種電力領(lǐng)域文本分類(lèi)的方法,其特征在于,包括步驟:
構(gòu)建電力預(yù)訓(xùn)練模型;
獲取待訓(xùn)練數(shù)據(jù),對(duì)所述待訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理;
選取L個(gè)深度學(xué)習(xí)框架,所述L值大于等于2;
對(duì)預(yù)處理后的待訓(xùn)練數(shù)據(jù)進(jìn)行隨機(jī)取樣生成K組訓(xùn)練數(shù)據(jù),所述訓(xùn)練數(shù)據(jù)包括:模型訓(xùn)練數(shù)據(jù)和模型驗(yàn)證數(shù)據(jù);
設(shè)置M個(gè)超參組合,結(jié)合所述電力預(yù)訓(xùn)練模型、所述L個(gè)深度學(xué)習(xí)框架和所述模型訓(xùn)練數(shù)據(jù)生成L*K*M個(gè)業(yè)務(wù)分類(lèi)子模型;
根據(jù)所述模型驗(yàn)證數(shù)據(jù)對(duì)所述L*K*M個(gè)業(yè)務(wù)分類(lèi)子模型進(jìn)行驗(yàn)證,得每個(gè)業(yè)務(wù)分類(lèi)子模型的模型評(píng)估數(shù)據(jù);
根據(jù)所述模型評(píng)估數(shù)據(jù)調(diào)整模型參數(shù),直至確定最佳超參使得獲得的業(yè)務(wù)分類(lèi)子模型符合預(yù)設(shè)條件,共生成L*K個(gè)符合預(yù)設(shè)條件的業(yè)務(wù)分類(lèi)子模型;
輸入待預(yù)測(cè)文本至符合預(yù)設(shè)條件的業(yè)務(wù)分類(lèi)子模型,得文本分類(lèi)結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種電力領(lǐng)域文本分類(lèi)的方法,其特征在于,所述“構(gòu)建電力預(yù)訓(xùn)練模型”,還包括步驟:
獲取電力語(yǔ)料;
獲取預(yù)設(shè)的預(yù)訓(xùn)練模型;
通過(guò)預(yù)設(shè)的預(yù)訓(xùn)練模型對(duì)所述電力語(yǔ)料進(jìn)行訓(xùn)練得電力預(yù)訓(xùn)練模型。
3.根據(jù)權(quán)利要求1所述的一種電力領(lǐng)域文本分類(lèi)的方法,其特征在于,所述“對(duì)所述待訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理”,還包括步驟:
對(duì)所述待訓(xùn)練數(shù)據(jù)進(jìn)行初步處理,所述初步處理包括:去除特殊字符、刪除重復(fù)數(shù)據(jù);
對(duì)所述初步處理后的待訓(xùn)練數(shù)據(jù)進(jìn)行數(shù)據(jù)擴(kuò)增操作,所述數(shù)據(jù)擴(kuò)增操作包括以下中的一種或多種:同義詞替換、隨機(jī)插入、隨機(jī)交換、隨機(jī)刪除。
4.根據(jù)權(quán)利要求1所述的一種電力領(lǐng)域文本分類(lèi)的方法,其特征在于,所述“選取L個(gè)深度學(xué)習(xí)框架”,還包括步驟:
選取4個(gè)深度學(xué)習(xí)框架;
所述“輸入待預(yù)測(cè)文本至符合預(yù)設(shè)條件的業(yè)務(wù)分類(lèi)子模型,得文本分類(lèi)結(jié)果”,還包括步驟:
所述待預(yù)測(cè)文本在所述4K個(gè)符合預(yù)設(shè)條件的業(yè)務(wù)分類(lèi)子模型屬于分類(lèi)i的結(jié)果個(gè)數(shù)分別為:a、b、c、d,所述4個(gè)深度學(xué)習(xí)框架對(duì)應(yīng)的得分權(quán)重分別為:T、K、V、W,則所述待預(yù)測(cè)文本屬于分類(lèi)i的概率為:
Pi=(aT+bK+cV+dW)/(4K);
計(jì)算所述待預(yù)測(cè)文本的所有的分類(lèi)概率,得最終的分類(lèi)結(jié)果。
5.根據(jù)權(quán)利要求1所述的一種電力領(lǐng)域文本分類(lèi)的方法,其特征在于,所述深度學(xué)習(xí)框架包括以下中的一種或多種:Bert、paddle、xlnet、albert。
6.一種存儲(chǔ)設(shè)備,其中存儲(chǔ)有指令集,其特征在于,所述指令集用于執(zhí)行:構(gòu)建電力預(yù)訓(xùn)練模型;
獲取待訓(xùn)練數(shù)據(jù),對(duì)所述待訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理;
選取L個(gè)深度學(xué)習(xí)框架,所述L值大于等于2;
對(duì)預(yù)處理后的待訓(xùn)練數(shù)據(jù)進(jìn)行隨機(jī)取樣生成K組訓(xùn)練數(shù)據(jù),所述訓(xùn)練數(shù)據(jù)包括:模型訓(xùn)練數(shù)據(jù)和模型驗(yàn)證數(shù)據(jù);
設(shè)置M個(gè)超參組合,結(jié)合所述電力預(yù)訓(xùn)練模型、所述L個(gè)深度學(xué)習(xí)框架和所述模型訓(xùn)練數(shù)據(jù)生成L*K*M個(gè)業(yè)務(wù)分類(lèi)子模型;
根據(jù)所述模型驗(yàn)證數(shù)據(jù)對(duì)所述L*K*M個(gè)業(yè)務(wù)分類(lèi)子模型進(jìn)行驗(yàn)證,得每個(gè)業(yè)務(wù)分類(lèi)子模型的模型評(píng)估數(shù)據(jù);
根據(jù)所述模型評(píng)估數(shù)據(jù)調(diào)整模型參數(shù),直至確定最佳超參使得獲得的業(yè)務(wù)分類(lèi)子模型符合預(yù)設(shè)條件,共生成L*K個(gè)符合預(yù)設(shè)條件的業(yè)務(wù)分類(lèi)子模型;
輸入待預(yù)測(cè)文本至符合預(yù)設(shè)條件的業(yè)務(wù)分類(lèi)子模型,得文本分類(lèi)結(jié)果。
7.根據(jù)權(quán)利要求6所述的一種存儲(chǔ)設(shè)備,其特征在于,所述指令集還用于執(zhí)行:所述“構(gòu)建電力預(yù)訓(xùn)練模型”,還包括步驟:
獲取電力語(yǔ)料;
獲取預(yù)設(shè)的預(yù)訓(xùn)練模型;
通過(guò)預(yù)設(shè)的預(yù)訓(xùn)練模型對(duì)所述電力語(yǔ)料進(jìn)行訓(xùn)練得電力預(yù)訓(xùn)練模型。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于福建億榕信息技術(shù)有限公司;國(guó)網(wǎng)信息通信產(chǎn)業(yè)集團(tuán)有限公司;國(guó)網(wǎng)信通億力科技有限責(zé)任公司,未經(jīng)福建億榕信息技術(shù)有限公司;國(guó)網(wǎng)信息通信產(chǎn)業(yè)集團(tuán)有限公司;國(guó)網(wǎng)信通億力科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011070721.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車(chē)輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無(wú)線(xiàn)電力傳輸系統(tǒng)、無(wú)線(xiàn)電力發(fā)送裝置和無(wú)線(xiàn)電力接收裝置
- 一種電力監(jiān)控平臺(tái)數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線(xiàn)圈無(wú)線(xiàn)傳輸電力的無(wú)線(xiàn)電力傳輸系統(tǒng)
- 一種電力運(yùn)行數(shù)據(jù)監(jiān)控系統(tǒng)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 數(shù)據(jù)分類(lèi)的方法和裝置
- 一種圖像分類(lèi)方法及裝置
- 報(bào)文分類(lèi)方法及網(wǎng)絡(luò)設(shè)備
- 一種短文本多標(biāo)簽分類(lèi)方法及裝置
- 一種高正確率的自然語(yǔ)言分類(lèi)器系統(tǒng)
- 多分類(lèi)模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種回收部件的分類(lèi)回收箱和分類(lèi)驗(yàn)收裝置
- 一種基于神經(jīng)網(wǎng)絡(luò)的文本分類(lèi)方法和裝置
- 一種塑料大小分類(lèi)機(jī)





