[發(fā)明專利]適用于用電業(yè)擴(kuò)報(bào)裝申請(qǐng)的圖文資料自動(dòng)識(shí)別方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202011474451.0 | 申請(qǐng)日: | 2020-12-14 |
| 公開(公告)號(hào): | CN112686099A | 公開(公告)日: | 2021-04-20 |
| 發(fā)明(設(shè)計(jì))人: | 潘明明;覃劍;田世明;張昊瑋;陳宋宋;韓凝暉;宮飛翔;高曦瑩;張冶;蔡穎凱;曹世龍;王一哲;回茜;鄒云峰;嵇友浪;俞陽(yáng);孫少辰 | 申請(qǐng)(專利權(quán))人: | 中國(guó)電力科學(xué)研究院有限公司;國(guó)網(wǎng)江蘇省電力有限公司營(yíng)銷服務(wù)中心;國(guó)網(wǎng)江蘇省電力有限公司;國(guó)家電網(wǎng)有限公司;國(guó)網(wǎng)遼寧省電力有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 北京安博達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 11271 | 代理人: | 徐國(guó)文 |
| 地址: | 100192 北*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 適用于 用電 業(yè)擴(kuò)報(bào)裝 申請(qǐng) 圖文 資料 自動(dòng)識(shí)別 方法 系統(tǒng) | ||
1.適用于用電業(yè)擴(kuò)報(bào)裝申請(qǐng)的圖文資料識(shí)別方法,其特征在于,包括:
獲取用電業(yè)擴(kuò)報(bào)裝申請(qǐng)的圖文資料并進(jìn)行切割,得到包含字符的圖像塊;
將所述包含字符的圖像塊輸入到預(yù)先優(yōu)化好的深度卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別模型,得到從所述包含字符的圖像塊中識(shí)別的字符;
其中,所述深度卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別模型利用包含字符的歷史圖像塊和所述歷史圖像塊對(duì)應(yīng)的字符對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化訓(xùn)練得到。
2.根據(jù)權(quán)利要求1所述方法,其特征在于,所述深度卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別模型的優(yōu)化,包括:
基于包含字符的歷史圖像塊和所述歷史圖像塊對(duì)應(yīng)的字符構(gòu)建樣本集;
基于所述樣本集,利用神經(jīng)網(wǎng)絡(luò)優(yōu)化方法對(duì)神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行優(yōu)化訓(xùn)練和校驗(yàn),得到優(yōu)化好的深度卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別模型。
3.根據(jù)權(quán)利要求1或2所述方法,其特征在于,所述圖像塊中的字符,包括下述中的至少一種:中文;數(shù)字;字母。
4.根據(jù)權(quán)利要求2所述方法,其特征在于,所述利用神經(jīng)網(wǎng)絡(luò)優(yōu)化方法對(duì)神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行優(yōu)化訓(xùn)練和校驗(yàn),包括:
獲取神經(jīng)網(wǎng)絡(luò)中每一個(gè)字符的權(quán)重和偏置的集合;
利用正則化方法對(duì)所述每個(gè)權(quán)重進(jìn)行L2正則化處理,得到正則化處理后的權(quán)重;
利用指數(shù)衰減法設(shè)置權(quán)重和偏置更新幅度的學(xué)習(xí)率,得到設(shè)置好的適用于所述每個(gè)權(quán)重和偏置更新迭代至最優(yōu)值的學(xué)習(xí)率;
基于所述每個(gè)權(quán)重和偏置的集合、正則化處理后的權(quán)重及設(shè)置好的適用于所述每個(gè)權(quán)重和偏置更新迭代至最優(yōu)值的學(xué)習(xí)率;
利用BP算法將所述神經(jīng)網(wǎng)絡(luò)中每一個(gè)字符的權(quán)重和偏置的集合調(diào)整至適用于梯度下降法的范圍,得到調(diào)整好的神經(jīng)網(wǎng)絡(luò)中每一個(gè)字符的權(quán)重和偏置;
再利用梯度下降法將所述調(diào)整好的神經(jīng)網(wǎng)絡(luò)中的每一個(gè)字符的權(quán)重和偏置更新迭代至最優(yōu)值。
5.根據(jù)權(quán)利要求4所述方法,其特征在于,所述利用梯度下降法將所述調(diào)整好的神經(jīng)網(wǎng)絡(luò)中的每一個(gè)字符的權(quán)重和偏置更新迭代至最優(yōu)值,按下式確定:
式中,θn、θn+1分別表示神經(jīng)網(wǎng)絡(luò)中第n個(gè)和第n+1個(gè)字符的權(quán)重和偏置的集合,η表示學(xué)習(xí)率,J(θn)表示在參數(shù)為θn時(shí)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練集上損失函數(shù);
其中,按下式確定所述學(xué)習(xí)率η:
式中,η是每個(gè)參數(shù)更新迭代所使用的學(xué)習(xí)率,η0為初始學(xué)習(xí)率,α是衰減系數(shù),k為所有權(quán)重和偏置更新迭代的輪數(shù),s是衰減次數(shù)。
6.根據(jù)權(quán)利要求2所述方法,其特征在于,所述利用神經(jīng)網(wǎng)絡(luò)優(yōu)化方法對(duì)神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行優(yōu)化,還包括:
利用交叉熵作為所述深度卷積神經(jīng)網(wǎng)絡(luò)字符識(shí)別模型輸出和期望值之間的接近程度的評(píng)判依據(jù)。
7.根據(jù)權(quán)利要求2所述方法,其特征在于,所述利用神經(jīng)網(wǎng)絡(luò)優(yōu)化方法對(duì)神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行優(yōu)化訓(xùn)練和校驗(yàn),還包括:
利用基于模板的最近鄰算法、全連接神經(jīng)網(wǎng)絡(luò)及未優(yōu)化的深度卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行優(yōu)化校驗(yàn)。
8.根據(jù)權(quán)利要求1所述方法,其特征在于,所述獲取用電業(yè)擴(kuò)報(bào)裝申請(qǐng)的圖文資料并進(jìn)行切割,得到包含字符的圖像塊,包括:
利用二值化方法對(duì)所述獲取到的圖文資料或歷史圖文資料進(jìn)行處理,得到以像素點(diǎn)呈現(xiàn)的圖文資料;
利用統(tǒng)計(jì)投影法將所述以像素點(diǎn)呈現(xiàn)的圖文資料或歷史圖文資料的像素點(diǎn)進(jìn)行水平方向投影,得到所述以像素點(diǎn)呈現(xiàn)的圖文資料或歷史圖文資料的水平方向投影像素點(diǎn)統(tǒng)計(jì)圖,根據(jù)所述以像素點(diǎn)呈現(xiàn)的圖文資料或歷史圖文資料的水平方向投影像素點(diǎn)統(tǒng)計(jì)圖,利用與所述圖文資料或歷史圖文資料中待提取內(nèi)容對(duì)應(yīng)的像素點(diǎn)對(duì)圖文資料或歷史圖文資料中的內(nèi)容進(jìn)行提取,得到提取后的以像素點(diǎn)顯示的圖文資料或以像素點(diǎn)顯示的歷史圖文資料;
利用圖像大小歸一化方法對(duì)所述提取后的以像素點(diǎn)顯示的圖文資料或以像素點(diǎn)顯示的歷史圖文資料進(jìn)行切割,得到包含字符的圖像塊或歷史包含字符的圖像塊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)電力科學(xué)研究院有限公司;國(guó)網(wǎng)江蘇省電力有限公司營(yíng)銷服務(wù)中心;國(guó)網(wǎng)江蘇省電力有限公司;國(guó)家電網(wǎng)有限公司;國(guó)網(wǎng)遼寧省電力有限公司,未經(jīng)中國(guó)電力科學(xué)研究院有限公司;國(guó)網(wǎng)江蘇省電力有限公司營(yíng)銷服務(wù)中心;國(guó)網(wǎng)江蘇省電力有限公司;國(guó)家電網(wǎng)有限公司;國(guó)網(wǎng)遼寧省電力有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011474451.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于存量容量與業(yè)擴(kuò)報(bào)裝特征的售電量預(yù)測(cè)方法
- 一種電力營(yíng)銷高壓業(yè)擴(kuò)報(bào)裝全過程管控系統(tǒng)
- 一種基于業(yè)擴(kuò)報(bào)裝大數(shù)據(jù)和計(jì)量經(jīng)濟(jì)模型的用電量預(yù)測(cè)方法
- 一種10kV業(yè)擴(kuò)報(bào)裝工單異動(dòng)分析裝置及分析方法
- 一種基于業(yè)擴(kuò)報(bào)裝大數(shù)據(jù)的電量預(yù)測(cè)方法
- 業(yè)擴(kuò)報(bào)裝系統(tǒng)和方法
- 用于業(yè)擴(kuò)報(bào)裝服務(wù)的評(píng)價(jià)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 低壓業(yè)擴(kuò)數(shù)據(jù)處理方法和系統(tǒng)
- 一種基于營(yíng)配信息集成平臺(tái)的業(yè)擴(kuò)輔助報(bào)裝方法
- 用于電力行業(yè)的智能終端業(yè)擴(kuò)報(bào)裝裝置及系統(tǒng)





