[發(fā)明專利]基于特征融合的文本識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202111056077.7 | 申請(qǐng)日: | 2021-09-09 |
| 公開(公告)號(hào): | CN113688823A | 公開(公告)日: | 2021-11-23 |
| 發(fā)明(設(shè)計(jì))人: | 王振明 | 申請(qǐng)(專利權(quán))人: | 平安醫(yī)療健康管理股份有限公司 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京市京大律師事務(wù)所 11321 | 代理人: | 姚維 |
| 地址: | 200001 上海市黃浦*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 特征 融合 文本 識(shí)別 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及人工智能領(lǐng)域,公開了基于特征融合的文本識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用于提高文本識(shí)別的準(zhǔn)確率。調(diào)用預(yù)置的神經(jīng)網(wǎng)絡(luò)組對(duì)待識(shí)別醫(yī)療圖像進(jìn)行特征提取,生成醫(yī)療局部特征圖像和醫(yī)療全局特征圖像,并調(diào)用預(yù)置的加權(quán)求和函數(shù)對(duì)所述醫(yī)療局部特征圖像和所述醫(yī)療全局特征圖像進(jìn)行特征融合,生成目標(biāo)醫(yī)療融合特征圖像;調(diào)用預(yù)置的雙向雙層循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)醫(yī)療融合特征圖像進(jìn)行字符集提取,生成醫(yī)療分類字符集,并基于醫(yī)療分類字符集與預(yù)置的時(shí)序分類算法進(jìn)行對(duì)齊解碼,生成目標(biāo)醫(yī)療文本。此外,本發(fā)明還涉及區(qū)塊鏈技術(shù),待識(shí)別醫(yī)療圖像可存儲(chǔ)于區(qū)塊鏈中。
技術(shù)領(lǐng)域
本發(fā)明涉及神經(jīng)網(wǎng)絡(luò)領(lǐng)域,尤其涉及一種基于特征融合的文本識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著科技的發(fā)展,人工智能應(yīng)用在越來越多的領(lǐng)域,其中,文本識(shí)別是人工智能中的重要領(lǐng)域,并且已經(jīng)成功應(yīng)用于身份證識(shí)別、銀行卡識(shí)別,醫(yī)療診斷書識(shí)別、醫(yī)療卡識(shí)別等諸多業(yè)務(wù)。
在現(xiàn)有技術(shù)中,利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)圖像進(jìn)行文本識(shí)別,卷積神經(jīng)網(wǎng)絡(luò)主要關(guān)注局部特征的提取,由于圖像背景復(fù)雜,卷積神經(jīng)網(wǎng)絡(luò)無法結(jié)合全局信息區(qū)分文本和背景,導(dǎo)致文本識(shí)別不準(zhǔn)確。
發(fā)明內(nèi)容
本發(fā)明提供了一種基于特征融合的文本識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),用于提高文本識(shí)別的準(zhǔn)確率。
本發(fā)明第一方面提供了一種基于特征融合的文本識(shí)別方法,包括:調(diào)用預(yù)置的神經(jīng)網(wǎng)絡(luò)組對(duì)待識(shí)別醫(yī)療圖像進(jìn)行特征提取,生成醫(yī)療局部特征圖像和醫(yī)療全局特征圖像,并調(diào)用預(yù)置的加權(quán)求和函數(shù)對(duì)所述醫(yī)療局部特征圖像和所述醫(yī)療全局特征圖像進(jìn)行特征融合,生成目標(biāo)醫(yī)療融合特征圖像;調(diào)用預(yù)置的雙向雙層循環(huán)神經(jīng)網(wǎng)絡(luò)對(duì)所述目標(biāo)醫(yī)療融合特征圖像進(jìn)行字符集提取,生成醫(yī)療分類字符集,并基于醫(yī)療分類字符集與預(yù)置的時(shí)序分類算法進(jìn)行對(duì)齊解碼,生成目標(biāo)醫(yī)療文本。
可選的,在本發(fā)明第一方面的第一種實(shí)現(xiàn)方式中,所述調(diào)用預(yù)置的神經(jīng)網(wǎng)絡(luò)組對(duì)待識(shí)別醫(yī)療圖像進(jìn)行特征提取,生成醫(yī)療局部特征圖像和醫(yī)療全局特征圖像,并調(diào)用預(yù)置的加權(quán)求和函數(shù)對(duì)所述醫(yī)療局部特征圖像和所述醫(yī)療全局特征圖像進(jìn)行特征融合,生成目標(biāo)醫(yī)療融合特征圖像包括:獲取初始醫(yī)療圖像,并對(duì)所述初始醫(yī)療圖像進(jìn)行預(yù)處理,生成預(yù)處理后的醫(yī)療圖像,所述初始醫(yī)療圖像包括初始醫(yī)療文本;對(duì)所述預(yù)處理后的醫(yī)療圖像進(jìn)行歸一化處理,生成待識(shí)別醫(yī)療圖像,所述待識(shí)別醫(yī)療圖像包括待識(shí)別醫(yī)療文本;調(diào)用神經(jīng)網(wǎng)絡(luò)組中預(yù)置的卷積神經(jīng)網(wǎng)絡(luò)對(duì)所述待識(shí)別醫(yī)療圖像進(jìn)行局部特征提取,生成醫(yī)療局部特征圖像;調(diào)用所述神經(jīng)網(wǎng)絡(luò)組中預(yù)置的注意力神經(jīng)網(wǎng)絡(luò)對(duì)所述待識(shí)別醫(yī)療圖像進(jìn)行全局特征提取,生成醫(yī)療全局特征圖像;調(diào)用預(yù)置的加權(quán)求和函數(shù)對(duì)所述醫(yī)療局部特征圖像和所述醫(yī)療全局特征圖像進(jìn)行特征融合,生成目標(biāo)醫(yī)療融合特征圖像。
可選的,在本發(fā)明第一方面的第二種實(shí)現(xiàn)方式中,所述獲取初始醫(yī)療圖像,并對(duì)所述初始醫(yī)療圖像進(jìn)行預(yù)處理,生成預(yù)處理后的醫(yī)療圖像,所述初始醫(yī)療圖像包括初始醫(yī)療文本包括:獲取初始醫(yī)療圖像,判斷所述初始醫(yī)療圖像中初始醫(yī)療文本的方向是否為預(yù)置的標(biāo)準(zhǔn)方向,所述初始醫(yī)療圖像包括初始醫(yī)療文本;若所述初始醫(yī)療圖像中初始醫(yī)療文本的方向不為預(yù)置的標(biāo)準(zhǔn)方向,則結(jié)合所述初始醫(yī)療文本按照預(yù)置的標(biāo)準(zhǔn)方向?qū)λ龀跏坚t(yī)療圖像進(jìn)行調(diào)整,生成預(yù)處理后的醫(yī)療圖像。
可選的,在本發(fā)明第一方面的第三種實(shí)現(xiàn)方式中,所述對(duì)所述預(yù)處理后的醫(yī)療圖像進(jìn)行歸一化處理,生成待識(shí)別醫(yī)療圖像,所述待識(shí)別醫(yī)療圖像包括待識(shí)別醫(yī)療文本包括:按照預(yù)置的縮放規(guī)則對(duì)所述預(yù)處理后的醫(yī)療圖像進(jìn)行縮放處理,生成縮放后的醫(yī)療圖像;對(duì)所述縮放后的醫(yī)療圖像進(jìn)行歸一化處理,生成待識(shí)別醫(yī)療圖像,所述待識(shí)別醫(yī)療圖像包括待識(shí)別醫(yī)療文本。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安醫(yī)療健康管理股份有限公司,未經(jīng)平安醫(yī)療健康管理股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111056077.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





