[發(fā)明專利]醫(yī)學(xué)化驗(yàn)單的文本識(shí)別方法和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010829924.8 | 申請(qǐng)日: | 2020-08-18 |
| 公開(kāi)(公告)號(hào): | CN111967391A | 公開(kāi)(公告)日: | 2020-11-20 |
| 發(fā)明(設(shè)計(jì))人: | 吳及;張丹陽(yáng) | 申請(qǐng)(專利權(quán))人: | 清華大學(xué) |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京律智知識(shí)產(chǎn)權(quán)代理有限公司 11438 | 代理人: | 孫寶海;袁禮君 |
| 地址: | 100084*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 醫(yī)學(xué) 化驗(yàn)單 文本 識(shí)別 方法 計(jì)算機(jī) 可讀 存儲(chǔ) 介質(zhì) | ||
本公開(kāi)提供了一種醫(yī)學(xué)化驗(yàn)單的文本識(shí)別方法和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),涉及文本識(shí)別技術(shù)領(lǐng)域。其中,醫(yī)學(xué)化驗(yàn)單的文本識(shí)別方法包括:通過(guò)基于錨的卷積神經(jīng)網(wǎng)絡(luò)對(duì)待識(shí)別化驗(yàn)單的文本框進(jìn)行字段定位,錨的水平寬度是根據(jù)待識(shí)別化驗(yàn)單的文本框的水平寬度預(yù)設(shè)確定的,卷積神經(jīng)網(wǎng)絡(luò)的下采樣比例由錨的水平寬度確定;將字段定位的特征圖輸入至文本識(shí)別模塊,文本識(shí)別模塊的輸出層包含前向?后向神經(jīng)網(wǎng)絡(luò)層,以獲取待識(shí)別化驗(yàn)單的第一字符識(shí)別結(jié)果,前向?后向神經(jīng)網(wǎng)絡(luò)層中引入注意力機(jī)制。通過(guò)本公開(kāi)的技術(shù)方案,減少了提取文本框的漏檢或黏連的情況發(fā)生,提高了醫(yī)學(xué)化驗(yàn)單的文本識(shí)別的可靠性和準(zhǔn)確性。
技術(shù)領(lǐng)域
本公開(kāi)涉及文本識(shí)別技術(shù)領(lǐng)域,尤其涉及一種醫(yī)學(xué)化驗(yàn)單的文本識(shí)別 方法和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
OCR(Optical Character Recognition,光學(xué)字符識(shí)別)技術(shù)已經(jīng)經(jīng)歷了 幾十年的發(fā)展,從早期的文檔識(shí)別,擴(kuò)展到已經(jīng)在收費(fèi)停車(chē)場(chǎng)等場(chǎng)景下發(fā) 揮重要作用的車(chē)牌識(shí)別,以及目前尚未實(shí)現(xiàn)大面積應(yīng)用的身份證識(shí)別、銀 行卡識(shí)別、增值稅發(fā)票識(shí)別等。
然而,目前針對(duì)醫(yī)學(xué)化驗(yàn)單識(shí)別的研究仍較為匱乏,尚未發(fā)現(xiàn)相關(guān)技 術(shù)中存在魯棒性高和準(zhǔn)確性高的中文化驗(yàn)單識(shí)別系統(tǒng)。
基于此,由于醫(yī)學(xué)化驗(yàn)單的稀疏排布、多語(yǔ)言混合、含較多生僻的醫(yī) 學(xué)名詞等不同于一般文檔的特性,如果采用OCR系統(tǒng)進(jìn)行識(shí)別,則準(zhǔn)確 率較低。
另外,OCR系統(tǒng)輸出的識(shí)別結(jié)果是散亂的非結(jié)構(gòu)化文本,不利于后 續(xù)分析生成醫(yī)學(xué)報(bào)告。
需要說(shuō)明的是,在上述背景技術(shù)部分公開(kāi)的信息僅用于加強(qiáng)對(duì)本公開(kāi) 的背景的理解,因此可以包括不構(gòu)成對(duì)本領(lǐng)域普通技術(shù)人員已知的現(xiàn)有技 術(shù)的信息。
發(fā)明內(nèi)容
本公開(kāi)的目的在于提供一種醫(yī)學(xué)化驗(yàn)單的文本識(shí)別方法和計(jì)算機(jī)可 讀存儲(chǔ)介質(zhì),至少在一定程度上克服相關(guān)技術(shù)中文本識(shí)別的準(zhǔn)確率低和魯 棒性差的問(wèn)題。
本公開(kāi)的其他特性和優(yōu)點(diǎn)將通過(guò)下面的詳細(xì)描述變得顯然,或部分地 通過(guò)本公開(kāi)的實(shí)踐而習(xí)得。
根據(jù)本公開(kāi)的一個(gè)方面,提供一種醫(yī)學(xué)化驗(yàn)單的文本識(shí)別方法,包括: 通過(guò)基于錨的卷積神經(jīng)網(wǎng)絡(luò)對(duì)待識(shí)別化驗(yàn)單的文本框進(jìn)行字段定位,錨的 水平寬度是根據(jù)待識(shí)別化驗(yàn)單的文本框的水平寬度預(yù)設(shè)確定的,卷積神經(jīng) 網(wǎng)絡(luò)的下采樣比例由錨的水平寬度確定;將所述字段定位的特征圖輸入至 文本識(shí)別模塊,所述文本識(shí)別模塊的輸出層包含前向-后向神經(jīng)網(wǎng)絡(luò)層, 以獲取待識(shí)別化驗(yàn)單的第一字符識(shí)別結(jié)果,所述前向-后向神經(jīng)網(wǎng)絡(luò)層中 引入注意力機(jī)制。
在本公開(kāi)的一個(gè)實(shí)施例中,卷積神經(jīng)網(wǎng)絡(luò)包括多個(gè)卷積塊;在通過(guò)基 于錨的卷積神經(jīng)網(wǎng)絡(luò)對(duì)待識(shí)別化驗(yàn)單的文本框進(jìn)行特征提取前,還包括: 根據(jù)錨的寬度調(diào)整卷積塊的池化層的核寬度,以調(diào)整卷積神經(jīng)網(wǎng)絡(luò)的下采 樣比例。
在本公開(kāi)的一個(gè)實(shí)施例中,卷積神經(jīng)網(wǎng)絡(luò)包括第一卷積塊、第二卷積 塊、第三卷積塊、第四卷積塊和第五卷積塊,第一卷積塊、第二卷積塊、 第三卷積塊和第四卷積塊包含的池化層分別為第一池化層、第二池化層、 第三池化層和第四池化層,第一池化層的核寬度、第二池化層的核寬度、 第三池化層的核寬度和調(diào)整后的第四池化層的核寬度的乘積結(jié)果與錨的 寬度相等。
在本公開(kāi)的一個(gè)實(shí)施例中,前向-后向神經(jīng)網(wǎng)絡(luò)層的下一級(jí)網(wǎng)絡(luò)為長(zhǎng) 短期記憶網(wǎng)絡(luò)層,醫(yī)學(xué)化驗(yàn)單的文本識(shí)別方法還包括:確定長(zhǎng)短期記憶網(wǎng) 絡(luò)層在獲取第一字符識(shí)別結(jié)果的前一時(shí)刻的內(nèi)部隱藏狀態(tài)值;根據(jù)內(nèi)部隱 藏狀態(tài)值確定第一字符識(shí)別結(jié)果對(duì)應(yīng)的注意力權(quán)重;采用注意力權(quán)重對(duì)第 一字符識(shí)別結(jié)果進(jìn)行加權(quán)處理,以得到第二字符識(shí)別結(jié)果;將第二字符識(shí) 別結(jié)果輸入長(zhǎng)短期記憶網(wǎng)絡(luò)層;將長(zhǎng)短期記憶網(wǎng)絡(luò)層的輸出結(jié)果依次進(jìn)行 線性層和柔性最大化處理,以得到文本框包含的字符串的概率分布。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010829924.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 醫(yī)學(xué)詢問(wèn)細(xì)化系統(tǒng)、方法、裝置及包括醫(yī)學(xué)詢問(wèn)系統(tǒng)的工作站
- 將醫(yī)學(xué)設(shè)備自動(dòng)整合到醫(yī)學(xué)設(shè)施網(wǎng)絡(luò)的方法和設(shè)備
- 基于人工智能的醫(yī)學(xué)影像分類(lèi)處理系統(tǒng)及方法
- 一種醫(yī)學(xué)圖像系統(tǒng)
- 醫(yī)學(xué)知識(shí)圖譜構(gòu)建方法及裝置、存儲(chǔ)介質(zhì)和電子設(shè)備
- 一種實(shí)現(xiàn)醫(yī)學(xué)編碼映射的方法、裝置及設(shè)備
- 醫(yī)學(xué)影像的分類(lèi)方法、醫(yī)學(xué)影像的檢索方法和裝置
- 一種醫(yī)學(xué)圖像處理方法、醫(yī)學(xué)圖像識(shí)別方法及裝置
- 醫(yī)學(xué)圖像標(biāo)記方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





