[發明專利]一種文本識別方法和裝置在審

申請號：	201910108577.7	申請日：	2019-01-18
公開（公告）號：	CN111461105A	公開（公告）日：	2020-07-28
發明（設計）人：	劉聰海;陳亮亮;方清;曾曉嘉;淦小健;朱正一;崔子玲	申請（專利權）人：	順豐科技有限公司
主分類號：	G06K9/32	分類號：	G06K9/32;G06K9/62
代理公司：	深圳翼盛智成知識產權事務所(普通合伙) 44300	代理人：	黃威
地址：	518000 廣東省深圳市南山區學府路（以南）***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種文本識別方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請公開了一種文本識別方法、裝置及存儲介質，本申請文本識別裝置獲取包含目標文本的待識別圖像；根據預置的文本識別網絡模型以及預置的特征詞從待識別圖像中確定特征文本區域；再根據訓練后的文本提取網絡模型從特征文本區域中提取文本信息，文本提取網絡模型由四個CNN模塊、一個RNN模塊以及一個CTC模塊組成；最后根據文本信息確定目標文本。該方案從待識別圖像中提取(剪切)與特征詞相關的文本區域，再根據文本提取網絡模型從提取出的特征文本區域中提取文本信息，然后從文本信息中識別出目標文本，故該方案可以自動從圖像中識別出目標文本，且只提取與特征詞相關的文本區域的文本信息可以降低無關文本的干擾程度，識別準確率高。

技術領域

本申請涉及圖像識別領域，具體涉及一種文本識別方法和裝置。

背景技術

自然場景圖像指的是圖片中除了含有文字之外還含有其他摻雜場景的圖像，從自然場景圖像中提取指定類型的文本難度很大。

例如，在現在的地圖系統里，往往需要提供小區內部各個單元樓棟門牌號信息來滿足實際的使用需求，對于快遞業務來說，如果電子地圖能夠提供樓棟號的高精度定位，可以大大節省人力的損耗，加快投遞速度。但是由于從自然場景圖像中提取門牌文本信息(提取指定類型的文本)難度很大，故構建此類地圖往往需要采用人員從含有門牌文本信息的自然場景圖片中手工采集門牌文本信息，或實地到訪手工采集門牌文本信息。

發明內容

本申請實施例提供一種文本識別方法、裝置，用于從圖像中自動獲取目標文本。

一方面，本申請提供一種文本識別方法，所述方法包括：

獲取包含目標文本的待識別圖像；

根據預置的文本識別網絡模型以及預置的特征詞從所述待識別圖像中確定特征文本區域；

根據訓練后的文本提取網絡模型從所述特征文本區域中提取文本信息，所述文本提取網絡模型由四個卷積神經網絡CNN模塊、一個循環神經網絡RNN模塊以及一個CTC模塊組成；

根據所述文本信息確定所述目標文本。

可選的，所述根據預置的文本識別網絡模型以及預置的特征詞從所述待識別圖像中確定特征文本區域，包括：

根據所述文本識別網絡模型從所述待識別圖像中確定文本區域；

根據所述特征詞從所述文本區域中確定所述特征文本區域。

可選的，所述根據所述文本信息確定所述目標文本，包括：

將所述文本信息映射到訓練后的高維空間模型中，得到所述特征詞與多個子文本的詞距；