[發明專利]基于自適應學習的紙質影像地圖中文標注信息識別方法及系統有效
| 申請號: | 202010346076.5 | 申請日: | 2020-04-27 |
| 公開(公告)號: | CN111626281B | 公開(公告)日: | 2022-12-02 |
| 發明(設計)人: | 徐桂彬;李華鋒;王杰;鐘全成;石碟;王博;高俊;吳健;白曉春;謝連科;臧玉魏 | 申請(專利權)人: | 國家電網有限公司;湖北華中電力科技開發有限責任公司;國網陜西省電力公司電力科學研究院;國網山東省電力公司電力科學研究院 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/148;G06V30/18;G06V30/19;G06V10/82;G06N3/04 |
| 代理公司: | 武漢楚天專利事務所 42113 | 代理人: | 孔敏 |
| 地址: | 100031 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自適應 學習 紙質 影像 地圖 中文 標注 信息 識別 方法 系統 | ||
1.一種基于自適應學習的紙質影像地圖中文標注信息識別方法,其特征在于包括如下步驟:
S1、標準區域初步定位:在紙質影像地圖中,初步定位可能存在中文標注信息的區域,通過矩形框框選紙質影像中的非連續區域,以標識該區域;
S2、標注區域精確定位:在步驟S1初選出中文標識信息區域的基礎上,進一步篩選準確的中文信息標識區域;
S3、中文標注信息前景提取:在步驟S2精確篩選出中文標識信息區域的基礎上,通過高斯混合模型的背景建模算法,將影像與中文標識信息分割,其中地圖影像作為背景、中文標識信息作為前景提取;
S4、中文標注信息單字符識別:通過構建海量的中文訓練樣本,實現步驟S4中提取前景中文標識信息的的單個漢字的有效識別;
S5、中文標注信息語義識別過濾:通過構建地圖常用中文字符串數據庫,過濾不符合中文語義習慣、不在數據庫中的非中文標識信息;
S6、中文標注信息最終解析:最終中文標注信息的解析輸出,輸出標準的、符合中文語義語法的中文字符串。
2.如權利要求1所述的基于自適應學習的紙質影像地圖中文標注信息識別方法,其特征在于:步驟S1的子步驟為:
1)紙質影像地圖的電子化處理:將紙質地圖高質量掃描為電子影像地圖;
2)濾波處理:過濾電子影像地圖中由于紙質影像質量欠佳造成的局部信息干擾;
3)通過色彩增強方法,調整影像色彩及對比度;
4)搭建Tensorflow深度學習框架,訓練標準漢字庫的樣本數據,采用Fast R-CNN模型,實現地圖區域中文漢字的初始識別;
5)設置超參接口,根據紙質影像質量,人工設置、調整閾值,高于設定的閾值則認為是地圖中的中文漢字區域,在地圖中以方框標識;
6)最終實現影像地圖中中文標準信息的初步定位。
3.如權利要求1所述的基于自適應學習的紙質影像地圖中文標注信息識別方法,其特征在于:步驟S2采用ResNet神經網絡模型實現,訓練樣本采樣自目標影像,實時生成,樣本標簽分為兩類:一類為“是中文標識信息區域”,一類為“非中文標識信息區域”,其中第一類樣本制作采用標準漢字庫中的隨機選擇的漢字,疊加目標影像中的非中文漢字區域生產;第二類樣本直接選用目標區域的非中文漢字區域,通過標準庫中漢字的隨機選擇與影像的隨機選擇,構建較大規模的訓練集完成模型訓練;將訓練好的模型,訓練標注區域初步定位步驟所產生的區域,實現在中文標注區域初步定位基礎上的精確定位。
4.如權利要求1所述的基于自適應學習的紙質影像地圖中文標注信息識別方法,其特征在于:步驟S3的子步驟為:
1)構建高斯混合模型背景建模框架;
2)實現影像地圖中影像與標識信息的分離,影像為背景,標識信息作為前景提取;
3)同標注區域初步定位步驟,設置超參接口,根據紙質影像質量,人工設置、調整閾值,高于設定的閾值則認為前景提取達到要求,停止提取操作,轉至下一步驟繼續執行;
4)若前景提取始終無法達到滿意效果,則通過人工輔助方式實現前景提取,人工輔助方法為:在地圖中新建圖層手工描繪文字,并作為新圖層存儲。
5.如權利要求1所述的基于自適應學習的紙質影像地圖中文標注信息識別方法,其特征在于:步驟S4的子步驟為:
1)搭建Tensorflow深度學習框架,配置RestNet神經網絡模型訓練環境;
2)配置標準漢字庫中的多字體作為訓練樣本,所述多字體包括宋體、仿宋、楷體;
3)通過RestNet神經網絡訓練中文漢字識別模型;
4)運用訓練生成的中文漢字識別模型,識別前序步驟提取的前景信息;
5)實現最終前景信息中的中文文字識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網有限公司;湖北華中電力科技開發有限責任公司;國網陜西省電力公司電力科學研究院;國網山東省電力公司電力科學研究院,未經國家電網有限公司;湖北華中電力科技開發有限責任公司;國網陜西省電力公司電力科學研究院;國網山東省電力公司電力科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010346076.5/1.html,轉載請聲明來源鉆瓜專利網。





