[發明專利]基于光學字符識別技術的航空維修工卡工作內容識別方法有效
| 申請號: | 201611152083.1 | 申請日: | 2016-12-14 |
| 公開(公告)號: | CN106845467B | 公開(公告)日: | 2019-07-19 |
| 發明(設計)人: | 劉劍;李俊杰;劉媛;王麗;孫金濤;王本元;李鵬;張強 | 申請(專利權)人: | 北京航天測控技術有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 北京方安思達知識產權代理有限公司 11472 | 代理人: | 王宇楊;陳琳琳 |
| 地址: | 100041 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 光學 字符 識別 技術 航空 維修工 工作 內容 方法 | ||
本發明涉及一種基于光學字符識別技術的航空維修工卡工作內容識別方法,包括:對航空維修工卡的內容按類型進行分析,制定相關的模板識別匹配規則以及控制邏輯,生成控制配置文件;所述控制配置文件包括所述模板識別匹配規則與所述控制邏輯;讀取待識別的航空維修工卡的內容,同時加載控制配置文件;從所述控制配置文件中讀取控制邏輯以及模板識別匹配規則,根據所述控制邏輯與模塊識別匹配規則采用光學字符識別技術解析待識別航空維修工卡中的內容信息,然后將航空維修工卡的內容進行結構化處理,輸出結構化的文檔內容。
技術領域
本發明涉及文字識別方法領域,特別涉及采用光學字符識別技術進行維修工卡內容識別方法。
背景技術
在航空維修過程中會產生大量的工卡、表單,對于這些數據,在無信息化手段的情況下,一般通過批量掃描方式對數據進行采集,這種采集方式帶來的問題就是無法解決數據的格式化、數據查詢、數據再利用的問題。
在實際處理維修工卡時,遇到的一個問題就是解決航空工卡自動分類(比如AD工卡、EO工卡、MAO工卡、CAO工卡、SB工卡等)、飛機號、工卡完工日期、完工簽署、工作者的蓋章、檢查者蓋章、工作反饋單等內容的識別問題。
傳統方法依靠檔案管理人員手動上傳、分類、檢查,這樣導致檔案管理人員工作量巨大、錯誤率高、可能存在工卡損壞、遺失等風險,而采用工卡自動分類和內容識別技術,將極大提高檔案管理人員的工作效率,節省成本,維修工卡的管理水平。
OCR(Optical Character Recognition,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。
航空維修過程中會產生大量的工卡、表單,由于格式復雜,簡單地采用OCR識別方式,仍舊解決不了工卡、表單的自動分類和內容識別問題。
發明內容
本發明的目的在于克服已有的航空維修工卡在內容識別時由于格式復雜所造成的內容識別困難,從而提供一種能有效提高識別準確率的航空維修工卡工作內容識別方法。
為了實現上述目的,本發明提供了一種基于光學字符識別技術的航空維修工卡工作內容識別方法,包括:
步驟1)、對航空維修工卡的內容按類型進行分析,制定相關的模板識別匹配規則以及控制邏輯,生成控制配置文件;所述控制配置文件包括所述模板識別匹配規則與所述控制邏輯;
步驟2)、讀取待識別的航空維修工卡的內容,同時加載步驟1)所生成的控制配置文件;
步驟3)、從所述控制配置文件中讀取控制邏輯以及模板識別匹配規則,根據所述控制邏輯與模塊識別匹配規則采用光學字符識別技術解析待識別航空維修工卡中的內容信息,然后將航空維修工卡的內容進行結構化處理,輸出結構化的文檔內容。
上述技術方案中,在步驟1)中,制定模板識別匹配規則包括:將表格分解為表頭、循環體、表尾三個部分,并對這三個部分進行定義以形成模板;其中,對于表頭、表尾,在定義時按照單元格內容方式進行組織,通過文字或圖形像素定義單元格的位置,對于循環體,在定義時明確循環條件以及內容。
上述技術方案中,對表頭、循環體、表尾進行定義以形成模板包括:
針對表頭、循環體頭、表尾頭進行定義,在定義時采集關鍵詞文本;
分別針對表頭中需識別的單元格標識、循環體中的循環項標識、表尾中的單元格標識進行定義,在定義中采用關鍵詞文本的方法。
上述技術方案中,在步驟1)中,制定控制邏輯至少包括:定義單元格的識別邏輯、定義循環體的識別邏輯;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航天測控技術有限公司,未經北京航天測控技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611152083.1/2.html,轉載請聲明來源鉆瓜專利網。





