[發明專利]一種基于模板匹配和BP神經網絡的東巴文識別方法有效
| 申請號: | 202010101030.7 | 申請日: | 2020-02-19 |
| 公開(公告)號: | CN111325270B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 莊建軍;夏一飛;魏世桓;沈祎辰;趙一鳴;王昀牧;申彤;黎文斯;張鑫;楊鴻榮;楊繼瓊;張志儉 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/244;G06V30/148;G06V30/168;G06V30/164;G06V30/30;G06K9/62;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模板 匹配 bp 神經網絡 東巴文 識別 方法 | ||
基于模板匹配和BP神經網絡的東巴文識別方法,由如下步驟構成,1)圖片預處理、2)特征提取、3)模板匹配、4)神經網絡處理四個步驟;步驟1)中,圖片預處理包括二值化、圖片去噪和細化處理;圖片指直接通過拍照或掃描得到的東巴文彩色圖片;步驟2)特征提取包括歸一化和筆劃特征提取;端點位置特征的提取:計算圖片中每一個像素點的以8鄰域尋找相鄰像素點的個數,僅保留相鄰像素點的個數為0或1的像素點;確定這些像素點構成的圖片中以8連通尋找每一個連通區域的重心位置,將重心位置的坐標作為端點位置特征;步驟3)模板匹配的方法,利用改進后的豪斯多夫距離計算樣本圖片的筆劃特征與模板圖片的筆劃特征之間的距離。
技術領域
本發明涉及一種古文字的識別方法,尤其是東巴文的識別方法。
背景技術:
東巴文是一種文字形態原始的象形文字。由于學習和使用東巴文的人群數量正在減少,為滿足研究和保護東巴文的要求,需要實現計算機對東巴文的自動識別。
現有技術方案一般如下或類似的步驟:
步驟1、將欲識別圖片灰度化,并平滑去噪。
步驟2、用投影法和特征點法進行特征提取。
步驟3、分別用模板匹配法或高階神經網絡進行識別。現有技術需要大量已識別的東巴文圖片樣本。由于模板匹配法是基于單一模板進行匹配,在圖片噪聲的干擾下識別準確率低;由于利用神經網絡進行訓練需要大量已識別的圖片樣本,而已識別的東巴文圖片數量較少,易出現欠擬合的現象。
發明內容
發明目的:本發明所要解決的技術問題是:準確識別東巴文圖片樣本內容。通過提出改進技術手段來準確識別包含東巴文文字的圖片中的東巴文文字內容。利用東巴文模板和少量樣本,準確識別包含東巴文文字的圖片的東巴文文字內容,為東巴文研究者提供高效的識別工具。
本發明的技術方案是,基于模板匹配和BP神經網絡的東巴文識別方法,其特征是,由如下步驟構成,1)圖片預處理、2)特征提取、3)模板匹配、4)神經網絡處理四個步驟;
步驟1)中,圖片預處理包括二值化、圖片去噪和細化處理;圖片指直接通過拍照或掃描得到的東巴文彩色圖片。
1-1)將圖片灰度化,用最大類間方差法確定灰度閾值,根據灰度閾值將圖片二值化;二值化后的圖片被稱為二值圖片,二值圖片由像素點“0”(即圖片中的空白像素)和像素點“1”(即構成筆劃的黑色像素)構成。下文“像素點”未特殊說明時即指像素點“1”。
1-2)對圖片做閉操作處理,刪除面積小于面積閾值(閾值可根據情況設定)的連通區域;閉操作:第一步,遍歷二值圖片的全部像素,將像素點“1”和像素點“0”的邊界像素點標記為“圖片邊緣像素點”,將全部圖片邊緣像素點修改為像素點“1”。第二步,重新遍歷圖片并標記圖片邊緣像素點,將全部圖片邊緣像素點修改為為像素點“0”。
刪除面積小于閾值的連通區域:連通區域指二值圖片中位置相鄰(以8連通尋找)的像素點“1”組成的圖片區域,連通區域的面積等于像素點“1”的個數。遍歷二值圖片的全部像素,標記每一個連通區域的位置和面積。將每一個面積小于面積閾值(8-16個像素點)的連通區域的所有像素點“1”修改為像素點“0”。
1-3)用羅森菲爾德細化算法對圖片做細化處理,得到東巴文文字骨架圖片。
細化算法:遍歷二值圖片的全部像素,將像素點“1”和像素點“0”的邊界像素點標記為“圖片邊緣像素點”。若將某一個邊緣像素點“1”修改為為像素點“0”的操作不會增加連通區域的個數(以8連通尋找),則執行此操作。對全部圖片邊緣像素點執行以上操作稱為一次“細化”,反復執行“細化”直到沒有能夠修改的像素點則停止“細化”。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010101030.7/2.html,轉載請聲明來源鉆瓜專利網。





