[發明專利]一種基于模板匹配和BP神經網絡的東巴文識別方法有效
| 申請號: | 202010101030.7 | 申請日: | 2020-02-19 |
| 公開(公告)號: | CN111325270B | 公開(公告)日: | 2022-03-25 |
| 發明(設計)人: | 莊建軍;夏一飛;魏世桓;沈祎辰;趙一鳴;王昀牧;申彤;黎文斯;張鑫;楊鴻榮;楊繼瓊;張志儉 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/244;G06V30/148;G06V30/168;G06V30/164;G06V30/30;G06K9/62;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210093 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模板 匹配 bp 神經網絡 東巴文 識別 方法 | ||
1.基于模板匹配和BP神經網絡的東巴文識別方法,其特征是,由如下步驟構成,1)圖片預處理、2)特征提取、3)模板匹配、4)神經網絡處理四個步驟;
步驟1)中,圖片預處理包括二值化、圖片去噪和細化處理;圖片指直接通過拍照或掃描得到的東巴文彩色圖片;
1-1)將圖片灰度化,用最大類間方差法確定灰度閾值,根據灰度閾值將圖片二值化;二值化后的圖片被稱為二值圖片,二值圖片由像素點“0”、即圖片中的空白像素和像素點“1”、即構成筆劃的黑色像素構成;“像素點”未特殊說明時即指像素點“1”;
1-2)對圖片做閉操作處理,刪除面積小于面積閾值的連通區域;閉操作:第一步,遍歷二值圖片的全部像素,將像素點“1”和像素點“0”的邊界像素點標記為“圖片邊緣像素點”,將全部圖片邊緣像素點修改為像素點“1”;第二步,重新遍歷圖片并標記圖片邊緣像素點,將全部圖片邊緣像素點修改為像素點“0”;
刪除面積小于閾值的連通區域:連通區域指二值圖片中以8連通尋找位置相鄰的像素點“1”組成的圖片區域,連通區域的面積等于像素點“1”的個數;遍歷二值圖片的全部像素,標記每一個連通區域的位置和面積;將每一個面積小于面積閾值的連通區域的所有像素點“1”修改為像素點“0”;
1-3)用羅森菲爾德細化算法對圖片做細化處理,得到東巴文文字骨架圖片;
細化算法:遍歷二值圖片的全部像素,將像素點“1”和像素點“0”的邊界像素點標記為“圖片邊緣像素點”;若將某一個邊緣像素點“1”修改為像素點“0”的操作不會增加以8連通尋找連通區域的個數,則執行此操作;對全部圖片邊緣像素點執行以上操作稱為一次“細化”,反復執行“細化”直到沒有能夠修改的像素點則停止“細化”;
2)特征提取包括歸一化和筆劃特征提取;
2-1)歸一化的方法,計算圖片的重心位置、橫向標準差和縱向標準差,對圖片進行平移和縮放,使得圖片重心與圖片中心重合,橫向標準差和縱向標準差為固定值;
2-2)筆劃特征提取的方法,筆劃特征包括筆劃的連通塊位置特征、筆劃的封閉塊位置特征、筆劃的端點位置特征、筆劃的交點位置特征和筆劃的連線位置特征;
步驟2-2)中,筆劃的連通塊位置特征的提取:確定筆劃的圖片中以8連通尋找每一個連通區域的重心位置,將重心位置的坐標作為連通塊位置特征;
封閉塊位置特征的提取:對圖片做非運算,再確定圖片中以4連通尋找每一個連通區域的重心位置,將重心位置的坐標作為封閉塊位置特征;
非運算:指將像素點“1”修改為像素點“0”,將像素點“0”修改為像素點“1”;
端點位置特征的提取:計算圖片中每一個像素點的以8鄰域尋找相鄰像素點的個數,僅保留相鄰像素點的個數為0或1的像素點;確定這些像素點構成的圖片中以8連通尋找每一個連通區域的重心位置,將重心位置的坐標作為端點位置特征;
交點位置特征的提取:計算圖片中每一個像素點的以8鄰域尋找相鄰像素點的個數,僅保留相鄰像素點的個數大于2的像素點;確定這些像素點構成的圖片中以8連通尋找每一個連通區域的重心位置,將重心位置的坐標作為交點位置特征;
連線位置特征的提取:計算圖片中以8鄰域尋找每一個像素點的相鄰像素點的個數,僅保留相鄰像素點的個數等于2的像素點;確定這些像素點構成的圖片中以8連通尋找每一個連通區域的重心位置,將重心位置的坐標作為連線位置特征;
3)模板匹配的方法
利用改進后的豪斯多夫距離計算樣本圖片的筆劃特征與模板圖片的筆劃特征之間的距離:對于每一種筆劃特征,分別可以得到樣本圖片的位置特征對應的坐標集合為A={(x1,y1),(x2,y2),...,(xn,yn)},而欲匹配的模板圖片的位置特征對應的坐標集合為B={(x′1,y′1),(x′2,y′2),...,(x′m,y′m)};
根據改進后的豪斯多夫距離,樣本圖片的筆劃特征與模板圖片的筆劃特征之間的距離為:其中a,b分別是A,B中的坐標點;
4)、神經網絡處理的方法
將樣本圖片與全部東巴文模板圖片做模板匹配的距離按固定順序排列為一個列向量;對每一種筆劃特征進行該操作,共得到5個維度相同的列向量,記為{X1,X2,X3,X4,X5},即特征向量;將特征向量送入BP神經網絡進行訓練;
神經網絡設置了兩層隱藏層;輸出層使用歸一化指數函數進行分類操作;神經網絡執行前向傳播時,首先對同一個列向量中的各個元素分配不同的權值,然后進入全連接層并輸出;神經網絡執行反向傳播時,更新參數矩陣的權值;利用梯度下降算法,選擇合適的學習率,利用一定量的東巴文圖片樣本進行訓練;當損失函數收斂至較小值時,保存神經網絡的權值矩陣;權值矩陣即神經網絡保存的訓練數據;當神經網絡需要識別新的圖片樣本時,需要讀取并調用該權值矩陣從而實現準確的識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010101030.7/1.html,轉載請聲明來源鉆瓜專利網。





