[發(fā)明專利]字符辨識系統(tǒng)及其字符辨識方法有效
| 申請?zhí)枺?/td> | 201611114117.8 | 申請日: | 2016-12-07 |
| 公開(公告)號: | CN108108732B | 公開(公告)日: | 2022-01-11 |
| 發(fā)明(設(shè)計(jì))人: | 高志忠;康浩平;吳佳樺 | 申請(專利權(quán))人: | 財(cái)團(tuán)法人工業(yè)技術(shù)研究院 |
| 主分類號: | G06V10/25 | 分類號: | G06V10/25;G06V10/74;G06N3/02 |
| 代理公司: | 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 11006 | 代理人: | 徐金國 |
| 地址: | 中國臺灣新竹*** | 國省代碼: | 臺灣;71 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 字符 辨識 系統(tǒng) 及其 方法 | ||
一種字符辨識系統(tǒng)及其字符辨識方法。字符辨識方法包括:使用第一卷積神經(jīng)網(wǎng)絡(luò)模型,辨識有興趣區(qū)塊中的字符串,產(chǎn)出辨識字符串,其中該有興趣區(qū)塊中的字符串包括一或多個(gè)字符;以及比較該辨識字符串與字符數(shù)據(jù)庫中多個(gè)字符串,以尋找與該辨識字符串相對應(yīng)的字符串,其中該多個(gè)字符串的每個(gè)字符串包括一或多個(gè)字符;其中,若找到該辨識字符串相對應(yīng)的字符串,以該辨識字符串作為字符辨識結(jié)果,若未找到該辨識字符串相對應(yīng)的字符串,使用第二卷積神經(jīng)網(wǎng)絡(luò)模型,更正該辨識字符串,以產(chǎn)出新辨識字符串作為字符辨識結(jié)果。
技術(shù)領(lǐng)域
本揭露是有關(guān)于字符辨識系統(tǒng)及其相關(guān)字符辨識方法,特別是有關(guān)于一種基于卷積神經(jīng)網(wǎng)絡(luò)的字符辨識系統(tǒng)及其相關(guān)字符辨識方法。
背景技術(shù)
隨著運(yùn)動(dòng)風(fēng)氣的盛行及使用者需求的驅(qū)使下,每場賽事都會記錄大量的照片或影片。愈來愈多的賽事單位或運(yùn)動(dòng)網(wǎng)站提供運(yùn)動(dòng)員使用號碼布上標(biāo)示的字符(譬如說號碼等)進(jìn)行照片或影片搜尋的服務(wù),以方便參賽者于賽后搜尋自己的照片或影片并分享于社群網(wǎng)絡(luò)。一般而言,這類辨識是透過計(jì)算機(jī)來進(jìn)行影像分析與處理。然而,因?yàn)檎掌蛴捌刑柎a布位移與變形的關(guān)系,使得用計(jì)算機(jī)進(jìn)行辨識號碼布上的字符的正確率較低,因此目前大都是以雇用大量工讀生進(jìn)行人工辨識后,標(biāo)記照片或影片上出現(xiàn)的號碼布上的字符,導(dǎo)致需耗費(fèi)大量的人力、時(shí)間與成本。
近年來,隨著類神經(jīng)網(wǎng)絡(luò)的技術(shù)提升,使得辨識的效果跟以往的技術(shù)相比有相當(dāng)顯著的進(jìn)步,因此類神經(jīng)網(wǎng)絡(luò)可被廣泛用于譬如說文字辨識。傳統(tǒng)類神經(jīng)網(wǎng)絡(luò)的文字辨識的步驟包括文字偵測、文字分割和文字辨識等步驟,雖然使用類神經(jīng)網(wǎng)絡(luò)可提升辨識的效果,然而,因?yàn)樘柎a布上的文字容易受到號碼布的扭曲影響而無法完整的切割,導(dǎo)致后續(xù)的字元辨識(Optical Character Recognize,OCR)容易發(fā)生錯(cuò)誤,影響文字辨識的正確率。
發(fā)明內(nèi)容
有鑒于此,本揭露提供一種基于卷積神經(jīng)網(wǎng)絡(luò)的字符辨識系統(tǒng)及其相關(guān)字符辨識方法。
本揭露的一實(shí)施例提供一種字符辨識方法,適用于包括儲存裝置與影像處理器的字符辨識系統(tǒng)。字符辨識方法包括:使用第一卷積神經(jīng)網(wǎng)絡(luò)(Convolutional NeuralNetwork,CNN)模型,辨識有興趣區(qū)塊中的字符串(character string),產(chǎn)出辨識字符串,其中該有興趣區(qū)塊中的字符串包括一或多個(gè)字符;以及比較該辨識字符串與字符數(shù)據(jù)庫中多個(gè)字符串,以尋找與該辨識字符串相對應(yīng)的字符串,其中該多個(gè)字符串的每個(gè)字符串包括一或多個(gè)字符;其中,若找到該辨識字符串相對應(yīng)的字符串,以該辨識字符串作為字符辨識結(jié)果,若未找到該辨識字符串相對應(yīng)的字符串,使用第二卷積神經(jīng)網(wǎng)絡(luò)模型,更正該辨識字符串,以產(chǎn)出新辨識字符串作為字符辨識結(jié)果。
本揭露另一實(shí)施例提供一種字符辨識系統(tǒng),包括:儲存裝置以及影像處理器。儲存裝置經(jīng)配置儲存字符數(shù)據(jù)庫。影像處理器耦接儲存裝置,經(jīng)配置使用第一卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)模型,辨識有興趣區(qū)塊中的字符串(characterstring),產(chǎn)出辨識字符串,其中有興趣區(qū)塊中的字符串包括一或多個(gè)字符,并且比較該辨識字符串與該字符數(shù)據(jù)庫中多個(gè)字符串,以尋找與該辨識字符串相對應(yīng)的字符串,其中多個(gè)字符串的每個(gè)字符串包括一或多個(gè)字符;其中,若找到辨識字符串相對應(yīng)的字符串時(shí),影像處理器是以辨識字符串作為字符辨識結(jié)果,若未找到辨識字符串相對應(yīng)的字符串,影像處理器經(jīng)配置使用第二卷積神經(jīng)網(wǎng)絡(luò)模型,更正辨識字符串,以產(chǎn)出新辨識字符串作為字符辨識結(jié)果。
本揭露的上述方法可經(jīng)由本揭露的裝置或系統(tǒng)來實(shí)作,其為可執(zhí)行特定功能的硬件或固件,亦可以透過程序碼方式收錄于記錄媒體中,并結(jié)合特定硬件來實(shí)作。當(dāng)程序碼被電子裝置、處理器、計(jì)算機(jī)或機(jī)器載入且執(zhí)行時(shí),電子裝置、處理器、計(jì)算機(jī)或機(jī)器變成用以實(shí)行本揭露的裝置或系統(tǒng)。
附圖說明
圖1是顯示依據(jù)本揭露的字符辨識系統(tǒng)一實(shí)施例的示意圖;
圖2是顯示本揭露的字符辨識方法一實(shí)施例的流程圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于財(cái)團(tuán)法人工業(yè)技術(shù)研究院,未經(jīng)財(cái)團(tuán)法人工業(yè)技術(shù)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611114117.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





