[發(fā)明專利]掃描識別裝置和方法有效
| 申請?zhí)枺?/td> | 201110141320.5 | 申請日: | 2011-05-27 |
| 公開(公告)號: | CN102324027A | 公開(公告)日: | 2012-01-18 |
| 發(fā)明(設(shè)計)人: | 李永彬 | 申請(專利權(quán))人: | 漢王科技股份有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 掃描 識別 裝置 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于計算機外圍設(shè)備領(lǐng)域,涉及一種掃描識別裝置和方法,具體涉及一種掃描識別所選擇的字符序列的裝置和方法。
背景技術(shù)
電子掃描筆(簡稱掃描筆)是OCR的重要應(yīng)用之一。掃描筆的光學(xué)攝像頭按照一定頻率對被掃描資料進行連續(xù)拍照,獲取被掃描資料的圖像幀序列,然后將圖像幀序列拼接成一幅全景圖像后進行OCR處理。
用戶在使用掃描筆掃描時,其掃描速度是變化的,一種典型的使用方式是,在剛剛開始掃描時,掃描筆的掃描速度從零開始逐漸增大,然后達到一個速度峰值,此后速度逐漸下降,直到掃描結(jié)束,在保證速度峰值時相鄰圖像幀之間有一定重疊內(nèi)容的情況下,掃描速度越低,相鄰圖像幀之間的重疊內(nèi)容越多,換言之,當(dāng)掃描速度較小時,當(dāng)前圖像幀不但與其前一圖像幀有重疊內(nèi)容,而且很可能與其前一幀之前的一個或多個圖像幀也有一定的重疊內(nèi)容,當(dāng)掃描速度很小時,當(dāng)前圖像幀一定與其前一幀之前的一個或多個圖像幀有一定的重疊內(nèi)容。
另外,隨著硬件技術(shù)的提高,為了提高掃描筆支持的掃描速度峰值,提高用戶的使用感受,可以使用更高采樣頻率的光學(xué)傳感器,當(dāng)掃描筆的光學(xué)傳感器采樣頻率提高時,相比于較低的采樣頻率,在相同掃描速度下當(dāng)前圖像幀與其前一幀之前的一個或多個圖像幀有一定的重疊內(nèi)容的概率更高。
授權(quán)公告號CN1160657C的專利公開了一種文字的記錄方法和裝置,該裝置掃過選擇字符序列時,光學(xué)傳感器同步記錄多個內(nèi)容部分重疊的圖像,信號處理單元將這些圖像水平、垂直地組合成為一幅全景圖像,并將全景圖像中的字符識別后存儲在裝置中。但該發(fā)明的信號處理單元只能通過重疊內(nèi)容將每個圖像幀與前一個圖像幀垂直地和水平地組合,這樣每兩幀相鄰的圖像幀就必然進行組合。在當(dāng)前圖像幀與其前一幀之前的一個或多個圖像幀也有一定的重疊內(nèi)容時,每兩幀相鄰的圖像幀進行組合拼接的方式,不但使信號處理單元的負(fù)荷大大加重,占用了硬件資源,而且也降低了整個圖像幀序列的拼接速度。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題為提供了一種掃描識別裝置和方法,通過對采集到的圖像幀序列中的圖像幀進行篩選,對得到的待拼接圖像幀根據(jù)重疊內(nèi)容進行拼接,降低了控制模塊的處理負(fù)荷,提高了整個圖像幀序列的拼接速度。
本發(fā)明公開了一種掃描識別裝置,包括用于拍攝圖像的光學(xué)傳感器和用于處理圖像及識別字符的控制模塊,所述光學(xué)傳感器對被掃描字符進行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列,所述圖像幀序列中每幀圖像的內(nèi)容與前一幀圖像的內(nèi)容部分重疊;所述控制模塊通過重疊內(nèi)容將圖像幀序列中的每幀圖像與相關(guān)的圖像幀進行拼接合成一個全景圖像,對所述全景圖像進行傾斜校正后進行字符識別,得到被掃描字符的字符編碼。
所述控制模塊包括:
設(shè)置單元,設(shè)置圖像幀序列中的當(dāng)前幀的幀屬性,形成圖像幀組,幀屬性包括基準(zhǔn)幀、預(yù)測幀和跳過幀;
預(yù)測單元,根據(jù)當(dāng)前幀的幀屬性及相關(guān)圖像幀的拼接信息的更新值計算當(dāng)前幀的拼接信息的預(yù)測值;
搜索單元,根據(jù)當(dāng)前幀的拼接信息的預(yù)測值搜索當(dāng)前幀的拼接信息的計算值;
更新單元,根據(jù)當(dāng)前幀的拼接信息的計算值計算當(dāng)前幀的拼接信息的更新值,轉(zhuǎn)至設(shè)置單元,直至圖像幀序列中各基準(zhǔn)幀、預(yù)測幀的拼接信息的更新值計算完畢;
拼接單元、根據(jù)計算完畢的各基準(zhǔn)幀、預(yù)測幀的拼接信息的計算值拼接為全景圖像。
本發(fā)明還公開了一種掃描識別方法,包括如下步驟:
步驟一,對被掃描字符進行連續(xù)拍攝以得到含有被掃描字符的圖像幀序列,所述圖像幀序列中每幀圖像的內(nèi)容與前一幀圖像的內(nèi)容部分重疊;
步驟二,裝置中的控制模塊通過重疊內(nèi)容將圖像幀序列中的每幀圖像與相關(guān)的圖像幀進行拼接合成一個全景圖像;
步驟三,對所述全景圖像進行傾斜校正后進行字符識別,得到被掃描字符的字符編碼。
進一步,所述方法的步驟二包括:
步驟a,設(shè)置圖像幀序列中的當(dāng)前幀的幀屬性,形成圖像幀組,幀屬性包括基準(zhǔn)幀、預(yù)測幀和跳過幀;
步驟b,根據(jù)當(dāng)前幀的幀屬性及相關(guān)圖像幀的拼接信息的更新值計算當(dāng)前幀的拼接信息的預(yù)測值;
步驟c,根據(jù)當(dāng)前幀的拼接信息的預(yù)測值搜索當(dāng)前幀的拼接信息的計算值;
步驟d,根據(jù)當(dāng)前幀的拼接信息的計算值計算當(dāng)前幀的拼接信息的更新值,轉(zhuǎn)至步驟a,直至圖像幀序列中各基準(zhǔn)幀、預(yù)測幀的拼接信息的更新值計算完畢;
步驟e、根據(jù)計算完畢的各基準(zhǔn)幀、預(yù)測幀的拼接信息的計算值拼接為全景圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于漢王科技股份有限公司,未經(jīng)漢王科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110141320.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





