[發(fā)明專利]電子設(shè)備及其文本錄入的方法無效
| 申請?zhí)枺?/td> | 200710030634.1 | 申請日: | 2007-09-29 |
| 公開(公告)號: | CN101140617A | 公開(公告)日: | 2008-03-12 |
| 發(fā)明(設(shè)計)人: | 董磊;徐波;邱光益 | 申請(專利權(quán))人: | 東莞市步步高教育電子產(chǎn)品有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20 |
| 代理公司: | 廣州三環(huán)專利代理有限公司 | 代理人: | 郝傳鑫 |
| 地址: | 523860廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 電子設(shè)備 及其 文本 錄入 方法 | ||
1.一種電子設(shè)備中文本錄入的方法,其特征在于,包括:
通過錄像方式采集待錄入的文本圖像;
將采集得到的連續(xù)文本圖像序列組合成靜態(tài)文本圖像;
利用對比識別算法將所述靜態(tài)文本圖像轉(zhuǎn)化成文本格式。
2.如權(quán)利要求1所述的方法,其特征在于,所述利用對比識別算法將所述靜態(tài)文本圖像轉(zhuǎn)換成文本格式的步驟具體包括:
對所述靜態(tài)文本圖像進(jìn)行影像處理;
對經(jīng)過所述影像處理后的靜態(tài)文本圖像進(jìn)行版面分析及識別處理;
將經(jīng)過所述版面分析及識別處理后的靜態(tài)文本圖像切割成單個字符圖像并提取所述單個字符圖像的文字特征;
利用對比識別算法根據(jù)所述單個字符圖像的文字特征,將所述單個字符圖像轉(zhuǎn)化成文本格式。
3.如權(quán)利要求2所述的方法,其特征在于,
所述影像處理包括:圖像正規(guī)化處理、噪聲去除處理、影像矯正處理。
4.如權(quán)利要求2所述的方法,其特征在于,所述版面分析具體包括:
對所述靜態(tài)文本圖像區(qū)分出文本段落、排版順序以及圖像和表格的區(qū)域;
對需要識別的區(qū)域進(jìn)行定位和標(biāo)識。
5.如權(quán)利要求2所述的方法,其特征在于,所述文字特征包括:統(tǒng)計特征、結(jié)構(gòu)特征。
6.如權(quán)利要求2所述的方法,其特征在于,將經(jīng)過所述版面分析及識別處理后的靜態(tài)文本圖像切割成單個字符圖像具體為:
通過頁面切分將所述靜態(tài)文本圖像的頁面切分成一個一個的文字段落;
通過行行切分將所述文字段落切分成一個一個的圖像行;
從所述圖像行中分離出單個字符圖像,并擦除圖像塊,保留文字塊。
7.如權(quán)利要求1至6任意一項(xiàng)所述的方法,其特征在于,所述對比識別算法包括:歐氏空間的對比方法、松弛比對法、動態(tài)程序比對法、類神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫建立及比對、隱馬爾可夫模型及專家系統(tǒng)法。
8.如權(quán)利要求1至6任意一項(xiàng)所述的方法,其特征在于,所述電子設(shè)備包括:電子詞典、掌上電腦、學(xué)習(xí)機(jī)、手機(jī)、數(shù)碼相機(jī)、GPS設(shè)備。
9.一種電子設(shè)備,其特征在于,包括:
圖像采集模塊,用于通過錄像方式采集待錄入的文本圖像;
數(shù)據(jù)庫模塊,至少存儲有欲識別的字集文字的特征數(shù)據(jù)庫;
中央處理模塊,根據(jù)數(shù)據(jù)庫模塊存儲的特征數(shù)據(jù)庫,利用對比識別算法將圖像采集模塊采集到的文本圖像轉(zhuǎn)化成文本格式。
10.如權(quán)利要求9所述的電子設(shè)備,其特征在于,所述圖像采集模塊包括:
圖像輸入單元,用于將待輸入的文本轉(zhuǎn)換成文本圖像;
圖像處理單元,用于將圖像輸入單元連續(xù)錄入的文本圖像形成圖像序列。
11.如權(quán)利要求9所述的電子設(shè)備,其特征在于,所述中央處理單元包括:
靜態(tài)圖像生成單元,用于將所述圖像采集模塊采集到的文本圖像序列組合成靜態(tài)文本圖像;
格式轉(zhuǎn)化單元,利用對比識別算法將所述靜態(tài)文本圖像轉(zhuǎn)化成文本格式。
12.如權(quán)利要求11所述的電子設(shè)備,其特征在于,所述格式轉(zhuǎn)化單元包括:
圖像預(yù)處理單元,用于對靜態(tài)圖像生成單元組合得到的靜態(tài)文本圖像進(jìn)行影像處理;
圖像定位單元,用于對經(jīng)圖像預(yù)處理單元處理后的靜態(tài)文本圖像進(jìn)行版面分析及識別處理;
圖像切分單元,用于將經(jīng)圖像定位單元處理后的靜態(tài)文本圖像切割成單個字符圖像;
對比識別單元,利用對比識別算法將圖像切分單元切割得到的單個字符圖像轉(zhuǎn)化成文本格式。
13.如權(quán)利要求12所述的電子設(shè)備,其特征在于,所述對比識別單元包括:
文字特征提取單元,用于提取所述圖像切分單元切割得到的單個字符圖像的文字特征;
文字抽取單元,根據(jù)所述單個字符圖像的文字特征,從所述數(shù)據(jù)庫模塊存儲的特征數(shù)據(jù)庫中抽取與所述單個字符圖像具有相同文字特征的特征群組;
對比單元,根據(jù)對比識別算法從所述特征群組中查找與所述單個字符圖像相對應(yīng)的字符。
14.如權(quán)利要求13所述的電子設(shè)備,其特征在于,所述格式轉(zhuǎn)化單元進(jìn)一步包括:
字詞后處理單元,用于對所述對比識別單元轉(zhuǎn)化得到的文本文字進(jìn)行校正處理。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東莞市步步高教育電子產(chǎn)品有限公司,未經(jīng)東莞市步步高教育電子產(chǎn)品有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710030634.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 藍(lán)牙信息錄入設(shè)備、錄入系統(tǒng)及錄入方法
- 一種原筆跡手寫錄入方法和系統(tǒng)
- 藍(lán)牙信息錄入設(shè)備、錄入系統(tǒng)及錄入方法
- 數(shù)據(jù)錄入系統(tǒng)、數(shù)據(jù)錄入方法以及數(shù)據(jù)錄入裝置
- 錄入方法及錄入系統(tǒng)
- 智慧校園系統(tǒng)的信息錄入方法、裝置和計算機(jī)可讀存儲介質(zhì)
- 指紋底庫錄入方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種肺癌患者隨訪系統(tǒng)
- 一種爆破施工填報系統(tǒng)及方法
- 數(shù)據(jù)錄入方法及裝置、設(shè)備、計算機(jī)可讀存儲介質(zhì)





