[發(fā)明專(zhuān)利]電子設(shè)備及其文本錄入的方法無(wú)效
| 申請(qǐng)?zhí)枺?/td> | 200710030634.1 | 申請(qǐng)日: | 2007-09-29 |
| 公開(kāi)(公告)號(hào): | CN101140617A | 公開(kāi)(公告)日: | 2008-03-12 |
| 發(fā)明(設(shè)計(jì))人: | 董磊;徐波;邱光益 | 申請(qǐng)(專(zhuān)利權(quán))人: | 東莞市步步高教育電子產(chǎn)品有限公司 |
| 主分類(lèi)號(hào): | G06K9/00 | 分類(lèi)號(hào): | G06K9/00;G06K9/20 |
| 代理公司: | 廣州三環(huán)專(zhuān)利代理有限公司 | 代理人: | 郝傳鑫 |
| 地址: | 523860廣東省*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 電子設(shè)備 及其 文本 錄入 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及電子產(chǎn)品領(lǐng)域,尤其涉及一種電子設(shè)備及其文本錄入的方法。
背景技術(shù)
目前電子設(shè)備的文本錄入方式,一般是通過(guò)鍵盤(pán)或手寫(xiě)筆等人工方式實(shí)現(xiàn),如:當(dāng)電子詞典用戶(hù)在閱讀書(shū)面文本遇到需要查詢(xún)的單詞時(shí),需要通過(guò)鍵盤(pán)或者手寫(xiě)筆將單詞逐個(gè)輸入到電子詞典,才能達(dá)到查詢(xún)目的。這種鍵盤(pán)或手寫(xiě)筆等方式錄入文字或文本相當(dāng)繁瑣、麻煩,同時(shí),過(guò)度的使用鍵盤(pán)或手寫(xiě)筆,很容易導(dǎo)致鍵盤(pán)或手寫(xiě)筆及輸入屏的損壞,從而降低了電子詞典的壽命。另外,鍵盤(pán)輸入范圍較窄,僅可通過(guò)特定的方法用特定的操作才能輸入,比如阿拉伯語(yǔ)對(duì)于外國(guó)人就難以完成正確輸入,因?yàn)榘⒗Z(yǔ),它的字符存在四種變換方式,鍵盤(pán)上是基本形態(tài),但當(dāng)輸入后它會(huì)隨前一個(gè)字符而變換形態(tài),形成連成一片的文字,對(duì)于我們非阿拉伯人來(lái)說(shuō),照著樣本都不知道怎么輸入。另一種錄入方式是通過(guò)語(yǔ)音錄入,但這種方式并不成熟,易受環(huán)境背景噪聲的干擾,同時(shí),還會(huì)受方言、語(yǔ)調(diào)、語(yǔ)速及詞匯量的影響,目前無(wú)法在電子產(chǎn)品中使用。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例的目的在于提供一種電子設(shè)備及其文本錄入的方法,可通過(guò)攝像錄入的方式,將待錄入文本輸入電子設(shè)備并轉(zhuǎn)化為文本格式,以備用戶(hù)使用。
一方面,本發(fā)明實(shí)施例提出了一種電子設(shè)備文本錄入的方法,其包括:
通過(guò)錄像采集待錄入的文本圖像;
將采集得到的連續(xù)文本圖像序列組合成靜態(tài)文本圖像;
利用對(duì)比識(shí)別算法將所述靜態(tài)文本圖像轉(zhuǎn)化成文本格式,所述對(duì)比識(shí)別算法包括:歐氏空間的對(duì)比方法、松弛比對(duì)法、動(dòng)態(tài)程序比對(duì)法、類(lèi)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)庫(kù)建立及比對(duì)、隱馬爾可夫模型(Hidden?Markov?Model,HMM)及專(zhuān)家系統(tǒng)法。
其中,所述利用對(duì)比識(shí)別算法將所述靜態(tài)文本圖像轉(zhuǎn)換成文本格式的步驟
具體包括:
對(duì)所述靜態(tài)文本圖像進(jìn)行影像處理,所述影像處理包括:圖像正規(guī)化處理、噪聲去除處理、影像矯正處理。
對(duì)經(jīng)過(guò)所述影像處理后的靜態(tài)文本圖像進(jìn)行版面分析及識(shí)別處理;
將經(jīng)過(guò)所述版面分析及識(shí)別處理后的靜態(tài)文本圖像切割成單個(gè)字符圖像并提取所述單個(gè)字符圖像的文字特征(如:統(tǒng)計(jì)特征和結(jié)構(gòu)特征);
利用對(duì)比識(shí)別算法根據(jù)所述單個(gè)字符圖像的文字特征,將所述單個(gè)字符圖像轉(zhuǎn)化成文本格式
優(yōu)選地,所述版面分析具體包括:
對(duì)所述靜態(tài)文本圖像進(jìn)行總體分析,區(qū)分出文本段落、排版順序以及圖像和表格的區(qū)域;
對(duì)需要識(shí)別的區(qū)域進(jìn)行定位和標(biāo)識(shí)。
優(yōu)選地,將經(jīng)過(guò)所述版面分析及識(shí)別處理后的靜態(tài)文本圖像切割成單個(gè)字符圖像具體為:
通過(guò)頁(yè)面切分將所述靜態(tài)文本圖像的頁(yè)面切分成一個(gè)一個(gè)的文字段落;
通過(guò)行行切分將所述文字段落切分成一個(gè)一個(gè)的圖像行;
從所述圖像行中分離出單個(gè)字符圖像,并擦除圖像塊,保留文字塊。
另一方面,本發(fā)明實(shí)施例提出了一種電子設(shè)備,包括:
圖像采集模塊,用于通過(guò)錄像采集待錄入的文本圖像;
數(shù)據(jù)庫(kù)模塊,至少存儲(chǔ)有欲識(shí)別的字集文字的特征數(shù)據(jù)庫(kù);
中央處理模塊,根據(jù)數(shù)據(jù)庫(kù)模塊存儲(chǔ)的特征數(shù)據(jù)庫(kù),利用對(duì)比識(shí)別算法將圖像采集模塊采集到的文本圖像轉(zhuǎn)化成文本格式。
其中,所述圖像采集模塊包括:
圖像輸入單元,用于通過(guò)錄像的方式將待輸入的文本轉(zhuǎn)換成文本圖像;
圖像處理單元,用于將圖像輸入單元連續(xù)錄入的文本圖像形成圖像序列。
其中,所述中央處理單元包括:
靜態(tài)圖像生成單元,用于將所述圖像采集模塊采集到的文本圖像序列組合成靜態(tài)文本圖像;
格式轉(zhuǎn)化單元,利用對(duì)比識(shí)別算法將所述靜態(tài)文本圖像轉(zhuǎn)化成文本格式。
較佳地,所述中央處理單元還可以包括一緩存單元,用于保存圖像采集模塊采集的文本圖像序列,供靜態(tài)圖像生成單元處理。
優(yōu)選地,所述格式轉(zhuǎn)化單元包括:
圖像預(yù)處理單元,用于對(duì)靜態(tài)圖像生成單元組合得到的靜態(tài)文本圖像進(jìn)行影像處理(如:圖像正規(guī)化處理、噪聲去除處理、影像矯正處理等);
圖像定位單元,用于對(duì)經(jīng)圖像預(yù)處理單元處理后的靜態(tài)文本圖像進(jìn)行版面分析及識(shí)別處理;
圖像切分單元,用于將經(jīng)圖像定位單元處理后的靜態(tài)文本圖像切割成單個(gè)字符圖像;
對(duì)比識(shí)別單元,利用對(duì)比識(shí)別算法將圖像切分單元切割得到的單個(gè)字符圖像轉(zhuǎn)化成文本格式。
優(yōu)選地,所述格式轉(zhuǎn)化單元進(jìn)一步包括一字詞后處理單元,用于對(duì)所述對(duì)比識(shí)別單元轉(zhuǎn)化得到的文本文字進(jìn)行校正處理。
其中,所述對(duì)比識(shí)別單元包括:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于東莞市步步高教育電子產(chǎn)品有限公司,未經(jīng)東莞市步步高教育電子產(chǎn)品有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710030634.1/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 藍(lán)牙信息錄入設(shè)備、錄入系統(tǒng)及錄入方法
- 一種原筆跡手寫(xiě)錄入方法和系統(tǒng)
- 藍(lán)牙信息錄入設(shè)備、錄入系統(tǒng)及錄入方法
- 數(shù)據(jù)錄入系統(tǒng)、數(shù)據(jù)錄入方法以及數(shù)據(jù)錄入裝置
- 錄入方法及錄入系統(tǒng)
- 智慧校園系統(tǒng)的信息錄入方法、裝置和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 指紋底庫(kù)錄入方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種肺癌患者隨訪系統(tǒng)
- 一種爆破施工填報(bào)系統(tǒng)及方法
- 數(shù)據(jù)錄入方法及裝置、設(shè)備、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)





