[發(fā)明專(zhuān)利]一種識(shí)別圓形公章中文字的方法有效
| 申請(qǐng)?zhí)枺?/td> | 201510960809.3 | 申請(qǐng)日: | 2015-12-18 |
| 公開(kāi)(公告)號(hào): | CN105631447B | 公開(kāi)(公告)日: | 2019-02-15 |
| 發(fā)明(設(shè)計(jì))人: | 范晨 | 申請(qǐng)(專(zhuān)利權(quán))人: | 杭州仁盈科技股份有限公司 |
| 主分類(lèi)號(hào): | G06K9/32 | 分類(lèi)號(hào): | G06K9/32 |
| 代理公司: | 杭州九洲專(zhuān)利事務(wù)所有限公司 33101 | 代理人: | 陳繼亮 |
| 地址: | 310020 浙江省杭州市*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識(shí)別 圓形 公章 文字 方法 | ||
本發(fā)明涉及一種識(shí)別圓形公章中文字的方法,第1步:裁剪出一個(gè)覆蓋了蓋章位置的盡量小的圖片1。第2步:在圖片1中找圓。第3步:根據(jù)找到的圓形的圓心和半徑從圖片1中再次裁剪出一個(gè)只含有圓形的圖片2;第4步:二值化圖片2;第5步,將文字圖像按順序“拉直”;第6步:將“拉直”后的圖像內(nèi)容進(jìn)行文字識(shí)別。本發(fā)明的有益效果為:公章中的內(nèi)容雖環(huán)繞圓心看起來(lái)不是平直的,但單獨(dú)看每個(gè)字,依然都是標(biāo)準(zhǔn)的印刷體,只不過(guò)每個(gè)文字都有一定的傾斜角度。本發(fā)明將這些環(huán)繞圓心的文字想辦法“拉直”變?yōu)榘葱袝?shū)寫(xiě)的文字,再送入通用的OCR模塊,即可實(shí)現(xiàn)公章內(nèi)容的識(shí)別,使業(yè)務(wù)系統(tǒng)自動(dòng)識(shí)別出企業(yè)的名稱(chēng),進(jìn)一步提高運(yùn)營(yíng)商業(yè)務(wù)系統(tǒng)的工作效率。
技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理、文字識(shí)別技術(shù)領(lǐng)域,尤其涉及一種識(shí)別圓形公章中文字的方法。
背景技術(shù)
目前OCR(Optical Character Recognition,光學(xué)字符識(shí)別)技術(shù)已經(jīng)相當(dāng)成熟并應(yīng)用在各個(gè)領(lǐng)域。如手機(jī)上的各種拍攝名片即可將名片內(nèi)容導(dǎo)入通訊錄的程序、高速公路上拍攝車(chē)牌進(jìn)行號(hào)牌識(shí)別的儀器、掃描文檔將文檔圖片轉(zhuǎn)化為文字的程序等等。這些應(yīng)用都是借助OCR技術(shù)對(duì)相關(guān)文字圖片進(jìn)行分析轉(zhuǎn)化為文字信息,極大地降低了人們的工作量。
電信運(yùn)營(yíng)商也應(yīng)用了此技術(shù)來(lái)提高工作效率。如目前集團(tuán)業(yè)務(wù)占電信運(yùn)營(yíng)商的業(yè)務(wù)比重非常高,有的電信運(yùn)營(yíng)商派出客戶經(jīng)理去企業(yè)辦理集團(tuán)類(lèi)業(yè)務(wù)時(shí),集團(tuán)企業(yè)需要簽訂相關(guān)的紙質(zhì)協(xié)議單,運(yùn)營(yíng)商的客戶經(jīng)理只要用手機(jī)拍攝協(xié)議單,利用OCR技術(shù),就可將協(xié)議單上的關(guān)鍵信息錄入運(yùn)營(yíng)商的后臺(tái)管理系統(tǒng),提高了客戶經(jīng)理的工作效率。同時(shí)集團(tuán)客戶簽訂的協(xié)議單作為回執(zhí)保留在客戶處,運(yùn)營(yíng)商不再需要保留紙質(zhì)的協(xié)議單,節(jié)省了50%的協(xié)議單印刷量,實(shí)現(xiàn)了一定的節(jié)能減排。
這里存在的問(wèn)題是,集團(tuán)類(lèi)業(yè)務(wù)需要加蓋企業(yè)的公章,業(yè)務(wù)系統(tǒng)OCR只會(huì)識(shí)別正規(guī)的印刷體,而無(wú)法識(shí)別圓形的印章內(nèi)容,也就無(wú)法從協(xié)議單上讀出辦理業(yè)務(wù)的企業(yè)名稱(chēng),還是要靠客戶經(jīng)理手工輸入企業(yè)名稱(chēng),沒(méi)有實(shí)現(xiàn)完全的自動(dòng)化,工作效率還有待提高。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)存在的不足,而提供一種識(shí)別圓形公章中文字的方法,使業(yè)務(wù)系統(tǒng)自動(dòng)識(shí)別出企業(yè)的名稱(chēng),進(jìn)一步提高運(yùn)營(yíng)商業(yè)務(wù)系統(tǒng)的工作效率。
本發(fā)明的目的是通過(guò)如下技術(shù)方案來(lái)完成的。這種識(shí)別圓形公章中文字的方法,步驟如下:
第1步:裁剪出一個(gè)覆蓋了蓋章位置的盡量小的圖片1。
第2步:在圖片1中,利用Hough變換找圓。
第3步:根據(jù)找到的圓形的圓心和半徑從圖片1中再次裁剪出一個(gè)只含有圓形的圖片2
第4步:二值化圖片2;
第5步,根據(jù)發(fā)明的算法將二值化后的圍繞圓心的文字圖像按順序“拉直”;
第6步:將“拉直”后的圖像內(nèi)容送入通用OCR模塊進(jìn)行文字識(shí)別。
其中,除了“步驟5”外,其它步驟都是成熟的技術(shù)。簡(jiǎn)單介紹如下:
Hough變換,將圖像空間內(nèi)具有一定關(guān)系的像元進(jìn)行聚類(lèi),尋找能把這些像元用某一解析形式聯(lián)系起來(lái)的參數(shù)空間累積對(duì)應(yīng)點(diǎn),用來(lái)找圖像中的直線和圓比較理想。
圖像的二值化,就是將圖像上的像素點(diǎn)的灰度值根據(jù)一定的閾值設(shè)置為0或255,也就是將整個(gè)圖像呈現(xiàn)出只有黑和白的視覺(jué)效果。實(shí)際應(yīng)用為便于分析,一般白色空白用0表示,黑色有效像素用1表示。
故本發(fā)明只討論如何將二值化后的公章內(nèi)圓形的文字“拉直”并重新組合為“平直”的文字。
二值化后的印章圖片采用一維數(shù)組存儲(chǔ),圖片的原點(diǎn)在左上角,按行存儲(chǔ),其中值為0表示空白像素,值為1表示黑色像素。
1,計(jì)算印章文字形成的圓圈底部和頂部到圓心的距離r1,r2;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于杭州仁盈科技股份有限公司,未經(jīng)杭州仁盈科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510960809.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





