[發(fā)明專利]文字掃描圖像的快速拼接方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111121258.3 | 申請(qǐng)日: | 2021-09-24 |
| 公開(kāi)(公告)號(hào): | CN113902616A | 公開(kāi)(公告)日: | 2022-01-07 |
| 發(fā)明(設(shè)計(jì))人: | 李晨;宋超;蔣濤;唐達(dá);何煉 | 申請(qǐng)(專利權(quán))人: | 四川智動(dòng)木牛智能科技有限公司 |
| 主分類號(hào): | G06T3/40 | 分類號(hào): | G06T3/40;G06T3/00 |
| 代理公司: | 北京遠(yuǎn)大卓悅知識(shí)產(chǎn)權(quán)代理有限公司 11369 | 代理人: | 張忠慶 |
| 地址: | 610041 四川*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文字 掃描 圖像 快速 拼接 方法 | ||
本發(fā)明公開(kāi)了一種文字掃描圖像的快速拼接方法,包括:步驟一,通過(guò)圖像灰度投影的運(yùn)動(dòng)估計(jì)算法對(duì)圖像行列的投影曲線做一次相關(guān)性運(yùn)算,以通過(guò)獲取圖像前后幀的運(yùn)動(dòng)矢量完成第一次拼接;步驟二,對(duì)第一拼接后存在偏移的文字圖像進(jìn)行矯正,進(jìn)行第二次拼接;步驟三,從第二次拼接后的文字圖像中提取完整的中間行文字,并將所有中間行文字拼接到單獨(dú)的圖像空間,得到最終的中間行文字圖像,完成拼接。本文明提供一種文字掃描圖像的快速拼接方法,能提高文字掃描圖像的拼接速度和拼接的完整度,同時(shí)增加了文字掃描圖像的偏移矯正功能,可用于低算力嵌入式設(shè)備,在保證拼接速度和效果的同時(shí)可降低硬件成本。
技術(shù)領(lǐng)域
本發(fā)明涉及一種在文字掃描圖像情況下使用的快速拼接方法。
背景技術(shù)
圖像拼接技術(shù)就是將數(shù)張有重疊部分的圖像(可能是不同時(shí)間、不同視角或者不同傳感器獲得的)拼成一幅無(wú)縫的全景圖或高分辨率圖像的技術(shù)。
圖像拼接技術(shù)常用于獲取全景圖像,還有一種應(yīng)用為掃描圖像拼接(即通對(duì)掃描機(jī)構(gòu)的設(shè)定使其自動(dòng)運(yùn)行,將一張帶文字的圖像通過(guò)多次分區(qū)塊掃描后進(jìn)行拼接,完成對(duì)整體圖像的掃描,也可以通過(guò)對(duì)掃描機(jī)構(gòu)的設(shè)定,完成對(duì)圖像某一區(qū)塊的單獨(dú)掃描拼接,通過(guò)拼接后的圖像與后期的文字識(shí)別相配合,完成對(duì)帶圖像文字的識(shí)別處理)。掃描圖像指的是通過(guò)移動(dòng)攝像頭拍攝得到的一系列圖像,有時(shí)需要把這一系列圖像拼接成一幅完整的圖像,以供后續(xù)處理。比如文字掃描圖像,經(jīng)過(guò)圖像拼接后,得到完整圖像,然后進(jìn)行文字識(shí)別,實(shí)現(xiàn)將書(shū)本或屏幕上的文字錄入到計(jì)算機(jī)的功能。
現(xiàn)有的文字掃描圖像的快速拼接方法中,常用的是基于特征點(diǎn)匹配的圖像拼接方法,并不能有效的應(yīng)用于掃描圖像拼接,主要原因有以下兩點(diǎn):
1.拼接速度慢
掃描圖像拼接通常需要在低算力的嵌入式設(shè)備上運(yùn)行,而且要求實(shí)時(shí)掃描實(shí)時(shí)拼接,特征點(diǎn)匹配的方法在檢測(cè)特征點(diǎn)和匹配特征點(diǎn)的步驟都很耗時(shí),很難做到低算力環(huán)境下的實(shí)時(shí)運(yùn)行。
2.易出現(xiàn)拼接不完整
文字掃描圖像,分辨率通常較小,而且內(nèi)容只有文字,所以每張圖存在的特征點(diǎn)相對(duì)較少,特別是遇到一些斷句的地方,基于特征點(diǎn)匹配的方法有可能會(huì)因?yàn)槿鄙僮銐虻奶卣鼽c(diǎn)而出現(xiàn)拼接中斷的情況。
另一種方法是:基于快速傅立葉變換的圖像拼接方法,該方法在拼接的完整性上優(yōu)于第一種方法,但是同樣存在拼接速度慢的問(wèn)題。
當(dāng)然現(xiàn)有技術(shù)中也有人借鑒光學(xué)圖像防抖中的一種基于灰度投影相關(guān)性的方法來(lái)進(jìn)行圖像拼接,這種方法運(yùn)算簡(jiǎn)單,對(duì)算力要求低,再結(jié)合高幀率相機(jī),基本上可以解決上述兩個(gè)問(wèn)題,但由于圖像在掃描的過(guò)程中會(huì)出現(xiàn)偏移,而該方法并不具備矯正偏移的能力,使得其拼接效果受限。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是解決至少上述問(wèn)題和/或缺陷,并提供至少后面將說(shuō)明的優(yōu)點(diǎn)。
為了實(shí)現(xiàn)根據(jù)本發(fā)明的這些目的和其它優(yōu)點(diǎn),提供了一種文字掃描圖像的快速拼接方法,包括:
步驟一,通過(guò)圖像灰度投影的運(yùn)動(dòng)估計(jì)算法對(duì)圖像行列的投影曲線做一次相關(guān)性運(yùn)算,以通過(guò)獲取圖像前后幀的運(yùn)動(dòng)矢量完成第一次拼接;
步驟二,對(duì)第一拼接后存在偏移的文字圖像進(jìn)行矯正,進(jìn)行第二次拼接;
步驟三,從第二次拼接后的文字圖像中提取完整的中間行文字,并將所有中間行文字拼接到單獨(dú)的圖像空間,得到最終的中間行文字圖像,完成拼接。
優(yōu)選的是,在步驟一中,所述第一次拼接的步驟被配置為包括:
S10,從視頻流里取相鄰的兩幀圖像,并對(duì)其進(jìn)行圖像灰度預(yù)處理;
S11,計(jì)算預(yù)處理后的各圖像在X軸和Y軸上的灰度投影;
S12,基于圖像灰度投影相關(guān)性計(jì)算公式,計(jì)算兩幀圖像之間在水平和垂直方向的位移矢量;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于四川智動(dòng)木牛智能科技有限公司,未經(jīng)四川智動(dòng)木牛智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111121258.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





