[發(fā)明專利]一種書冊圖像掃描方法在審
| 申請?zhí)枺?/td> | 202011564028.X | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112565549A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設(shè)計)人: | 吳志雄;白丹;周興杰;馮智輝 | 申請(專利權(quán))人: | 深圳太極云軟技術(shù)有限公司 |
| 主分類號: | H04N1/04 | 分類號: | H04N1/04;H04N1/203;G06N3/08;G06N3/04 |
| 代理公司: | 深圳金偉創(chuàng)新專利代理事務(wù)所(普通合伙) 44628 | 代理人: | 韋永吉 |
| 地址: | 518000 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 書冊 圖像 掃描 方法 | ||
本發(fā)明公開了一種書冊圖像掃描方法,包括以下步驟:S1、輸入書本圖像;S2、使用折痕識別模型識別書本圖像的分頁折痕,得到分頁坐標,沿分頁折痕分割書本圖像,調(diào)整角度輸出頁面圖像;S3、頁面圖像預(yù)處理,識別頁面圖像的文本輪廓;S4、將文本輪廓組成樣本跨度,在每個跨度生成代表點,創(chuàng)建初始參數(shù)估計,實現(xiàn)投影到圖像平面,使用最小優(yōu)化算法優(yōu)化參數(shù),使重投影的誤差變小,得到優(yōu)化參數(shù)后,重新映射圖像,展平頁面圖像;S5、輸出結(jié)果圖。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別處理領(lǐng)域,具體為一種書冊圖像掃描方法。
背景技術(shù)
高拍儀是超便攜低碳辦公用品,也是一款辦公領(lǐng)域革新性產(chǎn)品,能完成一秒鐘高速掃描,具有OCR文字識別功能,可以將掃描的圖片識別轉(zhuǎn)換成可編輯的word文檔,大大提高辦公效率。然而目前市場上的高拍儀針對書籍拍攝存在一些不足,如拍攝畸變,書頁沒有展平等困難,極度影響拍攝掃描的結(jié)果,從而進一步影響OCR文字識別的精度。
現(xiàn)有的高拍儀多為一體式,書籍材料圖像分頁一般采用產(chǎn)品設(shè)定的輔助分割線處理,用戶需要再指定位置放置文本才能分頁,并且需對其分割線才能分割準確,方式較為局限。
如現(xiàn)有技術(shù)一種書籍高拍儀(CN211063657U),針對書籍的分頁折痕和扭曲等問題,針對性改進高拍儀,但是存在通用性較低、大量更換高拍儀的成本過高的問題。
因此,針對現(xiàn)有高拍儀提供一種書籍材料圖像處理方法成了亟需解決的難題。
發(fā)明內(nèi)容
本發(fā)明的發(fā)明目的在于提供一種通用性強、成本低的書冊圖像掃描方法,用于解決現(xiàn)有技術(shù)書籍材料圖像分頁困難和圖像扭曲的問題。
本發(fā)明解決上述技術(shù)問題所采取的技術(shù)方案如下:
一種書冊圖像掃描方法,包括以下步驟:
S1、輸入書本圖像;
S2、使用折痕識別模型識別書本圖像的分頁折痕,得到分頁坐標,沿分頁折痕分割書本圖像,調(diào)整角度輸出頁面圖像;
S3、頁面圖像預(yù)處理,識別頁面圖像的文本輪廓;
S4、將文本輪廓組成樣本跨度,在每個跨度生成代表點,創(chuàng)建初始參數(shù)估計,實現(xiàn)投影到圖像平面,使用最小優(yōu)化算法優(yōu)化參數(shù),使重投影的誤差變小,得到優(yōu)化參數(shù)后,重新映射圖像,展平頁面圖像;
S5、輸出結(jié)果圖。
進一步的,所述步驟S1之前包括步驟S0:
采集各種需要分頁的文字材料并標注分頁折痕制作訓(xùn)練集和測試集,使用卷積神經(jīng)網(wǎng)絡(luò)和訓(xùn)練集建立折痕識別模型,通過測試集和深度學(xué)習(xí)網(wǎng)絡(luò)調(diào)優(yōu)折痕識別模型參數(shù)使其擬合數(shù)據(jù)。
進一步的,所述卷積神經(jīng)網(wǎng)絡(luò)為YOLO。
進一步的,在訓(xùn)練過程中,將損失函數(shù)設(shè)置為:
loss=lbox+lobj+lcls
其中,xywh部分帶來的誤差,記為lbox:
置信度帶來的誤差,記為lobj:
類別帶來的誤差,記為lcls:
進一步的,所述步驟S3包括以下子步驟:
S3a、計算頁面圖像的文本內(nèi)容區(qū)域確定頁面邊界;
S3b、通過自適應(yīng)閾值對頁面圖像進行二值化、膨脹、腐蝕和連通區(qū)域分析,檢測文本輪廓。
進一步的,所述最小優(yōu)化算法為共軛梯度法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳太極云軟技術(shù)有限公司,未經(jīng)深圳太極云軟技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011564028.X/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





