[發(fā)明專利]一種快速將紙質(zhì)書內(nèi)容轉(zhuǎn)化為數(shù)字內(nèi)容的方法與裝置在審
| 申請?zhí)枺?/td> | 201910518766.1 | 申請日: | 2019-06-15 |
| 公開(公告)號(hào): | CN110298349A | 公開(公告)日: | 2019-10-01 |
| 發(fā)明(設(shè)計(jì))人: | 沈之銳 | 申請(專利權(quán))人: | 韶關(guān)市啟之信息技術(shù)有限公司 |
| 主分類號(hào): | G06K9/34 | 分類號(hào): | G06K9/34;G06K9/32;G06K9/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 512026 廣東省韶關(guān)市武江區(qū)百旺大道42號(hào)*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)字內(nèi)容 書內(nèi)容 數(shù)字版 紙質(zhì) 拍攝 轉(zhuǎn)化 書本 手機(jī)攝像頭 攝像頭 準(zhǔn)確度 快速翻頁 內(nèi)容數(shù)據(jù) 內(nèi)容轉(zhuǎn)化 書本內(nèi)容 圖像數(shù)據(jù) 紙質(zhì)書本 頁碼 翻頁 糾正 | ||
1.一種快速將紙質(zhì)書內(nèi)容轉(zhuǎn)化為數(shù)字內(nèi)容的方法,其特征在于,所述方法包括:
用高速攝像頭對書本快速翻頁過程進(jìn)行拍攝,獲得翻書視頻;所述快速翻頁過程主要是指用手或工具擠壓書,使書頁因?yàn)槭艿綌D壓力而能夠迅速從書的一邊翻到另一邊;
獲取翻書過程的視頻圖像數(shù)據(jù);去除所述翻書視頻圖像中,書頁處于書本中間位置的幀,獲取書本內(nèi)容數(shù)據(jù);
對書本內(nèi)容數(shù)據(jù)進(jìn)行去重,獲得書本每一頁數(shù)據(jù);
對所述書本每一頁數(shù)據(jù)進(jìn)行傾斜糾正;
根據(jù)書本每一頁數(shù)據(jù),獲取頁碼,對頁碼進(jìn)行排序;
若頁碼缺失,則進(jìn)行再次翻頁拍攝;
根據(jù)書本每一頁數(shù)據(jù),采用ocr字符識(shí)別技術(shù),獲得全書數(shù)字版內(nèi)容。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述用攝像頭對書本快速翻頁過程進(jìn)行拍攝,主要包括:
通過高速攝像頭進(jìn)行拍攝,
所述快速翻頁過程,包括通過手或其他工具,翻開書,書翻到預(yù)設(shè)的角度范圍,使書展開一半,書面被擠成一定弧度;
順序一頁頁松開書的一端,使書一頁頁翻向另一端;
重復(fù)若干次,使書內(nèi)快速翻過的內(nèi)容可以被攝像頭拍攝到。
3.根據(jù)權(quán)利要求1所述的方法,其中,所述獲取書本內(nèi)容數(shù)據(jù),主要包括:
對拍攝的翻頁視頻進(jìn)行提取,并獲取視頻幀;
檢測翻頁頁面處于中間位置的幀,對這些頁面進(jìn)行去除;所述中間位置是指,書在翻頁過程中,頁面正好處于垂直于書本的預(yù)設(shè)的角度,無法被攝像頭拍攝到頁面數(shù)據(jù)內(nèi)容的位置。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述對書本內(nèi)容數(shù)據(jù)進(jìn)行去重,獲得書本每一頁數(shù)據(jù),主要包括:
計(jì)算頁面內(nèi)容相似度大于預(yù)設(shè)閾值的幀,保留書本內(nèi)容最多的幀;
所述計(jì)算頁面內(nèi)容相似度大于預(yù)設(shè)閾值的幀是指,每一個(gè)書頁被翻過的過程中,會(huì)被高速攝像頭拍攝很多次,因?yàn)轫撁嬖趧?dòng),每一次拍攝都能看到頁面中的部分?jǐn)?shù)據(jù),數(shù)據(jù)的相似度越大,代表他們屬于同一個(gè)頁面的概率越大,計(jì)算相似度大于預(yù)設(shè)閾值的幀即可獲得去重后的,書的每一個(gè)頁面;
對書本頁面內(nèi)容圖片,進(jìn)行聚類;把具有相似內(nèi)容的書本內(nèi)容圖片聚合在一起,然后在里面識(shí)別字符內(nèi)容所占面積最大的一張圖片;
該圖片的文字信息最多,選為目標(biāo)圖片;該目標(biāo)圖片記錄了書本中的一個(gè)頁面的數(shù)據(jù)。
5.根據(jù)權(quán)利要求1所述的方法,其中,所述對所述書本每一頁數(shù)據(jù)進(jìn)行傾斜糾正,主要包括:
對目標(biāo)圖片進(jìn)行圖像傾斜矯正,采用改進(jìn)式Hough變換算法,使圖片中傾斜的文字矯正為正常的文字。
6.根據(jù)權(quán)利要求1所述的方法,其中,所述若頁碼缺失,則進(jìn)行再次翻頁拍攝,主要包括:
對書本中的頁碼進(jìn)行識(shí)別;
獲取頁面中與頁面聚集內(nèi)容具有預(yù)設(shè)距離的數(shù)字;
對該數(shù)字進(jìn)行識(shí)別,獲得頁碼;
根據(jù)所述頁碼,對書本內(nèi)容進(jìn)行排序。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述對書本內(nèi)容進(jìn)行排序,主要包括:
當(dāng)缺少頁碼時(shí);
提醒用戶,該頁面缺失,需要針對目標(biāo)缺失數(shù)據(jù),再對著攝像頭,翻一次書。
8.根據(jù)權(quán)利要求1所述的方法,其中,所述用ocr字符識(shí)別技術(shù)獲得全書數(shù)字版內(nèi)容,主要包括:
采用ocr算法或相關(guān)軟件工具,對通過手動(dòng)快速翻頁得到的書本攝像圖片內(nèi)容,進(jìn)行文字識(shí)別,獲得紙質(zhì)書本的ocr文字內(nèi)容。
9.一種快速將紙質(zhì)書內(nèi)容轉(zhuǎn)化為數(shù)字內(nèi)容的裝置,其特征在于,所述系統(tǒng)包括:
拍攝模塊,用于通過高速攝像頭和快速翻頁動(dòng)作,對書本內(nèi)容進(jìn)行拍攝;
獲取模塊,用于去除無用的數(shù)據(jù),計(jì)算頁面內(nèi)容相似度大于預(yù)設(shè)閾值的幀,保留信息量最大的幀,獲取書本翻頁過程中的最有用的數(shù)據(jù);
圖像傾斜矯正模塊,用于使傾斜的文字矯正為正常的文字;
頁碼識(shí)別排序與糾錯(cuò)模塊,用于識(shí)別書本頁碼,根據(jù)頁碼進(jìn)行排序,并對缺失頁碼進(jìn)行提示;
字符識(shí)別模塊,用于通過ocr技術(shù)獲取書本的數(shù)字版數(shù)據(jù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于韶關(guān)市啟之信息技術(shù)有限公司,未經(jīng)韶關(guān)市啟之信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910518766.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種帶權(quán)利要求說明的數(shù)字內(nèi)容打包方法
- 一種在內(nèi)容適配中防止數(shù)字水印丟失的方法、系統(tǒng)及數(shù)字版權(quán)中心
- 數(shù)字內(nèi)容使用方法、裝置與系統(tǒng)、數(shù)字版權(quán)管理裝置
- 數(shù)字版權(quán)管理交易系統(tǒng)
- 數(shù)字內(nèi)容分段加密解密的方法及裝置
- 一種數(shù)字內(nèi)容保護(hù)方法和設(shè)備
- 區(qū)塊鏈數(shù)字內(nèi)容版權(quán)操作平臺(tái)
- 一種基于鏈的數(shù)字內(nèi)容分發(fā)的方法及其應(yīng)用
- 基于區(qū)塊鏈平臺(tái)的數(shù)字內(nèi)容版權(quán)保護(hù)方法和裝置
- 數(shù)字內(nèi)容存儲(chǔ)和訪問方法及數(shù)字內(nèi)容存儲(chǔ)和訪問系統(tǒng)
- 一種圖像處理方法及移動(dòng)終端
- 一種共享圖書系統(tǒng)中圖書內(nèi)容審核的方法
- 漫畫類型電子書的自動(dòng)翻頁方法、計(jì)算設(shè)備及存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)包及數(shù)據(jù)分享系統(tǒng)
- 電子書內(nèi)容展示方法、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種判決書內(nèi)容提取方法及相關(guān)裝置
- 一種投影支架及投影裝置
- 一種顯示方法及裝置
- 一種基于云端的電子黑板控制系統(tǒng)和方法
- 電子書源文件處理方法、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 對HD-DVD的基本和增強(qiáng)層的交織
- 數(shù)字媒體個(gè)性化增值服務(wù)云平臺(tái)
- 數(shù)字內(nèi)容版本切換的方法以及相應(yīng)設(shè)備
- 可數(shù)字成像且具有極性超薄屏障層的柔版印刷元件
- 用于柔性版印刷版的線上生產(chǎn)的裝置和方法
- 一種字符網(wǎng)版的標(biāo)識(shí)工藝
- 一種樓層高度模擬模塊及跨代樓宇對講實(shí)訓(xùn)裝置
- 一種樓層高度模擬模塊及跨代樓宇對講實(shí)訓(xùn)裝置
- 一種數(shù)字印刷機(jī)的供給裝置
- 版權(quán)保護(hù)方法、數(shù)字記錄裝置和控制集成電路





