[發明專利]自動識別書頁的方法及裝置有效
| 申請號: | 201910464694.7 | 申請日: | 2019-05-30 |
| 公開(公告)號: | CN110209759B | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 不公告發明人 | 申請(專利權)人: | 北京網梯科技發展有限公司 |
| 主分類號: | G06F16/31 | 分類號: | G06F16/31;G06F16/33;G06F16/583;G06K9/32 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100098 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自動識別 書頁 方法 裝置 | ||
1.一種自動識別書頁的方法,其特征在于,所述方法包括
使用智能相機或其它設備的攝像頭拍攝待定位書頁的圖像;
使用圖像處理算法或深度學習方法自動對圖像質量進行評估,若所述圖像質量低于設定的閾值,則重新拍攝圖像;
使用圖像處理算法或深度學習方法自動識別出書頁圖像的大致方向,根據識別出的方向對圖像做旋轉,使文字方向自動調整為正常閱讀的方向;
對調整后的圖像進行自動分割,并自動識別其中的文字塊或文字行中的文本;
將識別出的全部或部分的文本結果,作為檢索詞,使用自動搜索技術檢索出包含檢索詞的分頁數據,提取其對應的書名和頁碼,根據檢索詞匹配的數量計算每個分頁數據的檢索分值;
對檢索出的分頁數據按照檢索分值排序,將分值最高的分頁數據作為檢索結果;
將分值最高的檢索分值與設定的第二閾值進行比較,若比較的結果為低于第二閾值,則返回定位失敗,重新拍攝圖像,否則,輸出從檢索結果中提取的內容。
2.如權利要求1所述的方法,其特征在于,所述圖像質量包括圖像的光照、是否模糊。
3.如權利要求1或2所述的方法,其特征在于,還包括,使用光學字符識別技術OCR技術自動分割出文字塊或文字行。
4.如權利要求3所述的方法,其特征在于,所述分頁數據是指單獨的文本文件或數據記錄,具體包括書名、頁碼、文本及其對應關系。
5.一種自動識別書頁的裝置,其特征在于,所述裝置包括
使用智能相機或其它設備的攝像頭拍攝待定位書頁的圖像的部件;
使用圖像處理算法或深度學習方法自動對圖像質量進行評估,若所述圖像質量低于設定的閾值,則重新拍攝圖像的部件;
使用圖像處理算法或深度學習方法自動識別出書頁圖像的大致方向,根據識別出的方向對圖像做旋轉,使文字方向自動調整為正常閱讀的方向的部件;
對調整后的圖像進行自動分割,并自動識別其中的文字塊或文字行中的文本的部件;
將識別出的全部或部分的文本結果,作為檢索詞,使用自動搜索技術檢索出包含檢索詞的分頁數據,提取其對應的書名和頁碼,根據檢索詞匹配的數量計算每個分頁數據的檢索分值的部件;
對檢索出的分頁數據按照檢索分值排序,將分值最高的分頁數據作為檢索結果的部件;
將分值最高的檢索分值與設定的第二閾值進行比較,若比較的結果為低于第二閾值,則返回定位失敗,否則,輸出從檢索結果中提取的內容的部件。
6.如權利要求5所述的裝置,其特征在于,所述圖像質量包括圖像的光照、是否模糊。
7.如權利要求6所述的裝置,其特征在于,還包括,使用光學字符識別技術OCR技術自動分割出文字塊或文字行。
8.如權利要求5-7任一項所述的裝置,其特征在于,所述分頁數據是指單獨的文本文件或數據記錄,具體包括書名、頁碼、文本及其對應關系。
9.一種用于實現如權利要求1-4任一項所述方法的自動識別書頁系統,其特征在于,所述系統包括如權利要求5-8任一項所述裝置。
10.一種計算機可讀存儲介質,其特征在于,所述存儲介質上存儲著程序代碼,所述程序代碼能夠被處理器執行,用于實現如權利要求1-4任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京網梯科技發展有限公司,未經北京網梯科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910464694.7/1.html,轉載請聲明來源鉆瓜專利網。





