[發明專利]一種基于熵值校驗的表格圖像區域識別方法及系統在審
| 申請號: | 202110490611.9 | 申請日: | 2021-05-06 |
| 公開(公告)號: | CN113191277A | 公開(公告)日: | 2021-07-30 |
| 發明(設計)人: | 蘇琳 | 申請(專利權)人: | 北京惠朗時代科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06F17/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100176 北京市大興區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 校驗 表格 圖像 區域 識別 方法 系統 | ||
本發明提出了一種基于熵值校驗的表格圖像區域識別方法及系統,涉及圖像識別領域。一種基于熵值校驗的表格圖像區域識別方法包括:根據HOG對多個表格圖像區域和待識別圖像區域進行特征提取,然后利用歐式距離計算待識別圖像區域和多個表格圖像區域的特征相似性度量;通過熵值計算公式求得待識別圖像區域的熵值;根據第一預設條件判定待識別圖像區域是否為表格圖像區域;其能夠通過特征相似性檢驗及熵值檢驗模型對表格圖像區域識別有較強的針對性,可以顯著地提升表格圖像區域識別的精度。此外本發明還提出了一種基于熵值校驗的表格圖像區域識別系統,包括:特征相似度模塊、區域熵模塊及結果模塊。
技術領域
本發明涉及圖像識別領域,具體而言,涉及一種基于熵值校驗的表格圖像區域識別方法及系統。
背景技術
隨著科技的進步,很多論文、報告書、合同等文件經常出現在我們的生活中,它們也經常以圖片的形式在網絡中傳輸、共享或者展示。在論文、報告書、合同中,表格往往是其中非常重要的部分。如果想要對圖像中的表格及相關內容進行識別、編輯,能夠精準地判別出表格圖像區域是非常重要的一個環節。
針對上述問題,很多專家和學者進行了較為深入的研究。但傳統的表格圖像區域識別方法往往沒有針對性,沒有充分考慮表格圖像區域的特異性,導致了表格圖像區域的識別精度不高。同時,多數傳統方法往往利用了較為復雜的模型或者利用了較多的訓練樣本,大大增加了計算資源的消耗。因此,如何設計一種針對性較強的簡易表格圖像區域識別方法,能夠利用較低的資源消耗較高精度地識別出表格圖像區域是一個非常有意義且亟待解決的問題。
發明內容
本發明的目的在于提供一種基于熵值校驗的表格圖像區域識別方法,其能夠通過特征相似性檢驗及熵值檢驗模型對表格圖像區域識別有較強的針對性,可以顯著地提升表格圖像區域識別的精度,整個模型中用的算法相對較為簡易,相比于其它復雜方法或者基于大量訓練樣本的方法,可以有效地減少計算資源的消耗。
本發明的另一目的在于提供一種基于熵值校驗的表格圖像區域識別系統,其能夠運行一種基于熵值校驗的表格圖像區域識別方法。
本發明的實施例是這樣實現的:
第一方面,本申請實施例提供一種基于熵值校驗的表格圖像區域識別方法,其包括根據HOG對多個表格圖像區域和待識別圖像區域進行特征提取,然后利用歐式距離計算待識別圖像區域和多個表格圖像區域的特征相似性度量;通過熵值計算公式求得待識別圖像區域的熵值;根據特征相似性度量及待識別圖像區域的熵值的第一預設條件判定待識別圖像區域是否為表格圖像區域。
在本發明的一些實施例中,還包括:計算多個表格圖像區域和待識別圖像區域的長寬比,并利用絕對差值計算待識別圖像區域和表格圖像區域的長寬比相似性。
在本發明的一些實施例中,還包括:判斷相似性待識別圖像區域和多個表格圖像區域中任意一個表格圖像區域的長寬比相似性是否滿足第二預設條件,若滿足,則判定待識別圖像區域為準表格圖像區域繼續下一步判定,若不滿足,則判定待識別圖像區域為非表格圖像區域。
在本發明的一些實施例中,上述第二預設條件包括:判斷待識別圖像區域和任意一個表格圖像區域的長寬比相似性度量滿足第一預設值。
在本發明的一些實施例中,上述通過熵值計算公式求得待識別圖像區域的熵值包括:計算待識別圖像區域中每個像素點的灰度值,并計算任意一個灰度值在該圖像中出現的概率,通過預設公式對區域熵進行計算。
在本發明的一些實施例中,上述通過預設公式對區域熵進行計算包括:利用公式對區域熵進行計算,其中,H為區域熵,P為灰度概率,i為灰度值。
在本發明的一些實施例中,上述根據第一預設條件判定待識別圖像區域是否為表格圖像區域包括:判斷待識別圖像區域和任意一個表格圖像區域的特征相似性度量是否滿足第二預設值,及待識別圖像區域熵值是否滿足第三預設值,若同時滿足,則判定待識別圖像區域為表格圖像區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京惠朗時代科技有限公司,未經北京惠朗時代科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110490611.9/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





