[發(fā)明專利]一種研報板式識別和分割的方法、系統(tǒng)及裝置在審
| 申請?zhí)枺?/td> | 201810906272.6 | 申請日: | 2018-08-10 |
| 公開(公告)號: | CN108960210A | 公開(公告)日: | 2018-12-07 |
| 發(fā)明(設計)人: | 趙勇 | 申請(專利權)人: | 武漢優(yōu)品楚鼎科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430000 湖北省武漢市東湖新技術開*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 板式 分欄 分割 系統(tǒng)及裝置 波谷位置 空白像素 直方圖 標注 圖片 預處理操作 正則表達式 內容提供 圖像處理 自動獲取 自動識別 便利性 截取 遍歷 工作量 分析 | ||
1.一種研報板式識別和分割的方法,其特征在于所述方法步驟為:
步驟101,轉換模塊將源文件轉換為圖片一;
步驟102,預處理模塊獲取所述圖片一執(zhí)行預處理操作,生成預處理圖片二;
步驟103,分析模塊獲取所述預處理圖片二,生成所述預處理圖片二的空白像素直方圖,分析所述空白像素直方圖中的最低波谷,獲取所述空白像素直方圖中目標分欄的位置;
步驟104,標注模塊根據(jù)所述空白像素直方圖中的所述目標分欄的位置,在所述圖片一中進行所述目標分欄的位置標注,生成標注圖片。
2.根據(jù)權利要求1所述的一種研報板式識別和分割的方法,其特征在于所述方法還包括:
步驟105,分割模塊根據(jù)所述圖片一中標注的所述目標分欄的位置分割所述圖片,并保存所述分割的圖片。
3.根據(jù)權利要求1或2所述的一種研報板式識別和分割的方法,其特征在于所述步驟102的預處理操作為按照任意順序執(zhí)行包含如下處理的操作:
預處理模塊獲取所述圖片執(zhí)行灰度化操作;
預處理模塊獲取所述圖片執(zhí)行閾值分割操作;
預處理模塊獲取所述圖片執(zhí)行二值化操作;
預處理模塊獲取所述圖片執(zhí)行去噪預處理操作。
4.根據(jù)權利要求3所述的一種研報板式識別和分割的方法,其特征在于所述預處理操作為依次執(zhí)行灰度化-閾值分割-二值化-去噪的預處理操作。
5.根據(jù)權利要求4所述的一種研報板式識別和分割的方法,其特征在于所述閾值分割預處理操作為otsu閾值分割;所述去噪預處理操作為腐蝕膨脹去噪。
6.根據(jù)權利要求4或5所述的一種研報板式識別和分割的方法,其特征在于所述步驟103為:
分析模塊獲取所述預處理圖片二,生成所述預處理圖片二的橫軸方向的空白像素直方圖;
遍歷所述空白像素直方圖的橫軸,分析獲取所述空白像素直方圖中橫軸的最低波谷;
根據(jù)所述最低波谷分析獲取所述空白像素直方圖中縱軸方向的目標分欄的位置。
7.根據(jù)權利要求6所述的一種研報板式識別和分割的方法,其特征在于所述步驟103為:
分析模塊獲取所述預處理圖片二,生成所述預處理圖片二的縱軸方向的空白像素直方圖;
遍歷所述空白像素直方圖的縱軸,分析獲取所述空白像素直方圖中縱軸的最低波谷;
根據(jù)所述最低波谷分析獲取所述空白像素直方圖中橫軸方向的目標分欄的位置。
8.一種研報板式識別和分割的系統(tǒng),其特征在于所述系統(tǒng)結構為:
轉換模塊,用于將PDF文件按頁分別保存為圖片一;
預處理模塊,用于對所述圖片一執(zhí)行預處理操作,生成預處理圖片二;
分析模塊,用于生成所述預處理圖片二的空白像素直方圖,分析所述空白像素直方圖,獲取所述空白像素直方圖中目標分欄的位置;
標注模塊,用于在所述圖片一中標注所述目標分欄的位置,生成標注圖片;
分割模塊,用于根據(jù)所述標注圖片中標注的所述目標分欄的位置分割所述標注圖片,并保存所述分割的圖片。
9.根據(jù)權利要求8所述的一種研報板式識別和分割的系統(tǒng),其特征在于所述預處理模塊先后執(zhí)行灰度化、閾值分割、二值化、去噪預處理操作,生成預處理圖片二;所述分析模塊獲取所述預處理圖片二,生成所述預處理圖片二的橫/縱軸方向的空白像素直方圖,遍歷所述空白像素直方圖的橫/縱軸,分析獲取所述空白像素直方圖中橫/縱軸的最低波谷,根據(jù)所述最低波谷分析獲取所述空白像素直方圖中縱/橫軸方向的目標分欄的位置。
10.一種研報板式識別和分割的裝置,其特征在于所述裝置包括:計算機可讀存儲裝置、中央處理器、總線;所述計算機可讀存儲裝置同所述中央處理器通過總線進行連接;所述計算機可讀存儲裝置存儲有多條操作指令供中央處理器調用以及存儲權利要求1-7所述方法生成的圖片供所述中央處理器通過所述操作指令進行調用,所述中央處理器執(zhí)行所述操作指令實現(xiàn)權利要求1-7所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢優(yōu)品楚鼎科技有限公司,未經(jīng)武漢優(yōu)品楚鼎科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810906272.6/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。





