[發明專利]版面分欄方法及裝置有效
| 申請號: | 201711365896.3 | 申請日: | 2017-12-18 |
| 公開(公告)號: | CN107943780B | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 胡雨隆;胡金水 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F40/189 | 分類號: | G06F40/189 |
| 代理公司: | 北京華圣典睿知識產權代理有限公司 11510 | 代理人: | 陳國偉 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 版面 分欄 方法 裝置 | ||
1.一種版面分欄方法,其特征在于,所述方法包括:
獲取待分欄文本圖像;
對所述文本圖像進行文本行切分,得到各文本行;
對所述文本行進行合并成欄處理,得到最終分欄結果;
所述對所述文本行進行合并成欄處理,得到最終分欄結果包括:
將各文本行作為獨立的文本欄,存入到文本欄集合中作為當前分欄結果,并計算當前分欄代價;所述分欄代價包括:欄內代價和欄間代價;所述欄內代價是指文本欄內相鄰文本行屬于同一欄的代價;所述欄間代價是指當前文本欄與其相鄰文本欄為獨立欄的代價;
依次對相鄰文本欄進行合并,并計算合并后的分欄代價,得到其中的最小分欄代價,并根據所述最小分欄代價及當前分欄代價更新分欄結果及當前分欄代價;
所有相鄰文本欄合并完成后,得到最終分欄結果。
2.根據權利要求1所述的方法,其特征于,所述依次對相鄰文本欄進行合并,并計算合并后的分欄代價,得到其中的最小分欄代價,并根據所述最小分欄代價及當前分欄代價更新分欄結果及當前分欄代價包括:
(1)依次選擇當前分欄結果中的一個文本欄作為當前文本欄進行預測:將當前文本欄與其相鄰文本欄合并后的文本欄作為預測文本欄,得到預測分欄結果,計算對應所述預測分欄結果的預測分欄代價,并得到其中的最小預測分欄代價;
(2)判斷所述最小預測分欄代價是否小于當前分欄代價;
(3)如果是,則更新當前分欄結果為所述最小預測分欄代價對應的預測分欄結果,并更新當前分欄代價為所述最小預測分欄代價,然后執行步驟(1);
(4)否則,將當前分欄代價作為最小分欄代價;
所述所有相鄰文本欄合并完成后,得到最終分欄結果包括:
所有相鄰文本欄合并完成后,將所述最小分欄代價對應的當前分欄結果作為最終分欄結果。
3.根據權利要求2所述的方法,其特征在于,所述計算預測分欄代價包括:
計算所述預測文本欄的欄內代價;
計算所述預測文本欄的欄間代價;
根據所述欄內代價和所述欄間代價得到預測分欄代價。
4.根據權利要求3所述的方法,其特征在于,所述計算所述預測文本欄的欄內代價包括:
基于預先構建的欄內代價模型分別計算所述預測文本欄內每兩個相鄰文本行屬于同一欄的代價值;所述欄內代價模型的輸入為以下任意一項或多項:兩個相鄰文本行的間距、X軸重疊比例、X軸長度比例;所述欄內代價模型的輸出為兩個相鄰文本行屬于同一欄的代價值;
將得到的所有代價值取平均值,將該平均值作為所述預測文本欄的欄內代價。
5.根據權利要求3所述的方法,其特征在于,所述計算所述預測文本欄的欄間代價包括:
基于預先構建的欄間代價模型計算所述預測文本欄與各相鄰文本欄不屬于同一欄的代價值;所述欄間代價模型的輸入為以下任意一項或多項:所述預測文本欄與相鄰文本欄內像素外接凸包間的最小距離、X軸重疊比例、Y軸重疊比例、X軸長度比例、Y軸長度比例;所述欄間代價模型的輸出為兩相鄰文本欄作為獨立欄的代價值;
將得到的所有代價值取平均值,將該平均值作為所述預測文本欄與其相鄰文本欄的欄間代價。
6.根據權利要求1至5任一項所述的方法,其特征在于,所述相鄰文本欄是指設定范圍內的所有文本欄。
7.一種版面分欄裝置,其特征在于,所述裝置包括:
圖像獲取模塊,用于獲取待分欄文本圖像;
切分模塊,用于對所述文本圖像進行文本行切分,得到各文本行;
分欄處理模塊,用于將各文本行作為獨立的文本欄,存入到文本欄集合中作為當前分欄結果,并計算當前分欄代價;依次對相鄰文本欄進行合并,并計算合并后的分欄代價,得到其中的最小分欄代價;并根據所述最小分欄代價及當前分欄代價更新分欄結果及當前分欄代價;所有相鄰文本欄合并完成后,得到最終分欄結果;其中,所述分欄代價包括:欄內代價和欄間代價;所述欄內代價是指文本欄內相鄰文本行屬于同一欄的代價;所述欄間代價是指當前文本欄與其相鄰文本欄為獨立欄的代價。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711365896.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于數字出版的動態可配置的系統和方法
- 下一篇:關鍵詞識別方法及裝置





