[發明專利]一種單字區域的合并方法和裝置有效
| 申請號: | 201210486972.7 | 申請日: | 2012-11-26 |
| 公開(公告)號: | CN103839060A | 公開(公告)日: | 2014-06-04 |
| 發明(設計)人: | 鄭琪;王永攀 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 英屬開曼群島大開曼*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 單字 區域 合并 方法 裝置 | ||
1.一種單字區域的合并方法,其特征在于,包括:
提取圖像中的連通分量,對所述連通分量進行合并,得到合并過程產生的多個合并區域;
排列所述合并區域,得到至少一個文字行;
統計所述文字行包含的合并區域的個數,保留包含所述合并區域的個數最多的最大文字行,并刪除與之重疊的其他文字行,其中,所述最大文字行中所包含的所述合并區域為所述單字區域。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
如果除所述最大文字行和與所述最大文字行重疊的文字行之外還有剩余的文字行,從所述剩余的文字行中繼續保留下一個最大文字行,并刪除與之重疊的其他文字行,以此類推,直到無最大文字行可保留為止;
其中,所述每次保留的最大文字行中所包含的所述合并區域為所述單字區域。
3.根據權利要求1所述的方法,其特征在于,所述排列所述合并區域,得到至少一個文字行,包括:
獲取第一合并區域集合,所述第一合并區域集合包括至少兩個具有相同連通分量的合并區域,基于所述第一合并區域集合中包含連通分量個數最多的合并區域提取文字行;
獲取第二合并區域集合,所述第二合并區域集合包括至少一個不具有相同連通分量的合并區域,基于所述第二合并區域集合中的合并區域提取文字行。
4.根據權利要求3所述的方法,其特征在于,所述獲取第一合并區域集合,所述第一合并區域集合包括至少兩個具有相同連通分量的合并區域,基于所述第一合并區域集合中包含連通分量個數最多的合并區域提取文字行,包括:
當采用基于霍夫變換的文字行排列分析方法時,將所述第一合并區域集合中各合并區域之間的直線關系設置為不可計算,從對合并區域進行文字行排列分析得到的文字行中查找所述第一合并區域集合;
在查找的所述第一合并區域集合中保留連通分量個數最多的合并區域,去除其它的合并區域。
5.根據權利要求3所述的方法,其特征在于,所述獲取第一合并區域集合,所述第一合并區域集合包括至少兩個具有相同連通分量的合并區域,基于所述第一合并區域集合中包含連通分量個數最多的合并區域提取文字行,包括:
當采用基于區域聚合的文字行排列分析方法時,在各合并區域權重的權重因子中增加合并區域包含的連通分量個數;
將所述第一合并區域集合中各合并區域之間的權重設置為0。
6.根據權利要求1所述的方法,其特征在于,所述提取圖像中的連通分量,對所述連通分量進行合并,得到合并過程產生的多個合并區域,包括:
對提取的連通分量進行兩兩比較,將符合包圍結構關系和相鄰結構關系的任意兩個連通分量進行合并,得到合并區域;
將連通分量和合并過程產生的所述合并區域作為合并對象,重復對合并對象進行兩兩比較,將符合包圍結構關系和相鄰結構關系的任何兩個合并對象進行合并,直到不能合并為止。
7.根據權利要求6所述的方法,其特征在于,所述將符合包圍結構關系和相鄰結構關系的任意兩個連通分量進行合并,包括:
判斷兩個連通分量的擬合矩形之間的重疊面積與兩個連通分量的擬合矩形中面積最小的擬合矩形面積的比值是否大于第一預設倍數,以及兩個連通分量的顏色和筆劃寬度是否接近,如果是,符合包圍結構關系,否則,不符合包圍結構關系;
判斷兩個連通分量的擬合矩形的寬度和與中心距離之間的比值是否大于第二預設倍數,兩個連通分量的顏色和筆劃是否接近,以及合并后的區域的擬合矩形的長度與寬度的比值是否小于第三預設倍數,如果是,符合相鄰結構關系,否則,不符合相鄰結構關系。
8.根據權利要求6所述的方法,其特征在于,所述將符合相鄰結構關系的兩個合并對象進行合并,包括:
判斷兩個合并對象的擬合矩形之間的重疊面積與兩個合并對象的擬合矩形中面積最小的擬合矩形面積的比值是否大于第一預設倍數,以及兩個合并對象的顏色和筆劃寬度是否接近,如果是,符合包圍結構關系,否則,不符合包圍結構關系;
判斷兩個合并對象的擬合矩形的寬度和與中心距離之間的比值是否大于第二預設倍數,兩個合并對象的顏色和筆劃是否接近,以及合并后的區域的擬合矩形的長度與寬度的比值是否小于第三預設倍數,如果是,符合相鄰結構關系,否則,不符合相鄰結構關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210486972.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種區熔爐新型爐門鎖緊機構
- 下一篇:觸點自動雙向鎖





