[發明專利]一種基于圖割的復雜背景文本圖像分割方法有效
| 申請號: | 201110322549.9 | 申請日: | 2011-10-21 |
| 公開(公告)號: | CN102332097A | 公開(公告)日: | 2012-01-25 |
| 發明(設計)人: | 王春恒;史存召;肖柏華;周文 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 周國城 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 復雜 背景 文本 圖像 分割 方法 | ||
1.一種基于圖割的復雜背景文本圖像分割方法,其特征在于,包括以下步驟:
步驟1,將原始文本塊圖像粗分為若干個子圖;
步驟2,通過判斷每個子圖的極性,確定整個文本塊圖像的極性;
步驟3,根據文本塊圖像的極性,結合字符筆畫的固有特征,自動為圖割提供一些置信度較高的前景點和背景點作為圖割的硬約束;
步驟4,根據獲得的硬約束,對子圖施加相應的軟約束,用圖割將硬約束傳播到整個子圖,進而得到子圖的最優分割;
步驟5,將得到的最優分割的子圖合并得到整體的文本分割圖像。
2.如權利要求1所述的方法,其特征在于,所述步驟1具體為:
求取原始文本塊圖像的邊緣圖像,對邊緣圖像進行連通域分析得到“種子”子圖,依據所述“種子”子圖將原始文本塊圖像粗分為若干個子圖。
3.如權利要求2所述的方法,其特征在于,依據“種子”子圖將原始文本塊圖像粗分為若干個子圖時,為保證信息的完整性,對于“種子”子圖區域以外的所有區域部分采用強制分割,以確保所有文字都會分割在子圖中。
4.如權利要求1所述的方法,其特征在于,所述步驟2中判斷子圖的極性具體為:
對每個子圖進行初始二值化,統計子圖文字的筆畫寬度,以及子圖膨脹及腐蝕后文字的筆畫寬度,如果子圖膨脹后文字的筆畫變寬、腐蝕后筆畫變細,則該子圖的極性為1,反之為0。
5.如權利要求1所述的方法,其特征在于,所述步驟2中確定整個文本塊圖像的極性具體為:
根據子圖的極性,通過投票決定整個文本塊圖像的極性。
6.如權利要求1所述的方法,其特征在于,所述步驟3具體包括:
根據字符筆畫所具有的特征,分別水平、垂直掃描各個子圖,得到對應于每個子圖的亮度變化波形圖;
根據亮度變化波形圖及文本塊圖像的極性確定候選前景點及背景點;
對候選前景點及背景點進行聚類,取離聚類中心點較近的前景、背景點作為圖割的硬約束點。
7.如權利要求1所述的方法,其特征在于,所述步驟4中的軟約束為圖割的損失函數,所述損失函數E(L)包括區域損失R(L)和邊界損失B(L):
?????????????????E(L)=λR(L)+B(L),
其中,λ為R(L)與B(L)之間的比重關系。
8.如權利要求7所述的方法,其特征在于,區域損失R(L)是將某個像素劃分為前景或者背景所帶來的損失:
其中,p為圖中的某一節點;Lp為節點p的分割標簽;每個像素的區域損失Rp(Lp)包括兩部分:
??????????????????????Rp(Lp)=Rp(0)+Rp(1),
其中,Rp(1)是將此像素劃分為前景的損失,Rp(0)是將此像素劃分為背景的損失。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110322549.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:花箱支承框裝置
- 下一篇:一種移動終端組合式電路板及其組裝方法





