[發明專利]一種圖片中文字區域的獲取方法及裝置有效
| 申請號: | 201210153810.1 | 申請日: | 2012-05-17 |
| 公開(公告)號: | CN103425980B | 公開(公告)日: | 2017-06-06 |
| 發明(設計)人: | 王暉;謝曉境 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 吳貴明,張永明 |
| 地址: | 518044 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖片 文字 區域 獲取 方法 裝置 | ||
1.一種圖片中文字區域的獲取方法,其特征在于,所述方法包括:
對當前圖片進行預處理;
對預處理后的圖片進行角點處理,所述角點處理包括角點獲取、角點濾波以及角點聚類;
獲取角點處理后的連通區域,將所述連通區域作為文字區域輸出;
將所述圖片劃分成多個區域,為每個區域設置不同的權值,并根據所設置的權值,計算所述文字區域的加權和。
2.如權利要求1所述的方法,其特征在于,所述預處理包括二值化處理以及以下至少一種:噪點去除、明度增強、尺寸歸一化、圖像馬賽克。
3.如權利要求1所述的方法,其特征在于,所述角點獲取具體包括:
根據預設模板,判斷公式一的結果值是否小于第一閾值,若否,繼續判斷公式二的結果值是否小于第二閾值,若否,則判定所述預設模板內的中心點為角點,獲取所述中心點,其中所述預設模板為3×3模板:
公式一:R1=min(rA,rB),其中rA=(fA–fC)2+(fA1–fC)2,rB=(fB–fC)2+(fB1–fC)2,A、B、C、A1、B1表示像素點,C表示中心點,f表示像素點的亮度分量;
公式二:R2=M–N2/Z,其中M=rA,N=min(X1,X2),Z=rB–rA–2×N,X1=(fB–fA)×(fA–fC)+(fB1–fA1)×(fA1–fC),X2=(fB–fA1)×(fA1–fC)+(fB1–fA)×(fA–fC);
所述角點濾波具體包括:
計算角點獲取后圖片上每一行的角點數,當所述角點數小于第三閾值時,刪除該行的所有角點;或者計算預設模板覆蓋塊內的角點數,當所述角點數小于所述模板覆蓋塊的閾值時,刪除所述模板覆蓋塊內的所有角點數;
所述角點聚類具體包括:
連接角點距離小于或者等于第四閾值的兩個角點。
4.如權利要求1所述的方法,其特征在于,所述獲取角點處理后的連通區域,將所述連通區域作為文字區域輸出具體包括:
獲取角點聚類后的連通線段,并合并獲取后的所有連通線段,獲得連通區域;
刪除所述連通區域中的重疊部分;
將刪除重疊部分的連通區域作為文字區域輸出,
其中,獲取角點聚類后的連通線段包括:判斷預設的模板塊中的角點數是否大于預設閾值,若是,則判定所述模板塊內的角點屬于同一連通線段,提取所述連通線段。
5.一種圖片中文字區域的獲取裝置,其特征在于,所述裝置包括:
預處理單元,用于對當前圖片進行預處理;
角點處理單元,用于在所述預處理單元處理完后進行角點處理,所述角點處理包括角點獲取、角點濾波以及角點聚類;
輸出單元,用于獲取角點處理后的連通區域,將所述連通區域作為文字區域輸出;
權值計算單元,用于將所述圖片劃分成多個區域,為每個區域設置不同的權值,并根據所設置的權值,計算所述文字區域的加權和。
6.如權利要求5所述的裝置,其特征在于,所述預處理包括二值化處理以及以下至少一種:噪點去除、明度增強、尺寸歸一化、圖像馬賽克。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210153810.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:對視頻中的目標進行分類的方法和裝置
- 下一篇:信息顯示控制方法及移動終端





