[發(fā)明專利]一種交互式的自然場景文本檢測方法有效
| 申請?zhí)枺?/td> | 201310308807.7 | 申請日: | 2013-07-22 |
| 公開(公告)號: | CN103336961A | 公開(公告)日: | 2013-10-02 |
| 發(fā)明(設(shè)計)人: | 王春恒;胡僅龍;肖柏華;史存召;高嵩 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/38 |
| 代理公司: | 中科專利商標代理有限責(zé)任公司 11021 | 代理人: | 宋焰琴 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 交互式 自然 場景 文本 檢測 方法 | ||
1.一種交互式自然場景文本檢測方法,其特征在于,該方法包括以下步驟:
步驟1,輸入待檢測圖像;
步驟2,使用標記線在所述待檢測圖像中人為標記待檢測文字所在的區(qū)域,并以所述標記線為基準進行擴展,得到一擴展后的文本區(qū)域;
步驟3,對于所述擴展后的文本區(qū)域進行邊緣檢測,對邊緣檢測結(jié)果進行膨脹處理和連通域標記,判斷所得到的每個連通域是否為文字,并去除非文本連通域;
步驟4,對于去除非文本連通域后的文本區(qū)域,利用投影法得到由所述文本區(qū)域所包含的文本的邊緣組成的邊緣文本區(qū)域;
步驟5,對所述邊緣文本區(qū)域進行分塊二值化處理,并利用投影法和連通域標記得到粗略文本區(qū)域;
步驟6,將所述粗略文本區(qū)域進行分塊二值化處理,并將得到的二值化圖像進行反色,得到兩種二值化圖像;
步驟7,對所述兩種二值化圖像分別進行連通域標記,判斷所得到的每個連通域是否為文字,去除非文本連通域以及每個文字連通域中的各種噪聲;
步驟8,利用投影法確定所述步驟7得到的文本連通域所在位置的邊界,并統(tǒng)計所有文本連通域的數(shù)目;
步驟9,根據(jù)兩種二值化圖像所得到的文本連通域的數(shù)目確定圖像的極性,并對與此極性對應(yīng)的連通域進行融合,最終得到精確文本區(qū)域。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟2中,以所述標記線為基準進行擴展具體為:分別向上向下擴展待檢測圖像高度的1/3,向左向右擴展所述標記線長度的1/3。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟3中,根據(jù)以下規(guī)則判斷每個連通域是否為文字:
其中,Width,Height為擴展文本區(qū)域的寬度和高度;width_CoCo,height_CoCo為連通域的寬度和高度;top_CoCo,bottom_CoCo為連通域頂部和底部的位置;top_Line,bottom_Line為標記線頂部和底部的位置;Tw1,Tw2,Th1,Th2,Twh為連通域?qū)傩缘拈撝担?amp;&表示關(guān)系與操作。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟4中,從標記線開始向上下左右四個方向逐行掃描判斷是否為文本的邊緣,并根據(jù)以下規(guī)則判斷某一行或列是否為邊緣文本區(qū)域的邊界:
上下邊界:num_pixel_255<Trow*Width
左右邊界:num_pixel_255<Tcol*Height’
其中,num_pixel_255為所述邊緣文本區(qū)域中所有邊緣點的數(shù)目;Width,Height為所述邊緣文本區(qū)域的寬度和高度;Trow,Tcol為閾值。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟5進一步包括以下步驟:
步驟51,將所述邊緣文本區(qū)域分成多個子圖像塊,并對每個子圖像塊進行二值化,得到二值邊緣文本區(qū)域;
步驟52,對于所述二值邊緣文本區(qū)域,利用投影法得到所述二值邊緣文本區(qū)域的邊界;
步驟53,對于得到的區(qū)域再進行連通域標記,判斷所得到的每個連通域是否為文字,并去除非文本連通域,得到粗略文本區(qū)域。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述步驟53中,根據(jù)以下規(guī)則判斷每個連通域是否為文字:
其中,Width,Height為所述步驟52得到的區(qū)域的寬度和高度;width_CoCo,height_CoCo為連通域的寬度和高度;left_CoCo,right_CoCo,top_CoCo,bottom_CoCo為連通域的左邊、右邊、頂部和底部的位置;left_Line,right_Line,top_Line,bottom_Line為標記線的左邊、右邊、頂部和底部的位置;Tw,Twh為連通域?qū)傩缘拈撝怠?/p>
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310308807.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





