[發明專利]一種網絡動畫中的文字定位及識別方法有效
| 申請號: | 201010111374.2 | 申請日: | 2010-02-10 |
| 公開(公告)號: | CN102147863A | 公開(公告)日: | 2011-08-10 |
| 發明(設計)人: | 張樹武;劉杰;梁偉 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 梁愛榮 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 動畫 中的 文字 定位 識別 方法 | ||
1.一種網絡動畫中的文字定位及識別方法,其特征在于,將網絡動畫結構分析技術與光學字符識別技術結合,直接提取網絡動畫文件中的編碼內嵌文字,并利用一種基于連通域的啟發合并、特征聚類的兩階段文字定位算法定位非內嵌文字,利用一種基于筆畫寬度直方圖的噪聲過濾算法去除非文字連通域,最后利用基于梯度直方圖特征識別非內嵌文字,該方法的步驟為:
步驟S1:利用網絡動畫結構分析技術,分析給定網絡動畫文件的內容,如果存在DefineText標簽,DefineText2標簽之一,則將其中TextRecords域中FontID所定義的編碼內嵌文字直接提取出來;
步驟S2:利用網絡動畫結構分析技術,將網絡動畫分解為若干基本形狀,再將基本形狀轉化為無失真壓縮圖像;基本形狀是構成網絡動畫的元素,它包含網絡動畫中的全部非內嵌文字且背景更加簡單,從而提高光學字符識別技術的準確性;
步驟S3:針對每個基本形狀轉化后的圖像,利用基于連通域的啟發合并、特征聚類的兩階段文字定位算法,將基本形狀中的非內嵌文字圖像準確定位,獲得非內嵌文字定位圖像和錯誤定位的非文字連通圖像;
步驟S4:利用基于筆畫寬度直方圖的噪聲過濾算法,將上述錯誤定位出的非文字連通域圖像過濾掉;
步驟S5:利用基于梯度直方圖特征識別非內嵌文字,最后將識別出的非內嵌文字與編碼內嵌文字返回給用戶。
2.根據權利要求1所述的網絡動畫中的文字定位及識別方法,其特征在于,所述分解若干基本形狀的具體步驟包括:
步驟S21:首先讀取網絡動畫文件的頭信息:簽名、版本、文件大小、幀的大小、幀率、幀數、背景色;
步驟S22:根據網絡動畫文件的頭信息,如果是壓縮格式,則對網絡動畫文件進行解壓,并轉入步驟23,如果不是壓縮格式,則直接轉入步驟23;
步驟S23:讀取下一個標簽頭部信息,判斷是否為End標簽,如果是,結束系統,如果不是,轉入步驟S24;
步驟S24:判斷標簽是否為DefineShape標簽、DefineShape2標簽、DefineShape3標簽、DefineShape4標簽之一,如果是,則轉入步驟S25,如果不是,則返回到步驟S23;
步驟S25:創建一個網絡動畫文件,按照上述標簽頭部信息指定的長度,將原網絡動畫文件中的對應內容寫入新的網絡動畫文件中,從而分解出基本形狀。
3.根據權利要求1所述的網絡動畫中的文字定位及識別方法,其特征在于,將所述基本形狀轉化為無失真壓縮圖像的具體步驟是:將每個基本形狀轉化為背景色相反的兩幅圖像,然后選擇兩幅圖像中前景區域大、反差強烈的圖像進行文字定位及識別。
4.根據權利要求1或2所述的網絡動畫中的文字定位及識別方法,其特征在于,所述文字定位步驟是:
步驟S41:在文字區域顏色一致的假設前提下,通過顏色聚類將圖像分割成若干的顏色層,并在每個圖像顏色層上定位非內嵌文字,同時用顏色聚類可去除文字顏色漸變的不利影響;
步驟S42:利用文字特點設計啟發規則,該啟發規則在保證無錯的前提下,先正確地將若干符合啟發規則的連通域合并成非內嵌文字;
步驟S43:再利用連通域的寬、高及寬高比的特征進行聚類,若屬于某個特征的連通域的數目足夠多,則認為該特征是有意義的文字連通域特征,反之則認為是無意義的連通域特征;
步驟S44:利用步驟33確定的有意義的文字連通域特征,誘導其它連通域進行合并,當若干連通域就近結合且符合有意義的文字連通域特征,則認為該連通域是非內嵌文字,從而準確地將非內嵌文字定位出來。
5.根據權利要求1所述的網絡動畫中的文字定位及識別方法,其特征在于,所述基于筆畫寬度直方圖的噪聲過濾的具體步驟是:
步驟S51:利用文字連通域的筆畫寬度相對穩定,而噪聲連通域的寬度變化較大的特點,對連通域建立水平方向與垂直方向的筆畫寬度直方圖;
步驟S52:對兩個直方圖分別進行聚類,如果兩個直方圖的峰值的頻率足夠多且相差不大,則認為該連通域是非內嵌文字,反之,則認為是噪聲。
6.根據權利要求1所述的網絡動畫中的文字定位及識別方法,其特征在于,所述連通域的啟發合并,是初始化一個連通域鏈表,將連通域中所有符合以下啟發式規則之一的連通域合并,該啟發式規則具體步驟包括如下:
規則a:
其中:Area(i)和Area(j)分別表示恰好包含連通域i和j的矩形面積,min(Area(i),Area(j))則表示二者中的較小值,Area(i∩j)表示他們相交區域的面積;
規則b:
其中:W(i∪j)和H(i∪j)分別代表包含連通域i和j的矩形的寬和高,而Dis(i,j)則表示他們之間中心的距離,Tdis是一個自適應的閾值,自適應的閾值與包含連通域i和j的矩形的最小寬或高成正比,其定義如下:
Tdis=min(W(i),H(i),W(j),H(j))×a,
其中:a是一個放大系數,在實驗中被設置為2.3。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010111374.2/1.html,轉載請聲明來源鉆瓜專利網。





