[發明專利]一種網絡動畫中的文字定位及識別方法有效

申請號：	201010111374.2	申請日：	2010-02-10
公開（公告）號：	CN102147863A	公開（公告）日：	2011-08-10
發明（設計）人：	張樹武;劉杰;梁偉	申請（專利權）人：	中國科學院自動化研究所
主分類號：	G06K9/20	分類號：	G06K9/20;G06K9/46
代理公司：	中科專利商標代理有限責任公司 11021	代理人：	梁愛榮
地址：	100080 ***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種網絡動畫中的文字定位識別方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種網絡動畫中的文字定位及識別方法，其特征在于，將網絡動畫結構分析技術與光學字符識別技術結合，直接提取網絡動畫文件中的編碼內嵌文字，并利用一種基于連通域的啟發合并、特征聚類的兩階段文字定位算法定位非內嵌文字，利用一種基于筆畫寬度直方圖的噪聲過濾算法去除非文字連通域，最后利用基于梯度直方圖特征識別非內嵌文字，該方法的步驟為：

步驟S1：利用網絡動畫結構分析技術，分析給定網絡動畫文件的內容，如果存在DefineText標簽，DefineText2標簽之一，則將其中TextRecords域中FontID所定義的編碼內嵌文字直接提取出來；

步驟S2：利用網絡動畫結構分析技術，將網絡動畫分解為若干基本形狀，再將基本形狀轉化為無失真壓縮圖像；基本形狀是構成網絡動畫的元素，它包含網絡動畫中的全部非內嵌文字且背景更加簡單，從而提高光學字符識別技術的準確性；

步驟S3：針對每個基本形狀轉化后的圖像，利用基于連通域的啟發合并、特征聚類的兩階段文字定位算法，將基本形狀中的非內嵌文字圖像準確定位，獲得非內嵌文字定位圖像和錯誤定位的非文字連通圖像；

步驟S4：利用基于筆畫寬度直方圖的噪聲過濾算法，將上述錯誤定位出的非文字連通域圖像過濾掉；

步驟S5：利用基于梯度直方圖特征識別非內嵌文字，最后將識別出的非內嵌文字與編碼內嵌文字返回給用戶。

2.根據權利要求1所述的網絡動畫中的文字定位及識別方法，其特征在于，所述分解若干基本形狀的具體步驟包括：

步驟S21：首先讀取網絡動畫文件的頭信息：簽名、版本、文件大小、幀的大小、幀率、幀數、背景色；

步驟S22：根據網絡動畫文件的頭信息，如果是壓縮格式，則對網絡動畫文件進行解壓，并轉入步驟23，如果不是壓縮格式，則直接轉入步驟23；

步驟S23：讀取下一個標簽頭部信息，判斷是否為End標簽，如果是，結束系統，如果不是，轉入步驟S24；

步驟S24：判斷標簽是否為DefineShape標簽、DefineShape2標簽、DefineShape3標簽、DefineShape4標簽之一，如果是，則轉入步驟S25，如果不是，則返回到步驟S23；

步驟S25：創建一個網絡動畫文件，按照上述標簽頭部信息指定的長度，將原網絡動畫文件中的對應內容寫入新的網絡動畫文件中，從而分解出基本形狀。

3.根據權利要求1所述的網絡動畫中的文字定位及識別方法，其特征在于，將所述基本形狀轉化為無失真壓縮圖像的具體步驟是：將每個基本形狀轉化為背景色相反的兩幅圖像，然后選擇兩幅圖像中前景區域大、反差強烈的圖像進行文字定位及識別。

4.根據權利要求1或2所述的網絡動畫中的文字定位及識別方法，其特征在于，所述文字定位步驟是：

步驟S41：在文字區域顏色一致的假設前提下，通過顏色聚類將圖像分割成若干的顏色層，并在每個圖像顏色層上定位非內嵌文字，同時用顏色聚類可去除文字顏色漸變的不利影響；

步驟S42：利用文字特點設計啟發規則，該啟發規則在保證無錯的前提下，先正確地將若干符合啟發規則的連通域合并成非內嵌文字；

步驟S43：再利用連通域的寬、高及寬高比的特征進行聚類，若屬于某個特征的連通域的數目足夠多，則認為該特征是有意義的文字連通域特征，反之則認為是無意義的連通域特征；

步驟S44：利用步驟33確定的有意義的文字連通域特征，誘導其它連通域進行合并，當若干連通域就近結合且符合有意義的文字連通域特征，則認為該連通域是非內嵌文字，從而準確地將非內嵌文字定位出來。

5.根據權利要求1所述的網絡動畫中的文字定位及識別方法，其特征在于，所述基于筆畫寬度直方圖的噪聲過濾的具體步驟是：

步驟S51：利用文字連通域的筆畫寬度相對穩定，而噪聲連通域的寬度變化較大的特點，對連通域建立水平方向與垂直方向的筆畫寬度直方圖；

步驟S52：對兩個直方圖分別進行聚類，如果兩個直方圖的峰值的頻率足夠多且相差不大，則認為該連通域是非內嵌文字，反之，則認為是噪聲。

6.根據權利要求1所述的網絡動畫中的文字定位及識別方法，其特征在于，所述連通域的啟發合并，是初始化一個連通域鏈表，將連通域中所有符合以下啟發式規則之一的連通域合并，該啟發式規則具體步驟包括如下：

規則a：

Area(i∩j)min(Area(i),Area(j))>0.5,]]>

其中：Area(i)和Area(j)分別表示恰好包含連通域i和j的矩形面積，min(Area(i)，Area(j))則表示二者中的較小值，Area(i∩j)表示他們相交區域的面積；

規則b：

W(i∪j)H(i∪j)<1.2andH(i∪j)W(i∪j)<1.2andDis(i,j)<Tdis,]]>

其中：W(i∪j)和H(i∪j)分別代表包含連通域i和j的矩形的寬和高，而Dis(i，j)則表示他們之間中心的距離，T_dis是一個自適應的閾值，自適應的閾值與包含連通域i和j的矩形的最小寬或高成正比，其定義如下：

T_dis＝min(W(i)，H(i)，W(j)，H(j))×a，

其中：a是一個放大系數，在實驗中被設置為2.3。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所，未經中國科學院自動化研究所許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201010111374.2/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種基于參數化多普勒瞬態模型的列車輪對軸承故障瞬態特征檢測方法
下一篇：一種驅動微博信息的方法

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06K 數據識別；數據表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復掃描圖形的方法
G06K9-18 .應用具有附加代碼標記或含有代碼標記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預處理，即無須判定關于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】