[發明專利]一種基于骨架指導的文字圖像矢量化方法及系統有效
| 申請號: | 201410047304.3 | 申請日: | 2014-02-11 |
| 公開(公告)號: | CN103942552B | 公開(公告)日: | 2017-02-08 |
| 發明(設計)人: | 潘婉瓊;連宙輝;唐英敏;肖建國 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06K9/40 | 分類號: | G06K9/40 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙)11200 | 代理人: | 余長江 |
| 地址: | 100871 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 骨架 指導 文字 圖像 矢量 方法 系統 | ||
技術領域
本發明涉及一種圖像矢量化方法及系統,具體涉及一種圖像去噪、圖像增強、生成圖像骨架、邊緣檢測和曲線擬合的方法進行基于骨架指導的文字圖像矢量化方法及系統,屬于計算機圖像處理技術領域。
背景技術
書法是中國上下五千年文明歷史中的珍貴文化瑰寶,被譽為:無言的詩,無行的舞,無圖的畫,無聲的樂。從甲骨文、金文演變而為大篆、小篆、隸書,至東漢、魏、晉的草書、楷書、行書諸體,書法一直散發著獨特的藝術魅力。
中國書法歷史悠久,書體沿革流變,書法藝術美麗迷人。隨著科技的發展,為了更好的保護書法作品,常常需要將其電子化。但是由于書法常常是刻在石碑,或者是用毛筆寫在宣紙上,掃描得到的書法文字都包含大量的噪聲,并且常存在筆畫斷裂的情況。這就需要矢量化算法能夠對噪聲有極大的魯棒性,并且在去除噪聲的同時,要選擇性的保留原有書法作品中的筆畫細節。
圖像的矢量化是指將位圖圖像轉換成矢量圖的一種技術:位圖由一個一個的像素組成,伸縮后會產生鋸齒狀的噪聲;矢量圖是由數學公式表示的曲線組成,具有伸縮不變形。由于字體在使用的過程中常常需要不同的字號,因此幾乎所有的字庫都是用矢量化的文字輪廓表示的。
傳統商業公司在進行書法文字圖像的矢量化時,為了使得矢量化的效果更好,常常加入一些人工的干預和指導,這就加大了矢量化的成本,并且減慢了矢量化的速度。
現有的自動化矢量化方法和系統中,對于所有輸入的圖像都采用完全相同的處理算法,從不進行圖像內容分析,也不關注圖像自身的特征,導致這些方法很難區分出圖像中的噪聲和細節特征,如果去除所有的噪聲,那么圖像的細節也會同時被丟失;如果保留太多細節的話,噪聲會使得結果顯得很不美觀,失去了矢量化的意義。
發明內容
本發明的目的在于提出了一種基于骨架指導的文字圖像矢量化方法和系統,可以有效的解決筆畫的斷裂問題,并在保持文字重要細節特征的前提下,選擇性的去除文字輪廓上的鋸齒噪聲。
為了實現上述目的,本發明采用的技術方案如下:
一種基于骨架指導的文字圖像矢量化的方法,其步驟包括:
1)對單個文字圖像進行預處理,包括文字圖像的二值化、文字筆畫的連接和文字邊緣的平滑;
2)獲取預處理后單個文字圖像的骨架信息,所述骨架信息包括骨架、骨架點以及骨架上的關鍵點;
3)提取出文字圖像的邊緣輪廓,并找出邊緣輪廓上的曲率極值點,然后根據骨架上的關鍵點將曲率極值點劃分為:角點和連接點;
4)從上述角點和連接點中篩選出最優的輪廓分割點,所述最優的輪廓分割點將文字圖像的邊緣輪廓劃分為若干輪廓段,每個單獨的輪廓段都使用一條貝塞爾曲線進行曲線擬合,同時使曲線擬合過程中連接點處的曲率連續,最終得到矢量化的文字輪廓。
本發明中,對于輸入圖像的格式顏色和分辨率無任何的要求,可以是手機拍攝的圖像,也可以是掃描得到的圖像。
更進一步,所述對單個文字圖像進行預處理,包括以下幾個步驟:
1)圖像二值化;
2)使用數學形態學中的膨脹算法,對圖像進行膨脹操作,連接斷裂的筆畫;
3)使用各項異性擴散算法,平滑文字輪廓;
4)使用形態學中的腐蝕算法,對圖像進行腐蝕操作,消除由于膨脹算法引起的筆畫寬度變化影響;
5)使用各項異性擴散算法,進一步的平滑文字輪廓。
進一步地,通過骨架增長算法獲取預處理后單個文字圖像的骨架及骨架點,然后使用關鍵點檢測算法得到骨架上的關鍵點,所述關鍵點檢測算法包括Harris角點檢測算法。
進一步地,使用邊緣檢測算法提取出文字圖像的邊緣輪廓及邊緣輪廓上的輪廓點,從所述輪廓點中找出邊緣輪廓中的曲率極值點,所述邊緣檢測算法包括Sobel算子,Canny算子。
更進一步,所述曲率極值點劃分,具體包括以下步驟:
1)得到文字圖像的骨架和骨架上的關鍵點之后,在文字圖像的邊緣輪廓中,為骨架中的每個關鍵點P劃分一個半徑為DisT的圓形區域R。
2)DisT的值等于關鍵點P到最近d個輪廓點的平均距離,d為在關鍵點P的八鄰域中的骨架點的個數。這些值都可以通過算法自動計算得到,不需要預先設定。
3)在區域R內的曲率極值點被選為角點,剩下的曲率極值點作為連接點。
更進一步,使用加權的動態規劃算法對曲率極值點進行篩選,得到最優的輪廓分割點。具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410047304.3/2.html,轉載請聲明來源鉆瓜專利網。





