[發明專利]一種基于藏經典文獻中多樣性字體的計算機表達方法在審
| 申請號: | 202010050067.1 | 申請日: | 2020-01-17 |
| 公開(公告)號: | CN111274762A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 朱倩倩;車文剛;苗晗;廖江福 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F40/109 | 分類號: | G06F40/109;G06F40/151;G06K9/34;G06K9/62 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 650504 云南*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 經典 文獻 多樣性 字體 計算機 表達 方法 | ||
1.一種基于藏經典文獻中多樣性字體的計算機表達方法,其特征在于,所述方法包括以下步驟:
Step1、收集、歸納、整理要研究的藏經典文獻的原始影印資料;
Step2、將整理的藏文經典文獻原始影印資料掃描到計算機,生成文稿圖像材料;
Step3、對文稿圖像做去噪聲、去邊框、傾斜等處理;
Step4、根據文稿圖像的行列布局情況進行不同的算法分割,分割成單一的藏文字符圖像;
Step5、提取文稿圖像中不同風格的字體;
Step6、根據經文中產生不同風格的字體的特點,建立多樣性表達模型;
Step7、將從文稿中提取的N套字體根據用戶偏好的不同,建立偏態分布字體模型;
Step8、根據文稿中字體的多樣性和離散性的特點,提出字體多樣性表達算法;
Step9、以Microsoft Himalaya字體的電子版作為經典文獻的標準文檔,根據偏態分布字體模型,將經典文獻中的Microsoft Himalaya字體逐一替換為文稿中提取出來的多種風格的字體,實現計算機字體多樣性表達,生成具有多樣性和離散性字體的藏文經典文獻。
2.根據權利要求1所述的一種基于藏經典文獻中多樣性字體的計算機表達方法,其特征在于:
步驟Step4中所述文稿圖像的行列布局分為以下三種情況:行列間距明顯的情況、行列間有重合但是不粘連的情況、行列間存在粘連的情況。
3.根據權利要求2所述的一種基于藏經典文獻中多樣性字體的計算機表達方法,其特征在于:所述步驟Step4的具體步驟如下:
Step4.1、對文稿圖像進行投影分割,
公式(1)為圖像在V(x,y)點的像素值,黑色(前景)像素值為1,白色(背景)像素值為0,然后對圖像做行(列)投影處理,統計投影和為0的行(列),就是行(列)間空隙線,以此坐標作為圖像分割點,進行圖像的粗分割;
Step4.2、通過步驟Step4.1將文稿中行(列)有明顯間隔的部分分割完畢,對于行(列)間無明顯間隔的版面采取連通域分割方法,它是通過檢查各像素與其相鄰像素的連通性,將文本塊聯通,然后進行字符的分割;
Step4.3、通過步驟Step4.2將文稿中行(列)間有重合但又不粘連的文本塊分割完畢,考慮到文稿中行(列)間可能存在粘連的情況,采用改進的滴水法分割圖像,首先采用Zhang-Sueng提出的并行細化方法處理粘連字符,只保留圖像的拓撲結構,然后確定候選分割點,再通過自組織映射網絡確定最終分割路徑,實現粘連字符的分割。
4.根據權利要求1所述的一種基于藏經典文獻中多樣性字體的計算機表達方法,其特征在于:所述步驟Step5的具體步驟如下:
Step5.1、對分割的單一字符進行字符識別;
Step5.2、將文稿中提取的所有字符進行字體分類;
Step5.3、根據已經分類的不同風格的字體,生成字體庫文件;
Step5.4、將所有風格的字體裝入計算機備用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010050067.1/1.html,轉載請聲明來源鉆瓜專利網。





