[發(fā)明專利]一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法在審

申請(qǐng)?zhí)枺?/td>	202010050067.1	申請(qǐng)日：	2020-01-17
公開（公告）號(hào)：	CN111274762A	公開（公告）日：	2020-06-12
發(fā)明（設(shè)計(jì)）人：	朱倩倩;車文剛;苗晗;廖江福	申請(qǐng)（專利權(quán)）人：	昆明理工大學(xué)
主分類號(hào)：	G06F40/109	分類號(hào)：	G06F40/109;G06F40/151;G06K9/34;G06K9/62
代理公司：	北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350	代理人：	湯東鳳
地址：	650504 云南***	國省代碼：	云南;53
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于經(jīng)典文獻(xiàn) 多樣性字體計(jì)算機(jī) 表達(dá) 方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法，屬于藏文信息處理技術(shù)領(lǐng)域，本發(fā)明首先收集藏經(jīng)典文獻(xiàn)的原材料，根據(jù)文獻(xiàn)版面布局進(jìn)行藏文字分割，根據(jù)字體全局特征和局部特征對(duì)分割的藏文字進(jìn)行字體風(fēng)格分類，獲取文獻(xiàn)中不同風(fēng)格的字體集，進(jìn)而根據(jù)作者的偏好建立偏態(tài)分布模型，實(shí)現(xiàn)計(jì)算機(jī)的多樣性表達(dá)，實(shí)現(xiàn)經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)化。本發(fā)明解決了用計(jì)算機(jī)字體來表達(dá)經(jīng)典藏文文獻(xiàn)中多樣性字體的問題，實(shí)現(xiàn)計(jì)算機(jī)字體的多樣性表達(dá)，實(shí)現(xiàn)經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)化。

技術(shù)領(lǐng)域

本發(fā)明涉及一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法，屬于藏文信息處理技術(shù)領(lǐng)域。

背景技術(shù)

藏文有一千多年的歷史，流傳下來大量經(jīng)典文獻(xiàn)。如敦煌古藏文文獻(xiàn)、《大藏經(jīng)》為代表的佛教典籍等這些文獻(xiàn)無論從歷史、政治、宗教、文化等角度均有重要的價(jià)值。目前對(duì)這些文獻(xiàn)的保存方式有兩種：掃描成數(shù)字圖像保存，它保留了原版文獻(xiàn)的細(xì)節(jié)，但是這種保存方式需要處理的數(shù)據(jù)量巨大，且不能實(shí)現(xiàn)基本的計(jì)算機(jī)文字信息處理功能；保存成電子文檔，計(jì)算機(jī)生成統(tǒng)一的字體之后，這些文獻(xiàn)成為可編輯、共享電子文檔。計(jì)算機(jī)字體的使用，丟失了原版文獻(xiàn)中具有文化背景和歷史意義的特色字體，喪失了字體的多樣性和字形的美感。

目前，北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所提出風(fēng)格學(xué)習(xí)算法自動(dòng)生成大規(guī)模手寫字體；清華大學(xué)提出了Style-Aware Auto-Encoder,SA-VAE框架，僅僅通過觀察一個(gè)或者少數(shù)樣本來生成不同風(fēng)格的漢字。這些方式生成的計(jì)算機(jī)手寫字體，只還原了用戶書寫的一種字體，仍然沒有實(shí)現(xiàn)手寫字體的多樣性和離散性。

發(fā)明內(nèi)容

本發(fā)明公開了一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法，實(shí)現(xiàn)計(jì)算機(jī)字體多樣性表達(dá)，生成用戶偏愛的具有多樣性和離散性字體的藏文經(jīng)典文獻(xiàn)文檔。

本發(fā)明的技術(shù)方案是：一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法，所述方法包括以下步驟：

Step1、收集、歸納、整理要研究的藏經(jīng)典文獻(xiàn)的原始影印資料；

Step2、將整理的藏文經(jīng)典文獻(xiàn)原始影印資料掃描到計(jì)算機(jī)，生成文稿圖像材料；

Step3、對(duì)文稿圖像做去噪聲、去邊框、傾斜等處理；

Step4、根據(jù)文稿圖像的行列布局情況進(jìn)行不同的算法分割，分割成單一的藏文字符圖像；

Step5、提取文稿圖像中不同風(fēng)格的字體；

Step6、根據(jù)經(jīng)文中產(chǎn)生不同風(fēng)格的字體的特點(diǎn)，建立多樣性表達(dá)模型；

Step7、將從文稿中提取的N套字體根據(jù)用戶偏好的不同，建立偏態(tài)分布字體模型；

Step8、根據(jù)文稿中字體的多樣性和離散性的特點(diǎn)，提出字體多樣性表達(dá)算法；

Step9、以Microsoft Himalaya字體的電子版作為經(jīng)典文獻(xiàn)的標(biāo)準(zhǔn)文檔，根據(jù)偏態(tài)分布字體模型，將經(jīng)典文獻(xiàn)中的Microsoft Himalaya字體逐一替換為文稿中提取出來的多種風(fēng)格的字體，實(shí)現(xiàn)計(jì)算機(jī)字體多樣性表達(dá)，生成具有多樣性和離散性字體的藏文經(jīng)典文獻(xiàn)。

進(jìn)一步地，步驟Step4中所述文稿圖像的行列布局分為以下三種情況：行列間距明顯的情況、行列間有重合但是不粘連的情況、行列間存在粘連的情況。

進(jìn)一步地，所述步驟Step4的具體步驟如下：

Step4.1、對(duì)文稿圖像進(jìn)行投影分割，

公式(1)為圖像在V(x,y)點(diǎn)的像素值，黑色(前景)像素值為1，白色(背景)像素值為0，然后對(duì)圖像做行(列)投影處理，統(tǒng)計(jì)投影和為0的行(列)，就是行(列)間空隙線，以此坐標(biāo)作為圖像分割點(diǎn)，進(jìn)行圖像的粗分割；

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué)，未經(jīng)昆明理工大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010050067.1/2.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種用于大型熱處理爐爐溫均勻性測量中的布點(diǎn)方法
下一篇：一種防火墻安全策略的調(diào)整方法及裝置

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】