[發(fā)明專利]一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010050067.1 | 申請(qǐng)日: | 2020-01-17 |
| 公開(公告)號(hào): | CN111274762A | 公開(公告)日: | 2020-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 朱倩倩;車文剛;苗晗;廖江福 | 申請(qǐng)(專利權(quán))人: | 昆明理工大學(xué) |
| 主分類號(hào): | G06F40/109 | 分類號(hào): | G06F40/109;G06F40/151;G06K9/34;G06K9/62 |
| 代理公司: | 北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 650504 云南*** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 經(jīng)典 文獻(xiàn) 多樣性 字體 計(jì)算機(jī) 表達(dá) 方法 | ||
本發(fā)明公開了一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法,屬于藏文信息處理技術(shù)領(lǐng)域,本發(fā)明首先收集藏經(jīng)典文獻(xiàn)的原材料,根據(jù)文獻(xiàn)版面布局進(jìn)行藏文字分割,根據(jù)字體全局特征和局部特征對(duì)分割的藏文字進(jìn)行字體風(fēng)格分類,獲取文獻(xiàn)中不同風(fēng)格的字體集,進(jìn)而根據(jù)作者的偏好建立偏態(tài)分布模型,實(shí)現(xiàn)計(jì)算機(jī)的多樣性表達(dá),實(shí)現(xiàn)經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)化。本發(fā)明解決了用計(jì)算機(jī)字體來表達(dá)經(jīng)典藏文文獻(xiàn)中多樣性字體的問題,實(shí)現(xiàn)計(jì)算機(jī)字體的多樣性表達(dá),實(shí)現(xiàn)經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)化。
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法,屬于藏文信息處理技術(shù)領(lǐng)域。
背景技術(shù)
藏文有一千多年的歷史,流傳下來大量經(jīng)典文獻(xiàn)。如敦煌古藏文文獻(xiàn)、《大藏經(jīng)》為代表的佛教典籍等這些文獻(xiàn)無論從歷史、政治、宗教、文化等角度均有重要的價(jià)值。目前對(duì)這些文獻(xiàn)的保存方式有兩種:掃描成數(shù)字圖像保存,它保留了原版文獻(xiàn)的細(xì)節(jié),但是這種保存方式需要處理的數(shù)據(jù)量巨大,且不能實(shí)現(xiàn)基本的計(jì)算機(jī)文字信息處理功能;保存成電子文檔,計(jì)算機(jī)生成統(tǒng)一的字體之后,這些文獻(xiàn)成為可編輯、共享電子文檔。計(jì)算機(jī)字體的使用,丟失了原版文獻(xiàn)中具有文化背景和歷史意義的特色字體,喪失了字體的多樣性和字形的美感。
目前,北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所提出風(fēng)格學(xué)習(xí)算法自動(dòng)生成大規(guī)模手寫字體;清華大學(xué)提出了Style-Aware Auto-Encoder,SA-VAE框架,僅僅通過觀察一個(gè)或者少數(shù)樣本來生成不同風(fēng)格的漢字。這些方式生成的計(jì)算機(jī)手寫字體,只還原了用戶書寫的一種字體,仍然沒有實(shí)現(xiàn)手寫字體的多樣性和離散性。
發(fā)明內(nèi)容
本發(fā)明公開了一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法,實(shí)現(xiàn)計(jì)算機(jī)字體多樣性表達(dá),生成用戶偏愛的具有多樣性和離散性字體的藏文經(jīng)典文獻(xiàn)文檔。
本發(fā)明的技術(shù)方案是:一種基于藏經(jīng)典文獻(xiàn)中多樣性字體的計(jì)算機(jī)表達(dá)方法,所述方法包括以下步驟:
Step1、收集、歸納、整理要研究的藏經(jīng)典文獻(xiàn)的原始影印資料;
Step2、將整理的藏文經(jīng)典文獻(xiàn)原始影印資料掃描到計(jì)算機(jī),生成文稿圖像材料;
Step3、對(duì)文稿圖像做去噪聲、去邊框、傾斜等處理;
Step4、根據(jù)文稿圖像的行列布局情況進(jìn)行不同的算法分割,分割成單一的藏文字符圖像;
Step5、提取文稿圖像中不同風(fēng)格的字體;
Step6、根據(jù)經(jīng)文中產(chǎn)生不同風(fēng)格的字體的特點(diǎn),建立多樣性表達(dá)模型;
Step7、將從文稿中提取的N套字體根據(jù)用戶偏好的不同,建立偏態(tài)分布字體模型;
Step8、根據(jù)文稿中字體的多樣性和離散性的特點(diǎn),提出字體多樣性表達(dá)算法;
Step9、以Microsoft Himalaya字體的電子版作為經(jīng)典文獻(xiàn)的標(biāo)準(zhǔn)文檔,根據(jù)偏態(tài)分布字體模型,將經(jīng)典文獻(xiàn)中的Microsoft Himalaya字體逐一替換為文稿中提取出來的多種風(fēng)格的字體,實(shí)現(xiàn)計(jì)算機(jī)字體多樣性表達(dá),生成具有多樣性和離散性字體的藏文經(jīng)典文獻(xiàn)。
進(jìn)一步地,步驟Step4中所述文稿圖像的行列布局分為以下三種情況:行列間距明顯的情況、行列間有重合但是不粘連的情況、行列間存在粘連的情況。
進(jìn)一步地,所述步驟Step4的具體步驟如下:
Step4.1、對(duì)文稿圖像進(jìn)行投影分割,
公式(1)為圖像在V(x,y)點(diǎn)的像素值,黑色(前景)像素值為1,白色(背景)像素值為0,然后對(duì)圖像做行(列)投影處理,統(tǒng)計(jì)投影和為0的行(列),就是行(列)間空隙線,以此坐標(biāo)作為圖像分割點(diǎn),進(jìn)行圖像的粗分割;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010050067.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 單纖量子密鑰分配系統(tǒng)中經(jīng)典信號(hào)的驅(qū)動(dòng)與探測甄別系統(tǒng)及方法
- 一種東巴經(jīng)典古籍傳承體系數(shù)字化國際共享平臺(tái)
- 單纖融合量子密鑰分發(fā)系統(tǒng)、方法及相關(guān)系統(tǒng)、方法
- 一種經(jīng)典光強(qiáng)自調(diào)節(jié)量子信號(hào)與經(jīng)典信號(hào)復(fù)用的傳輸系統(tǒng)
- 一種經(jīng)典光強(qiáng)自調(diào)節(jié)量子信號(hào)與經(jīng)典信號(hào)復(fù)用的傳輸系統(tǒng)
- 量子密鑰分發(fā)系統(tǒng)的經(jīng)典信號(hào)編解碼方法、同步方法及裝置
- 量子-經(jīng)典信號(hào)共纖傳輸型QKD系統(tǒng)發(fā)射裝置
- 一種量子與經(jīng)典混合云平臺(tái)以及任務(wù)執(zhí)行方法
- 量子-經(jīng)典信號(hào)共纖傳輸型QKD系統(tǒng)發(fā)射裝置
- 混合型量子計(jì)算機(jī)架構(gòu)及其執(zhí)行計(jì)算任務(wù)的方法
- PDF科技文獻(xiàn)管理系統(tǒng)及其方法
- 建立新舊文獻(xiàn)代替關(guān)系的方法及裝置
- 一種自動(dòng)標(biāo)注文獻(xiàn)作廢的方法和裝置
- 一種新型的中文科技文獻(xiàn)半自動(dòng)標(biāo)引方法
- 文獻(xiàn)歸一方法、文獻(xiàn)搜索方法及對(duì)應(yīng)裝置
- 文獻(xiàn)價(jià)值評(píng)估方法和裝置
- 一種基于引用次數(shù)的文獻(xiàn)推薦方法
- 一種多語種文獻(xiàn)分類方法、裝置及存儲(chǔ)介質(zhì)
- 一種文獻(xiàn)標(biāo)簽的識(shí)別方法及裝置
- 一種基于文檔數(shù)據(jù)分析的在線文獻(xiàn)歸納和儲(chǔ)存系統(tǒng)





