[發明專利]一種基于生成式對抗網絡的書法字體自動生成算法在審
| 申請號: | 201811172321.4 | 申請日: | 2018-10-09 |
| 公開(公告)號: | CN109408776A | 公開(公告)日: | 2019-03-01 |
| 發明(設計)人: | 彭宏;張國洲;陳茹;王軍 | 申請(專利權)人: | 西華大學 |
| 主分類號: | G06F17/21 | 分類號: | G06F17/21;G06N3/04;G06N3/08 |
| 代理公司: | 四川君士達律師事務所 51216 | 代理人: | 芶忠義 |
| 地址: | 610039 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 書法字體 生成式 算法 印刷字體 自動生成 數據集 圖像 對抗 鑒別 計算損失函數 調整參數 神經網絡 生成圖像 輸出生成 書法風格 網絡參數 網絡收斂 網絡 反卷積 鑒別器 生成器 輸出帶 迭代 卷積 字體 送入 真偽 漢字 概率 重復 優化 | ||
一種基于生成式對抗網絡的書法字體自動生成算法,首先搭建兩個生成式對抗網絡,各自的生成器分別為G和F,G和F的鑒別器為Dy,Dx;再分別從印刷字體數據集X和書法字體數據集Y中提取minibatch,分別送入G和F中生成對應的書法字體圖像G(x)、印刷字體圖像F(y),再由Dy、Dx鑒別生成圖像為真的概率并計算損失函數,優化網絡參數;其次將G(x)輸入到F中、F(y)輸入到G中,經卷積、反卷積后輸出生成的F(G(x))、G(F(y)),再鑒別圖像真偽、計算損失,調整參數;四:重復至網絡收斂或達到迭代次數。本發明算法可以將任意一個輸入到訓練好的神經網絡中的漢字,均能輸出帶書法風格的字體。
技術領域
本發明屬于深度學習領域,具體涉及一種基于生成式對抗網絡的書法字體自動生成算法。
背景技術
在計算機中輸入一個漢字,選擇需要轉換的書法風格,最終的效果是輸出對應風格的書法字體,比如輸入一個正楷字“張”,選擇王羲之字體風格,輸出帶有王羲之字體風格的“張”字。
現有的字體風格轉換方法是,首先輸入需要轉換字體風格的漢字,比如‘張’,然后通過索引對應的書法字體數據庫,找到對應‘張’字的書法字體,最后輸出。其中書法字體風格數據庫是人工預先仿寫某一書法風格的常用漢字,比如仿寫王羲之風格的字體,之后掃描存入數據庫。這一方法的缺點有:第一、只能轉換預先已存入數據庫的字的字體風格,如果遇到沒有錄入的字體風格,只能輸出原字體;第二、這種方法是人工仿寫,并不能仿寫出真正帶有對應風格的字體(比如仿寫王羲之字體);第三、保存書法字體需要占用較大內存空間。
生成式對抗網絡(GAN)在圖像生成,圖像編輯,表征學習等方面都取得了很好的結果。原始GAN模型的主要目標是迫使判別模型D輔助生成模型G,產生與真實數據分布相似的偽數據,其中G和D一般為非線性映射函數,通常由多層感知機或卷積神經網絡等網絡結構來形式化。給定隨機噪聲變量z服從簡單分布Pz(z),生成模型G通過將z映射為G(z)隱式地定義了一個生成分布Pg來擬合真實樣本分布Pdata。判別模型D作為一個二分類器,分別以真實樣本x和生成樣本G(z)作為輸入,以一個標量值作為概率輸出,表示D對于當前輸入是真實數據還是生成的偽數據的置信度,以此來判斷G生成數據的好壞。當輸入為真實訓練樣本x~Pdata時,D(x)期望輸出高概率,當輸入為生成樣本G(z)時,D(G(z))期望輸出低概率,而對于G來說要盡可能使D(G(z))輸出高概率,讓D無法區分真實數據和生成數據。兩個模型交替訓練,從而形成競爭與對抗,整個優化過程可以視為一個極小極大博弈。
CycleGAN的方法建立在Isola等人的pix2pix框架上,pix2pix使用cGAN來學習從輸入到輸出的映射,但它依賴配對訓練數據。CycleGAN的創新點在于能夠在源域和目標域之間,無須建立訓練數據間一對一的映射,就可實現這種遷移。這種方法通過對原圖像進行兩步變換:首先將原圖像映射到目標域,然后再從目標域返回原圖像得到二次生成圖像,從而消除了在目標域中圖像配對的要求。使用生成器網絡將圖像映射到目標域,并且通過鑒別器(discriminator)提高該生成圖像的質量。
發明內容
本發明目的是提供一種基于生成式對抗網絡的書法字體自動生成算法,可以將任意一個輸入到訓練好的神經網絡中的漢字,均能輸出帶書法風格的字體。
本發明采取的技術方案是:
一種基于生成式對抗網絡的書法字體自動生成算法,包括以下步驟:
一:搭建兩個生成式對抗網絡,各自的生成器分別為G和F,其中,G的鑒別器為Dy,F的鑒別器為Dx;
二:分別從印刷字體數據集X和書法字體數據集Y中提取minibatch(梯度下降),并分別送入G和F中生成對應的書法字體圖像G(x)、印刷字體圖像F(y),再分別由Dy、Dx鑒別生成圖像為真的概率并計算損失函數,優化網絡參數;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西華大學,未經西華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811172321.4/2.html,轉載請聲明來源鉆瓜專利網。





