[發明專利]一種基于云數據中心分布式詩歌生成方法有效
| 申請號: | 202110241954.1 | 申請日: | 2021-03-04 |
| 公開(公告)號: | CN112989812B | 公開(公告)日: | 2023-05-02 |
| 發明(設計)人: | 沈鴻;馬亮亮 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06F40/279 | 分類號: | G06F40/279;G06N20/00 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據中心 分布式 詩歌 生成 方法 | ||
1.一種基于云數據中心分布式詩歌生成方法,其特征在于,包括以下步驟:
S1:生成模型訓練;
S2:引入評價模型,利用評價模型來對步驟S1中的生成模型進行優化;
S3:利用步驟S2中優化后的生成模型進行詩歌生成;
所述步驟S1的具體過程是:
1)、預先訓練好的一個詞嵌入模型,將訓練集中每首詩的每個字映射到一個浮點向量,對該詞嵌入模型訓練時,維護一個以訓練數據中的一首詩的標題初始化的集合,作為模型的輸入,模型先以此將標題的每個字映射為向量然后輸入長短期記憶神經網絡中,最后輸出是一個向量,它表示生成的詩歌的第一個單詞,這個向量和本輪訓練用的詩中第一個字映射的詞向量進行比較,用來計算訓練損失;
2)、訓練用的詩的第一個字被添加到詞嵌入模型維護的輸入集合中,以生成下一個單詞;訓練過程一直在進行,直到一整首訓練用的詩被添加到輸入集中,然后繼續訓練下一首詩,直至達到使用者滿意的收斂程度,即訓練誤差降低到一定范圍以下;
所述步驟S2中,生成模型的優化過程是:
設置一個估值網絡,一個經驗緩沖區以及并行多個表演者網絡,每輪訓練學習者先同步自己的生成模型參數到每一個表演者網絡、同步自己的估值網絡參數到經驗緩沖區;然后每個表演者網絡各自開始隨機初始化題目然后生成詩歌,每生成一句詩就會與評價模型進行交流,評價模型會輸出一個負數的獎勵,然后生成模型將此時的生成詩、字選擇信息、獎勵值打包送給經驗緩沖區;緩沖區對經驗排序,最大者優先傳輸給學習者進行對生成模型的優化;
緩沖區對經驗排序的過程是:
經驗緩沖區對(R-Vθ(s))+的值從大到小排序,其中R表示獎勵值加上用生成詩輸入估值網絡的輸出,Vθ(s)表示生成此字之前的詩輸入估值網絡輸出,+表示取與0的最大值;
學習者中生成模型的損失函數使用近端策略優化損失,估值網絡使用(R-Vθ(s))+對網絡進行梯度下降。
2.根據權利要求1所述的基于云數據中心分布式詩歌生成方法,其特征在于,所述步驟S2中,評價模型的建立過程是:
訓練一個評價模型學習藝術作品的詞向量變化規律,該評價模型的訓練數據為宋詞、元曲的非詩數據;將訓練數據中每個詞或曲中的句子分為K組,K為生成模型所需要生成的詩的句數;該評價模型使用長短期記憶模型,在訓練時每輪訓練一首詞或曲,依次輸入K組中第i組,將此組中的每個字的詞向量之和作為特征輸入評價模型,輸出也為一個詞向量,與第i+1組的詞向量之和計算距離:
作為訓練誤差,以此反向傳播優化評價模型,其中M表示第i+1組中字的個數,vj是輸出的詞向量,vq是第i+1組中字的詞向量。
3.根據權利要求2所述的基于云數據中心分布式詩歌生成方法,其特征在于,所述步驟S2中,評價模型訓練結束后接受當前已生成詩為輸入,計算評價模型輸出的詞向量和新生成的一句詩的詞向量之和的距離,以此距離的負數作為評價獎勵返回給調用的單位。
4.根據權利要求3所述的基于云數據中心分布式詩歌生成方法,其特征在于,評價模型在句子層面上進行訓練,模仿宋詞、元曲中合理的內涵發展軌跡,而詩歌生成模型每次生成一個字,在評價時,生成模型在每次到生成到句尾時就用評價模型進行評價,對比評價模型生成的向量和生成詩句的最后一句的平均詞向量進行比較計算負的二范數距離設為獎勵。
5.根據權利要求4所述的基于云數據中心分布式詩歌生成方法,其特征在于,評價模型對句中的獎勵均設為0。
6.根據權利要求4所述的基于云數據中心分布式詩歌生成方法,其特征在于,所述估值網絡根據當前生成的詩歌輸出一個浮點數表示價值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110241954.1/1.html,轉載請聲明來源鉆瓜專利網。





