[發(fā)明專利]一種基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法有效

申請(qǐng)?zhí)枺?/td>	202110241954.1	申請(qǐng)日：	2021-03-04
公開（公告）號(hào)：	CN112989812B	公開（公告）日：	2023-05-02
發(fā)明（設(shè)計(jì)）人：	沈鴻;馬亮亮	申請(qǐng)（專利權(quán)）人：	中山大學(xué)
主分類號(hào)：	G06F40/279	分類號(hào)：	G06F40/279;G06N20/00
代理公司：	廣州粵高專利商標(biāo)代理有限公司 44102	代理人：	劉俊
地址：	510275 廣東***	國(guó)省代碼：	廣東;44
權(quán)利要求書：	查看更多	說(shuō)明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于數(shù)據(jù)中心分布式詩(shī)歌生成方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法，其特征在于，包括以下步驟：

S1：生成模型訓(xùn)練；

S2：引入評(píng)價(jià)模型，利用評(píng)價(jià)模型來(lái)對(duì)步驟S1中的生成模型進(jìn)行優(yōu)化；

S3：利用步驟S2中優(yōu)化后的生成模型進(jìn)行詩(shī)歌生成；

所述步驟S1的具體過(guò)程是：

1)、預(yù)先訓(xùn)練好的一個(gè)詞嵌入模型，將訓(xùn)練集中每首詩(shī)的每個(gè)字映射到一個(gè)浮點(diǎn)向量，對(duì)該詞嵌入模型訓(xùn)練時(shí)，維護(hù)一個(gè)以訓(xùn)練數(shù)據(jù)中的一首詩(shī)的標(biāo)題初始化的集合，作為模型的輸入，模型先以此將標(biāo)題的每個(gè)字映射為向量然后輸入長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)中，最后輸出是一個(gè)向量，它表示生成的詩(shī)歌的第一個(gè)單詞，這個(gè)向量和本輪訓(xùn)練用的詩(shī)中第一個(gè)字映射的詞向量進(jìn)行比較，用來(lái)計(jì)算訓(xùn)練損失；

2)、訓(xùn)練用的詩(shī)的第一個(gè)字被添加到詞嵌入模型維護(hù)的輸入集合中，以生成下一個(gè)單詞；訓(xùn)練過(guò)程一直在進(jìn)行，直到一整首訓(xùn)練用的詩(shī)被添加到輸入集中，然后繼續(xù)訓(xùn)練下一首詩(shī)，直至達(dá)到使用者滿意的收斂程度，即訓(xùn)練誤差降低到一定范圍以下；

所述步驟S2中，生成模型的優(yōu)化過(guò)程是：

設(shè)置一個(gè)估值網(wǎng)絡(luò)，一個(gè)經(jīng)驗(yàn)緩沖區(qū)以及并行多個(gè)表演者網(wǎng)絡(luò)，每輪訓(xùn)練學(xué)習(xí)者先同步自己的生成模型參數(shù)到每一個(gè)表演者網(wǎng)絡(luò)、同步自己的估值網(wǎng)絡(luò)參數(shù)到經(jīng)驗(yàn)緩沖區(qū)；然后每個(gè)表演者網(wǎng)絡(luò)各自開始隨機(jī)初始化題目然后生成詩(shī)歌，每生成一句詩(shī)就會(huì)與評(píng)價(jià)模型進(jìn)行交流，評(píng)價(jià)模型會(huì)輸出一個(gè)負(fù)數(shù)的獎(jiǎng)勵(lì)，然后生成模型將此時(shí)的生成詩(shī)、字選擇信息、獎(jiǎng)勵(lì)值打包送給經(jīng)驗(yàn)緩沖區(qū)；緩沖區(qū)對(duì)經(jīng)驗(yàn)排序，最大者優(yōu)先傳輸給學(xué)習(xí)者進(jìn)行對(duì)生成模型的優(yōu)化；

緩沖區(qū)對(duì)經(jīng)驗(yàn)排序的過(guò)程是：

經(jīng)驗(yàn)緩沖區(qū)對(duì)(R-V_θ(s))₊的值從大到小排序，其中R表示獎(jiǎng)勵(lì)值加上用生成詩(shī)輸入估值網(wǎng)絡(luò)的輸出，V_θ(s)表示生成此字之前的詩(shī)輸入估值網(wǎng)絡(luò)輸出，+表示取與0的最大值；

學(xué)習(xí)者中生成模型的損失函數(shù)使用近端策略優(yōu)化損失，估值網(wǎng)絡(luò)使用(R-V_θ(s))₊對(duì)網(wǎng)絡(luò)進(jìn)行梯度下降。

2.根據(jù)權(quán)利要求1所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法，其特征在于，所述步驟S2中，評(píng)價(jià)模型的建立過(guò)程是：

訓(xùn)練一個(gè)評(píng)價(jià)模型學(xué)習(xí)藝術(shù)作品的詞向量變化規(guī)律，該評(píng)價(jià)模型的訓(xùn)練數(shù)據(jù)為宋詞、元曲的非詩(shī)數(shù)據(jù)；將訓(xùn)練數(shù)據(jù)中每個(gè)詞或曲中的句子分為K組，K為生成模型所需要生成的詩(shī)的句數(shù)；該評(píng)價(jià)模型使用長(zhǎng)短期記憶模型，在訓(xùn)練時(shí)每輪訓(xùn)練一首詞或曲，依次輸入K組中第i組，將此組中的每個(gè)字的詞向量之和作為特征輸入評(píng)價(jià)模型，輸出也為一個(gè)詞向量，與第i+1組的詞向量之和計(jì)算距離：

作為訓(xùn)練誤差，以此反向傳播優(yōu)化評(píng)價(jià)模型，其中M表示第i+1組中字的個(gè)數(shù)，v_j是輸出的詞向量，v_q是第i+1組中字的詞向量。

3.根據(jù)權(quán)利要求2所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法，其特征在于，所述步驟S2中，評(píng)價(jià)模型訓(xùn)練結(jié)束后接受當(dāng)前已生成詩(shī)為輸入，計(jì)算評(píng)價(jià)模型輸出的詞向量和新生成的一句詩(shī)的詞向量之和的距離，以此距離的負(fù)數(shù)作為評(píng)價(jià)獎(jiǎng)勵(lì)返回給調(diào)用的單位。

4.根據(jù)權(quán)利要求3所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法，其特征在于，評(píng)價(jià)模型在句子層面上進(jìn)行訓(xùn)練，模仿宋詞、元曲中合理的內(nèi)涵發(fā)展軌跡，而詩(shī)歌生成模型每次生成一個(gè)字，在評(píng)價(jià)時(shí)，生成模型在每次到生成到句尾時(shí)就用評(píng)價(jià)模型進(jìn)行評(píng)價(jià)，對(duì)比評(píng)價(jià)模型生成的向量和生成詩(shī)句的最后一句的平均詞向量進(jìn)行比較計(jì)算負(fù)的二范數(shù)距離設(shè)為獎(jiǎng)勵(lì)。

5.根據(jù)權(quán)利要求4所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法，其特征在于，評(píng)價(jià)模型對(duì)句中的獎(jiǎng)勵(lì)均設(shè)為0。

6.根據(jù)權(quán)利要求4所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法，其特征在于，所述估值網(wǎng)絡(luò)根據(jù)當(dāng)前生成的詩(shī)歌輸出一個(gè)浮點(diǎn)數(shù)表示價(jià)值。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué)，未經(jīng)中山大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110241954.1/1.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說(shuō)明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】