[發(fā)明專利]一種基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110241954.1 | 申請(qǐng)日: | 2021-03-04 |
| 公開(公告)號(hào): | CN112989812B | 公開(公告)日: | 2023-05-02 |
| 發(fā)明(設(shè)計(jì))人: | 沈鴻;馬亮亮 | 申請(qǐng)(專利權(quán))人: | 中山大學(xué) |
| 主分類號(hào): | G06F40/279 | 分類號(hào): | G06F40/279;G06N20/00 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 劉俊 |
| 地址: | 510275 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù)中心 分布式 詩(shī)歌 生成 方法 | ||
1.一種基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法,其特征在于,包括以下步驟:
S1:生成模型訓(xùn)練;
S2:引入評(píng)價(jià)模型,利用評(píng)價(jià)模型來(lái)對(duì)步驟S1中的生成模型進(jìn)行優(yōu)化;
S3:利用步驟S2中優(yōu)化后的生成模型進(jìn)行詩(shī)歌生成;
所述步驟S1的具體過(guò)程是:
1)、預(yù)先訓(xùn)練好的一個(gè)詞嵌入模型,將訓(xùn)練集中每首詩(shī)的每個(gè)字映射到一個(gè)浮點(diǎn)向量,對(duì)該詞嵌入模型訓(xùn)練時(shí),維護(hù)一個(gè)以訓(xùn)練數(shù)據(jù)中的一首詩(shī)的標(biāo)題初始化的集合,作為模型的輸入,模型先以此將標(biāo)題的每個(gè)字映射為向量然后輸入長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)中,最后輸出是一個(gè)向量,它表示生成的詩(shī)歌的第一個(gè)單詞,這個(gè)向量和本輪訓(xùn)練用的詩(shī)中第一個(gè)字映射的詞向量進(jìn)行比較,用來(lái)計(jì)算訓(xùn)練損失;
2)、訓(xùn)練用的詩(shī)的第一個(gè)字被添加到詞嵌入模型維護(hù)的輸入集合中,以生成下一個(gè)單詞;訓(xùn)練過(guò)程一直在進(jìn)行,直到一整首訓(xùn)練用的詩(shī)被添加到輸入集中,然后繼續(xù)訓(xùn)練下一首詩(shī),直至達(dá)到使用者滿意的收斂程度,即訓(xùn)練誤差降低到一定范圍以下;
所述步驟S2中,生成模型的優(yōu)化過(guò)程是:
設(shè)置一個(gè)估值網(wǎng)絡(luò),一個(gè)經(jīng)驗(yàn)緩沖區(qū)以及并行多個(gè)表演者網(wǎng)絡(luò),每輪訓(xùn)練學(xué)習(xí)者先同步自己的生成模型參數(shù)到每一個(gè)表演者網(wǎng)絡(luò)、同步自己的估值網(wǎng)絡(luò)參數(shù)到經(jīng)驗(yàn)緩沖區(qū);然后每個(gè)表演者網(wǎng)絡(luò)各自開始隨機(jī)初始化題目然后生成詩(shī)歌,每生成一句詩(shī)就會(huì)與評(píng)價(jià)模型進(jìn)行交流,評(píng)價(jià)模型會(huì)輸出一個(gè)負(fù)數(shù)的獎(jiǎng)勵(lì),然后生成模型將此時(shí)的生成詩(shī)、字選擇信息、獎(jiǎng)勵(lì)值打包送給經(jīng)驗(yàn)緩沖區(qū);緩沖區(qū)對(duì)經(jīng)驗(yàn)排序,最大者優(yōu)先傳輸給學(xué)習(xí)者進(jìn)行對(duì)生成模型的優(yōu)化;
緩沖區(qū)對(duì)經(jīng)驗(yàn)排序的過(guò)程是:
經(jīng)驗(yàn)緩沖區(qū)對(duì)(R-Vθ(s))+的值從大到小排序,其中R表示獎(jiǎng)勵(lì)值加上用生成詩(shī)輸入估值網(wǎng)絡(luò)的輸出,Vθ(s)表示生成此字之前的詩(shī)輸入估值網(wǎng)絡(luò)輸出,+表示取與0的最大值;
學(xué)習(xí)者中生成模型的損失函數(shù)使用近端策略優(yōu)化損失,估值網(wǎng)絡(luò)使用(R-Vθ(s))+對(duì)網(wǎng)絡(luò)進(jìn)行梯度下降。
2.根據(jù)權(quán)利要求1所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法,其特征在于,所述步驟S2中,評(píng)價(jià)模型的建立過(guò)程是:
訓(xùn)練一個(gè)評(píng)價(jià)模型學(xué)習(xí)藝術(shù)作品的詞向量變化規(guī)律,該評(píng)價(jià)模型的訓(xùn)練數(shù)據(jù)為宋詞、元曲的非詩(shī)數(shù)據(jù);將訓(xùn)練數(shù)據(jù)中每個(gè)詞或曲中的句子分為K組,K為生成模型所需要生成的詩(shī)的句數(shù);該評(píng)價(jià)模型使用長(zhǎng)短期記憶模型,在訓(xùn)練時(shí)每輪訓(xùn)練一首詞或曲,依次輸入K組中第i組,將此組中的每個(gè)字的詞向量之和作為特征輸入評(píng)價(jià)模型,輸出也為一個(gè)詞向量,與第i+1組的詞向量之和計(jì)算距離:
作為訓(xùn)練誤差,以此反向傳播優(yōu)化評(píng)價(jià)模型,其中M表示第i+1組中字的個(gè)數(shù),vj是輸出的詞向量,vq是第i+1組中字的詞向量。
3.根據(jù)權(quán)利要求2所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法,其特征在于,所述步驟S2中,評(píng)價(jià)模型訓(xùn)練結(jié)束后接受當(dāng)前已生成詩(shī)為輸入,計(jì)算評(píng)價(jià)模型輸出的詞向量和新生成的一句詩(shī)的詞向量之和的距離,以此距離的負(fù)數(shù)作為評(píng)價(jià)獎(jiǎng)勵(lì)返回給調(diào)用的單位。
4.根據(jù)權(quán)利要求3所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法,其特征在于,評(píng)價(jià)模型在句子層面上進(jìn)行訓(xùn)練,模仿宋詞、元曲中合理的內(nèi)涵發(fā)展軌跡,而詩(shī)歌生成模型每次生成一個(gè)字,在評(píng)價(jià)時(shí),生成模型在每次到生成到句尾時(shí)就用評(píng)價(jià)模型進(jìn)行評(píng)價(jià),對(duì)比評(píng)價(jià)模型生成的向量和生成詩(shī)句的最后一句的平均詞向量進(jìn)行比較計(jì)算負(fù)的二范數(shù)距離設(shè)為獎(jiǎng)勵(lì)。
5.根據(jù)權(quán)利要求4所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法,其特征在于,評(píng)價(jià)模型對(duì)句中的獎(jiǎng)勵(lì)均設(shè)為0。
6.根據(jù)權(quán)利要求4所述的基于云數(shù)據(jù)中心分布式詩(shī)歌生成方法,其特征在于,所述估值網(wǎng)絡(luò)根據(jù)當(dāng)前生成的詩(shī)歌輸出一個(gè)浮點(diǎn)數(shù)表示價(jià)值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué),未經(jīng)中山大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110241954.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)中心和數(shù)據(jù)中心設(shè)計(jì)
- 一種組網(wǎng)數(shù)據(jù)中心系統(tǒng)及方法
- 一種數(shù)據(jù)中心系統(tǒng)及其配置方法
- 一種數(shù)據(jù)中心能源利用效率的測(cè)算方法和裝置
- 跨數(shù)據(jù)中心協(xié)同計(jì)算方法及其系統(tǒng)
- 數(shù)據(jù)中心底座單體、數(shù)據(jù)中心底座及數(shù)據(jù)中心
- 一種醫(yī)療云數(shù)據(jù)系統(tǒng)
- 政務(wù)云基礎(chǔ)設(shè)施即服務(wù)實(shí)現(xiàn)系統(tǒng)
- 服務(wù)調(diào)用方法、裝置、設(shè)備及介質(zhì)
- 多數(shù)據(jù)中心訪問(wèn)方法及系統(tǒng)
- 一種自動(dòng)生成詩(shī)歌的方法和裝置
- 詩(shī)歌生成方法、裝置、計(jì)算機(jī)設(shè)備和介質(zhì)
- 一種自動(dòng)生成詩(shī)歌的方法及系統(tǒng)
- 基于深度學(xué)習(xí)的詩(shī)歌生成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 詩(shī)歌-語(yǔ)義知識(shí)圖譜的構(gòu)建方法及系統(tǒng)
- 融入傳統(tǒng)文化的外語(yǔ)學(xué)習(xí)系統(tǒng)
- 一種詩(shī)歌生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種詩(shī)歌生成的方法及相關(guān)裝置
- 一種詩(shī)歌生成方法、系統(tǒng)及可讀存儲(chǔ)介質(zhì)
- 詩(shī)歌電視,簡(jiǎn)稱詩(shī)TV或PTV





