[發(fā)明專利]韻律控制的詩詞生成方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201911039063.7 | 申請日: | 2019-10-29 |
| 公開(公告)號: | CN111046648A | 公開(公告)日: | 2020-04-21 |
| 發(fā)明(設(shè)計)人: | 鄧黎明;莊伯金;王少軍 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/205 | 分類號: | G06F40/205;G06F40/253;G06F16/33 |
| 代理公司: | 深圳市力道知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44507 | 代理人: | 何姣 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 韻律 控制 詩詞 生成 方法 裝置 設(shè)備 存儲 介質(zhì) | ||
本申請涉及自然語言處理,具體提供一種韻律控制的詩詞生成方法、裝置、設(shè)備及存儲介質(zhì),該方法包括:獲取源字符序列,將所述源字符序列的字符信息、句子信息、位置信息的嵌入向量和所述源字符序列的韻律嵌入向量疊加,得到綜合嵌入向量;對所述綜合嵌入向量進行編碼處理,得到輸入文本表征向量;獲取初始嵌入向量和韻律控制信息,將所述初始嵌入向量和所述韻律控制信息的嵌入向量疊加,得到初始化的輸出文本表征向量;對所述輸出文本表征向量和所述輸入文本表征向量進行解碼處理,以得到所述源字符序列對應(yīng)的生成語句。該方法提高了生成詩句的平仄押韻準確率,而不犧牲詩句的生成質(zhì)量。
技術(shù)領(lǐng)域
本申請涉及自然語言處理技術(shù)領(lǐng)域,尤其涉及一種韻律控制的詩詞生成方法、裝置、設(shè)備及存儲介質(zhì)。
背景技術(shù)
古人寫詩詞講究平仄押韻,是利用漢語聲調(diào)的平衡交替來造成語言中抑揚頓挫的美,讀起來瑯瑯上口,易于記憶。目前,國內(nèi)外對于詩歌生成的研究經(jīng)歷了由基于模板的生成方法到基于統(tǒng)計機器翻譯的方法再到基于神經(jīng)網(wǎng)絡(luò)等方法的演變過程。
隨著神經(jīng)網(wǎng)絡(luò)的興起,基于編碼器-解碼器的框架也逐步應(yīng)用到詩歌生成當中,該框架利用神經(jīng)網(wǎng)絡(luò)強大的擬合能力,能夠生成具有一定流暢度的詩句,但在韻律的表現(xiàn)方面與傳統(tǒng)的詩歌韻律規(guī)則有較大偏差。
發(fā)明內(nèi)容
本申請的主要目的在于提供一種韻律控制的詩詞生成方法、裝置、設(shè)備及存儲介質(zhì),旨在提高生成詩句的平仄押韻準確性。
第一方面,本申請?zhí)峁┮环N韻律控制的詩詞生成方法,所述韻律控制的詩詞生成方法包括以下步驟:
獲取源字符序列,將所述源字符序列的字符信息、句子信息、位置信息的嵌入向量和所述源字符序列的韻律嵌入向量疊加,得到綜合嵌入向量;
對所述綜合嵌入向量進行編碼處理,得到輸入文本表征向量;
獲取初始嵌入向量和韻律控制信息,將所述初始嵌入向量和所述韻律控制信息的嵌入向量疊加,得到初始化的輸出文本表征向量;
對所述輸出文本表征向量和所述輸入文本表征向量進行解碼處理,以得到所述源字符序列對應(yīng)的生成語句。
第二方面,本申請還提供一種詩詞生成模型的訓(xùn)練方法,所述詩詞生成模型的訓(xùn)練方法包括:
獲取訓(xùn)練樣本,所述訓(xùn)練樣本包括樣本字符序列,以及所述樣本字符序列的后一句詩詞,所述后一句詩詞和所述樣本字符序列的韻律相匹配;
將所述樣本字符序列的字符信息、句子信息、位置信息的嵌入向量和所述樣本字符序列的韻律嵌入向量疊加,得到綜合嵌入向量;
對所述綜合嵌入向量進行編碼處理,得到輸入文本表征向量;
對所述后一句詩詞的韻律信息進行嵌入處理,得到韻律期望向量;
獲取初始嵌入向量,將所述初始嵌入向量和所述韻律期望向量疊加,得到初始化的輸出文本表征向量;
對所述輸入文本表征向量和所述輸入文本表征向量進行解碼處理,得到所述樣本字符序列對應(yīng)生成語句;
根據(jù)所述生成語句的韻律信息和所述后一句詩詞的韻律信息計算損失值,根據(jù)所述損失值調(diào)整所述詩詞生成模型的參數(shù)。
第三方面,本申請還提供一種韻律控制的詩詞生成裝置,所述韻律生成裝置包括:
向量疊加模塊,用于獲取源字符序列,將所述源字符序列的字符信息、句子信息、位置信息的嵌入向量和所述源字符序列的韻律嵌入向量疊加,得到綜合嵌入向量。
編碼模塊,用于對所述綜合嵌入向量進行編碼處理,得到輸入文本表征向量。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911039063.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





