[發明專利]一種文本的生成方法及相關設備在審
| 申請號: | 201910409516.4 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN110134960A | 公開(公告)日: | 2019-08-16 |
| 發明(設計)人: | 王亮 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F17/22;G06F17/21 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 格式要求 目標編碼 句子編碼 目標序列 訓練數據 預設 句子 編碼生成 獲取目標 目標模型 語料庫 輸出 | ||
本發明實施例公開了一種文本的生成方法及相關設備,可以生成滿足特定格式要求的文本。本發明實施例方法包括:獲取目標編碼,所述目標編碼為待生成滿足特殊格式要求的文本的首句編碼;將所述目標編碼輸入預設模型,以輸出所述目標編碼對應的目標序列編碼,所述預設模型為通過目標模型對訓練數據進行訓練得到的,所述訓練數據包括語料庫中滿足所述特殊格式要求的每個文本以及所述每個文本中句子的句子編碼,所述每個文本中句子的句子編碼符合所述特殊格式要求;根據所述目標序列編碼生成所述滿足特殊格式要求的文本。
技術領域
本發明涉及自然語言處理領域,特別涉及一種文本的生成方法及相關設備。
背景技術
隨著NLP(Natural Language Processing,自然語言處理)技術的發展,AI(Artificial Intelligence,人工智能)寫詩,AI商品簡介,AI自動歌詞等文本生成應用已經開始出現在各大網站平臺。AI文本生成能有效的節省人力成本,滿足海量數據的實時生成要求,并且結果多樣,能實現個性化私人訂制,因而具有巨大的應用潛力。
現有的通過“在生成當前句文本的同時,也預測下一句話的關鍵詞”的方法,生成關鍵詞序列,以保持單句與單句之間的邏輯連貫性。
生成的單句與單句之間雖然邏輯連貫,卻不滿足特定格式文本的一些具體要求。如詩歌、歌詞通常要求偶數句之間押韻;歌詞甚至有長度要求,以符合特定的節奏韻律。
發明內容
本發明實施例提供了一種文本的生成方法及相關設備,用于生成滿足單句之間邏輯連貫之外也能滿足特定格式要求的文本。
本發明實施例第一方面提供了一種文本的生成方法,包括:
獲取目標編碼,所述目標編碼為待生成滿足特殊格式要求的文本的首句編碼;
將所述目標編碼輸入預設模型,以輸出所述目標編碼對應的目標序列編碼,所述預設模型為通過目標模型對訓練數據進行訓練得到的,所述訓練數據包括語料庫中滿足所述特殊格式要求的每個文本以及所述每個文本中句子的句子編碼,所述每個文本中句子的句子編碼符合所述特殊格式要求;
根據所述目標序列編碼生成所述滿足特殊格式要求的文本。
可選地,所述目標模型為循環神經網絡模型,所述將目標編碼輸入預設模型,以輸出所述目標編碼對應的目標序列編碼之前,所述方法還包括:
獲取所述每個文本;
根據所述特殊格式要求對所述每個文本中的句子分別進行編碼,以得到所述每個文本中句子的句子編碼;
基于所述每個文本中句子的句子編碼對所述循環神經網絡模型的模型參數進行迭代更新;
當達到預置的迭代終止條件,將達到所述預置的迭代終止條件時的所述循環神經網絡模型確定為所述預設模型。
可選地,所述特殊格式要求包括韻腳要求、節奏要求和/或內容要求,所述根據所述特殊格式要求對所述每個文本中的句子分別進行編碼,以得到所述每個文本中句子的句子編碼包括:
基于所述每個文本中的句子的最后一個字的韻母對所述每個文本中的句子進行韻腳編碼,得到所述每個文本中句子的韻腳編碼,所述韻腳編碼與所述韻腳要求相對應;
和/或,
基于所述每個文本中的句子的目標詞語對所述每個文本中的句子進行語義編碼,得到所述每個文本中句子的內容編碼,所述內容編碼與所述內容要求相對應;
和/或,
基于所述每個文本中的句子的句子長度對所述每個文本中的句子進行節奏編碼得到所述每個文本中句子的節奏編碼,所述節奏編碼與所述節奏要求相對應;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910409516.4/2.html,轉載請聲明來源鉆瓜專利網。





