[發明專利]基于類標序列生成式對抗模型的文本自動生成方法在審
| 申請號: | 202010065680.0 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111259650A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 陳晉音;張敦杰;王雪柯;吳洋洋 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F16/33;G06F16/35 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 曹兆霞 |
| 地址: | 310014 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 序列 生成 對抗 模型 文本 自動 方法 | ||
本發明公開了一種基于類標序列生成式對抗模型的文本自動生成方法,包括步驟:基于生成式對抗模型構建文本生成器;利用所述文本生成器生成基于真實文本的生成文本;調整所述生成文本的文本長度;對調整過文本長度的生成文本進行關鍵詞替換,獲得最終生成文本。該文本自動生成方法能夠生成完善的文本內容,提高文本的針對性和多樣化程度。
技術領域
本發明屬于深度學習自然語言處理領域,具體涉及一種基于類標序列生成式對抗模型的文本自動生成方法。
背景技術
深度學習受神經科學啟發而來,通過對大量數據進行學習,在自然語言處理領域獲得了更好的效果。具體表現在語音識別、機器翻譯、摘要生成、自然語言生成等各種自然語言相關的應用領域。為了能夠真正應用到相關應用領域中,生成自然語言的準確性以及合理性越發不可忽視,人們對自然語言處理領域的其他發展抱有越來越高的期望,這要求對自然語言生成質量的更高要求。
文本自動生成是自然語言處理領域的一個重要技術體現,自動生成的文本質量的好壞也標志著人工智能是否成熟的。文本生成任務的最終目的是讓計算機能寫出像人類寫出的高質量的自然語言作品,并且能在學習的過程中排查生成文本中的語法錯誤、情感不當等各種人類寫作時會出現的問題。文本自動生成技術的發展,可以幫助我們實現更加智能和自然的人機交互;通過文本自動生成系統,實現新聞的自動編輯,大大減少了編輯的工作量。在給人類生活帶來便利的同時,更高質量的自動生成文本,也可能被用于對人類認知進行欺騙,例如生成各類以假亂真的虛假政治新聞或評價文本,對大眾的認知產生誤導效果。
現有的自動文本生成技術已經有效提高了機器翻譯、自動問答、圖像描述生成等應用的效果,雖然將深度學習運用在自動文本生成任務中已經能完成一部分機器翻譯任務,并且在生成詩句和文本摘要等方面有不錯的表現,但傳統的文本生成方法大多只能生成定長文本,且面臨長文本生成任務時生成的文本質量較低,難以生成符合真實人類書寫的文本。生成的文本往往沒有具體的細節,難以應用于實際領域。
對于一些文本生成算法而言,往往需要輸入一段確定的文本作為訓練,多次訓練后得到一個可以生成對應文本的模型。需要生成另一類文本則需要重新選擇數據集進行訓練,并且重新保存模型等待生成,訓練的過程較為繁瑣。
專利公布號為CN109299211A的專利申請公開了一種基于Char-RNN模型的文本自動生成方法,該方法使用向量矩陣來表示字母或者漢字,通過Char-RNN模型中訓練,得到每一個字符對應的下一個字符的概率,以輸入的關鍵字詞作為起始字符,使用訓練好的模型結果來得到對應下一個字符的概率并輸出,并以此作為下一步的字符輸入,依次類推生成一段文本。該方法將關鍵詞作為起始字符,很多情況下不合符人類的寫作習慣。
發明內容
為了提高生成文本的質量,本發明提供了一種基于類標序列生成式對抗模型的文本自動生成方法,該文本自動生成方法能夠生成完善的文本內容,提高文本的針對性和多樣化程度。
本發明提供的技術方案為:
一種基于類標序列生成式對抗模型的文本自動生成方法,包括步驟:
基于生成式對抗模型構建文本生成器;
利用所述文本生成器生成基于真實文本的生成文本;
調整所述生成文本的文本長度;
對調整過文本長度的生成文本進行關鍵詞替換,獲得最終生成文本。
優選地,所述文本生成器的構建過程包括:
以LSeqGAN模型作為文本生成器的構建系統,LSeqGAN由生成器G和判別器D,其中,生成器G用于根據輸入的真實文本輸出指定類型的生成文本;判別器D用于判別真實文本和生成文本的真假;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010065680.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種移動船舶廢氣排放溯源裝置及方法
- 下一篇:一種土地價值評估方法及系統





