[發明專利]基于質量感知的文本生成方法、設備、存儲介質及裝置有效
| 申請號: | 201911040951.0 | 申請日: | 2019-10-29 |
| 公開(公告)號: | CN111061867B | 公開(公告)日: | 2022-10-25 |
| 發明(設計)人: | 鄧黎明;莊伯金;王少軍 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/30;G10L15/26 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 徐進之 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 質量 感知 文本 生成 方法 設備 存儲 介質 裝置 | ||
本發明公開了一種基于質量感知的文本生成方法、設備、存儲介質及裝置,該方法通過獲取待處理語料集,將待處理語料集進行多線程處理,通過序列到序列模型生成文本草稿,通過訓練好的質量感知遮擋語言模型,對文本草稿中待替換字的位置進行預測,根據預測的目標位置的上下文語境對目標位置的語義進行預測,獲得目標字,結合上下文語境能夠提高語義預測的準確性;通過訓練好的質量感知遮擋語言模型,將目標字替換待替換字,獲得新的文本草稿,返回根據新的文本草稿通過訓練好的質量感知遮擋語言模型,對新的文本草稿中待替換字的位置進行預測的步驟,直至所有待替換字均被替換,獲得目標文本,基于人工智能,通過多次迭代提高文本生成質量。
技術領域
本發明涉及人工智能的技術領域,尤其涉及一種基于質量感知的文本生成方法、設備、存儲介質及裝置。
背景技術
現有的文本生成方法主要是基于序列到序列的模型(Seq2seq)的單輪生成方法,該模型在文本生成階段,是由左到右(或由右到左)逐字單向生成的,只考慮了前面已經生成的文本信息,一旦前面文本生成效果不好,則會對后生成的文本產生較大影響,造成偏差累積。目前的多輪迭代技術,采用的也是簡單的從左到右每個字都更新一次,人工設定迭代輪次,相當于完全重新生成了整個文本。該方法存在三個關鍵問題:第一,無法判斷生成的文本中哪些字詞需要修改,哪些字詞可以保留;第二,不能獲得更符合該語境的字?第三,人工設定迭代輪次非常的經驗化,無法明確迭代終止的客觀條件是什么,導致自動生成的文本質量不佳。
上述內容僅用于輔助理解本發明的技術方案,并不代表承認上述內容是現有技術。
發明內容
本發明的主要目的在于提供一種基于質量感知的文本生成方法、設備、存儲介質及裝置,旨在解決現有技術中自動生成的文本質量不佳的技術問題。
為實現上述目的,本發明提供一種基于質量感知的文本生成方法,所述基于質量感知的文本生成方法包括以下步驟:
獲取待處理語料集,將所述待處理語料集進行多線程處理,通過序列到序列模型生成文本草稿;
根據所述文本草稿通過訓練好的質量感知遮擋語言模型,對所述文本草稿中待替換字的位置進行預測,獲得所述待替換字的目標位置;
通過所述訓練好的質量感知遮擋語言模型,根據所述目標位置的上下文語境信息對所述目標位置的語義進行預測,獲得所述目標位置對應的目標字;
通過所述訓練好的質量感知遮擋語言模型,將所述目標字替換所述待替換字,獲得第一次迭代文本,將所述第一次迭代文本作為新的文本草稿,返回所述根據所述新的文本草稿通過訓練好的質量感知遮擋語言模型,對所述新的文本草稿中待替換字的位置進行預測,獲得所述待替換字的目標位置的步驟,直至所述文本草稿中所有所述待替換字均被替換,迭代終止,獲得迭代更新后的目標文本。
優選地,所述根據所述文本草稿通過訓練好的質量感知遮擋語言模型,對所述文本草稿中待替換字的位置進行預測,獲得所述待替換字的目標位置之前,所述基于質量感知的文本生成方法還包括:
獲取標準文本,對所述標準文本中的字進行隨機替換,獲得替換文本;
建立待訓練質量感知遮擋語言模型;
根據所述標準文本和所述替換文本對所述待訓練質量感知遮擋語言模型進行訓練,獲得訓練好的質量感知遮擋語言模型。
優選地,所述替換文本包括:第一預設比例的第一替換文本、第二預設比例的第二替換文本和第三預設比例的標準文本;
所述獲取標準文本,對所述標準文本中的字進行隨機替換,獲得替換文本,包括:
通過隨機標記,選取所述標準文本中每句話中的任意一個字隨機替換為另外一個字獲得第一替換文本,并記錄被替換的字的位置標簽,所述第一預設比例為所述第一替換文本占所有替換文本的比例;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911040951.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種凹凸棒土復合脫酸材料及其應用
- 下一篇:用于目標檢測網絡的通道剪枝方法





