[發明專利]文本風格遷移方法、裝置、設備及存儲介質在審
| 申請號: | 202210363906.4 | 申請日: | 2022-04-08 |
| 公開(公告)號: | CN114818695A | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 劉弘一;李金龍;楊一梟;蒲珂宇 | 申請(專利權)人: | 招商銀行股份有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06F40/253;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 高川 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 風格 遷移 方法 裝置 設備 存儲 介質 | ||
本申請公開了一種文本風格遷移方法、裝置、設備及存儲介質,所述文本風格遷移方法包括:獲取待遷移文本信息,將所述待遷移文本信息輸入至已訓練的文本風格遷移模型,得到目標風格遷移文本,其中,所述文本風格遷移模型包括編碼器和解碼器,所述文本風格遷移模型為基于待訓練文本信息以及預設風格要求的特征向量進行訓練獲得。本申請解決了風格遷移的準確性較低的技術問題。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種文本風格遷移方法、裝置、設備及存儲介質。
背景技術
在現有的文本風格遷移過程中,使用較多的文本風格遷移方法為基于生成對抗網絡GAN進行文本風格遷移,然而,在進行GAN訓練時需要達到納什均衡,有時梯度下降法無法做到納什均衡,導致訓練得到GAN不是特別穩定,另外地,如果輸入至GAN的待遷移文本如果與之前訓練集數據差別過大,可能導致生成的文本不符合語法邏輯,或者生成的文本與目標風格不一致,進而導致風格遷移的準確性較低。
發明內容
本申請的主要目的在于提供一種文本風格遷移方法、裝置、設備及存儲介質,旨在解決現有技術中的風格遷移的準確性較低的技術問題。
為實現上述目的,本申請提供一種文本風格遷移方法,所述文本風格遷移方法包括:
獲取待遷移文本信息;
將所述待遷移文本信息輸入至已訓練的文本風格遷移模型,得到目標風格遷移文本,其中,所述文本風格遷移模型包括編碼器和解碼器,所述文本風格遷移模型為基于待訓練文本信息以及預設風格要求的特征向量進行訓練獲得。
可選地,所述將所述待遷移文本信息輸入至已訓練的文本風格遷移模型,得到目標風格遷移文本的步驟包括:
通過所述編碼器對所述待遷移文本進行編碼處理,獲得編碼向量;
將所述編碼向量輸入至所述解碼器做解碼處理,獲得目標特征向量;
基于所述目標特征向量,生成所述目標風格遷移文本。
可選地,在所述將所述待遷移文本信息輸入至已訓練的文本風格遷移模型,得到目標風格遷移文本的步驟之前,所述文本風格遷移方法還包括:
獲取待訓練文本信息,并對所述待訓練文本信息進行分詞處理;
基于分詞后的各個分詞信息和預設風格要求的特征向量,對待訓練遷移模型的編碼器和解碼器進行迭代訓練,獲得所述文本風格遷移模型。
可選地,所述基于分詞后的各個分詞信息和預設風格要求的特征向量,對待訓練遷移模型的編碼器和解碼器進行迭代訓練,獲得所述文本風格遷移模型的步驟包括:
基于分詞后的各個分詞信息,通過所述編碼器進行編碼處理,獲得所述待訓練文本信息對應的編碼向量,其中,所述編碼向量包括均值向量和方差向量;
基于所述均值向量和方差向量,選取滿足預設概率分布的采樣向量;
基于所述采樣向量和所述預設風格要求的特征向量,確定所述解碼器的目標輸入向量;
將所述目標輸入向量輸入所述解碼器進行解碼,獲得解碼結果;
基于所述解碼結果和所述待訓練文本信息的真實標簽之間的差異,對所述編碼器和所述解碼器進行優化訓練,獲得所述文本風格遷移模型。
可選地,所述基于所述解碼結果和所述待訓練文本信息的真實標簽之間的差異,對所述編碼器和所述解碼器進行優化訓練,獲得所述文本風格遷移模型的步驟包括:
基于預設損失函數,計算所述解碼結果與待訓練文本的真實標簽之間的模型損失;
計算所述模型損失的梯度,并基于梯度迭代優化所述編碼器和所述解碼器的模型參數,得到訓練后的文本風格遷移模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于招商銀行股份有限公司,未經招商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210363906.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鋼板板坯字符識別方法、設備、存儲介質及裝置
- 下一篇:一種冷輾擴油組合物





