[發明專利]一種條件文本生成方法及生成系統有效
| 申請號: | 202111474679.4 | 申請日: | 2021-12-06 |
| 公開(公告)號: | CN114118024B | 公開(公告)日: | 2022-06-21 |
| 發明(設計)人: | 岳希;羅偉爾;高燕;唐聃;何磊 | 申請(專利權)人: | 成都信息工程大學 |
| 主分類號: | G06F40/151 | 分類號: | G06F40/151;G06F40/166;G06N3/04;G06N3/08 |
| 代理公司: | 成都云縱知識產權代理事務所(普通合伙) 51316 | 代理人: | 伍星;劉沙粒 |
| 地址: | 610225 四川省成都*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 條件 文本 生成 方法 系統 | ||
1.一種條件文本生成方法,其特征在于,包括:
S1、采集文本數據;數據預處理,將文本數據轉化為適合訓練的數據集;
S2、構建編碼器、解碼器;
S3、將條件信息和文本數據分別通過編碼器編碼,得到條件特征、文本特征;將條件特征和文本特征進行特征融合,得到融合后的特征,記為融合特征;
S4、將所述融合特征作為解碼器的輸入,得到解碼器的輸出結果;
S5、計算損失;
S6、基于解碼器的輸出結果和損失,對網絡模型進行訓練,直到滿足訓練條件或達到最大訓練次數,輸出訓練后的網絡模型;
S7、向訓練后的網絡模型中輸入條件信息和提示文本,生成文本;
步驟S2中,利用采集的文本數據訓練GPT-2模型,將訓練好的模型記為模型M,以模型M作為編碼器和解碼器;
步驟S3包括:
S301、將條件信息輸入模型M,得到條件特征fc;
S302、將包含所述條件信息的文本數據輸入模型M,得到文本特征fp;
S303、將fc和fp進行特征融合,得到融合特征fcp;
步驟S303包括:
S3031、確定條件信息的個數n,各條件信息的條件特征依次記為fc1、fc2…fcn;其中n取正整數;
S3032、將各條件特征的鍵向量keyc1、鍵向量keyc2…鍵向量keycn和值向量valuec1、值向量valuec2…值向量valuecn分別依次連接到文本特征fp的鍵向量key和值向量value之前,并保持文本特征fp的查詢向量query不變,得到連接后的鍵向量keylast和值向量valuelast:
keylast=[keyc1;keyc2…keycn;key];
valuelast=[valuec1;valuec2…valuecn;value];
S3033、通過如下公式計算輸出值score:
式中,q代表查詢向量query,kT代表keylast的轉置,v代表valuelast,dk代表keylast的維度;
S3034、將score輸入前饋神經網絡,得到融合特征fcp;
步驟S5中,計算損失的方法包括:
S501、計算條件信息與文本數據的互信息損失Lpoint:
Lpoint=(ex-1)-1;
式中,a表示文本數據,c表示條件信息;x為文本數據和條件信息之間的互信息計算結果;p(a)表示文本數據中每個詞出現概率的累積;p(c)表示條件信息與文本數據中每個詞出現概率的累積;p(a,c)表示文本數據中每個詞與條件信息的概率累積;
S502、將條件信息設置為空集,計算無條件內容損失Lnull:
式中,c表示條件信息;xi表示當前生成的詞;{x1,x2…xi-1}表示生成xi需要的提示文本;表示xi的后驗概率;k表示生成文本的最大長度;
S503、通過如下公式計算最終損失Loss:
式中,當所述互信息損失參與訓練時,否則
當所述無條件內容損失參與訓練時,否則
2.根據權利要求1所述的一種條件文本生成方法,其特征在于,步驟S1中,通過爬蟲采集網上公開的文本數據,并存儲為json格式;所采集的文本數據包括內容和主題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都信息工程大學,未經成都信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111474679.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示設備
- 下一篇:FAK/PLK1雙靶標的喹唑啉衍生物及其制備方法和用途





