[發明專利]文本生成方法、裝置、介質和計算設備有效
| 申請號: | 201910362399.0 | 申請日: | 2019-04-30 |
| 公開(公告)號: | CN110110331B | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 邵智宏;黃民烈 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/34 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 韓雪梅 |
| 地址: | 100084 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 生成 方法 裝置 介質 計算 設備 | ||
1.一種文本生成方法,包括:
將文本生成任務規劃為多個文本塊生成子任務;
重復執行以下文本塊生成子任務直到所有子任務執行完畢:
基于輸入數據集合的子集組合序列中的當前子集以及在先子任務生成文本塊;
其中將文本生成任務規劃為多個文本塊生成子任務進一步配置為將文本生成任務規劃為至少一個能夠生成合理的語句結構的文本的包括多個文本塊生成子任務的子任務組:
基于全局隱變量將所述文本生成任務規劃為至少一個包括多個文本塊生成子任務的任務組,所述全局隱變量基于所述輸入數據集合的編碼表示來得到;
基于全局隱變量以及所述輸入數據集合生成一個包括所有輸入數據的子集組合序列:
g=argmaxgP(g|x,zp);
其中,g表示子集組合序列,x表示輸入數據集合,zp表示全局隱變量,argmaxg表示概率最大的子集組合序列,P表示概率。
2.如權利要求1所述的方法,其中,所述輸入數據集合中的數據在輸入之前被按照預設規則排序,然后利用雙向循環神經網絡對排序后的輸入數據集合進行編碼。
3.如權利要求2所述的方法,其中在每一輸入數據的格式為鍵值對(ai;vi)時,每一輸入數據均被表示為di=[e(ai);e(vi)],其中e(ai)和e(vi)分別為ai和vi的向量表示。
4.如權利要求3所述的方法,其中,所述雙向循環神經網絡為雙向門控循環單元,被配置為將前向門控循環單元和后向門控循環單元的末隱狀態拼接,作為輸入數據集合的編碼表示;
將每個時刻的前向門控循環單元和后向門控循環單元的隱狀態拼接,作為相應時刻的輸入數據的編碼表示。
5.如權利要求1所述的方法,其中,一個任務組中的所有子任務被執行完畢時,生成的文本為:
y=s1s2...sT;
其中,y表示文本,sT表示時間步t=T處的文本塊。
6.如權利要求5所述的方法,其中,基于所述輸入數據集合生成的一個包括所有輸入數據的子集組合序列為:
g=g1g2…gT;
其中,g表示子集組合序列,gT表示時間步t=T處的子集。
7.如權利要求1所述的方法,其中,所述全局隱變量基于其概率分布采樣獲得,所述概率分布基于所述輸入數據集合的編碼表示來構建。
8.如權利要求7所述的方法,其中,所述全局隱變量在推斷和訓練階段基于不同的概率分布獲得。
9.如權利要求8所述的方法,其中,所述全局隱變量在推斷階段從其先驗分布采樣獲得,在訓練階段從其近似后驗分布采樣獲取。
10.如權利要求1所述的方法,其中,所述子集組合序列中的子集由以下確定:
其中,gt表示所述子集組合序列中的時間步t處的子集,g<t表示gt之前的所有子集。
11.如權利要求10所述的方法,其中,子集組合序列中每一子集中所包括的元素由以下確定:
確定輸入數據集合中每一數據屬于當前子集的概率;
選取概率大于第一預設閾值的數據作為當前子集的元素。
12.如權利要求11所述的方法,其中,采用計劃解碼器確定所述子集組合序列中的每一子集。
13.如權利要求12所述的方法,其中,所述計劃解碼器采用循環神經網絡。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362399.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于文本的關鍵詞提取方法和計算機設備
- 下一篇:文本摘要生成方法及設備





