[發明專利]文本生成方法、裝置、介質和計算設備有效
| 申請號: | 201910362399.0 | 申請日: | 2019-04-30 |
| 公開(公告)號: | CN110110331B | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 邵智宏;黃民烈 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F16/34 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 韓雪梅 |
| 地址: | 100084 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 生成 方法 裝置 介質 計算 設備 | ||
本發明的實施方式提供了一種文本生成方法。該方法包括:將文本生成任務規劃為多個文本塊生成子任務;重復執行以下文本塊生成子任務直到所有子任務執行完畢:基于輸入數據集合的子集組合序列中的當前子集以及在先子任務生成文本塊。根據本發明的文本生成方法,在生成文本過程中模擬人類的寫作過程,合理規劃文章結構和各個部分的內容,能夠使得長文本中的句子與前后文之前取得較高的一致性和流暢性,并且更加全面的覆蓋輸入數據集合。此外,本發明的實施方式提供了一種文本生成裝置、介質和計算設備。
技術領域
本發明的實施方式涉及自然語言處理領域,更具體地,本發明的實施 方式涉及一種文本生成方法、裝置、介質和計算設備。
背景技術
本部分旨在為權利要求書中陳述的本發明的實施方式提供背景或上 下文。此處的描述不因為包括在本部分中就承認是現有技術。
數據到文本生成是從結構化數據生成自然語言文本,其具有廣泛的應 用(用于天氣預報,比賽報告,產品描述,廣告文檔等)。現有的一些基 于神經網絡的文本生成模型能夠在某些應用中生成流暢且連貫的短文本。 然而,在需要生成(如產品描述)篇幅較長的文本時,現有方法無法保證 句子間表達的一致性,前后銜接的流暢性,以及對輸入數據集合較高的覆 蓋率,并且表達方式也不夠多樣化。
發明內容
為此,非常需要一種改進的文本生成方法,更加適合基于輸入數據集 合生成篇幅較長的文本。
在本上下文中,本發明的實施方式期望提供一種文本生成方法、裝置、 介質和計算設備。
在本發明實施方式的第一方面中,提供了一種文本生成方法,包括:
將文本生成任務規劃為多個文本塊生成子任務;
重復執行以下文本塊生成子任務直到所有子任務執行完畢:
基于輸入數據集合的子集組合序列中的當前子集以及在先子任務生 成文本塊。
在本發明實施方式的第二方面中,提供了一種文本生成裝置,包括:
任務規劃模塊,被配置為將文本生成任務規劃為多個文本塊生成子任 務;
任務執行模塊,被配置為重復執行以下文本塊生成子任務直到所有子 任務執行完畢:
基于輸入數據集合的子集組合序列中的當前子集以及在先子任務生 成文本塊。
在本發明實施方式的第三方面中,提供了一種計算機可讀存儲介質, 存儲有程序代碼,所述程序代碼當被處理器執行時,實現如第一方面任一 實施例所述的方法。
在本發明實施方式的第四方面中,提供了一種計算設備,包括處理器 和存儲有程序代碼的存儲介質,所述程序代碼當被處理器執行時,實現如 第一方面任一實施例所述的方法。
根據本發明實施方式的文本生成方法、裝置、介質和計算設備,可以 將長文本生成任務分解為多個依賴相應組和先前生成的文本塊的文本塊 生成子任務,然后再逐一執行子任務生成相應的文本塊,最后拼接為長文 本。根據本發明的文本生成方法,在生成文本過程中模擬人類的寫作過程, 合理規劃文章結構和各個部分的內容,能夠使得長文本中的句子與前后文 之前取得較高的一致性和流暢性,并且更加全面的覆蓋輸入數據集合。
附圖說明
通過參考附圖閱讀下文的詳細描述,本發明示例性實施方式的上述以 及其他目的、特征和優點將變得易于理解。在附圖中,以示例性而非限制 性的方式示出了本發明的若干實施方式,其中:
圖1示意性地示出了根據本發明各個實施方式的一種應用場景示意 圖;
圖2示意性地示出了根據本發明一實施方式的文本生成方法的流程示 意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910362399.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于文本的關鍵詞提取方法和計算機設備
- 下一篇:文本摘要生成方法及設備





