[發(fā)明專利]文本生成方法、文本生成裝置及計算機可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202011027336.9 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112036155A | 公開(公告)日: | 2020-12-04 |
| 發(fā)明(設(shè)計)人: | 張嘉益;崔志 | 申請(專利權(quán))人: | 北京小米松果電子有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/289;G06F40/35;G06N3/08;G06N20/00 |
| 代理公司: | 北京英創(chuàng)嘉友知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11447 | 代理人: | 賈會玲 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 生成 方法 裝置 計算機 可讀 存儲 介質(zhì) | ||
本公開涉及一種文本生成方法、文本生成裝置及計算機可讀存儲介質(zhì)。方法包括:獲取目標文本;確定所述目標文本中待插入修辭文本的目標位置;根據(jù)處于所述目標位置的預(yù)設(shè)范圍內(nèi)的文本的語義,生成所述修辭文本;將所述修辭文本插入至所述目標位置。如此,無需用戶輸入本體和喻體即可自動生成修辭文本,使得生成的修辭文本更加多樣,提高了生成修辭文本的智能化程度。并且,在生成修辭文本時參考了處于目標位置的預(yù)設(shè)范圍內(nèi)的文本的語義,使得生成的修辭文本的語義與目標位置的預(yù)設(shè)范圍內(nèi)的文本的語義較為匹配,提高了對目標文本修飾的準確度,從而提高了修飾后的文本的信息量。
技術(shù)領(lǐng)域
本公開涉及計算機技術(shù)領(lǐng)域,尤其涉及一種文本生成方法、文本生成裝置及計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著科學(xué)技術(shù)的飛速發(fā)展,大量先進技術(shù)不斷涌現(xiàn),自然語言處理技術(shù)即為其中一個重要的技術(shù)。在自然語言處理技術(shù)的廣泛應(yīng)用中,自動生成文本成為一個研究的熱點問題。文本生成在人工智能、神經(jīng)網(wǎng)絡(luò)的發(fā)展下有了長足的進展,如自動摘要生成、自動標題生成、AI寫詩、人機對話、文本風(fēng)格轉(zhuǎn)換、故事生成等等。而對于人類語言寫作技巧的自動化使用卻少有研究或產(chǎn)品涉及。
在相關(guān)技術(shù)中,在學(xué)界中圍繞故事生成(story generation)的任務(wù),有著許多相關(guān)研究。其中,故事生成即是使用encoder-decoder框架模型,給定一段文本作為開頭輸入模型,模型就會繼續(xù)生成一段合適的故事展開文本或結(jié)尾文本。其中,模型在生成故事展開文本或結(jié)尾文本時刻結(jié)合相應(yīng)情感、主人公設(shè)定、指示圖譜作為額外輸入,增強輔助故事生成的結(jié)果。
上述用于故事生成的模型或多或少會生成一些包含有修飾性語句的句子,但是其缺點很明顯:在于端到端生成,對于使用什么樣的修辭寫作手法,完全不可控。另外,現(xiàn)有的端到端方法生成比喻的技術(shù),輸入必須為一對比喻的本體和喻體,模型才能針對性生成相應(yīng)的比喻文本。換言之,該技術(shù)僅限于給定本體和喻體的比喻文本的生成。并且,利用該技術(shù)生成比喻文本時并不參考上下文語義,無法保證所生成的文本忠于原文。
發(fā)明內(nèi)容
為克服相關(guān)技術(shù)中存在的問題,本公開提供一種文本生成方法、文本生成裝置及計算機可讀存儲介質(zhì)。
根據(jù)本公開實施例的第一方面,提供一種文本生成方法,包括:
獲取目標文本;
確定所述目標文本中待插入修辭文本的目標位置;
根據(jù)處于所述目標位置的預(yù)設(shè)范圍內(nèi)的文本的語義,生成所述修辭文本;
將所述修辭文本插入至所述目標位置。
可選地,所述確定所述目標文本中待插入修辭文本的目標位置,包括:
對所述目標文本進行分詞處理,得到所述目標文本的分詞結(jié)果,其中,所述分詞結(jié)果包括各分詞以及分詞所在的位置;
將所述分詞結(jié)果輸入至修飾概率預(yù)測模型,得到所述修飾概率預(yù)測模型輸出的各位置對應(yīng)的修飾概率,其中,位置對應(yīng)的修飾概率用于表征在所述位置處插入待生成的所述修辭文本的概率;
將最大修飾概率對應(yīng)的位置確定為所述目標位置。
可選地,所述根據(jù)處于所述目標位置的預(yù)設(shè)范圍內(nèi)的文本的語義,生成所述修辭文本,包括:
根據(jù)處于所述目標位置的預(yù)設(shè)范圍內(nèi)的文本的語義,確定所述目標位置對應(yīng)的語義向量;
根據(jù)所述語義向量生成所述修辭文本。
可選地,所述根據(jù)所述語義向量生成所述修辭文本,包括:
將所述語義向量輸入至文本生成模型中,得到所述文本生成模型輸出的所述修辭文本。
可選地,所述文本生成模型包括修辭類型生成子模型和修辭文本生成子模型;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京小米松果電子有限公司,未經(jīng)北京小米松果電子有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011027336.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





