[發(fā)明專利]文本摘要生成方法、裝置及電子設(shè)備有效
| 申請?zhí)枺?/td> | 202110991727.0 | 申請日: | 2021-08-27 |
| 公開(公告)號: | CN113434642B | 公開(公告)日: | 2022-01-11 |
| 發(fā)明(設(shè)計)人: | 黃詩雅;羅睦軍;鄧從健 | 申請(專利權(quán))人: | 廣州云趣信息科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/34;G06F40/289;G06F40/30 |
| 代理公司: | 北京博雅睿泉專利代理事務所(特殊普通合伙) 11442 | 代理人: | 李永凱 |
| 地址: | 510665 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 摘要 生成 方法 裝置 電子設(shè)備 | ||
本申請實施例提供了一種文本摘要生成方法、裝置及電子設(shè)備,包括:獲取待處理的第一文本;從所述第一文本中,獲取滿足預設(shè)條件的語句構(gòu)建初始摘要,并通過從所述第一文本中去除所述初始摘要,獲得第二文本;對所述第二文本中的語句進行預設(shè)替換處理,獲得第三文本;根據(jù)所述第三文本和所述初始摘要,獲得目標摘要。
技術(shù)領(lǐng)域
本公開實施例涉及自然語言處理技術(shù)領(lǐng)域,更具體地,涉及一種文本摘要生成方法、裝置及電子設(shè)備。
背景技術(shù)
隨著計算機技術(shù)的不斷發(fā)展,如何讓電子設(shè)備自動、快速及準確的提取一段文本的文本摘要,越來越受到人們的關(guān)注。
目前用來提取文本摘要的方法通常可以分為摘要抽取方法和摘要生成方法。摘要抽取方法一般是從文本中抽取若干個核心句子作為摘要;而摘要生成方法一般是基于自然語言處理(NLP,Natural Language Processing)技術(shù),在電子設(shè)備閱讀和理解文本后,按照自己的方式來生成流暢的摘要。
由于摘要抽取方法是將抽取到的句子進行簡單組合以作為文本的摘要,因此其生成的摘要可能出現(xiàn)口語化表述、語句不通暢以及不能準確獲取文本核心的問題。而摘要生成方法通常依賴于大量的樣本數(shù)據(jù)來進行訓練,而當待處理的文本為較難獲取樣本數(shù)據(jù)的領(lǐng)域中的文本時,例如,對通話數(shù)據(jù)進行轉(zhuǎn)換獲得的文本中往往存在口語表述嚴重、語音轉(zhuǎn)寫文字有誤等問題,這就使得該領(lǐng)域中的樣本數(shù)據(jù)通常較難獲得,從而導致基于該方法來提取文本摘要時往往存在結(jié)果不夠準確的問題。因此,有必要提供一種文本摘要生成方法,以快速、準確的提取文本摘要。
發(fā)明內(nèi)容
本公開的一個目的是提供一種生成文本摘要生成的新的技術(shù)方案。
根據(jù)本公開的第一方面,提供了文本摘要生成方法的一個實施例,包括:
獲取待處理的第一文本;
從所述第一文本中,獲取滿足預設(shè)條件的語句構(gòu)建初始摘要,并通過從所述第一文本中去除所述初始摘要,獲得第二文本;
對所述第二文本中的語句進行預設(shè)替換處理,獲得第三文本;
根據(jù)所述第三文本和所述初始摘要,獲得目標摘要。
可選地,所述從所述第一文本中,獲取滿足預設(shè)條件的語句構(gòu)建初始摘要,包括:
對所述第一文本中的語句進行重要性排名;
根據(jù)所述重要性排名,從所述第一文本中,選取滿足預設(shè)排名條件的至少一條語句構(gòu)建所述初始摘要。
可選地,所述通過從所述第一文本中去除所述初始摘要,獲得第二文本,包括:
通過將所述第一文本中的、滿足所述預設(shè)排名條件的語句替換為第一預設(shè)標記,獲得所述第二文本。
可選地,所述對所述第二文本中的語句進行預設(shè)替換處理,獲得第三文本,包括:
獲取第一語句中的標記詞語,其中,所述第一語句為所述第二文本中的任意一語句,所述標記詞語為使用預設(shè)策略從所述第一語句中選取的詞語;
使用第二預設(shè)標記替換所述標記詞語;
根據(jù)替換后的所述第一語句,獲得所述第三文本。
可選地,所述根據(jù)所述第三文本和所述初始摘要,獲得目標摘要,包括:
將所述第三文本輸入到目標摘要生成模型的編碼器子模型中,以及,將所述初始摘要輸入到目標摘要生成模型的解碼器子模型中,以獲得所述目標摘要;
其中,所述目標摘要生成模型用于根據(jù)所述編碼器子模型的第i層輸出的鍵向量、值向量,和所述解碼器子模型的第i-1層輸出的查詢向量,預測所述目標摘要,i為不小于1的整數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州云趣信息科技有限公司,未經(jīng)廣州云趣信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110991727.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





