[發(fā)明專利]一種文本摘要生成方法和裝置有效
| 申請?zhí)枺?/td> | 201911115181.1 | 申請日: | 2019-11-14 |
| 公開(公告)號: | CN110888976B | 公開(公告)日: | 2023-06-20 |
| 發(fā)明(設(shè)計(jì))人: | 韓慶宏 | 申請(專利權(quán))人: | 北京香儂慧語科技有限責(zé)任公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 柳欣 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文本 摘要 生成 方法 裝置 | ||
本發(fā)明提供了一種文本摘要生成方法和裝置,其中,該方法包括:獲取文檔的文本內(nèi)容,從所述文檔的文本內(nèi)容中提取多個文本片段形成所述文檔的候選摘要文本;提取所述候選摘要文本中各字符的特征向量;根據(jù)提出的所述候選摘要文本中各字符的特征向量,對所述候選摘要文本進(jìn)行修正,生成所述文檔的文本摘要。通過本發(fā)明實(shí)施例提供的文本摘要生成方法和裝置,可以降低生成文本摘要時的人工成本,并提高了生成文本摘要的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體而言,涉及一種文本摘要生成方法和裝置。
背景技術(shù)
目前,隨著近幾年文本信息的爆發(fā)式增長,人們每天都能夠接觸到海量的文檔,如新聞、博客、論文、微博、聊天等,從大量文檔信息中提取重要的內(nèi)容,成為一個迫切需求。生成文本摘要便是一種高效的解決手段,文本摘要旨在文檔基礎(chǔ)上得到包含文檔關(guān)鍵信息的文本摘要。用戶通過閱讀文本摘要就可以快速了解文檔內(nèi)容。
為了生成文檔的文本摘要,可以先將文檔輸入摘要生成模型中,由摘要生成模型抽取文檔中的句子形成文檔的待評測文本摘要;然后由人工閱讀該文檔,總結(jié)該文檔的中心思想,并以此對文檔的上述待評測文本摘要進(jìn)行修訂,最終生成文檔的文本摘要。
生成文檔的文本摘要過程需要人工參與,具有成本高且效率低的缺陷。
發(fā)明內(nèi)容
為解決上述問題,本發(fā)明實(shí)施例的目的在于提供一種文本摘要生成方法和裝置。
第一方面,本發(fā)明實(shí)施例提供了一種文本摘要生成方法,包括:
獲取文檔的文本內(nèi)容,從所述文檔的文本內(nèi)容中提取多個文本片段形成所述文檔的候選摘要文本;
提取所述候選摘要文本中各字符的特征向量;
根據(jù)提出的所述候選摘要文本中各字符的特征向量,對所述候選摘要文本進(jìn)行修正,生成所述文檔的文本摘要。
第二方面,本發(fā)明實(shí)施例還提供了一種文本摘要生成裝置,包括:
獲取模塊,用于獲取文檔的文本內(nèi)容,從所述文檔的文本內(nèi)容中提取多個文本片段形成所述文檔的候選摘要文本;
提取模塊,用于提取所述候選摘要文本中各字符的特征向量;
生成模塊,用于根據(jù)提出的所述候選摘要文本中各字符的特征向量,對所述候選摘要文本進(jìn)行修正,生成所述文檔的文本摘要。
本發(fā)明實(shí)施例上述第一方面至第二方面提供的方案中,通過從文檔的文本內(nèi)容中提取多個文本片段形成所述文檔的候選摘要文本,并根據(jù)候選摘要文本中各字符的特征向量,對所述候選摘要文本進(jìn)行修正,生成所述文檔的文本摘要,與相關(guān)技術(shù)中生成文檔的文本摘要過程需要人工參與的方式相比,可以先通過從文檔中提取的多個文本片段形成所述文檔的候選摘要文本,然后根據(jù)候選摘要文本中各字符的特征向量對候選摘要文本進(jìn)行修正生成文檔的文本摘要,生成文本摘要的過程無需人工參與,降低了生成文本摘要時的人工成本,并提高了生成文本摘要的效率。
為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能更明顯易懂,下文特舉較佳實(shí)施例,并配合所附附圖,作詳細(xì)說明如下。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1示出了本發(fā)明實(shí)施例1所提供的一種文本摘要生成方法的流程圖;
圖2示出了本發(fā)明實(shí)施例2所提供的一種文本摘要生成裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京香儂慧語科技有限責(zé)任公司,未經(jīng)北京香儂慧語科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911115181.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種富含活性益生菌的低鹽泡菜的制備方法
- 下一篇:成像鏡頭
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





