[發(fā)明專利]文檔摘要的獲取方法和裝置、存儲(chǔ)介質(zhì)及電子裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201911052170.3 | 申請(qǐng)日: | 2019-10-31 |
| 公開(kāi)(公告)號(hào): | CN110825870B | 公開(kāi)(公告)日: | 2023-07-14 |
| 發(fā)明(設(shè)計(jì))人: | 童國(guó)烽;譚翊章 | 申請(qǐng)(專利權(quán))人: | 騰訊科技(深圳)有限公司 |
| 主分類號(hào): | G06F16/34 | 分類號(hào): | G06F16/34;G06F16/33 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 周婷婷 |
| 地址: | 518000 廣東省深圳*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文檔 摘要 獲取 方法 裝置 存儲(chǔ) 介質(zhì) 電子 | ||
本發(fā)明公開(kāi)了一種文檔摘要的獲取方法和裝置、存儲(chǔ)介質(zhì)及電子裝置。其中,該方法包括:獲取待處理的初始問(wèn)題信息和目標(biāo)文檔;根據(jù)初始問(wèn)題信息對(duì)目標(biāo)文檔執(zhí)行多輪的摘要抽取操作,得到目標(biāo)文檔摘要;輸出目標(biāo)文檔摘要,其中,目標(biāo)文檔摘要包括執(zhí)行每輪的摘要抽取操作得到的摘要抽取結(jié)果。本發(fā)明解決了文檔摘要獲取的準(zhǔn)確性低的技術(shù)問(wèn)題。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)領(lǐng)域,具體而言,涉及一種文檔摘要的獲取方法和裝置、存儲(chǔ)介質(zhì)及電子裝置。
背景技術(shù)
文檔摘要的獲取是自動(dòng)文檔摘要任務(wù)的一個(gè)簡(jiǎn)單變種,即給定用戶查詢的問(wèn)題和對(duì)應(yīng)檢索的文檔,通過(guò)對(duì)文檔內(nèi)容進(jìn)行語(yǔ)義分析后生成和問(wèn)題相關(guān)聯(lián)的摘要。現(xiàn)有技術(shù)中主要基于抽取式摘要方法與閱讀理解式摘要方法進(jìn)行文檔摘要的獲取。
基于抽取式摘要的方法主要存在以下幾個(gè)問(wèn)題:抽取的多個(gè)句子間很難保證語(yǔ)義是語(yǔ)義連貫的,且模型無(wú)法預(yù)知抽取到何時(shí)摘要即該停止,所以通常需要預(yù)測(cè)完最后一句,然后根據(jù)最大字?jǐn)?shù)限制來(lái)選擇得分最高的句子。另外受限于摘要的長(zhǎng)度,一般摘要只包含幾個(gè)句子,而有些較長(zhǎng)的文檔中存在的句子數(shù)目很可觀,這種基于分類的方法在訓(xùn)練時(shí)會(huì)不可避免的遭遇類別不平衡問(wèn)題。而基于閱讀理解式摘要的方法,只能根據(jù)問(wèn)題預(yù)測(cè)一個(gè)連續(xù)的開(kāi)始和結(jié)束區(qū)間,無(wú)法直接建模句子的序列信息。因?yàn)閷?shí)際的摘要往往是分散在文檔中間,不一定是一個(gè)連續(xù)的區(qū)域,所以這種方法往往產(chǎn)生的結(jié)果不是很理想。因此,存在文檔摘要獲取的準(zhǔn)確性低的問(wèn)題。
針對(duì)上述的問(wèn)題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種文檔摘要的獲取方法和裝置、存儲(chǔ)介質(zhì)及電子裝置,以至少解決文檔摘要獲取的準(zhǔn)確性低的技術(shù)問(wèn)題。
根據(jù)本發(fā)明實(shí)施例的一個(gè)方面,提供了一種文檔摘要的獲取方法,包括:獲取待處理的初始問(wèn)題信息和目標(biāo)文檔;根據(jù)上述初始問(wèn)題信息對(duì)上述目標(biāo)文檔執(zhí)行多輪的摘要抽取操作,得到目標(biāo)文檔摘要,其中,在執(zhí)行每輪的摘要抽取操作時(shí),通過(guò)已執(zhí)行的一輪或多輪的摘要抽取操作獲取摘要抽取結(jié)果,進(jìn)而根據(jù)上述摘要抽取結(jié)果確定當(dāng)前輪的當(dāng)前問(wèn)題信息,并根據(jù)上述當(dāng)前問(wèn)題信息執(zhí)行當(dāng)前輪的摘要抽取操作,在執(zhí)行第1輪的摘要抽取操作時(shí),上述第1輪的當(dāng)前問(wèn)題信息為上述初始問(wèn)題信息;輸出上述目標(biāo)文檔摘要,其中,上述目標(biāo)文檔摘要包括上述執(zhí)行每輪的摘要抽取操作得到的摘要抽取結(jié)果。
根據(jù)本發(fā)明實(shí)施例的另一方面,還提供了一種文檔摘要的獲取裝置,包括:獲取單元,用于獲取待處理的初始問(wèn)題信息和目標(biāo)文檔;抽取單元,用于根據(jù)上述初始問(wèn)題信息對(duì)上述目標(biāo)文檔執(zhí)行多輪的摘要抽取操作,得到目標(biāo)文檔摘要,其中,在執(zhí)行每輪的摘要抽取操作時(shí),通過(guò)已執(zhí)行的一輪或多輪的摘要抽取操作獲取摘要抽取結(jié)果,進(jìn)而根據(jù)上述摘要抽取結(jié)果確定當(dāng)前輪的當(dāng)前問(wèn)題信息,并根據(jù)上述當(dāng)前問(wèn)題信息執(zhí)行當(dāng)前輪的摘要抽取操作,在執(zhí)行第1輪的摘要抽取操作時(shí),上述第1輪的當(dāng)前問(wèn)題信息為上述初始問(wèn)題信息;輸出單元,用于輸出上述目標(biāo)文檔摘要,其中,上述目標(biāo)文檔摘要包括上述執(zhí)行每輪的摘要抽取操作得到的摘要抽取結(jié)果。
根據(jù)本發(fā)明實(shí)施例的又一方面,還提供了一種計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀的存儲(chǔ)介質(zhì)中存儲(chǔ)有計(jì)算機(jī)程序,其中,該計(jì)算機(jī)程序被設(shè)置為運(yùn)行時(shí)執(zhí)行上述文檔摘要的獲取方法。
根據(jù)本發(fā)明實(shí)施例的又一方面,還提供了一種電子裝置,包括存儲(chǔ)器、處理器及存儲(chǔ)在存儲(chǔ)器上并可在處理器上運(yùn)行的計(jì)算機(jī)程序,其中,上述處理器通過(guò)計(jì)算機(jī)程序執(zhí)行上述的文檔摘要的獲取方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于騰訊科技(深圳)有限公司,未經(jīng)騰訊科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911052170.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種電子文檔識(shí)別方法及裝置
- 文檔匹配方法和文檔匹配裝置
- 復(fù)雜文檔分離組織方法以及復(fù)雜文檔自動(dòng)生成方法
- 一種文檔流程控制方法及裝置
- 云文檔加密及解密方法、加密及解密裝置、以及處理系統(tǒng)
- 一種將Markdown文檔轉(zhuǎn)換為PDF文檔的方法、裝置
- 文檔類型識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 基于文檔編輯軟件的文檔處理方法、裝置、設(shè)備及介質(zhì)
- 一種引用文檔的更新方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 文檔操作錄制方法、文檔操作動(dòng)畫生成方法、裝置及設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





