[發明專利]多文本摘要生成方法、裝置、服務器及存儲介質有效
| 申請號: | 201811523926.3 | 申請日: | 2018-12-13 |
| 公開(公告)號: | CN109657053B | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 李法遠;陳思姣;羅雨 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F40/211;G06F40/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 胡彬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 摘要 生成 方法 裝置 服務器 存儲 介質 | ||
本發明實施例公開了一種多文本摘要生成方法、裝置、服務器及存儲介質。其中,所述方法包括:從目標文本集合的每個文本的句子中確定與目標文本集合對應的摘要句集合;依據句子所屬文本的發布時間和句子在所屬文本中的位置,對目標文本集合的每個句子進行排序;依據每個句子的排序結果,確定所述摘要句集合中各摘要句的順序;按照所述摘要句的順序組合成目標文本集合的摘要。本發明實施例通過對摘要句按照時間排序法進行排序,排序后使得摘要整體更加通順、合理、自然,整體效果表現更加優秀。
技術領域
本發明實施例涉及互聯網技術領域,尤其涉及一種多文本摘要生成方法、裝置、服務器及存儲介質。
背景技術
多文本摘要從定義上講,就是把同一主題下的多個文本的主要信息按壓縮比提煉成一個摘要。從應用的角度講,一方面,在使用搜索引擎時,搜索同一主題的文本往往能返回成千上萬個網頁,如果將這些網頁形成一個統一精煉能夠反映主要信息的摘要必然具有重要意義。另一方面,網上某一新聞單位對同一事件的系列報道,或者某一時間數家新聞單位同一時間的報道,若能把這些相關性很強的文本提煉出一個覆蓋性強、形式簡介的摘要也是同樣具有重要意義的。
多文本摘要模型主要可以劃分為兩種:抽取式多文檔摘要、生成式多文檔摘要,其中研究最多的是抽取式多文本摘要。然而,傳統的抽取式多文本摘要算法生成的摘要往往不通順、不自然,摘要整體質量不高。
發明內容
本發明實施例提供了一種多文本摘要生成方法、裝置、服務器及存儲介質,以解決現有技術中利用傳統的抽取式多文檔摘要算法生成摘要時所存在的摘要內容不通順、不自然,導致摘要整體質量差的問題。
第一方面,本發明實施例提供了一種多文本摘要生成方法,包括:
從目標文本集合的每個文本的句子中確定與目標文本集合對應的摘要句集合;
依據句子所屬文本的發布時間和句子在所屬文本中的位置,對目標文本集合的每個句子進行排序;
依據每個句子的排序結果,確定所述摘要句集合中各摘要句的順序;
按照所述摘要句的順序組合成目標文本集合的摘要。
第二方面,本發明實施例還提供了一種多文本摘要生成裝置,包括:
從目標文本集合的每個文本的句子中確定與目標文本集合對應的摘要句集合;
依據句子所屬文本的發布時間和句子在所屬文本中的位置,對目標文本集合的每個句子進行排序;
依據每個句子的排序結果,確定所述摘要句集合中各摘要句的順序;
按照所述摘要句的順序組合成目標文本集合的摘要。
第三方面,本發明實施例還提供了一種服務器,包括:
一個或多個處理器;
存儲器,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如本發明任一實施例所述的多文本摘要生成方法。
第四方面,本發明實施例還提供了一種計算機可讀存儲介質,其上存儲有計算機程序,該程序被處理器執行時實現如本發明任一實施例所述的多文本摘要生成方法。
本發明實施例提供的一種多文本摘要生成方法、裝置、服務器及存儲介質,在確定摘要句集合后,根據各句子所屬文本的發布中間和在所屬文本中的位置,對目標文本集合中的所有句子進行排序,并依據排序結果對摘要句集合中的摘要句進行排序,以便組成所需的多文本摘要。由此,對摘要句按照時間排序法進行排序,經過排序后使得摘要整體更加通順、合理、自然,整體效果表現更加優秀。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811523926.3/2.html,轉載請聲明來源鉆瓜專利網。





