[發明專利]摘要生成方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202210374056.8 | 申請日: | 2022-04-11 |
| 公開(公告)號: | CN114817523A | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 杜江楠;李劍鋒 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F40/279;G06F40/30 |
| 代理公司: | 深圳市力道知識產權代理事務所(普通合伙) 44507 | 代理人: | 鄭永敏 |
| 地址: | 518057 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 摘要 生成 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種摘要生成方法,其特征在于,包括:
獲取待生成摘要的目標文本,所述目標文本包括標題文本與包含至少一個語句的正文語句集合;
根據所述標題文本與所述正文語句集合進行語句提取,獲得所述正文語句集合對應的關鍵語句;
基于摘要生成模型,根據所述關鍵語句與所述標題文本進行摘要生成,獲得所述目標文本對應的目標摘要信息。
2.根據權利要求1所述的摘要生成方法,其特征在于,所述根據所述標題文本與所述正文語句集合進行語句提取,獲得所述正文語句集合對應的關鍵語句,包括:
確定所述正文語句集合中的每個語句對應的第一重要性得分,所述第一重要性得分為每個所述語句與所述標題文本之間的重要性得分;
確定每個所述語句對應的第二重要性得分,所述第二重要性得分為每個所述語句在所述正文語句集合中的重要性得分;
根據每個所述語句的第一重要性得分與第二重要性得分,確定所述關鍵語句。
3.根據權利要求2所述的摘要生成方法,其特征在于,所述確定所述正文語句集合中的每個語句對應的第一重要性得分,包括:
將每個所述語句輸入向量化模型進行向量化,獲得每個所述語句對應的語句向量;
將所述標題文本輸入所述向量化模型進行向量化,獲得所述標題文本對應的標題文本向量;
計算每個所述語句對應的語句向量與所述標題文本向量之間的相似度,并將得到的相似度確定為每個所述語句對應的第一重要性得分。
4.根據權利要求2所述的摘要生成方法,其特征在于,所述確定每個所述語句對應的第二重要性得分,包括:
確定每個所述語句對應的語句向量;
根據不同語句對應的語句向量,計算每個所述語句與其它語句之間的相似度,獲得每個所述語句對應的相似度矩陣;
根據每個所述語句對應的相似度矩陣,確定每個所述語句對應的第二重要性得分。
5.根據權利要求4所述的摘要生成方法,其特征在于,所述根據每個所述語句對應的相似度矩陣,確定每個所述語句對應的第二重要性得分,包括:
構建所述正文語句集合的句子圖,所述句子圖中的每個節點對應所述正文語句集合中的一個語句,不同節點之間具有邊;
根據每個所述語句對應的相似度矩陣,確定所述句子圖中的邊的權重值;
基于文本排序算法,根據所述句子圖中的邊的權重值對所述句子圖中的節點的權重值進行迭代更新,直至滿足預設的收斂條件;
根據所述句子圖中的每個節點的權重值,確定每個所述語句對應的第二重要性得分。
6.根據權利要求2所述的摘要生成方法,其特征在于,所述根據每個所述語句的第一重要性得分與第二重要性得分,確定所述關鍵語句,包括:
對每個所述語句的第一重要性得分與第二重要性得分進行加權計算,獲得每個所述語句的重要性總分;
將重要性總分大于第一預設分數閾值的語句,確定為所述關鍵語句。
7.根據權利要求1所述的摘要生成方法,其特征在于,所述摘要生成模型包括向量化模型與摘要抽取層,所述關鍵語句有至少一個;所述基于摘要生成模型,根據所述關鍵語句與所述標題文本進行摘要生成,獲得所述目標文本對應的目標摘要信息,包括:
將所述標題文本、每個所述關鍵語句以及每個所述關鍵語句的上下文語句進行拼接,獲得每個所述關鍵語句對應的目標語句集合;
將每個所述關鍵語句對應的目標語句集合輸入所述向量化模型進行向量化,獲得每個所述關鍵語句對應的關鍵語句向量;
將每個所述關鍵語句對應的關鍵語句向量輸入所述摘要抽取層進行摘要抽取,獲得每個所述關鍵語句對應的摘要抽取結果;
根據每個所述關鍵語句對應的摘要抽取結果,確定所述目標摘要信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210374056.8/1.html,轉載請聲明來源鉆瓜專利網。





