[發明專利]一種基于層次多維變壓器模型的文檔摘要計算方法有效
| 申請號: | 202011421016.1 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112559729B | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 申德周;尹宏偉 | 申請(專利權)人: | 申德周;尹宏偉 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F40/279 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 層次 多維 變壓器 模型 文檔 摘要 計算方法 | ||
1.一種基于變壓器模型的文檔摘要計算方法,其特征在于,包括以下步驟:
步驟1.段落拆分與識別階段;具體步驟如下:
步驟1-1.根據文檔主題特征詞將文檔劃分成多個段落;
步驟1-2.保留以特征詞開頭的段落,舍棄其他段落;
步驟2.重點句識別階段;具體步驟如下:
步驟2-1.在訓練階段,利用標注句語料,基于海量語料預訓練多層變壓器語言模型,訓練句子權重判斷模型;
步驟2-2.識別階段,利用基于變壓器的句子權重判斷模型識別段落中重點句,舍棄其他句子;
步驟3.重點字詞識別階段;具體步驟如下:
步驟3-1.在訓練階段,利用重點字詞標注語料,基于無長度限制的海量語料預訓練多層變壓器語言模型,訓練字詞序列到序列的權重模型;
步驟3-2.在識別階段,利用無長度限制的海量語料預訓練多層變壓器語言模型以及序列到序列模型,根據字詞評分保留閾值內高評分的字詞,舍棄其他字詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于申德周;尹宏偉,未經申德周;尹宏偉許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011421016.1/1.html,轉載請聲明來源鉆瓜專利網。





