[發明專利]基于案件屬性感知的案件傾向性抽取式摘要方法有效
| 申請號: | 202010980726.1 | 申請日: | 2020-09-17 |
| 公開(公告)號: | CN112287687B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 余正濤;閆婉瑩;郭軍軍;相艷;黃于欣;線巖團 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/279;G06F40/258;G06F40/211;G06F16/35;G06F16/951;G06N3/04;G06N3/08 |
| 代理公司: | 昆明人從眾知識產權代理有限公司 53204 | 代理人: | 何嬌 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 案件 屬性 感知 傾向性 抽取 摘要 方法 | ||
本發明涉及基于案件屬性感知的案件傾向性抽取式摘要方法。本發明根據案件屬性詞構建案件信息庫并提出基于案件屬性感知的層級選擇性編碼結構、提出案件傾向性聯合注意力機制,獲得更傾向于涉案新聞的文本語義表征、通過句子打分與選擇框架聯合學習完成摘要句的抽取。本發明基于涉案新聞文本數據集的實驗結果表明,本文模型的Rouge評價指標均取得顯著提升并抽取出更傾向于與案件相關的摘要句。且在涉案新聞文本數據集上,加入案件信息庫可以有效的提升新聞摘要句與領域的相關性,實驗結果表明本發明提出方法的有效性。
技術領域
本發明涉及基于案件屬性感知的案件傾向性抽取式摘要方法,屬于自然語言處理技術領域。
背景技術
隨著信息化時代的到來,輿情信息爆炸性增長,網絡越來越影響著法院的方方面面,輿論監督也已經滲透到案件的方方面面,涉案新聞文本摘要的形成有利于在司法實踐和行政管理中極大地提高工作效率。目前,面向通用領域的文本摘要研究進展較為迅速,然而受限于法律領域知識及開放數據集規模,以涉案新聞文本為核心的文本摘要形成面臨極大困難與挑戰。
面向涉案新聞的文本摘要方法,其技術難點在于涉及法院新聞的數據包含大量的案件細節及案件屬性詞,并且主題句都凝練的非常準確,案件屬性詞是描述某一事物屬性的詞語,是定位、黏著性較強的黏著飾詞,其內部結構對涉案新聞文本分布功能會產生重要影響并與文本存在較密切的語義結構關系。
當前文本摘要的方法主要分為抽取式和生成式,抽取式摘要方法是通過分析文本統計特征、潛意語義特征等從原文中選取關鍵詞、關鍵句,在句子或段落級別上組成摘要,生成式摘要方法是在理解原文語義的基礎上,在詞語級別上組成摘要,有可能生成新的詞組。涉案新聞文本摘要需考慮其可讀性、連續性和邏輯完整性,簡單地將一個個單詞實體拼接起來,無法形成可讀的文段。因此上述文本特點要求模型更善于捕捉句子級特征與語義層面的特征。近年來,序列到序列網絡模型已被廣泛應用于文本摘要任務中,以層級編碼框架為代表的深度學習框架目前已在文本摘要任務中得到成果應用。然而,這些成果僅是解決了通用領域文本摘要問題,尚未解決特定領域如涉案新聞文本中領域知識的相關性對文本語義理解所造成的影響。
發明內容
為解決上述問題,本發明根據案件屬性信息構建案件信息庫,將領域信息與現有的文本摘要方法聯合學習完成涉案新聞文本摘要任務,并提出一種基于案件屬性感知的案件傾向性抽取式文本摘要模型,進行涉案新聞文本摘要句的抽取。
本發明的技術方案是:基于案件屬性感知的案件傾向性抽取式摘要方法,根據案件屬性詞構建案件信息庫并提出基于案件屬性感知的層級選擇性編碼結構、提出案件傾向性聯合注意力機制,獲得更傾向于涉案新聞的文本語義表征、通過句子打分與選擇框架聯合學習完成摘要句的抽取。
具體的,本發明首先使用雙向循環神經網絡對案件信息庫進行編碼,并通過自注意力機制獲得案件信息庫的權重信息;其次使用句子級選擇性編碼對涉案新聞文本句子依次進行編碼并選擇重要信息獲得句子級向量的語義表征,通過雙向循環神經網絡獲得文檔級語義向量,并通過感知案件屬性選擇編碼策略將特定案件信息庫已獲得的語義向量與文檔級語義向量共同學習得到案件屬性感知的文檔級語義向量,然后通過案件傾向性聯合注意力網絡將案件屬性感知文檔級選擇性編碼向量表示與案件信息庫編碼語義表征進行聯合學習,得到更傾向于案件信息的文檔表示;最后通過句子提取器完成摘要句的提取。
作為本發明的進一步方案,所述方法包括:
Step1、涉案新聞文本數據爬取并進行數據預處理;
Step2、通過案件信息庫編碼器模型得到案件信息庫的語義向量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010980726.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種LNG船液穹甲板分段的同胎建造方法
- 下一篇:一種金屬管加工冷卻裝置





