[發明專利]一種融合語義場景的摘要自動生成方法及系統有效
| 申請號: | 202110412989.7 | 申請日: | 2021-04-16 |
| 公開(公告)號: | CN113326866B | 公開(公告)日: | 2022-05-31 |
| 發明(設計)人: | 關勇;李茹;郭少茹;譚紅葉;張虎 | 申請(專利權)人: | 山西大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06F40/30 |
| 代理公司: | 太原申立德知識產權代理事務所(特殊普通合伙) 14115 | 代理人: | 郭海燕 |
| 地址: | 030006*** | 國省代碼: | 山西;14 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 語義 場景 摘要 自動 生成 方法 系統 | ||
本發明屬于自然語言處理研究領域,具體為一種融合語義場景的摘要自動生成方法及系統。具體內容如下:一、圖構建單元,根據文章中的框架分別構建語義場景圖和詞關系圖;二、文章編碼單元,使用預訓練模型獲取文章的向量表示;三、圖編碼單元,使用圖模型分別獲取語義場景圖和詞關系圖的向量表示;四、圖交互單元,計算詞關系圖對語義場景圖的影響,獲取圖向量表示;五、特征融合單元,融合文章和圖向量表示,得到最終的文章向量表示;六、解碼單元,將文章表示輸入解碼單元,獲得最終的摘要。本發明方法從結構和詞層面分別構建語義場景圖和詞關系圖,并計算兩者之間的關系,指導摘要的生成,具有很強的擴展性,能夠有效地提升生成摘要的質量。
技術領域
本發明屬于自然語言處理研究領域,具體為一種融合語義場景的摘要自動生成方法及系統。
背景技術
摘要自動生成是指利用計算機在原文的基礎上生成一個簡短且保留原文重要信息的文本。隨著大數據時代的到來,人們需要大量的時間從海量文本中獲取重要的信息,而文本自動摘要作為一個提升獲取重要信息效率的方法變得越來越重要。
隨著深度學習的不斷發展,基于深度學習的方法被廣泛應用到摘要生成任務中,其模型架構主要使用序列到序列編碼,包括兩部分:編碼層、解碼層。編碼層是將文章編碼為一個向量表示,解碼層是基于該向量表示解碼得到摘要。雖然基于序列到序列的深度學習方法已經取得了很大的成功,但是該模型架構傾向于捕捉文本的上下文信息,忽略了文本內在的結構信息,進而影響模型的性能。此外,當前基于圖的深度學習方法僅考慮了文本中詞之間的關系或者文本的結構信息,而忽略了兩者之間的關系。例如:Jiacheng Xu,ZheGan,Yu Cheng, and Jingjing Liu.2020.Discourse-aware neural extractive textsummarization.In Proceedings of the 58th Annual Meeting of the Associationfor Computational Linguistics,pages 5021–5031.Xu等使用Rhetorical StructureTheory(RST)將整句句子切分為子句,然后通過子句之間的關系學習文本的結構信息。Chenguang Zhu, William Hinthorn,Ruochen Xu,Qingkai Zeng,Michael Zeng,XuedongHuang,and Meng Jiang.2020.Boosting factual correctness of abstractivesummarization with knowledge graph.arXiv 2003.08612.針對摘要自動生成問題,從文本中抽取三元組(主,謂,賓)構建知識圖網絡,進而學習文本中詞之間的關系。
發明內容
針對上述問題本發明提供了一種融合語義場景的摘要自動生成方法。該方法同時考慮詞之間的關系以及文本的結構信息。通過構建語義場景圖和詞關系圖,計算詞關系圖對語義場景圖的影響,指導摘要的生成,使用這一方法可以有效的提升生成摘要的質量。
為了達到上述目的,本發明采用了下列技術方案:
本發明提供一種融合語義場景的摘要自動生成系統,包括:圖構建單元、文章編碼單元、圖編碼單元、圖交互單元、特征融合單元和解碼單元;所述圖構建單元用于構建語義場景圖和詞關系圖;所述文章編碼單元用于獲取文章的向量表示;所述圖編碼單元用于獲取語義場景圖和詞關系圖的向量表示;所述圖交互單元用于計算詞關系圖向量表示對語義場景圖向量表示的影響,從而得到最終的圖向量表示;所述特征融合單元用于獲取最終的文章向量表示;所述解碼單元用于生成摘要。
本發明還提供一種融合語義場景的摘要自動生成方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山西大學,未經山西大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110412989.7/2.html,轉載請聲明來源鉆瓜專利網。





