[發明專利]一種問題驅動的社交網絡答案摘要自動生成方法與裝置在審
| 申請號: | 202111365252.0 | 申請日: | 2021-11-17 |
| 公開(公告)號: | CN114048309A | 公開(公告)日: | 2022-02-15 |
| 發明(設計)人: | 楊鵬;李冰;陳維威;于曉潭 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F16/34 | 分類號: | G06F16/34;G06F40/216;G06F40/30;G06N3/04;G06N5/04;G06Q50/00 |
| 代理公司: | 南京眾聯專利代理有限公司 32206 | 代理人: | 杜靜靜 |
| 地址: | 211135 江蘇省南京市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 問題 驅動 社交 網絡 答案 摘要 自動 生成 方法 裝置 | ||
本發明公開了一種問題驅動的社交網絡答案摘要自動生成方法,所述方法包括以下步驟:步驟1:社交網絡文本采集;步驟2:數據預處理;步驟3:模型訓練;步驟4:模型測試與文本生成,本發明能夠改善傳統摘要生成方法中過度依賴語義關聯性而導致泛化能力低和缺乏可推理性等問題,進而提升生成摘要的可讀性、流暢性和簡潔性。
技術領域
本發明涉及一種問題驅動的社交網絡答案摘要自動生成方法與裝置,屬于互聯網和人工智能技術領域。
背景技術
隨著互聯網技術的飛速發展,社交媒體稱為人們快速發布和獲取信息的重要平臺,隨之帶來各種網絡知識查詢平臺上信息量的爆炸式增長。這些需要復雜答案的開放式問題被定義為非事實性問題,比如描述、觀點或解釋,該類問題所對應的答案中往往包含多個句子或段落,包括很多分析和解釋,導致答案十分冗長,并呈現了大量無意義的信息,從而造成了閱讀困難和理解偏差。因此,對于非事實類問答,根據問題,對答案進行全面分析、抽取、提煉出重要的信息,從而生成簡短而清晰的答案摘要呈現給用戶,可以有效幫助用戶迅速、方便的獲得所需,提高社交平臺的體驗感。
摘要生成主要分為抽取式摘要模型和生成式摘要模型。抽取式摘要模型是從源文檔中提取關鍵字或目的句,通過合理拼接形成摘要。這種方法更適合于新聞或文章類的事實類內容總結,不能保證總結信息的一致性。然而,與事實問答不同的是,非事實類文本包含非正式的寫作風格、嘈雜信息以及答案推理的過程,并且很難用抽取式摘要很好地建模答案。另外,由于答案中不同句子的貢獻值不同,要求模型具有良好的泛化推理性能。
生成式摘要模型最典型的模型為序列到序列(sequence-to-sequence,seq2seq)的模型。該模型由編碼器和解碼器組成。首先通過編碼器將輸入的文本轉化為文本編碼為能代表語義信息的向量,然后通過解碼器將狀態向量解碼并生成摘要。然而,多數研究者都將研究集中在如何利用注意力機制獲取重要信息或將問題添加到注意力機制中,這種做法只注重從整體上看問題的答案,缺乏對問題語義表征的分析和推理,導致抽象的可解釋性較弱。此外,如果不考慮相鄰句子語義依賴關系,隨機進行多跳推理,往往會導致信息跨度過大,大大降低模型的計算效率。
為此,本發明在seq2seq模型的基礎上,嘗試將自然語言中相鄰句子的語義繼承結構引入到文本信息推理的注意機制中。提出了一種分層滑動融合推理模塊,該模塊打破傳統的多跳機制,采用順序滑動融合機制,能保證降低算法的復雜度的同時,為句子之間的表示提供了可推理性的多層深度表示。此外,打破傳統的方法中只關注源文本的慣例,在指針生成網絡中引入了與源文本相關的問題表示,以擴展源文本池。有效地提高摘要的性能和流暢性,使生成的摘要更接近人類自然語言的流暢表達,并能簡明準確地回答對應的問題。
發明內容
為了解決現有技術中存在的問題與不足,本發明提出一種問題驅動的社交網絡答案摘要自動生成方法,利用分層滑動推理模塊選擇答案中與問題相關度最高,且包含重要關鍵信息的句子,為答案摘要的生成提供可解釋性;并通過雙驅動選擇生成器生成答案摘要。
為了實現上述目的,本發明的技術方案如下:一種問題驅動的社交網絡答案摘要自動生成方法,包括如下步驟:
步驟1:社交網絡文本采集,通過互聯網采集多篇社交網絡文本,積累樣本數據集,數據集中的一個樣本包括社交網絡文本中的問題和答案,以及答案所對應的標準答案摘要;
步驟2:數據預處理,對數據集中每一個樣本進行預處理,并構造三元組數據,一個三元組數據包括問題,答案原文,以及答案標準的摘要;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111365252.0/2.html,轉載請聲明來源鉆瓜專利網。





