[發明專利]基于筆畫和自注意力機制的神經網絡中文問題生成系統有效
| 申請號: | 201910572796.0 | 申請日: | 2019-06-28 |
| 公開(公告)號: | CN110334196B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 黎偉;康琦 | 申請(專利權)人: | 同濟大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/289;G06F40/30;G06F40/242;G06N3/088 |
| 代理公司: | 上海德昭知識產權代理有限公司 31204 | 代理人: | 郁旦蓉 |
| 地址: | 200092 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 筆畫 注意力 機制 神經網絡 中文 問題 生成 系統 | ||
本發明提供一種基于筆畫和自注意力機制的神經網絡中文問題生成系統,用于根據被獲取的中文段落生成相應的中文問題,其特征在于,包括:筆畫詞向量存儲部,用于存儲預先訓練得到的筆畫詞向量,中文段落獲取部,用于獲取中文段落,提示詞提取部,用于根據從中文段落中提取多個關鍵詞作為至少一個提示詞,詞向量轉換組合部,用于將中文段落轉換為中文詞向量、將提示詞轉換為掩碼形式的提示詞掩碼、并將中文詞向量以及提示詞掩碼與筆畫詞向量連接形成組合向量,問題詞生成部,用于根據組合向量生成多個問題詞,中文問題組合輸出部,用于將問題詞依序組合為中文問題并進行輸出。
技術領域
本發明屬于人工智能領域,涉及一種基于筆畫和自注意力機制的神經網絡中文問題生成系統。
背景技術
學習提問在人類智能的發展和人工智能系統的發展中都起著重要作用。在許多應用領域中,對問題產生的需求正在迅速增長。問題生成系統旨在根據給定的文章生成各種問題,可以提供根據文章,生成問題作為教育材料來指導學生學習,可以改進問答系統的準確率,還可以幫助聊天機器人冷啟動或繼續與人交談。
現有的中文問題生成效果不佳,目前最常用基于規則的系統將陳述句轉換為問題,這一種方法需要大量的人力創建規則,現有的基于規則的中文問題生成系統只能生成固定形式的問題,且需要大量的人力支持。由于系統規則中的錯誤以及一些其他不可避免的錯誤,這些模型表現不佳。
現有技術基于規則的中文問題生成,或直接使用英文問題生成系統,將帶來以下幾個問題:第一,若采用基于規則的中文問題生成,需要大量的人力創建規則,生成的問題也具有固定形式,并且無法避免規則中的錯誤;第二,沒有很好利用中文語義與字形相關這一特征,導致中文問題生成系統效果差;第三,直接使用英文問題生成系統,不能解決漢語中經常出現的未登錄詞(Out?Of?Vocabulary,OOV)問題。
現列舉三種相關技術及其缺點:
相關技術1:專利“一種基于答案與答案位置信息的神經網絡問題生成方法”,申請號201811587178.5。該發明專利涉及一種基于拷貝機制的序列到序列模型,基于答案與答案位置信息,問題句生成過程分為三個模式,問題詞生成模式,詞典詞生成模式和拷貝模式。
缺點:該專利是基于英文段落生成英文問題,由于中文中未登錄詞的數量很多,在生成的問題中無法表示,導致這種方法不能直接應用于中文問題生成。
相關技術2:專利“一種中文相似問題生成系統與方法”,申請號201811360413.5。該發明專利涉及一種中文相似問題生成系統,該系統可以根據相似度在手動標記的語義知識庫中定位相應的關鍵詞,通過關鍵詞在語義知識庫的關聯度和相似度排序輸出相似問題。
缺點:該專利需要事先構建語義知識庫,這一過程需要大量的人力;而且語義知識庫的質量會在很大程度上影響系統的表現,如果語義知識庫有錯誤的話,在問題生成部分會出現不可避免的錯誤,并且該方法生成的問題質量較差。
相關技術3:專利“一種基于生成式對抗網絡的開放式問題自動生成方法”,申請號201811495625。該發明專利涉及一種基于生成式對抗網絡的開放式問題自動生成方法,在開放式問題生成上,建立問題自動生成模型包括生成器和鑒別器,采用增強學習的模型對抗訓練方法,實現問題自動生成。
缺點:該專利主要針對開放式問題生成,評價標準為是否符合人類提問的語言風格,其針對封閉式問題的生成質量較差,不能很好生成有關某段文本的問題。
發明內容
為解決上述問題,提供一種基于筆畫和自注意力機制的神經網絡中文問題生成系統,本發明采用了如下技術方案:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于同濟大學,未經同濟大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910572796.0/2.html,轉載請聲明來源鉆瓜專利網。





