[發明專利]一種基于語義對齊的樹結構數學應用題求解方法及系統有效
| 申請號: | 202010084490.3 | 申請日: | 2020-02-10 |
| 公開(公告)號: | CN111259632B | 公開(公告)日: | 2023-04-11 |
| 發明(設計)人: | 龔科;周啟賢 | 申請(專利權)人: | 暗物智能科技(廣州)有限公司 |
| 主分類號: | G06F40/151 | 分類號: | G06F40/151;G06F17/11;G06N3/02 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 李紅團 |
| 地址: | 511400 廣東省廣州市南沙區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 對齊 結構 數學 應用題 求解 方法 系統 | ||
本發明公開了一種基于語義對齊的樹結構數學應用題求解方法及系統,將獲取的待求解的應用題題目文本轉化為語義編碼后的上下文特征表示;將上下文特征表示利構建根節點向量;對根節點向量進行節點類別,根據節點類別采用先序遍歷的方式構建表達式樹結構;對表達式樹結構的子樹特征和應用題題目文本的特征表示進行非線性變換,將兩者轉換到相同的語義空間;利用預設約束項對表達式樹結構的子樹特征與應用題題目文本的特征表示進行語義對齊處理;采用中序遍歷的方式將語義對齊處理后的表達式樹結構解析成完整的數學表達式作為待求解的方程。本發明通過樹結構來強化表達和顯式約束題目文本中的語義信息,從而能夠求解含有多個未知數的復雜題型應用題。
技術領域
本發明涉及數學應用題的自動化求解技術領域,具體涉及一種基于語義對齊的樹結構數學應用題求解方法及系統。
背景技術
數學應用題自動求解的任務目標是通過理解問題的文本描述,推理出表達式并計算出正確答案,這要求求解器具有強大的自然語言理解和推理能力。一個典型的數學應用題是一個簡短的故事,用文字敘述有關事實,反映某種數量關系,并提出含有一個或多個未知數的問題。為了解決這個問題,需要從文本中識別出相關的運算數和運算符,并且需要確定這些數量的計算順序。
傳統的應用題求解器依賴于手工特征提取和模板標注,這需要大量的人力和專業知識。深度學習為應用題自動化求解提供了新的方法。有的方法直接訓練一個序列到序列的模型來學習問題到方程的映射關系;有的方法基于循環神經網絡利用模板來構建數學表達式樹。現有的基于編碼器和解碼器的端到端深度學習模型,簡單地將數學應用題求解問題當成了序列理解和標注問題來求解,沒有挖掘和利用題目中的語義關系來幫助運算表達式的構建。除此之外,現有的技術只能求解含有一個未知數的應用題,不能解決含有多個未知數的非線性問題,距離能在實際應用中求解多種復雜題型的通用應用題求解器還有很大差距。
發明內容
因此,本發明提供的一種基于語義對齊的樹結構數學應用題求解方法及系統,克服現有的技術只能求解含有一個未知數的應用題,不能解決含有多個未知數的非線性問題的缺陷。
第一方面,本發明實施例提供基于語義對齊的樹結構數學應用題求解方法,包括:獲取待求解的應用題題目文本;將所述待求解的應用題題目文本通過第一神經網絡轉化為語義編碼后的上下文特征表示;將所述上下文特征表示利用第二神經網絡構建根節點向量;利用第三神經網絡對根節點向量進行節點類別,根據節點類別采用先序遍歷的方式構建表達式樹結構;利用第四神經網絡分別對表達式樹結構的子樹特征和應用題題目文本的特征表示進行非線性變換,將兩者轉換到相同的語義空間;利用預設約束項對表達式樹結構的子樹特征與應用題題目文本的特征表示進行語義對齊處理;采用中序遍歷的方式,將語義對齊處理后的表達式樹結構解析成完整的數學表達式作為待求解的方程。
在一實施例中,所述第二神經網絡、第三神經網絡以及第四神經網絡均為可實現非線性變換的神經網絡。
在一實施例中,將所述待求解的應用題題目文本通過第一神經網絡轉化為語義編碼后的上下文特征表示的步驟,包括:將待求解的應用題題目文本輸入中的每個詞標記通過查找單詞表的方式被轉換為詞嵌入;將詞嵌入向量被從頭到尾和從末到頭兩種方式輸入到循環神經網絡中,對應產生兩個隱狀態向量;將兩個隱狀態向量相加,得到應用題題目文本的語義編碼后的上下文特征表示。
在一實施例中,將詞嵌入向量被從頭到尾和從末到頭兩種方式輸入到循環神經網絡中,對應產生兩個隱狀態向量的步驟,包括:
將詞嵌入向量被從頭到尾和從末到頭兩種方式輸入到雙向門控循環單元中,對應產生兩個隱狀態向量和隱狀態向量的生成過程通過以下公式表示:
其中,GRU(.,.)表示兩層雙向門控循環單元的函數。
在一實施例中,將所述上下文特征表示利用第二神經網絡構建根節點向量的步驟,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于暗物智能科技(廣州)有限公司,未經暗物智能科技(廣州)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010084490.3/2.html,轉載請聲明來源鉆瓜專利網。





