[發明專利]數學問題求解模型的訓練方法和裝置、推理方法和裝置有效
| 申請號: | 201510363088.8 | 申請日: | 2015-06-26 |
| 公開(公告)號: | CN104933158B | 公開(公告)日: | 2018-06-19 |
| 發明(設計)人: | 周力普;戴帥湘;周曉 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆;胡彬 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 方法和裝置 求解模型 數學問題 推理 訓練文本 規約 二次規劃問題 權重向量 搜索空間 特征向量 錯誤解 模板庫 運算量 最大化 求解 | ||
本發明實施例公開了一種數學問題求解模型的訓練方法和裝置、推理方法和裝置。所述訓練方法包括:確定針對訓練文本的簡化的公式模板庫;提取所述訓練文本的特征向量;以及通過求解由最大化正確解與錯誤解之間的邊際而規約得到的二次規劃問題,確定所述數學問題求解模型的權重向量。本發明實施例提供的數學問題求解模型的訓練方法和裝置、推理方法和裝置縮小了模型的搜索空間,降低了運算量。
技術領域
本發明實施例涉及自然語言處理技術領域,尤其涉及一種數學問題求解模型的訓練方法和裝置、推理方法和裝置。
背景技術
對自然語言描述的數學問題的自動求解是教育產業的應用熱點。目前,在這個方向上已經陸續有成型的產品推出。但是,已經推出的產品普遍存在著對文本的理解能力不強,應用效果不好的缺陷。
Kushman等人針對現有技術的上述缺陷,提出了一種專門用于理解數學問題的描述文本,并求取數學問題的解的模型。參見圖1,通過對輸入文本的理解,可以將輸入文本描述的數學問題對應至一個公式模板,然后,通過將所述輸入文本中已知量、未知量以及名詞對齊至所述公式模板中的各個槽位(slot),可以將公式模板實例化為一個具體的公式。然后,通過對公式的求解就可以得到所述數學問題的解。
如果將上述選取模板、實例化及求解的全過程稱為一次推導,則可以定義一次推導y相對于問題x的條件概率是:
其中,φ(x,y)表示問題x與推導y之間的特征函數,θ表示權重參數。
將式(1)取對數,并對不同的推導y進行求和,即得到最大似然估計的目標函數:
假定對于問題x的特征向量是確定的,那么,運用最大似然估計的理念,使得上述式(2)的取值為最大的權重向量θ對應的模型即是求解文本描述的數學問題的最優的模型。
這種方案雖然提供了文本描述的數學問題的一種理論上可行的方法。但是,求解上述模型的時候,備選求解公式模板及對齊方式的數目太多,造成需要搜索的搜索空間太大,算法復雜度太高。并且,這種解決方案還存在著局部收斂的問題。
發明內容
針對上述技術問題,本發明實施例提供了一種數學問題自動求解模型的訓練方法和裝置、推理方法和裝置,以縮小搜索空間,降低運算量。
第一方面,本發明實施例提供了一種數學問題求解模型的訓練方法,所述方法包括:
確定針對訓練文本的簡化的公式模板庫,所述公式模板庫包含用于解決所述數學問題的公式模板;
提取所述訓練文本的特征向量;
通過求解由最大化正確解與錯誤解之間的邊際而規約得到的二次規劃問題,確定所述數學問題求解模型的權重向量。
第二方面,本發明實施例提供了一種數學問題求解模型的訓練裝置,所述裝置包括:
模板庫確定模塊,用于確定針對訓練文本的簡化的公式模板庫,所述公式模板庫包含用于解決所述數學問題的公式模板;
特征向量提取模塊,用于提取所述訓練文本的特征向量;
模型確定模塊,用于通過求解由最大化正確解與錯誤解之間的邊際而規約得到的二次規劃問題,確定所述數學問題求解模型的權重向量。
第三方面,本發明實施例提供了一種數學問題求解模型的推理方法,所述方法包括:
利用所述數學問題求解模型提取用于描述數學問題的輸入文本的特征向量,其中,所述數學問題求解模型是根據用于解決數學問題的簡化的公式模板,并根據二次規劃方法構建的求解模型;
利用所述數學問題求解模型,根據所述特征向量獲取所述數學問題的最優解。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510363088.8/2.html,轉載請聲明來源鉆瓜專利網。





