[發(fā)明專利]一種基于多叉樹(shù)結(jié)構(gòu)的非自回歸數(shù)學(xué)題求解器在審
| 申請(qǐng)?zhí)枺?/td> | 202310433743.7 | 申請(qǐng)日: | 2023-04-21 |
| 公開(kāi)(公告)號(hào): | CN116401624A | 公開(kāi)(公告)日: | 2023-07-07 |
| 發(fā)明(設(shè)計(jì))人: | 楊陽(yáng);賓燚;韓孟群;史文浩 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號(hào): | G06F18/25 | 分類號(hào): | G06F18/25;G06F18/24;G06F18/214;G06N3/04;G06N3/08;G06F17/11 |
| 代理公司: | 成都行之智信知識(shí)產(chǎn)權(quán)代理有限公司 51256 | 代理人: | 溫利平 |
| 地址: | 611731 四川省成*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多叉樹(shù) 結(jié)構(gòu) 回歸 數(shù)學(xué)題 求解 | ||
本發(fā)明公開(kāi)了一種基于多叉樹(shù)結(jié)構(gòu)的非自回歸數(shù)學(xué)題求解器,在現(xiàn)有題目編碼模塊以及目標(biāo)驅(qū)動(dòng)的多叉樹(shù)生成模塊的基礎(chǔ)上,增加非自回歸的目標(biāo)分解模塊,用于處理無(wú)序多分支分解工作,首先將父目標(biāo)Eg與I個(gè)位置編碼pi,i=1,2,…,I進(jìn)行融合,然后采用多頭自注意力機(jī)制進(jìn)行處理,再用一個(gè)多頭互注意模塊連接多頭自注意模塊的輸出和候選集Ec,得到上下文表示最后根據(jù)上下文表示以及候選集Ec,通過(guò)指針網(wǎng)絡(luò)選擇最相關(guān)的候選集Ec中的候選字符,得到概率分布矩陣Ptr,用于計(jì)算訓(xùn)練過(guò)程中的交叉熵?fù)p失以及預(yù)測(cè)過(guò)程中的預(yù)測(cè)數(shù)學(xué)題表達(dá)式。本發(fā)明通過(guò)非自回歸的目標(biāo)分解模塊用于處理無(wú)序多分支分解工作,探索和捕捉數(shù)字之間的關(guān)系,提高了數(shù)學(xué)題求解器的性能。
技術(shù)領(lǐng)域
本發(fā)明屬于數(shù)學(xué)題求解器技術(shù)領(lǐng)域,更為具體地講,涉及一種基于多叉樹(shù)結(jié)構(gòu)的非自回歸數(shù)學(xué)題求解器。
背景技術(shù)
自動(dòng)求解數(shù)學(xué)題(Math?Word?Problem,MWP)是機(jī)器推理的一個(gè)重要子問(wèn)題。對(duì)于一個(gè)數(shù)學(xué)題求解器,需要依據(jù)給定的問(wèn)題描述和數(shù)學(xué)先驗(yàn)知識(shí),生成符合規(guī)范可計(jì)算的解題等式。更具體地講,給定一個(gè)數(shù)學(xué)題目,這個(gè)題目由文本描述構(gòu)成,文本中包含數(shù)字q1,q2,…,qn以及某些數(shù)學(xué)定義,需要讓模型自動(dòng)地給出解題的表達(dá)式,并通過(guò)這個(gè)表達(dá)式來(lái)計(jì)算題目最終的答案。數(shù)學(xué)題求解任務(wù)涉及對(duì)自然語(yǔ)言文本的深入理解、機(jī)器智能的推理能力、可解釋性等人工智能研究中的核心問(wèn)題。作為機(jī)器智能的一個(gè)重要的測(cè)試基準(zhǔn),數(shù)學(xué)題求解一直以來(lái)都受到很多研究者的關(guān)注。
數(shù)學(xué)題求解任務(wù)自提出以來(lái),經(jīng)歷了好幾個(gè)階段。包括早期的基于模板的方法、基于統(tǒng)計(jì)的方法以及直到后來(lái)的基于深度學(xué)習(xí)的方法。基于統(tǒng)計(jì)和模板的方法嚴(yán)重依賴人工標(biāo)注和統(tǒng)計(jì),且定義的模型缺乏泛化性。在高性能計(jì)算機(jī)設(shè)備和互聯(lián)網(wǎng)海量數(shù)據(jù)的輔助下,深度學(xué)習(xí)取得了長(zhǎng)足的進(jìn)步,以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的方法也被應(yīng)用到了數(shù)學(xué)題求解任務(wù)中,一大批模型在數(shù)學(xué)題求解任務(wù)中取得了驚人的表現(xiàn)。自2019年樹(shù)解碼器被提出以來(lái),樹(shù)解碼器就被廣泛應(yīng)用于數(shù)學(xué)題求解任務(wù)中,成為了主流方法。
樹(shù)形結(jié)構(gòu)天然具有表示數(shù)學(xué)表達(dá)式的優(yōu)勢(shì),樹(shù)的深度可以對(duì)應(yīng)數(shù)學(xué)表達(dá)式中運(yùn)算的優(yōu)先級(jí),使得優(yōu)先級(jí)較高的運(yùn)算放在較低的層次上,樹(shù)的根節(jié)點(diǎn)即為優(yōu)先級(jí)最低的算子。樹(shù)形結(jié)構(gòu)首先具備數(shù)學(xué)表達(dá)式的結(jié)構(gòu)信息,樹(shù)解碼器可以通過(guò)自頂向下的方式來(lái)生成目標(biāo)表達(dá)式,并形成一棵表達(dá)式樹(shù)。自頂向下的方法可以理解為將題目問(wèn)題不斷拆分為子問(wèn)題,通過(guò)對(duì)子問(wèn)題的不斷求解最終得到題目的答案,這是符合人類直覺(jué)的解題方法,具有很好的可解釋性。在拆分過(guò)程中產(chǎn)生的子表達(dá)式其實(shí)就是題目中的中間變量,因此樹(shù)解碼器可以很好的表示數(shù)學(xué)題的結(jié)構(gòu)信息。
現(xiàn)有的數(shù)學(xué)題求解器大多遵循編碼器-解碼器的架構(gòu),這種架構(gòu)的求解過(guò)程是將基于自然語(yǔ)言的問(wèn)題描述翻譯為基于符號(hào)語(yǔ)言的數(shù)學(xué)描述(求解表達(dá)式)的過(guò)程。在這樣的架構(gòu)下,數(shù)學(xué)題求解器的改進(jìn)也可以主要總結(jié)為對(duì)編碼器的改進(jìn)和解碼器的改進(jìn)兩大類。
對(duì)于編碼器而言,關(guān)鍵是要增強(qiáng)神經(jīng)網(wǎng)絡(luò)模型對(duì)于問(wèn)題文本描述的理解,此外,數(shù)學(xué)題需要大量外部的數(shù)學(xué)先驗(yàn)和常識(shí)先驗(yàn)知識(shí),如何將這些先驗(yàn)知識(shí)融入編碼,以幫助模型更好的理解題目,也是改善模型編碼器的重要方面。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué),未經(jīng)電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310433743.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 一種基于多叉樹(shù)自動(dòng)布局的電網(wǎng)供電路徑展現(xiàn)方法
- 去中心化的即時(shí)通訊群組信息存儲(chǔ)方法和系統(tǒng)
- 一種基于多叉樹(shù)搜索的供電恢復(fù)方案生成方法
- 基于多叉樹(shù)模型的頁(yè)面推薦方法及裝置
- 一種矩陣多叉樹(shù)及規(guī)則創(chuàng)建方法
- 管線段邊線擬合方法及裝置
- 一種基于多叉樹(shù)算法的綜合布線節(jié)點(diǎn)刪除方法
- 一種計(jì)算血管樹(shù)相似度的方法
- 基于樹(shù)搜索的桁架裝配序列規(guī)劃方法
- 數(shù)據(jù)表關(guān)聯(lián)分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 卡片結(jié)構(gòu)、插座結(jié)構(gòu)及其組合結(jié)構(gòu)
- 鋼結(jié)構(gòu)平臺(tái)結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 鋼結(jié)構(gòu)支撐結(jié)構(gòu)
- 單元結(jié)構(gòu)、結(jié)構(gòu)部件和夾層結(jié)構(gòu)
- 鋼結(jié)構(gòu)扶梯結(jié)構(gòu)
- 鋼結(jié)構(gòu)隔墻結(jié)構(gòu)
- 鋼結(jié)構(gòu)連接結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 螺紋結(jié)構(gòu)、螺孔結(jié)構(gòu)、機(jī)械結(jié)構(gòu)和光學(xué)結(jié)構(gòu)
- 基于KNN的置信回歸算法及裝置
- 自動(dòng)行走設(shè)備的路徑回歸方法、自動(dòng)行走設(shè)備及路徑回歸系統(tǒng)
- 一種基于特征選擇和集成學(xué)習(xí)的軟件缺陷個(gè)數(shù)預(yù)測(cè)方法
- 一種基于集成正交成分最優(yōu)化回歸分析的軟測(cè)量方法
- 廣告場(chǎng)景的回歸測(cè)試方法、裝置及系統(tǒng)
- 回歸測(cè)試方法及裝置
- 正則化線性回歸生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種精確預(yù)測(cè)隧道圍巖位移的方法
- 多環(huán)境協(xié)同回歸方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)
- 回歸測(cè)試方法及裝置





