[發(fā)明專利]基于答案采樣的機(jī)器閱讀理解模型訓(xùn)練方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201811535115.5 | 申請(qǐng)日: | 2018-12-14 |
| 公開(公告)號(hào): | CN109635947B | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 李健銓;劉小康;陳夏飛;晉耀紅;楊凱程;陳瑋;張樂樂;董銘慆 | 申請(qǐng)(專利權(quán))人: | 安徽省泰岳祥升軟件有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06F16/332 |
| 代理公司: | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11363 | 代理人: | 逯長明;許偉群 |
| 地址: | 230088 安徽省合肥市高新區(qū)習(xí)友路333*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 答案 采樣 機(jī)器 閱讀 理解 模型 訓(xùn)練 方法 裝置 | ||
1.一種基于答案采樣的機(jī)器閱讀理解模型訓(xùn)練方法,其特征在于,包括:
選取預(yù)設(shè)數(shù)目的樣本,作為訓(xùn)練集;
將所述訓(xùn)練集中的樣本數(shù)據(jù)輸入機(jī)器閱讀理解模型中,得到所述機(jī)器閱讀理解模型輸出的訓(xùn)練集中各問題對(duì)應(yīng)的答案,其中,包括答案的開始和結(jié)束位置、以及位于所述開始和結(jié)束位置的概率;
以最小化極大似然估計(jì)損失函數(shù)為目標(biāo),調(diào)整所述機(jī)器閱讀理解模型的參數(shù),得到基礎(chǔ)機(jī)器閱讀理解模型;
將所述訓(xùn)練集中的樣本數(shù)據(jù)輸入所述基礎(chǔ)機(jī)器閱讀理解模型中,得到所述基礎(chǔ)機(jī)器閱讀理解模型輸出的訓(xùn)練集中各問題對(duì)應(yīng)的答案;
以最小化最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù)為目標(biāo),調(diào)整所述基礎(chǔ)機(jī)器閱讀理解模型的參數(shù);
其中,所述最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù)R(θ)的計(jì)算公式為:
其中,x(n)為所述訓(xùn)練集中的問題,y為所述機(jī)器閱讀理解模型輸出的答案,P(y|x(n);θ)為當(dāng)模型參數(shù)為θ時(shí)、所述機(jī)器閱讀理解模型輸出的答案概率值,Y(x(n))為對(duì)應(yīng)x(n)的所述機(jī)器閱讀理解模型所有可能輸出答案的集合,S(x(n))為通過k-top方式從Y(x(n))進(jìn)行動(dòng)態(tài)的采樣得到的答案的集合,β為控制概率分布的超參數(shù),Δ(y,y(n))為所述機(jī)器閱讀理解模型輸出的答案與標(biāo)準(zhǔn)答案y(n)之間的差異程度;
所述極大似然估計(jì)損失函數(shù)L(θ)的計(jì)算公式為:
其中,θ為所述機(jī)器閱讀理解模型需要訓(xùn)練的所有參數(shù),N為每次訓(xùn)練的樣本數(shù)目,表示第i個(gè)例子中真實(shí)的開始位置索引,表示第i個(gè)例子中真實(shí)的結(jié)束位置索引,表示第位置是開始位置的預(yù)測概率值,表示第位置是結(jié)束位置的預(yù)測概率值。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述S(x(n))為從Y(x(n))選取各問題對(duì)應(yīng)答案的概率值處于前16位的答案構(gòu)成的集合。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述Δ(y,y(n))的計(jì)算公式為:
Δ(y,y(n))=1-rouge(y,y(n)),其中,rouge的計(jì)算公式為:
X和Y為標(biāo)準(zhǔn)答案和模型輸出答案的文本序列,m為標(biāo)準(zhǔn)答案的長度,n為模型輸出答案的長度,γ為超參數(shù),LCS為最長公共子序列。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,以最小化最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù)為目標(biāo),調(diào)整所述基礎(chǔ)機(jī)器閱讀理解模型的參數(shù)之后,所述方法還包括:
當(dāng)對(duì)所述基礎(chǔ)機(jī)器閱讀理解模型的參數(shù)完成預(yù)設(shè)次數(shù)的調(diào)整后,則利用預(yù)設(shè)評(píng)價(jià)函數(shù)和選取的驗(yàn)證樣本,對(duì)訓(xùn)練后的基礎(chǔ)機(jī)器閱讀理解模型輸出答案的準(zhǔn)確性進(jìn)行評(píng)價(jià);
判斷經(jīng)過預(yù)設(shè)次數(shù)的評(píng)價(jià)后,得到的評(píng)價(jià)指標(biāo)是否有提升;
如果沒有提升,則停止對(duì)所述機(jī)器閱讀理解模型的訓(xùn)練,得到最終的機(jī)器閱讀理解模型。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述預(yù)設(shè)評(píng)價(jià)函數(shù)包括ROUGE評(píng)價(jià)或BLEU評(píng)價(jià)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽省泰岳祥升軟件有限公司,未經(jīng)安徽省泰岳祥升軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811535115.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用于智能問答系統(tǒng)的答案排序方法及裝置
- 一種基于串謀檢測的眾包結(jié)果匯聚方法及裝置
- 一種面向問答領(lǐng)域動(dòng)態(tài)計(jì)算問句與答案相似性的方法
- 一種基于數(shù)據(jù)處理的眾包任務(wù)答案確定方法及相關(guān)設(shè)備
- 一種手寫答案識(shí)別批改方法及裝置
- 一種答案批改方法及裝置
- 一種面向閱讀理解問答的多角度答案驗(yàn)證方法
- 一種訓(xùn)練文本關(guān)鍵內(nèi)容提取模型的方法和系統(tǒng)
- 填空題標(biāo)準(zhǔn)答案確定方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 互動(dòng)游戲書





