[發(fā)明專利]基于答案采樣的機(jī)器閱讀理解模型訓(xùn)練方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201811535115.5 | 申請(qǐng)日: | 2018-12-14 |
| 公開(公告)號(hào): | CN109635947B | 公開(公告)日: | 2020-11-03 |
| 發(fā)明(設(shè)計(jì))人: | 李健銓;劉小康;陳夏飛;晉耀紅;楊凱程;陳瑋;張樂樂;董銘慆 | 申請(qǐng)(專利權(quán))人: | 安徽省泰岳祥升軟件有限公司 |
| 主分類號(hào): | G06N3/08 | 分類號(hào): | G06N3/08;G06F16/332 |
| 代理公司: | 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11363 | 代理人: | 逯長(zhǎng)明;許偉群 |
| 地址: | 230088 安徽省合肥市高新區(qū)習(xí)友路333*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 答案 采樣 機(jī)器 閱讀 理解 模型 訓(xùn)練 方法 裝置 | ||
本申請(qǐng)?zhí)峁┝艘环N基于答案采樣的機(jī)器閱讀理解模型訓(xùn)練方法及裝置,具體的,在進(jìn)行機(jī)器閱讀理解模型訓(xùn)練時(shí),首先利用極大似然估計(jì)函數(shù)對(duì)目標(biāo)機(jī)器閱讀理解模型進(jìn)行訓(xùn)練,得到基礎(chǔ)機(jī)器閱讀理解模型,然后,再利用最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù),繼續(xù)對(duì)上述基礎(chǔ)機(jī)器閱讀理解模型進(jìn)行訓(xùn)練,以實(shí)現(xiàn)基礎(chǔ)機(jī)器閱讀理解模型參數(shù)的微調(diào)整,對(duì)模型繼續(xù)進(jìn)行優(yōu)化。由于本實(shí)例采用最最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù)對(duì)利用極大似然估計(jì)函數(shù)訓(xùn)練出的基礎(chǔ)模型進(jìn)行優(yōu)化,因此,所訓(xùn)練出來的模型抽取答案可以更準(zhǔn)確。另外,本實(shí)施例在利用最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù)進(jìn)行損失計(jì)算時(shí),是針對(duì)從模型輸出答案中進(jìn)行k?top動(dòng)態(tài)采樣得到的答案進(jìn)行損失計(jì)算,進(jìn)而可以減少數(shù)據(jù)處理量。
技術(shù)領(lǐng)域
本申請(qǐng)涉及自然語(yǔ)言處理技術(shù)領(lǐng)域,尤其涉及一種基于答案采樣的機(jī)器閱讀理解模型訓(xùn)練方法及裝置。
背景技術(shù)
目前,深度學(xué)習(xí)在圖像識(shí)別、語(yǔ)音識(shí)別等領(lǐng)域取得豐碩成果,機(jī)器閱讀理解(Machine Reading Comprehension,MRC)成為了人工智能研究與應(yīng)用領(lǐng)域的新熱點(diǎn),其主要功能是閱讀和理解給定的文章或上下文,自動(dòng)給出相關(guān)的問題的答案。
隨著機(jī)器閱讀理解技術(shù)的發(fā)展,閱讀理解的任務(wù)也在不斷升級(jí),從早期的“完形填空形式”,發(fā)展到基于維基百科的“單文檔閱讀理解”,如以斯坦福SQuAD(StanfordQuestion Answering Dataset,斯坦福問答數(shù)據(jù)集)為數(shù)據(jù)集的任務(wù)。并進(jìn)一步升級(jí)至基于web(網(wǎng)頁(yè))數(shù)據(jù)的“多文檔閱讀理解”,這一形式的典型代表是以微軟MS-MARCO(MicrosoftMAchine Reading Comprehension,微軟機(jī)器閱讀理解)、百度DuReader為數(shù)據(jù)集的任務(wù)。近年來,隨著閱讀理解任務(wù)不斷變化與發(fā)展,研究人員已經(jīng)設(shè)計(jì)出多種深度學(xué)習(xí)模型,其中,有一類模型的輸出為針對(duì)問題所對(duì)應(yīng)的答案在文檔中的的開始位置和結(jié)束位置。
目前,針對(duì)上述類型的機(jī)器閱讀理解的訓(xùn)練方法通常是監(jiān)督學(xué)習(xí)任務(wù)。所謂監(jiān)督學(xué)習(xí),是指訓(xùn)練樣本不僅包含輸入,同時(shí)包含對(duì)應(yīng)標(biāo)準(zhǔn)答案輸出。監(jiān)督學(xué)習(xí)的慣用訓(xùn)練準(zhǔn)則是極大似然估計(jì)(MLE,Maximum Likelihood Estimation),其基本思想是一個(gè)好的模型應(yīng)該盡可能使得觀測(cè)到的訓(xùn)練樣本概率最大。但是,在后續(xù)評(píng)價(jià)模型好壞時(shí),不同用戶往往有不同的側(cè)重點(diǎn)和需求,因而產(chǎn)生了多種多樣的評(píng)價(jià)方式,例如,采用BLEU(BilingualEvaluation Understudy,雙語(yǔ)評(píng)價(jià))評(píng)價(jià)系統(tǒng)、ROUGE(Recall-Oriented Understand ForGisting Evalution,面向研究的提升評(píng)價(jià)輔助研究)評(píng)價(jià)系統(tǒng)、基于rough集的評(píng)價(jià)系統(tǒng)等。因此,上述使用似然函數(shù),盡可能使觀測(cè)到的訓(xùn)練樣本概率最大作為訓(xùn)練階段的目標(biāo)的方式,會(huì)存在與測(cè)試階段所使用評(píng)價(jià)指標(biāo)不一致的問題。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種基于答案采樣的機(jī)器閱讀理解模型訓(xùn)練方法及裝置,以使訓(xùn)練出來的模型抽取答案更準(zhǔn)確,盡可能貼近用戶需求。
根據(jù)本發(fā)明實(shí)施例的第一方面,提供了一種基于答案采樣的機(jī)器閱讀理解模型訓(xùn)練方法,該方法包括:
選取預(yù)設(shè)數(shù)目的樣本,作為訓(xùn)練集;
將所述訓(xùn)練集中的樣本數(shù)據(jù)輸入機(jī)器閱讀理解模型中,得到所述機(jī)器閱讀理解模型輸出的訓(xùn)練集中各問題對(duì)應(yīng)的答案,其中,包括答案的開始和結(jié)束位置、以及位于所述開始和結(jié)束位置的概率;
以最小化極大似然估計(jì)損失函數(shù)為目標(biāo),調(diào)整所述機(jī)器閱讀理解模型的參數(shù),得到基礎(chǔ)機(jī)器閱讀理解模型;
將所述訓(xùn)練集中的樣本數(shù)據(jù)輸入所述基礎(chǔ)機(jī)器閱讀理解模型中,得到所述基礎(chǔ)機(jī)器閱讀理解模型輸出的訓(xùn)練集中各問題對(duì)應(yīng)的答案;
以最小化最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù)為目標(biāo),調(diào)整所述基礎(chǔ)機(jī)器閱讀理解模型的參數(shù)。
其中,所述最小風(fēng)險(xiǎn)訓(xùn)練損失函數(shù)R(θ)的計(jì)算公式為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽省泰岳祥升軟件有限公司,未經(jīng)安徽省泰岳祥升軟件有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811535115.5/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用于智能問答系統(tǒng)的答案排序方法及裝置
- 一種基于串謀檢測(cè)的眾包結(jié)果匯聚方法及裝置
- 一種面向問答領(lǐng)域動(dòng)態(tài)計(jì)算問句與答案相似性的方法
- 一種基于數(shù)據(jù)處理的眾包任務(wù)答案確定方法及相關(guān)設(shè)備
- 一種手寫答案識(shí)別批改方法及裝置
- 一種答案批改方法及裝置
- 一種面向閱讀理解問答的多角度答案驗(yàn)證方法
- 一種訓(xùn)練文本關(guān)鍵內(nèi)容提取模型的方法和系統(tǒng)
- 填空題標(biāo)準(zhǔn)答案確定方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 互動(dòng)游戲書





