[發(fā)明專利]智能機器閱讀理解方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110257925.4 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112632265A | 公開(公告)日: | 2021-04-09 |
| 發(fā)明(設(shè)計)人: | 劉磊 | 申請(專利權(quán))人: | 北京沃豐時代數(shù)據(jù)科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/30;G06K9/62;G06N20/00 |
| 代理公司: | 北京路浩知識產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王宇楊 |
| 地址: | 100160 北京市豐臺區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 智能 機器 閱讀 理解 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本發(fā)明實施例提供了一種智能機器閱讀理解方法、裝置、電子設(shè)備及存儲介質(zhì)。其中,智能機器閱讀理解方法,包括:獲取待檢問題;通過深度語義匹配的方式,從預(yù)設(shè)的問題答案優(yōu)選集中匹配所述待檢問題的答案;如果匹配到所述答案,則將所述答案作為最終答案,否則通過預(yù)先訓(xùn)練好的閱讀理解模型,獲得所述待檢問題的最終答案,其中,所述預(yù)先訓(xùn)練好的閱讀理解模型包括BERT模型和QANet模型。本發(fā)明的實施例,可以有效地提升智能機器閱讀理解結(jié)果的準(zhǔn)確性和可靠性。
技術(shù)領(lǐng)域
本發(fā)明涉及智能機器閱讀理解技術(shù)領(lǐng)域,尤其涉及一種智能機器閱讀理解方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
現(xiàn)有的機器閱讀理解技術(shù)都是基于特定數(shù)據(jù)集的處理方法,主要有三種代表方法:一種是基于傳統(tǒng)特征的方法,通過選取不同的特征,然后基于選取的特征構(gòu)造并學(xué)習(xí)一個三元打分函數(shù),將得分最高的候選答案a作為問題q在文檔d中的答案;第二種是基于神經(jīng)網(wǎng)絡(luò)的方法;第三種是基于深層語義的圖匹配方法。其中,基于傳統(tǒng)特征的方法由于特征本身所具有的局限性,很難處理復(fù)述以及遠距離依賴問題。基于神經(jīng)網(wǎng)絡(luò)的方法對于某些需要引入外部知識進行更深層次推理、幾乎不可能僅僅通過相似度匹配得到結(jié)果的任務(wù)則無能為力。基于深層語義的圖匹配方法由于對于外部知識的依賴性較強,因此適用范圍較窄,可拓展性較弱。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中的問題,本發(fā)明實施例提供一種智能機器閱讀理解方法、裝置、電子設(shè)備及存儲介質(zhì)。
具體地,本發(fā)明實施例提供了以下技術(shù)方案:
第一方面,本發(fā)明實施例提供了一種智能機器閱讀理解方法,包括:
獲取待檢問題;
通過深度語義匹配的方式,從預(yù)設(shè)的問題答案優(yōu)選集中匹配所述待檢問題的答案;
如果匹配到所述答案,則將所述答案作為最終答案,否則通過預(yù)先訓(xùn)練好的閱讀理解模型,獲得所述待檢問題的最終答案,其中,所述預(yù)先訓(xùn)練好的閱讀理解模型包括BERT模型和QANet模型。
進一步地,所述如果匹配到所述答案,則將所述答案作為最終答案,包括:
從所述問題答案優(yōu)選集和所述待檢問題進行深度語義匹配,并判斷匹配結(jié)果中是否存在匹配度超過預(yù)設(shè)閾值的結(jié)果;
如果有,則將匹配度超過預(yù)設(shè)閾值的結(jié)果作為所述最終答案。
進一步地,在通過預(yù)先訓(xùn)練好的閱讀理解模型,獲得所述待檢問題的最終答案之前,包括:對所述閱讀理解模型進行訓(xùn)練。
進一步地,所述對所述閱讀理解模型進行訓(xùn)練,包括:
對文檔集以及問答對集進行切分,得到問題集以及候選答案片段集;
通過BERT模型預(yù)測答案起始位置和終止位置,并預(yù)測答案與真實答案的評測差異;
基于所述評測差異對所述BERT模型進行二次訓(xùn)練,得到訓(xùn)練好的BERT模型。
進一步地,通過預(yù)先訓(xùn)練好的閱讀理解模型,獲得所述待檢問題的最終答案,包括:
獲得所述BERT模型的預(yù)測答案,獲得所述QANet模型的預(yù)測答案;
對所述BERT模型的預(yù)測答案和所述QANet模型的預(yù)測答案進行加權(quán)求和,得到所述最終答案。
進一步地,還包括:
獲取最終答案的反饋信息,并根據(jù)反饋信息對所述閱讀理解模型進行模型優(yōu)化。
第二方面,本發(fā)明實施例還提供了一種智能機器閱讀理解裝置,包括:
獲取模塊,用于獲取待檢問題;
答案確定模塊,用于通過深度語義匹配的方式,從預(yù)設(shè)的問題答案優(yōu)選集中匹配所述待檢問題的答案,如果匹配到所述答案,則將所述答案作為最終答案,否則通過預(yù)先訓(xùn)練好的閱讀理解模型,獲得所述待檢問題的最終答案,其中,所述預(yù)先訓(xùn)練好的閱讀理解模型包括BERT模型和QANet模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京沃豐時代數(shù)據(jù)科技有限公司,未經(jīng)北京沃豐時代數(shù)據(jù)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110257925.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





