[發明專利]智能機器閱讀理解方法、裝置、電子設備及存儲介質在審
| 申請號: | 202110257925.4 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112632265A | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 劉磊 | 申請(專利權)人: | 北京沃豐時代數據科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/30;G06K9/62;G06N20/00 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 王宇楊 |
| 地址: | 100160 北京市豐臺區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 智能 機器 閱讀 理解 方法 裝置 電子設備 存儲 介質 | ||
1.一種智能機器閱讀理解方法,其特征在于,包括:
獲取待檢問題;
通過深度語義匹配的方式,從預設的問題答案優選集中匹配所述待檢問題的答案;
如果匹配到所述答案,則將所述答案作為最終答案,否則通過預先訓練好的閱讀理解模型,獲得所述待檢問題的最終答案,其中,所述預先訓練好的閱讀理解模型包括BERT模型和QANet模型。
2.根據權利要求1所述的智能機器閱讀理解方法,其特征在于,所述如果匹配到所述答案,則將所述答案作為最終答案,包括:
從所述問題答案優選集和所述待檢問題進行深度語義匹配,并判斷匹配結果中是否存在匹配度超過預設閾值的結果;
如果有,則將匹配度超過預設閾值的結果作為所述最終答案。
3.根據權利要求1或2所述的智能機器閱讀理解方法,其特征在于,在通過預先訓練好的閱讀理解模型,獲得所述待檢問題的最終答案之前,包括:對所述閱讀理解模型進行訓練。
4.根據權利要求3所述的智能機器閱讀理解方法,其特征在于,所述對所述閱讀理解模型進行訓練,包括:
對文檔集以及問答對集進行切分,得到問題集以及候選答案片段集;
通過BERT模型預測答案起始位置和終止位置,并預測答案與真實答案的評測差異;
基于所述評測差異對所述BERT模型進行二次訓練,得到訓練好的BERT模型。
5.根據權利要求1所述的智能機器閱讀理解方法,其特征在于,通過預先訓練好的閱讀理解模型,獲得所述待檢問題的最終答案,包括:
獲得所述BERT模型的預測答案,獲得所述QANet模型的預測答案;
對所述BERT模型的預測答案和所述QANet模型的預測答案進行加權求和,得到所述最終答案。
6.根據權利要求1所述的智能機器閱讀理解方法,其特征在于,還包括:
獲取最終答案的反饋信息,并根據反饋信息對所述閱讀理解模型進行模型優化。
7.一種智能機器閱讀理解裝置,其特征在于,包括:
獲取模塊,用于獲取待檢問題;
答案確定模塊,用于通過深度語義匹配的方式,從預設的問題答案優選集中匹配所述待檢問題的答案,如果匹配到所述答案,則將所述答案作為最終答案,否則通過預先訓練好的閱讀理解模型,獲得所述待檢問題的最終答案,其中,所述預先訓練好的閱讀理解模型包括BERT模型和QANet模型。
8.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現根據權利要求1~6任一項所述的智能機器閱讀理解方法的步驟。
9.一種非暫態計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該計算機程序被處理器執行時實現根據權利要求1~6任一項所述的智能機器閱讀理解方法的步驟。
10.一種計算機程序產品,所計算機程序產品包括有計算機程序,其特征在于,該計算機程序被處理器執行時實現根據權利要求1~6任一項所述的智能機器閱讀理解方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京沃豐時代數據科技有限公司,未經北京沃豐時代數據科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110257925.4/1.html,轉載請聲明來源鉆瓜專利網。





