日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于BERT的機器閱讀理解方法、裝置、設備及存儲介質有效

專利信息
申請號: 202011187381.0 申請日: 2020-10-29
公開(公告)號: CN112464641B 公開(公告)日: 2023-01-03
發明(設計)人: 侯麗;劉翔 申請(專利權)人: 平安科技(深圳)有限公司
主分類號: G06F40/205 分類號: G06F40/205;G06F40/295;G06F40/166
代理公司: 深圳市力道知識產權代理事務所(普通合伙) 44507 代理人: 賀小旺
地址: 518000 廣東省深圳市福田區福*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 bert 機器 閱讀 理解 方法 裝置 設備 存儲 介質
【說明書】:

發明涉及人工智能技術領域,公開了一種基于BERT的機器閱讀理解方法、裝置、計算機設備及計算機可讀存儲介質,該方法包括:根據待訓練問題文檔對訓練第一預置預訓練語言模型,生成文檔排序模型;根據所述待訓練問題文檔對訓練預置多文檔答案預測模型,生成閱讀理解模型;根據待預測問題文檔對和文檔排序模型,輸出所述第二問題對應的目標文檔;基于所述閱讀理解模型,根據所述第二問題和所述目標文檔,獲取所述閱讀理解模型輸出所述目標文檔中的目標文本,并將所述目標文本作為所述第二問題的閱讀理解答案,實現將多文檔閱讀理解問題轉換為單文檔閱讀理解問題,降低閱讀理解時抽取答案的干擾,從而提高多文檔閱讀理解答案的準確性。

技術領域

本申請涉及人工智能技術領域,尤其涉及一種基于BERT的機器閱讀理解方法、裝置、計算機設備及計算機可讀存儲介質。

背景技術

機器閱讀理解是人工智能技術的重要組成部分,過去幾年里,隨著深度學習的出現,機器閱讀理解(其要求機器基于給定的上下文回答問題)已經贏得了越來越廣泛的關注,尤其是隨著以BERT(Bidirectional Encoder Representations from Transformers預訓練語言模型)為代表的預訓練語言模型的發展,機器閱讀理解任務都有著飛速的發展,主要體現為從關注限定文本到結合外部知識,從關注特定片段到對上下文的全面理解。然而在實際的應用場景中,常常會面臨單個問題對應多個搜索引擎檢索獲得的文檔,即需要整合多個文檔的信息來預測答案。

目前對于多文檔閱讀理解,多采用多個文檔進行拼接成一個長文檔,再采用文檔滑動窗口,將長文檔拆分為固定長度的多個段文本,每個文本段均與問題進行拼接后進行閱讀理解,對同一個問題選擇多個文本段中得分最高的答案作為該問題的閱讀理解答案。例如,MS MARCO(Microsoft MAchine Reading Comprehension微軟機器閱讀理解)的Question Answering(智能問答)數據集是一個國際上權威的閱讀理解數據集,其每條記錄包含一個問題,十個候選文檔,這十個候選答案有一個或者兩個是包含問題答案文檔。使用基于bert預訓練語言模型在測試集上進行對比測試,直接使用十個候選文檔拼接的長文本進行閱讀理解的答案ROUGEL值大概為0.48,而比直接在含有答案的單個文檔中進行閱讀理解的答案ROUGEL值大概為0.56,兩者相差約0.08分。其中,ROUGEL包括ROUGE(Recall-Oriented Understudy for Gisting Evaluation評估自動文摘以及機器翻譯的一組指標)和L(longest common subsequence,最長公共子序列),ROUGEL值是機器閱讀理解領域通用的答案質量評價指標,ROUGEL值越大,代表預測答案質量越好。使用基于bert預訓練語言模型在一定程度上解決了現有模型對于多文檔場景的輸入長度受限的缺點,但其準確率與對單個文檔進行閱讀理解的準確率較低。

發明內容

本申請的主要目的在于提供一種基于BERT的機器閱讀理解方法、裝置、計算機設備及計算機可讀存儲介質,旨在解決現有使用基于bert預訓練語言模型在一定程度上解決了現有模型對于多文檔場景的輸入長度受限的缺點,但其準確率與對單個文檔進行閱讀理解的準確率較低的技術問題。

第一方面,本申請提供一種基于BERT的機器閱讀理解方法,所述基于BERT的機器閱讀理解方法包括以下步驟:

獲取待訓練的第一問題和多個候選文檔,將所述第一問題分別與各個候選文檔組合,生成待訓練問題文檔對;

根據所述待訓練問題文檔對訓練第一預置預訓練語言模型,生成文檔排序模型;

根據所述待訓練問題文檔對訓練預置多文檔答案預測模型,生成閱讀理解模型;

獲取待預測問題文檔對,其中,所述待預測問題文檔對包括第二問題和所述第二問題對應的多個候選文檔;

基于所述文檔排序模型,根據所述待預測問題文檔對,輸出所述第二問題對應的目標文檔;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/202011187381.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一区二区二| 狠狠色成色综合网| 91精品一二区| 欧美日韩三区| 日韩精品久久一区二区| 欧美精品一区久久| 中文字幕欧美日韩一区| 欧美系列一区二区| 国产精品免费观看国产网曝瓜| 国产精品一区一区三区| 91偷拍网站| 7777久久久国产精品| 欧美在线一区二区视频| 国产91白嫩清纯初高中在线| 国产精品日韩一区二区三区| 挺进警察美妇后菊| 国产91免费在线| 亚洲精品日本久久一区二区三区| 亚洲欧美一区二区三区1000| 久久激情图片| 国产电影精品一区二区三区| 久久影视一区二区| 国产精品一区二区av日韩在线| 91精品夜夜| 日韩国产精品一区二区| 91精品国产麻豆国产自产在线| 午夜特片网| а√天堂8资源中文在线| 国产精品九九九九九九九| 欧美高清极品videossex| 国产美女视频一区二区三区| 精品国产91久久久| 精品久久久综合| 国产91综合一区在线观看| 99久久精品免费看国产免费粉嫩| 欧美一区二区三区三州| 亚洲精品人| 免费看农村bbwbbw高潮| 国内精品久久久久影院日本| 99热久久精品免费精品| 欧美大成色www永久网站婷| 国91精品久久久久9999不卡| 日韩av视屏在线观看| 野花国产精品入口| 国产性猛交| 在线观看v国产乱人精品一区二区| 国产一级在线免费观看| 日韩无遮挡免费视频| 丰满少妇高潮惨叫久久久| 91精品综合| 中文字幕一区二区在线播放| 精品videossexfreeohdbbw| 国模一区二区三区白浆| 国产在线一区观看| 国产精品自拍不卡| 欧美综合在线一区| 91区国产| 日韩中文字幕亚洲欧美| 久久精视频| 日韩精品一区二区久久| 国产日韩欧美亚洲| 国产欧美www| 少妇自拍一区| 午夜欧美a级理论片915影院 | 性色av香蕉一区二区| 野花社区不卡一卡二| 97精品久久人人爽人人爽| 99re国产精品视频| 4399午夜理伦免费播放大全| 欧美性xxxxx极品少妇| 国产亚洲精品精品国产亚洲综合| 日本伦精品一区二区三区免费| 国产在线一二区| 麻豆9在线观看免费高清1| 中文av一区| 亚洲国产一区二区精华液| 国产videosfree性另类| 久久天堂国产香蕉三区| 玖玖玖国产精品| 精品国产品香蕉在线| 国产精品乱码一区| 国产69精品福利视频|