[發明專利]選擇題生成模型訓練方法、選擇題生成方法、設備及介質有效
| 申請號: | 202011604701.8 | 申請日: | 2020-12-29 |
| 公開(公告)號: | CN112560443B | 公開(公告)日: | 2022-11-29 |
| 發明(設計)人: | 陳杭;賴眾程;張舒婷;史文鑫;倪佳;林志超;何鳳連;李筱藝;李會璟;賴幸斌;林嘉喜 | 申請(專利權)人: | 平安銀行股份有限公司 |
| 主分類號: | G06F40/211 | 分類號: | G06F40/211;G06F40/30;G06K9/62 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 譚果林 |
| 地址: | 518000 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 選擇題 生成 模型 訓練 方法 設備 介質 | ||
1.一種選擇題生成模型訓練方法,其特征在于,包括:
獲取目標應用領域對應的訓練文檔、標準題目信息和標準干擾選項;
根據所述標準題目信息對所述訓練文檔進行關鍵段落提取,獲取與所述標準題目信息相對應的關鍵段落;
獲取FinBert-UniLM模型,配置所述FinBert-UniLM模型對應的模型參數,所述FinBert-UniLM是在FinBert的注意力層采用UniLM,將FinBert中的Encoder結構轉換為Seq2seq結構的模型,所述FinBert是采用目標應用領域相關的海量訓練語料對Bert的模型參數進行預訓練且采用LAMB優化器對Adam權重衰減優化器進行替代的Bert類模型;
將所述關鍵段落和所述標準題目信息輸入到所述FinBert-UniLM模型進行模型訓練,獲取所述目標應用領域對應的題目生成模型;
將所述關鍵段落、所述標準題目信息和所述標準干擾選項輸入到所述FinBert-UniLM模型進行模型訓練,獲取與所述題目生成模型相對應的干擾項生成模型。
2.如權利要求1所述的選擇題生成模型訓練方法,其特征在于,所述根據所述標準題目信息對所述訓練文檔進行關鍵段落提取,獲取與所述標準題目信息相對應的關鍵段落,包括:
采用預設分隔符對所述訓練文檔分句,獲取所述訓練文檔對應的多個句子字符串;
根據每一所述句子字符串和所述標準題目信息,獲取每一所述句子字符串對應的句子評分值;
依據至少一個所述句子字符串對應的句子評分值進行排序,獲取句子排序結果;
根據所述句子排序結果,對滿足段落拼接條件的所有句子字符串拼接,獲取與所述標準題目信息相對應的關鍵段落。
3.如權利要求1所述的選擇題生成模型訓練方法,其特征在于,所述標準題目信息包括標準題干和標準正確選項;
所述將所述關鍵段落和所述標準題目信息輸入到所述FinBert-UniLM模型進行模型訓練,獲取所述目標應用領域對應的題目生成模型,包括:
將所述關鍵段落輸入到所述FinBert-UniLM模型的編碼器進行編碼,獲取所述關鍵段落對應的段落語義表征;
將所述段落語義表征輸入到所述FinBert-UniLM模型的解碼器進行解碼,獲取候選題目信息,所述候選題目信息包括候選題干和候選正確選項;
根據所述標準題干和所述候選題干,確定題干損失值,并根據所述標準正確選項和所述候選正確選項,確定正確選項損失值;
根據所述題干損失值和所述正確選項損失值,獲取題目信息損失值;
若所述題目信息損失值小于第一損失閾值,則獲取所述目標應用領域對應的題目生成模型。
4.如權利要求1所述的選擇題生成模型訓練方法,其特征在于,所述將所述關鍵段落、所述標準題目信息和所述標準干擾選項輸入到所述FinBert-UniLM模型進行模型訓練,獲取與所述題目生成模型相對應的干擾項生成模型,包括:
將所述標準題目信息、所述標準干擾選項和所述關鍵段落輸入到所述FinBert-UniLM模型的編碼器進行編碼,獲取綜合語義表征;
將所述綜合語義表征輸入到所述FinBert-UniLM模型的解碼器進行解碼,獲取候選干擾選項;
根據所述候選干擾選項和所述標準干擾選項,計算干擾選項損失值;
若所述干擾選項損失值小于第二損失閾值,則獲取與所述題目生成模型相對應的干擾項生成模型。
5.一種選擇題生成方法,其特征在于,包括:
獲取目標應用領域對應的待處理文檔;
對所述待處理文檔進行分段,獲取至少一個待處理段落;
獲取所述目標應用領域對應的題目生成模型和干擾項生成模型,所述題目生成模型和干擾項生成模型為執行權利要求1-4任一項所述選擇題生成模型訓練方法獲取到的模型;
將所述待處理段落輸入到所述題目生成模型,獲取目標題目信息,所述目標題目信息包括目標題干和目標正確選項;
將所述待處理段落和所述目標題目信息輸入到所述干擾項生成模型,獲取目標干擾選項;
采用選擇題生成模板對所述目標題干、所述目標正確選項和所述目標干擾選項進行處理,獲取目標選擇題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安銀行股份有限公司,未經平安銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011604701.8/1.html,轉載請聲明來源鉆瓜專利網。





