[發明專利]一種問答任務的下游任務處理方法及模型有效
| 申請號: | 202011539404.X | 申請日: | 2020-12-23 |
| 公開(公告)號: | CN112732879B | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 王勇;雷沖;陳秋怡 | 申請(專利權)人: | 重慶理工大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 重慶博凱知識產權代理有限公司 50212 | 代理人: | 胡逸然 |
| 地址: | 400054 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 問答 任務 下游 處理 方法 模型 | ||
1.一種問答任務的下游任務處理方法,其特征在于,包括如下步驟:
S1、將問題與上下文輸入預訓練語言模塊,獲取上下文的語言關聯特征;
S2、利用雙向注意力機制基于上下文的語言關聯特征得到關鍵信息感知的上下文表示HCKey以及關鍵信息感知的問題表示HQKey;
S3、利用雙向注意力流基于關鍵信息感知的上下文表示HCKey以及關鍵信息感知的問題表示HQKey,得到問題感知的上下文表示G;
S4、利用門機制基于問題感知的上下文表示G計算更新向量z和記憶權重g,利用更新向量z和記憶權重g更新問題感知的上下文表示G得到輸出向量Gg;
S5、利用粒計算基于上下文的語言關聯特征生成上下文粒度向量GC及序列粒度向量GCLS,基于上下文粒度向量GC、序列粒度向量GCLS及輸出向量Gg生成多角度理解上下文以及上下文總體與局部的關系的輸出向量Cout;
S6、將基于上下文的語言關聯特征生成多角度理解上下文以及上下文總體與局部的關系的輸出向量Cout通過線性層處理后,使用softmax計算上下文中每個字作為答案起止位置的概率,抽取概率最大的連續子序列作為答案。
2.如權利要求1所述的問答任務的下游任務處理方法,其特征在于,上下文的語言關聯特征為H,H={h1,h2,h3,...,hs},h1至hs表示上下文和問題拼接成的序列經過編碼器編碼后的表示,S表示上下文和問題拼接成的序列長度,步驟S2包括:
S201、基于上下文和問題在H中的位置,截取問題截取部分HQ和上下文截取部分HC,HQ={h2,h3,h4,...,hn+1},HC={hn+3,hn+4,...,hn+m+2},n表示問題詞的長度,m表示上下文詞的長度;
S202、構建相似性矩陣S,
S=WS(HC,HQ,HC·HQ)
式中,WS為一個可訓練矩陣;
S203、分別對相似性矩陣S的每行和每列進行softmax運算,得到S1和S2,S1表示對于每個上下文詞,所有的問題詞與之的相關性;S2表示對于每個問題詞,所有的上下文詞與之的相關性;S1=softmax→(S),S2=softmax↓(S);
S204、突出問題關鍵詞和上下文關鍵詞權重;
S205、基于下式生成關鍵信息感知的上下文表示HCKey以及關鍵信息感知的問題表示HQKey:
HCKey=HC+HC⊙AC
HQKey=HQ+HQ⊙AQ
式中,AC表示與問題關鍵詞相關聯的上下文關鍵部分注意力,AQ表示與上下文關鍵詞相關聯的問題關鍵部分注意力;
AC=S2·SQkey
AQ=S1·SCkey
式中,SQkey表示突出關鍵詞的問題權重,SCkey表示突出關鍵詞的上下文權重;
SQkey=mean↓(S1)
SCkey=mean→(S2)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶理工大學,未經重慶理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011539404.X/1.html,轉載請聲明來源鉆瓜專利網。





