[發(fā)明專利]一種針對(duì)詞匯序列數(shù)據(jù)的綜合位置編碼方法有效

申請(qǐng)?zhí)枺?/td>	202011297709.4	申請(qǐng)日：	2020-11-18
公開（公告）號(hào)：	CN112464651B	公開（公告）日：	2023-06-23
發(fā)明（設(shè)計(jì)）人：	柳林青;徐小龍	申請(qǐng)（專利權(quán)）人：	南京郵電大學(xué)
主分類號(hào)：	G06F40/242	分類號(hào)：	G06F40/242;G06F40/284;G06F40/58;G06N3/0455;G06N3/047;G06N3/048;G06N3/08
代理公司：	南京縱橫知識(shí)產(chǎn)權(quán)代理有限公司 32224	代理人：	母秋松
地址：	210003 江蘇***	國(guó)省代碼：	江蘇;32
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種針對(duì) 詞匯序列數(shù)據(jù) 綜合位置編碼方法
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.一種針對(duì)詞匯序列數(shù)據(jù)的綜合位置編碼方法，其特征在于：包括如下步驟：

通過在實(shí)數(shù)空間隨機(jī)采樣生成三組詞典：源輸入和目標(biāo)輸入的詞匯編碼詞典源輸入和目標(biāo)輸入的絕對(duì)位置編碼詞典源輸入和目標(biāo)輸入的相對(duì)位置編碼鍵位詞典和相對(duì)位置編碼值位詞典其中，l_src和l_tgt分別表示源輸入詞匯編碼詞典和目標(biāo)輸入詞匯編碼詞典的大小，下標(biāo)src、tgt分別代表源輸入、目標(biāo)輸入，下標(biāo)src:K、tgt:K分別代表源輸入鍵位、目標(biāo)輸入鍵位，下標(biāo)src:V、tgt:V分別代表源輸入值位、目標(biāo)輸入值位，dim為每個(gè)特征向量的長(zhǎng)度，max_len表示數(shù)據(jù)中源輸入和目標(biāo)輸入中出現(xiàn)過的最長(zhǎng)的序列長(zhǎng)度，k表示任意兩個(gè)詞匯計(jì)算相對(duì)位置時(shí)允許的最大距離；

根據(jù)輸入中的詞匯查找到詞匯編碼詞典VOC_src、VOC_tgt中對(duì)應(yīng)的特征向量x_i、y_i,組成源輸入和目標(biāo)輸入詞匯特征向量組：

X^{len(src)×dim}＝[x₁,x₂…x_len(src)-1,end]

Y^{len(tgt)×dim}＝[start,y₁…y_len(tgt)-1]

len(src)-1和len(tgt)-1分別表示源輸入和目標(biāo)輸入的長(zhǎng)度，end和start分別表示語(yǔ)句的結(jié)束和開始向量；

在絕對(duì)位置詞典VOC_PO_src、VOC_PO_tgt中分別截取前l(fā)en(src)和len(tgt)行，生成源輸入和目標(biāo)輸入絕對(duì)位置特征向量組：

將以上數(shù)據(jù)輸入Transformer模型進(jìn)行訓(xùn)練，得到訓(xùn)練好的Transformer模型；

所述將以上數(shù)據(jù)輸入Transformer模型進(jìn)行訓(xùn)練，得到訓(xùn)練好的Transformer模型，具體包括如下步驟：

S3-1：對(duì)Transformer模型N層編碼器進(jìn)行訓(xùn)練，其中，第i層編碼器一端的輸入如下：

其中，W_i1Q，W_i1K，W_i1V是編碼器中的參數(shù)矩陣，b_i1Q，b_i1K，b_i1V是編碼器中的參數(shù)向量，X_i-1為第i-1層的編碼器的輸出；

第i層編碼器另一端輸出如下：

其中，W_i2，W_i3為參數(shù)矩陣，b_i2，b_i3為參數(shù)向量；X_i為第i層的編碼器的輸出；

當(dāng)i＝0時(shí)：

X₀＝X+PO_src

其中，X為源輸入詞匯特征向量組，PO_src為源輸入絕對(duì)位置特征向量組,X₀第1層編碼器一端的輸入；

S3-2：對(duì)Transformer模型N層解碼器進(jìn)行訓(xùn)練，其中，第i層解碼器一端的輸入如下：

其中，W_i1Q，W_i1K，W_i1V是解碼器中的參數(shù)矩陣，b_i1Q，b_i1K，b_i1V是解碼器中的參數(shù)向量，Y_i-1為第i-1層的解碼器的輸出；

第i層解碼器另一端的輸出如下：

其中，X_N代表第N層編碼器的輸出，W_i1Q:context,W_i1K:context,W_i1V:context為參數(shù)矩陣，b_i1Q:context,b_i1K:context,b_i1V:context為參數(shù)向量；

當(dāng)i＝0時(shí)：

Y₀＝Y(jié)+PO_tgt

其中，Y_i為第i層的解碼器的輸出，Y為目標(biāo)輸入詞匯特征向量組，PO_tgt為目標(biāo)輸入絕對(duì)位置特征向量組，Y₀第1層解碼器一端的輸入，Y_N為第N層解碼器的輸出，為Transformer模型的輸出、W_end、b_end分別代表參數(shù)矩陣、參數(shù)向量；

S3-3：設(shè)其中，每個(gè)v代表一個(gè)目標(biāo)輸入詞匯的特征向量，根據(jù)Y中每個(gè)詞匯的編號(hào)生成一個(gè)答案矩陣：

則整個(gè)Transformer模型此輪訓(xùn)練的誤差為：

ΔO^{len(tgt)×dim}＝Y(jié)-(O*A×VOC_tgt)

其中，O為

S3-4：準(zhǔn)備新的訓(xùn)練樣例X和Y，重復(fù)執(zhí)行過程S3-1～S3-3，直到訓(xùn)練輪次滿足設(shè)定閾值時(shí)，得到訓(xùn)練好的Transformer模型。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué)，未經(jīng)南京郵電大學(xué)許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202011297709.4/1.html，轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。

上一篇：一種換流變壓器損耗測(cè)定方法
下一篇：一種虛擬遙控器的生成方法、裝置、終端設(shè)備及介質(zhì)

同類專利

專利分類

G 物理

G06 計(jì)算；推算；計(jì)數(shù)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】