[發(fā)明專利]針對(duì)多任務(wù)模型的訓(xùn)練方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201911203428.5 | 申請(qǐng)日: | 2019-11-29 |
| 公開(公告)號(hào): | CN110909145B | 公開(公告)日: | 2022-08-09 |
| 發(fā)明(設(shè)計(jì))人: | 張望舒;溫祖杰 | 申請(qǐng)(專利權(quán))人: | 支付寶(杭州)信息技術(shù)有限公司 |
| 主分類號(hào): | G06F16/332 | 分類號(hào): | G06F16/332;G06F16/35;G06F16/33 |
| 代理公司: | 北京億騰知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11309 | 代理人: | 陳霽;周良玉 |
| 地址: | 310000 浙江省杭州市*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 針對(duì) 任務(wù) 模型 訓(xùn)練 方法 裝置 | ||
1.一種針對(duì)多任務(wù)模型的訓(xùn)練方法,所述多任務(wù)模型包括語義編碼層,針對(duì)搜索交互場(chǎng)景的搜索分類層,以及針對(duì)問答交互場(chǎng)景的問答分類層,所述方法包括:
獲取多個(gè)訓(xùn)練樣本,其中包括所述搜索交互場(chǎng)景下采集的若干搜索訓(xùn)練樣本和所述問答交互場(chǎng)景下采集的若干問答訓(xùn)練樣本,所述多個(gè)訓(xùn)練樣本中每個(gè)訓(xùn)練樣本至少包括用戶輸入文本和對(duì)應(yīng)的標(biāo)準(zhǔn)文本類別標(biāo)簽;
對(duì)于所述多個(gè)訓(xùn)練樣本中任意的第一樣本,至少將其中的用戶輸入文本輸入所述語義編碼層,得到語義向量,并且,將所述語義向量分別輸入所述搜索分類層和所述問答分類層;
當(dāng)所述第一樣本屬于所述若干搜索訓(xùn)練樣本時(shí),基于所述搜索分類層輸出的分類結(jié)果和所述第一樣本中的標(biāo)準(zhǔn)文本類別標(biāo)簽,確定所述第一樣本對(duì)應(yīng)的預(yù)測(cè)損失;
當(dāng)所述第一樣本屬于所述若干問答訓(xùn)練樣本時(shí),基于所述問答分類層輸出的分類結(jié)果和所述第一樣本中的標(biāo)準(zhǔn)文本類別標(biāo)簽,確定所述第一樣本對(duì)應(yīng)的預(yù)測(cè)損失;
基于所述多個(gè)訓(xùn)練樣本各自對(duì)應(yīng)的預(yù)測(cè)損失之和,調(diào)整所述多任務(wù)模型的參數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其中,每個(gè)訓(xùn)練樣本中還包括業(yè)務(wù)代碼,用于指示在跳轉(zhuǎn)至用戶輸入文本的輸入界面之前顯示的界面所對(duì)應(yīng)的業(yè)務(wù);所述至少將其中的用戶輸入文本輸入所述語義編碼層,包括:
將所述用戶輸入文本和所述業(yè)務(wù)代碼進(jìn)行拼接后,輸入所述語義編碼層。
3.一種針對(duì)多任務(wù)模型的訓(xùn)練方法,所述多任務(wù)模型包括語義編碼層,針對(duì)搜索交互場(chǎng)景的搜索關(guān)聯(lián)度預(yù)測(cè)層,以及針對(duì)問答交互場(chǎng)景的問答關(guān)聯(lián)度預(yù)測(cè)層,所述方法包括:
獲取多個(gè)訓(xùn)練樣本,其中包括所述搜索交互場(chǎng)景下采集的若干搜索訓(xùn)練樣本和所述問答交互場(chǎng)景下采集的若干問答訓(xùn)練樣本,所述多個(gè)訓(xùn)練樣本中每個(gè)訓(xùn)練樣本至少包括歷史文本對(duì)和對(duì)應(yīng)的文本關(guān)聯(lián)標(biāo)簽,所述歷史文本對(duì)包括用戶輸入文本和對(duì)應(yīng)的標(biāo)準(zhǔn)文本;
對(duì)于所述多個(gè)訓(xùn)練樣本中任意的第一樣本,至少將其中的歷史文本對(duì)輸入所述語義編碼層,得到語義向量,并且,將所述語義向量分別輸入所述搜索關(guān)聯(lián)度預(yù)測(cè)層和所述問答關(guān)聯(lián)度預(yù)測(cè)層;
當(dāng)所述第一樣本屬于所述若干搜索訓(xùn)練樣本時(shí),至少基于所述搜索關(guān)聯(lián)度預(yù)測(cè)層輸出的預(yù)測(cè)結(jié)果和所述第一樣本中的文本關(guān)聯(lián)標(biāo)簽,確定與所述第一樣本相關(guān)的預(yù)測(cè)損失;
當(dāng)所述第一樣本屬于所述若干問答訓(xùn)練樣本時(shí),基于所述問答關(guān)聯(lián)度預(yù)測(cè)層輸出的預(yù)測(cè)結(jié)果和所述第一樣本中的文本關(guān)聯(lián)標(biāo)簽,確定所述第一樣本相關(guān)的預(yù)測(cè)損失;
基于所述多個(gè)訓(xùn)練樣本各自相關(guān)的預(yù)測(cè)損失之和,調(diào)整所述多任務(wù)模型的參數(shù)。
4.根據(jù)權(quán)利要求3所述的方法,其中,每個(gè)訓(xùn)練樣本中還包括業(yè)務(wù)代碼,用于指示在跳轉(zhuǎn)至用戶輸入文本的輸入界面之前顯示的界面所對(duì)應(yīng)的業(yè)務(wù);所述至少將其中的歷史文本對(duì)輸入所述語義編碼層,包括:
至少將所述歷史文本對(duì)和所述業(yè)務(wù)代碼組成的第一輸入序列,輸入所述語義編碼層。
5.根據(jù)權(quán)利要求4所述的方法,其中,至少將所述歷史文本對(duì)和所述業(yè)務(wù)代碼組成的第一輸入序列,輸入所述語義編碼層,包括:
基于預(yù)先設(shè)定的用于區(qū)分用戶輸入文本、標(biāo)準(zhǔn)文本和業(yè)務(wù)代碼的三種字符,確定與所述第一輸入序列對(duì)應(yīng)的第二輸入序列;
將所述第一輸入序列和所述第二輸入序列共同輸入所述語義編碼層。
6.根據(jù)權(quán)利要求3所述的方法,其中,所述文本關(guān)聯(lián)標(biāo)簽指示對(duì)應(yīng)的用戶輸入文本和標(biāo)準(zhǔn)文本之間是否相關(guān)聯(lián)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于支付寶(杭州)信息技術(shù)有限公司,未經(jīng)支付寶(杭州)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911203428.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 任務(wù)協(xié)作裝置及方法
- 用于量化任務(wù)價(jià)值的任務(wù)管理方法及裝置
- 用于運(yùn)行任務(wù)的系統(tǒng)、方法和裝置
- 一種分布式任務(wù)調(diào)度系統(tǒng)及方法
- 任務(wù)信息處理方法
- 一種同步任務(wù)異步執(zhí)行的方法和調(diào)度系統(tǒng)
- 數(shù)據(jù)處理方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 一種自動(dòng)分配和推送的任務(wù)管理平臺(tái)及方法
- 程序執(zhí)行控制的裝置及方法、終端和存儲(chǔ)介質(zhì)
- 基于會(huì)話的任務(wù)待辦方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)





