[發(fā)明專利]模型訓(xùn)練方法和系統(tǒng)、服務(wù)器、存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201711131972.4 | 申請日: | 2017-11-15 |
| 公開(公告)號: | CN107808004B | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計)人: | 王一鳴;孫珂;賀文嵩 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 模型 訓(xùn)練 方法 系統(tǒng) 服務(wù)器 存儲 介質(zhì) | ||
1.一種模型訓(xùn)練方法,其特征在于,包括:
利用帶標(biāo)注的第一樣本數(shù)據(jù)訓(xùn)練得到基礎(chǔ)模型,其中,所述基礎(chǔ)模型用于數(shù)據(jù)庫查詢query理解,第一樣本數(shù)據(jù)包括查詢和所述查詢對應(yīng)的特征信息,第一樣本數(shù)據(jù)的標(biāo)注包括查詢的類型、意圖和槽位;
利用所述基礎(chǔ)模型對第二樣本數(shù)據(jù)的解析結(jié)果和用戶對第二樣本數(shù)據(jù)對應(yīng)的解析結(jié)果的反饋,訓(xùn)練得到回報模型,其中,所述回報模型用于對所述基礎(chǔ)模型的解析結(jié)果進(jìn)行評估;
利用第三樣本數(shù)據(jù),結(jié)合所述基礎(chǔ)模型和回報模型進(jìn)行反饋訓(xùn)練,并將所述回報模型的目標(biāo)置為正向反饋,以糾正所述基礎(chǔ)模型向用戶目標(biāo)調(diào)整,得到調(diào)整后的基礎(chǔ)模型;
其中,第二樣本數(shù)據(jù)和第三樣本數(shù)據(jù)為不帶標(biāo)注的樣本數(shù)據(jù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述利用所述基礎(chǔ)模型對第二樣本數(shù)據(jù)的解析結(jié)果和用戶對第二樣本數(shù)據(jù)對應(yīng)的解析結(jié)果的反饋,訓(xùn)練得到回報模型,包括:
將所述基礎(chǔ)模型對第二樣本數(shù)據(jù)的解析結(jié)果作為輸入,用戶對第二樣本數(shù)據(jù)對應(yīng)的解析結(jié)果的反饋作為目標(biāo),訓(xùn)練并得到所述回報模型;
其中,用戶對第二樣本數(shù)據(jù)對應(yīng)的解析結(jié)果的反饋是根據(jù)預(yù)設(shè)的模板句式劃分的正向反饋和負(fù)向反饋。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
利用帶標(biāo)注的第四樣本數(shù)據(jù),結(jié)合所述基礎(chǔ)模型和回報模型進(jìn)行雙目標(biāo)訓(xùn)練,其中,所述雙目標(biāo)包括所述基礎(chǔ)模型對第四樣本數(shù)據(jù)的解析結(jié)果和所述回報模型對第四樣本數(shù)據(jù)的解析結(jié)果的反饋結(jié)果,且所述反饋結(jié)果為正向反饋。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基礎(chǔ)模型為循環(huán)神經(jīng)網(wǎng)絡(luò)模型,并結(jié)合條件隨機場進(jìn)行訓(xùn)練;
所述回報模型采用包括softmax層和全連接層的機器學(xué)習(xí)模型。
5.一種模型訓(xùn)練系統(tǒng),其特征在于,包括:
基礎(chǔ)模型訓(xùn)練模塊,用于利用帶標(biāo)注的第一樣本數(shù)據(jù)訓(xùn)練得到基礎(chǔ)模型,其中,所述基礎(chǔ)模型用于數(shù)據(jù)庫查詢query理解,第一樣本數(shù)據(jù)包括查詢和所述查詢對應(yīng)的特征信息,第一樣本數(shù)據(jù)的標(biāo)注包括查詢的類型、意圖和槽位;
回報模型訓(xùn)練模塊,用于利用所述基礎(chǔ)模型對第二樣本數(shù)據(jù)的解析結(jié)果和用戶對第二樣本數(shù)據(jù)對應(yīng)的解析結(jié)果的反饋,訓(xùn)練得到回報模型,其中,所述回報模型用于對所述基礎(chǔ)模型的解析結(jié)果進(jìn)行評估;
模型調(diào)整訓(xùn)練模塊,用于利用第三樣本數(shù)據(jù),結(jié)合所述基礎(chǔ)模型和回報模型進(jìn)行反饋訓(xùn)練,并將所述回報模型的目標(biāo)置為正向反饋,以糾正所述基礎(chǔ)模型向用戶目標(biāo)調(diào)整,得到調(diào)整后的基礎(chǔ)模型;
其中,第二樣本數(shù)據(jù)和第三樣本數(shù)據(jù)為不帶標(biāo)注的樣本數(shù)據(jù)。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述回報模型訓(xùn)練模塊具體用于:
將所述基礎(chǔ)模型對第二樣本數(shù)據(jù)的解析結(jié)果作為輸入,用戶對第二樣本數(shù)據(jù)對應(yīng)的解析結(jié)果的反饋作為目標(biāo),訓(xùn)練并得到所述回報模型;
其中,用戶對第二樣本數(shù)據(jù)對應(yīng)的解析結(jié)果的反饋是根據(jù)預(yù)設(shè)的模板句式劃分的正向反饋和負(fù)向反饋。
7.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括:
雙目標(biāo)訓(xùn)練模塊,用于利用帶標(biāo)注的第四樣本數(shù)據(jù),結(jié)合所述基礎(chǔ)模型和回報模型進(jìn)行雙目標(biāo)訓(xùn)練,其中,所述雙目標(biāo)包括所述基礎(chǔ)模型對第四樣本數(shù)據(jù)的解析結(jié)果和所述回報模型對第四樣本數(shù)據(jù)的解析結(jié)果的反饋結(jié)果,且所述反饋結(jié)果為正向反饋。
8.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述基礎(chǔ)模型為循環(huán)神經(jīng)網(wǎng)絡(luò)模型,并結(jié)合條件隨機場進(jìn)行訓(xùn)練;
所述回報模型采用包括softmax層和全連接層的機器學(xué)習(xí)模型。
9.一種服務(wù)器,其特征在于,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當(dāng)所述一個或多個程序被所述一個或多個處理器執(zhí)行,使得所述一個或多個處理器實現(xiàn)如權(quán)利要求1~4中任一所述的模型訓(xùn)練方法。
10.一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,其特征在于,該程序被處理器執(zhí)行時實現(xiàn)如權(quán)利要求1~4中任一所述的模型訓(xùn)練方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711131972.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





