[發明專利]模型訓練方法和系統、服務器、存儲介質有效
| 申請號: | 201711131972.4 | 申請日: | 2017-11-15 |
| 公開(公告)號: | CN107808004B | 公開(公告)日: | 2021-02-26 |
| 發明(設計)人: | 王一鳴;孫珂;賀文嵩 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 系統 服務器 存儲 介質 | ||
本發明實施例公開了一種模型訓練方法和系統、服務器、存儲介質,其中,該方法包括:利用帶標注的第一樣本數據訓練得到基礎模型;利用基礎模型對第二樣本數據的解析結果和用戶對第二樣本數據對應的解析結果的反饋,訓練得到回報模型,其中,回報模型用于對基礎模型的解析結果進行評估;利用第三樣本數據,結合基礎模型和回報模型進行反饋訓練,并將回報模型的目標置為正向反饋,以糾正基礎模型向用戶目標調整,得到調整后的基礎模型。本發明實施例可以改善模型訓練過程中的交互方式,降低數據標注的人力成本,提高不同場景中數據的復用性。
技術領域
本發明實施例涉及自然語言處理技術領域,尤其涉及一種模型訓練方法和系統、服務器、存儲介質。
背景技術
在數據庫查詢(query)理解任務中,現在常用的方法是將query拆解為包括類別、意圖和槽位的三元組。類別即query屬于哪個類別,比如天氣、地圖、星座。意圖即query的目的,比如查看、購買、詢問或查找路線等。槽位即query中的關鍵信息,比如在“北京今天的天氣情況”中,“北京”是地點槽位,“今天”是時間槽位。數據查詢解析的方法,也從傳統的統計和規則變為現在較為常用的基于機器學習的方案。
但是,無論采用哪種方案,所需要的訓練數據都要求是已經有標注結果的數據,即每條訓練數據包括query和它對應的類別、意圖和槽位,而現有技術中通常是人工進行標注,且數據的復用性比較差。對于同一類別或者同一槽位,不同的應用場景或者不同的人的意圖,拆解方式都是不同的。例如,對于3C類的手機,可以按照【購買,查看】這種意圖拆分,也可以按照【購買,功能,參數,圖片,價格】這種意圖拆分。對于槽位,存在相同問題,例如,對于“iPhone6s”一詞,一種拆分方式為:把“iphone”作為品牌,“6s”作為型號;而另一種拆分方式可以為:把“iphone6”作為手機型號,“s”作為子型號。因此,拆分方式的多樣性,造成在不同的應用場景下,標注數據很難復用,經常需要對同一類別的數據進行不同的標注,消耗巨大的人力成本。
發明內容
本發明實施例提供一種模型訓練方法和系統、服務器、存儲介質,以解決現有技術中對目標query進行人工標注成本高、不同場景中數據復用性差的問題。
第一方面,本發明實施例提供了一種模型訓練方法,該方法包括:
利用帶標注的第一樣本數據訓練得到基礎模型;
利用所述基礎模型對第二樣本數據的解析結果和用戶對第二樣本數據對應的解析結果的反饋,訓練得到回報模型,其中,所述回報模型用于對所述基礎模型的解析結果進行評估;
利用第三樣本數據,結合所述基礎模型和回報模型進行反饋訓練,并將所述回報模型的目標置為正向反饋,以糾正所述基礎模型向用戶目標調整,得到調整后的基礎模型。
第二方面,本發明實施例還提供了一種模型訓練系統,該系統包括:
基礎模型訓練模塊,用于利用帶標注的第一樣本數據訓練得到基礎模型;
回報模型訓練模塊,用于利用所述基礎模型對第二樣本數據的解析結果和用戶對第二樣本數據對應的解析結果的反饋,訓練得到回報模型,其中,所述回報模型用于對所述基礎模型的解析結果進行評估;
模型調整訓練模塊,用于利用第三樣本數據,結合所述基礎模型和回報模型進行反饋訓練,并將所述回報模型的目標置為正向反饋,以糾正所述基礎模型向用戶目標調整,得到調整后的基礎模型。
第三方面,本發明實施例還提供了一種服務器,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如本發明任一實施例所述的模型訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711131972.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種文檔管理方法及裝置
- 下一篇:人力資源數據的處理方法、裝置及存儲介質





