[發明專利]一種模型訓練方法、模型訓練裝置及智能設備有效
| 申請號: | 202011424297.6 | 申請日: | 2020-12-08 |
| 公開(公告)號: | CN112528021B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 馬力 | 申請(專利權)人: | 深圳市優必選科技股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/33 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 肖遙 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 方法 裝置 智能 設備 | ||
本申請公開了一種模型訓練方法、裝置、智能設備及計算機可讀存儲介質。其中,該方法包括:獲取與第一語料庫存在區別的第二語料庫,其中,所述第一語料庫用于訓練文本分類任務所使用的分類模型;從所述第二語料庫中篩選得到至少一條噪聲語料;將所述噪聲語料添加進所述第一語料庫;基于添加了所述噪聲語料后的所述第一語料庫對所述分類模型進行訓練。通過本申請方案,可一定程度提升分類模型的分類準確率。
技術領域
本申請屬于人工智能技術領域,尤其涉及一種模型訓練方法、模型訓練裝置、智能設備及計算機可讀存儲介質。
背景技術
在利用統計機器學習模型進行文本分類時,模型常常會將一些字詞層面的局部特征當作分類判別的依據,而忽略整個文本語義層面上的特征。也即,文本分類模型容易在個別字詞信息上產生過擬合。
發明內容
本申請提供了一種模型訓練方法、模型訓練裝置、智能設備及計算機可讀存儲介質,可一定程度避免文本分類模型在個別字詞信息上產生過擬合的現象提升文本分類模型在實際應用場景中的魯棒性。
第一方面,本申請提供了一種模型訓練方法,包括:
獲取與第一語料庫存在區別的第二語料庫,其中,上述第一語料庫用于訓練文本分類任務所使用的分類模型;
從上述第二語料庫中篩選得到至少一條噪聲語料;
將上述噪聲語料添加進上述第一語料庫;
基于添加了上述噪聲語料后的上述第一語料庫對上述分類模型進行訓練。
第二方面,本申請提供了一種模型訓練裝置,包括:
獲取單元,用于獲取與第一語料庫存在區別的第二語料庫,其中,上述第一語料庫用于訓練文本分類任務所使用的分類模型;
篩選單元,用于從上述第二語料庫中篩選得到至少一條噪聲語料;
添加單元,用于將上述噪聲語料添加進上述第一語料庫;
訓練單元,用于基于添加了上述噪聲語料后的上述第一語料庫對上述分類模型進行訓練。
第三方面,本申請提供了一種智能設備,上述智能設備包括存儲器、處理器以及存儲在上述存儲器中并可在上述處理器上運行的計算機程序,上述處理器執行上述計算機程序時實現如上述第一方面的方法的步驟。
第四方面,本申請提供了一種計算機可讀存儲介質,上述計算機可讀存儲介質存儲有計算機程序,上述計算機程序被處理器執行時實現如上述第一方面的方法的步驟。
第五方面,本申請提供了一種計算機程序產品,上述計算機程序產品包括計算機程序,上述計算機程序被一個或多個處理器執行時實現如上述第一方面的方法的步驟。
本申請與現有技術相比存在的有益效果是:首先獲取與第一語料庫存在區別的第二語料庫,其中,上述第一語料庫用于訓練文本分類任務所使用的分類模型,然后從上述第二語料庫中篩選得到至少一條噪聲語料,并將上述噪聲語料作為負樣本添加進上述第一語料庫,最后基于添加了上述噪聲語料后的上述第一語料庫對上述分類模型進行訓練。上述過程中,通過在用于訓練分類模型的語料庫中添加負樣本,可避免分類模型產生過擬合的風險,一定程度提升分類模型在實際應用場景中的魯棒性。可以理解的是,上述第二方面至第五方面的有益效果可以參見上述第一方面中的相關描述,在此不再贅述。
附圖說明
為了更清楚地說明本申請實施例中的技術方案,下面將對實施例或現有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是本申請實施例提供的模型訓練方法的實現流程示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市優必選科技股份有限公司,未經深圳市優必選科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011424297.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分析子系統死機的方法、系統和終端設備
- 下一篇:一種爆胎防側翻車輪





