[發明專利]模型訓練方法及終端設備在審
| 申請號: | 201811004580.6 | 申請日: | 2018-08-30 |
| 公開(公告)號: | CN110874604A | 公開(公告)日: | 2020-03-10 |
| 發明(設計)人: | 蔣佳 | 申請(專利權)人: | TCL集團股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳中一專利商標事務所 44237 | 代理人: | 官建紅 |
| 地址: | 516006 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 終端設備 | ||
本發明涉及計算機技術領域,提供了一種模型訓練方法及終端設備。該方法包括:獲取待訓練模型和訓練數據;所述訓練數據包括多個樣本,且每個樣本對應一個概率值;根據各個樣本的概率值從所述訓練數據中選取若干個樣本生成訓練數據集;通過所述訓練數據集對所述待訓練模型進行訓練,并獲取所述待訓練模型對所述訓練數據集的識別結果;根據所述識別結果和所述訓練數據集計算所述訓練數據集的聚類效果評估值;根據所述聚類效果評估值對所述訓練數據集中各樣本對應的概率值進行調整。本發明通過將模型訓練和訓練數據的篩選相結合,能夠提高模型訓練的訓練效率;在訓練迭代過程中能夠增強難識別樣本對模型訓練的效果,進而提高訓練后模型的魯棒性和準確率。
技術領域
本發明涉及計算機技術領域,尤其涉及一種模型訓練方法及終端設備。
背景技術
人工智能技術需要使用大量的訓練數據進行模型訓練。以人工智能人臉識別技術為例,如果要訓練一個性能優越的模型,動輒需要成百萬級的人臉圖片。大量的人臉圖片,需要耗費大量的人力物力對不同人的人臉進行人工采集及清理。而由于人眼疲勞等因素,人工采集到的大量圖片中,很可能會有錯誤的圖片,導致訓練集里面的圖片有很多噪聲圖片。
另外,訓練數據中有一些人臉圖片,可能因為光照、拍攝角度等,導致識別難度較高。但是在現實的應用中,這些場景下的人臉識別卻往往需要識別準確。如果將這些難識別的樣本專門挑出來進行對模型加強訓練,會耗費較多的時間和人力。
現有的訓練數據清理工作都是靠人工完成,清理成本較高且清理效率低下。對于難識別的樣本,是通過先訓練模型,然后再用訓練好的模型對訓練數據進行驗證,將其中判定錯誤的樣本作為難識別樣本,用這些樣本重新訓練模型。這種訓練方式的訓練周期長,效率低。
發明內容
有鑒于此,本發明實施例提供了模型訓練及終端設備,以解決目前由于訓練數據中存在噪聲樣本及難識別的樣本導致模型訓練的訓練周期長、效率低的問題。
本發明實施例的第一方面提供了模型訓練方法,包括:
獲取待訓練模型和訓練數據;所述訓練數據包括多個樣本,且每個樣本對應一個概率值;
根據各個樣本的概率值從所述訓練數據中選取若干個樣本生成訓練數據集;
通過所述訓練數據集對所述待訓練模型進行訓練,并獲取所述待訓練模型對所述訓練數據集的識別結果;
根據所述識別結果和所述訓練數據集計算所述訓練數據集的聚類效果評估值;
根據所述聚類效果評估值對所述訓練數據集中各樣本對應的概率值進行調整。
本發明實施例的第二方面提供了模型訓練裝置,包括:
獲取模塊,用于獲取待訓練模型和訓練數據;所述訓練數據包括多個樣本,且每個樣本對應一個概率值;
選取模塊,用于根據各個樣本的概率值從所述訓練數據中選取若干個樣本生成訓練數據集;
訓練模塊,用于通過所述訓練數據集對所述待訓練模型進行訓練,并獲取所述待訓練模型對所述訓練數據集的識別結果;
評估模塊,用于根據所述識別結果和所述訓練數據集計算所述訓練數據集的聚類效果評估值;
調整模塊,用于根據所述聚類效果評估值對所述訓練數據集中各樣本對應的概率值進行調整。
本發明實施例的第三方面提供了終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現第一方面中的模型訓練方法。
本發明實施例的第四方面提供了計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,所述計算機程序被處理器執行時實現第一方面中的模型訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于TCL集團股份有限公司,未經TCL集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811004580.6/2.html,轉載請聲明來源鉆瓜專利網。





