[發明專利]模型獲取方法、裝置、系統、電子設備及存儲介質在審
| 申請號: | 202210423425.8 | 申請日: | 2022-04-21 |
| 公開(公告)號: | CN114999532A | 公開(公告)日: | 2022-09-02 |
| 發明(設計)人: | 趙情恩 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G06K9/62 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 谷春靜 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 獲取 方法 裝置 系統 電子設備 存儲 介質 | ||
本公開提供了模型獲取方法、裝置、系統、電子設備及存儲介質,涉及深度學習以及自然語言處理等人工智能領域,其中的方法可包括:獲取云端最新得到的全局模型,所述全局模型為云端確定不符合預定的結束條件時發送給至少兩個設備端的;利用全局模型為未標注的數據生成偽標簽,得到具有偽標簽的第一類訓練數據;利用第一類訓練數據以及具有人工標注標簽的第二類訓練數據對全局模型進行訓練,得到更新模型;將更新模型返回給云端,用于云端結合獲取到的各更新模型更新全局模型。應用本公開所述方案,可提升模型精度等。
技術領域
本公開涉及人工智能技術領域,特別涉及深度學習以及自然語言處理等領域的模型獲取方法、裝置、系統、電子設備及存儲介質。
背景技術
語音情緒識別在心理評估、機器人助手以及移動服務等方面有著廣泛的應用。在實際應用中,通常借助于語音情緒識別模型來進行語音情緒識別,而模型的精度直接影響著識別結果的準確性。
發明內容
本公開提供了模型獲取方法、裝置、系統、電子設備及存儲介質。
一種模型獲取方法,包括:
獲取云端最新得到的全局模型,所述全局模型為所述云端確定不符合預定的結束條件時發送給至少兩個設備端的;
利用所述全局模型為未標注的數據生成偽標簽,得到具有所述偽標簽的第一類訓練數據;
利用所述第一類訓練數據以及具有人工標注標簽的第二類訓練數據對所述全局模型進行訓練,得到更新模型;
將所述更新模型返回給所述云端,用于所述云端結合獲取到的各更新模型更新所述全局模型。
一種模型獲取方法,包括:
獲取預訓練得到的全局模型,并執行以下第一處理:
將所述全局模型發送給至少兩個設備端,并獲取所述設備端返回的更新模型,所述更新模型為所述設備端利用第一類訓練數據以及第二類訓練數據對所述全局模型進行訓練后得到的模型,所述第一類訓練數據為具有偽標簽的訓練數據,所述偽標簽為利用所述全局模型為未標注的數據生成的標簽,所述第二類訓練數據為具有人工標注標簽的訓練數據;
結合獲取到的各更新模型更新所述全局模型;
響應于確定符合預定的結束條件,將最新得到的所述全局模型作為最終所需的模型,否則,基于最新得到的所述全局模型重復執行所述第一處理。
一種模型獲取裝置,包括:第一獲取模塊、生成模塊、訓練模塊以及發送模塊;
所述第一獲取模塊,用于獲取云端最新得到的全局模型,所述全局模型為所述云端確定不符合預定的結束條件時發送給至少兩個設備端的;
所述生成模塊,用于利用所述全局模型為未標注的數據生成偽標簽,得到具有所述偽標簽的第一類訓練數據;
所述訓練模塊,用于利用所述第一類訓練數據以及具有人工標注標簽的第二類訓練數據對所述全局模型進行訓練,得到更新模型;
所述發送模塊,用于將所述更新模型返回給所述云端,用于所述云端結合獲取到的各更新模型更新所述全局模型。
一種模型獲取裝置,包括:第二獲取模塊以及更新模塊;
所述第二獲取模塊,用于獲取預訓練得到的全局模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210423425.8/2.html,轉載請聲明來源鉆瓜專利網。





