[發明專利]語音分類模型的訓練方法、語音分類方法及相關裝置在審
| 申請號: | 202110762453.8 | 申請日: | 2021-07-06 |
| 公開(公告)號: | CN113539243A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 張軍偉;李誠 | 申請(專利權)人: | 上海商湯智能科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/08;G10L15/16;G10L25/18;G10L25/24 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 何倚雯 |
| 地址: | 200233 上海市徐*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 分類 模型 訓練 方法 相關 裝置 | ||
本申請公開語音分類模型的訓練方法、語音分類方法及相關裝置、設備、存儲介質,其中,訓練方法包括:獲取至少一個類別的語音數據,同一類別的語音數據構成一個語音數據集;提取語音數據集中每個語音數據的語音特征;利用語音數據集中的語音特征對語音分類模型中的子分類模型進行訓練;語音分類模型包括至少一個子分類模型,子分類模型與語音數據集一一對應。通過對語音數據進行類別分類,形成對應語音數據集,利用語音特征訓練對應的子分類模型,從而得到識別所需類別語音數據的語音分類模型。本申請僅利用新類別的語音數據來進行訓練,即可使得語音分類模型實現對新類別的分類。
技術領域
本申請屬于語音識別領域,特別是涉及語音分類模型的訓練方法、語音分類方法及相關裝置、設備、存儲介質。
背景技術
語音識別技術就是讓智能設備聽懂人類的語音。它是一門涉及數字信號處理、人工智能、語言學、數理統計學、聲學、情感學及心理學等多學科交叉的科學。近年來,隨著人工智能的興起,語音識別技術在理論和應用方面都取得大突破,開始從實驗室走向市場,已逐漸走進我們的日常生活。
語音識別是人工智能技術的一個比較大的應用領域,分為語音意義識別和語音類型識別。對于語音類別的識別,當前能夠實現語音識別的人工智能產品中,一般集成的是訓練好的語音分類模型,當需要增加對新類別的識別,當前方案無法實現。
發明內容
本申請提供一種語音分類模型的訓練方法、語音分類方法及相關裝置、設備、存儲介質。
本申請第一方面提供了一種語音分類模型的訓練方法,訓練方法包括:獲取至少一個類別的語音數據,同一類別的語音數據構成一個語音數據集;提取語音數據集中每個語音數據的語音特征;利用語音數據集中的語音特征對語音分類模型中的子分類模型進行訓練;語音分類模型包括至少一個子分類模型,子分類模型與語音數據集一一對應。
因此,提出的語音分類模型包括子分類模型,一個子分類模型對應一個類別的語音數據集,則在訓練語音分類模型時,獲取到各個類別的語音數據,并且每個類別的語音數據構成一個語音數據集,利用語音數據集來對語音分類模型中的子分類模型進行訓練,即可使得語音分類模型能夠實現語音分類。且基于該訓練方法,本申請中語音分類模型可隨時增加新的語音類別的分類。
其中,訓練方法還包括:基于語音數據集中的至少部分語音數據,確定語音數據集的類別特征;利用語音數據集的類別特征,對語音數據集中每個語音數據的語音特征進行處理;利用語音數據集中的語音特征對語音分類模型中的子分類模型進行訓練,包括:利用語音數據集中處理后的語音特征對語音分類模型中的子分類模型進行訓練。
因此,利用語音數據集中的至少部分語音數據,可以獲得該語音數據集的類別特征,即通過類別特征突出體現該語音數據集的類別,利用類別特征對語音特征進行處理,可以使得訓練效果更好,更利于子分類模型識別該類別。
其中,語音數據集的類別特征包括語音數據集的音頻響度特征和音調變化特征。
因此,語音數據集的類別特征主要體現在語音的響度和音調的變化。
其中,基于語音數據集中的至少部分語音數據,確定語音數據集的類別特征,包括:計算語音數據集中至少部分語音數據的語音能量的均方根,以獲得音頻響度特征;計算語音數據集中至少部分語音數據的過零特征,以獲得音調變化特征。
因此,針對每個類別基礎音頻響度的不同,可獲得每個語音數據能量的均方根,從而獲得類別特征中的音頻響度特征。針對每個類別的音調變化不同,獲得每個語音數據的音頻過零特征,從而獲得類別特征中的音調變化特征。
其中,所述利用所述語音數據集的類別特征,對所述語音數據集中每個語音數據的語音特征進行處理,包括:將語音特征除以所述音頻響度特征,并加上所述音調變化特征。
因此,可基于不同語音數據的類別特征,獲得處理后的語音特征,以進一步強化不同類別的區別,利于后續訓練語音分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海商湯智能科技有限公司,未經上海商湯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110762453.8/2.html,轉載請聲明來源鉆瓜專利網。





