[發明專利]兒童語音識別模型的訓練方法及系統有效
| 申請號: | 201911000370.4 | 申請日: | 2019-10-21 |
| 公開(公告)號: | CN110706692B | 公開(公告)日: | 2021-12-14 |
| 發明(設計)人: | 錢彥旻;吳松澤;俞凱;盛佩瑤;楊卓林;李晨達 | 申請(專利權)人: | 思必馳科技股份有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/26;G10L15/20 |
| 代理公司: | 北京商專永信知識產權代理事務所(普通合伙) 11400 | 代理人: | 黃謙;車江華 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 兒童 語音 識別 模型 訓練 方法 系統 | ||
本發明實施例提供一種兒童語音識別模型的訓練方法。該方法包括:獲取訓練數據;通過基線聲學模型訓練得到無條件生成對抗網絡;將隨機噪聲數據輸入無條件生成對抗網絡,得到噪聲增強聲學特征;將噪聲增強聲學特征輸入至基線聲學模型,得到每一幀噪聲增強聲學特征對應的后驗概率軟標簽;至少將噪聲增強聲學特征和軟標簽以及兒童語音訓練數據和硬標簽作為樣本訓練數據訓練兒童語音增強聲學識別模型。本發明實施例還提供一種兒童語音識別模型的訓練系統。本發明實施例在兒童語音有限的情況下,改變了兒童語音的發音本質,生成多樣化的兒童語音,提高兒童語音識別模型的識別準確率。
技術領域
本發明涉及語音識別領域,尤其涉及一種兒童語音識別模型的訓練方法及系統。
背景技術
隨著智能語音的發展,不但為成年用戶提供了大量語音交互產品,還為兼顧到了兒童,為兒童提供了許多智能產品,例如,智能故事機、智能機器人。但是由于兒童聲音與成人聲音的差異,現有的語音識別系統對于兒童聲音的識別效果并不佳。
對于上述問題,通常會使用加入噪音的方法:在數據預處理上,對干凈的童聲音頻中的每一句話,用FaNT工具以20dB的信噪比加入115種噪音的隨機一種,以增加童聲數據量;或者,采用隨機特征映射方法:隨機特征映射通過學習一個仿射變換,將訓練集外說話人的特征變換為童聲說話人,來達到數據增強的目的;或者,采用自適應方法:該方法使用成年人數據預訓練模型,再用童聲數據進行自適應,自適應時只更新輸出層參數,將較低層的參數進行凍結。
在實現本發明過程中,發明人發現相關技術中至少存在如下問題:
自適應方法缺陷在于系統性能受到真實童聲數據量的限制,該方法需要引入額外的真實童聲數據,因此童聲數據量的大小必然會影響系統的性能。
加入噪音方法本質上是將噪音和干凈語音進行結合來生成新的數據,增強的數據高度依賴于噪音和干凈語音,同時增強數據量也會受到噪音種類和干凈語音數據量的影響,并且它們本質上說話的內容還是一樣的,多樣化也會受限。
隨機特征映射方法同加入噪音方法,需要依賴外部語音來增強數據,對數據量有較大影響。
而上述方法中需要的童聲數據本身就不好獲得,均會影響這些方法的效果。
發明內容
為了至少解決現有技術中由于童聲數據量不足,使得兒童語音識別模型效果不佳的問題。
第一方面,本發明實施例提供一種兒童語音識別模型的訓練方法,包括:
獲取訓練數據,所述訓練數據包括兒童語音訓練數據、所述兒童語音訓練數據對應的硬標簽、隨機噪聲數據;
通過基線聲學模型訓練得到無條件生成對抗網絡;
將所述隨機噪聲數據輸入所述無條件生成對抗網絡,以得到噪聲增強聲學特征;
將所述噪聲增強聲學特征輸入至所述基線聲學模型,得到每一幀所述噪聲增強聲學特征對應的后驗概率軟標簽;
至少將所述噪聲增強聲學特征和所述軟標簽以及所述兒童語音訓練數據和所述硬標簽作為樣本訓練數據訓練兒童語音增強聲學識別模型。
第二方面,本發明實施例提供一種兒童語音識別模型的訓練系統,包括:
數據獲取程序模塊,用于獲取訓練數據,所述訓練數據包括兒童語音訓練數據、所述兒童語音訓練數據對應的硬標簽、隨機噪聲數據;
對抗網絡生成程序模塊,用于通過基線聲學模型訓練得到無條件生成對抗網絡;
聲學特征確定程序模塊,用于將所述隨機噪聲數據輸入所述無條件生成對抗網絡,以得到噪聲增強聲學特征;
標簽確定程序模塊,用于將所述噪聲增強聲學特征輸入至所述基線聲學模型,得到每一幀所述噪聲增強聲學特征對應的后驗概率軟標簽;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于思必馳科技股份有限公司,未經思必馳科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911000370.4/2.html,轉載請聲明來源鉆瓜專利網。





