[發明專利]語音數據處理方法及裝置、存儲介質、電子設備有效
| 申請號: | 201711364085.1 | 申請日: | 2017-12-18 |
| 公開(公告)號: | CN108320733B | 公開(公告)日: | 2022-01-04 |
| 發明(設計)人: | 吳國兵;潘嘉 | 申請(專利權)人: | 上海科大訊飛信息科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/14;G10L25/90;G10L25/93 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 王立民 |
| 地址: | 200000 上海市浦東新區南*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 數據處理 方法 裝置 存儲 介質 電子設備 | ||
1.一種語音數據處理方法,其特征在于,所述方法包括:
獲取用戶輸入的語音數據,所述語音數據包括成功喚醒智能終端的喚醒語音數據,以及表示操作意圖的控制語音數據;
提取所述語音數據的聲學層面特征和/或語義層面特征,所述聲學層面特征用于表示用戶的發音特征,所述語義層面特征用于表示所述語音數據的文本特征;
將所述聲學層面特征和/或語義層面特征作為輸入,經預先構建的語音判別模型處理后,確定所述喚醒語音數據是否為誤喚醒數據;其中用于構建語音判別模型的樣本喚醒語音數據的數據類型包括正例喚醒語音數據或者反例喚醒語音數據。
2.根據權利要求1所述的方法,其特征在于,獲取所述喚醒語音數據的方式為:
判斷預設時間段內是否連續采集到至少兩條用于喚醒所述智能終端的語音數據;
如果所述預設時間段內連續采集到至少兩條用于喚醒所述智能終端的語音數據,且所述至少兩條用于喚醒所述智能終端的語音數據經當前喚醒模型處理后的得分值d滿足以下條件:d2≤d<d1,則將所述至少兩條用于喚醒所述智能終端的語音數據確定為所述喚醒語音數據,d1為第一喚醒得分門限值,d2為第二喚醒得分門限值。
3.根據權利要求1或2所述的方法,其特征在于,所述聲學層面特征包括當前喚醒模型的聲學得分,則提取所述語音數據的聲學層面特征包括:
獲取所述當前喚醒模型針對所述喚醒語音數據的每個語音單元輸出的前N個識別結果;
若各語音單元的前N個識別結果中包含該語音單元的正確發音,則判定該語音單元的識別結果為識別正確;
根據各語音單元的識別結果,統計所述喚醒語音數據的識別準確度,作為所述當前喚醒模型的聲學得分。
4.根據權利要求3所述的方法,其特征在于,
所述聲學層面特征還包括基頻均值、短時平均能量、短時過零率中的至少一個;
和/或,
所述聲學層面特征還包括清濁序列特征,則提取所述語音數據的聲學層面特征包括:將基頻均值、短時平均能量、短時過零率中的至少一個作為輸入,經預先構建的清濁分類器處理后,輸出所述喚醒語音數據的清濁序列{a1,a2,…,ai,…,am},其中,ai表示所述喚醒語音數據的第i個音素對應的清濁類別;計算所述喚醒語音數據的清濁序列與所述喚醒語音數據對應的喚醒詞的清濁序列之間的相似度,作為所述清濁序列特征;
和/或,
所述聲學層面特征還包括音調序列特征,則提取所述語音數據的聲學層面特征包括:將基頻均值、短時平均能量、短時過零率中的至少一個作為輸入,經預先構建的音調分類器處理后,輸出所述喚醒語音數據的音調序列{b1,b2,…,bj,…,bn},其中,bj表示所述喚醒語音數據的第j個音節對應的音調類別;計算所述喚醒語音數據的音調序列與所述喚醒語音數據對應的喚醒詞的音調序列之間的相似度,作為所述音調序列特征;
和/或,
所述聲學層面特征還包括語音單元的時間特征,則提取所述語音數據的聲學層面特征包括:統計所述喚醒語音數據的每個語音單元的持續時間;利用各語音單元的持續時間,計算時間均值以及時間方差,作為所述語音單元的時間特征;
和/或,
所述聲學層面特征還包括聲紋特征,則提取所述語音數據的聲學層面特征包括:利用預先構建的聲紋提取模型提取所述喚醒語音數據的i-vector特征,作為所述聲紋特征;
和/或,
所述聲學層面特征還包括能量分布特征,則提取所述語音數據的聲學層面特征包括:將所述語音數據切分為三部分ct-1、ct、ct+1,統計各部分的平均能量分布,作為所述能量分布特征;其中,ct表示所述喚醒語音數據,ct+1表示在所述喚醒語音數據之后采集到的包括所述控制語音數據的語音數據集,ct-1表示在所述喚醒語音數據之前采集到的語音數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海科大訊飛信息科技有限公司,未經上海科大訊飛信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711364085.1/1.html,轉載請聲明來源鉆瓜專利網。





