[發明專利]一種VAD動態參數調整方法和裝置有效
| 申請號: | 201611234787.3 | 申請日: | 2016-12-28 |
| 公開(公告)號: | CN106611598B | 公開(公告)日: | 2019-08-02 |
| 發明(設計)人: | 陳迪;李喆;朱頻頻 | 申請(專利權)人: | 上海智臻智能網絡科技股份有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/02;G10L15/16;G10L25/30 |
| 代理公司: | 工業和信息化部電子專利中心 11010 | 代理人: | 齊潔茹 |
| 地址: | 201803 上海市嘉*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 vad 動態 參數 調整 方法 裝置 | ||
本發明公開了一種VAD動態參數調整方法和裝置,所述方法包括:提取訓練語料中每句語音信號的情感特征向量;將各句語音信號的情感特征向量作為神經網絡的輸入特征、將預先確定的各句語音信號的最優VAD參數序列作為神經網絡的期望輸出,采用設定的神經網絡訓練算法,對搭建的神經網絡進行訓練;在語音處理時,利用已訓練的所述神經網絡以當前語句的前一語句的情感特征向量為輸入特征而輸出的VAD參數,對當前語句進行語音端點檢測。本發明通過找到語音中的情感信息和VAD模型相關參數間存在的規律,得到VAD效果最優參數模型,當需要語音端點檢測時,利用最優參數模型對VAD參數進行動態預估,從而達到優化特殊場景下的VAD的效果。
技術領域
本發明涉及信息處理技術領域,尤其涉及一種語音端點檢測VAD動態參數調整方法和裝置。
背景技術
能量雙門限法是語音端點檢測VAD的常用算法。語音信號一般可分為無聲段、清音段和濁音段。無聲段是背景噪聲段,平均能量最低;濁音段為聲帶振動發出對應的語音信號段,平均能量最高;清音段是空氣在口腔中的摩擦、沖擊或爆破而發出的語音信號段,平均能量居于前兩者之間。清音段和無聲段的波形特點有明顯的不同,無聲段信號變化較為緩慢,而清音段信號在幅度上變化劇烈,穿越零電平次數也多。經驗表明,通常清音段過零率最大。語音端點檢測就是首先判斷有聲還是無聲,如果有聲,則還要判斷是清音還是濁音。為正確地實現端點檢測,一般綜合利用短時能量和過零率兩個特征,采用雙門限檢測法。
目前有優化VAD效果的技術,但均是從能量VAD方面去嘗試優化,并未考慮到特殊場景的問題,也未能應用到語音中的語速,情感等信息,語音端點檢測準確性較低。
發明內容
鑒于上述問題,提出了本發明以便提供一種解決上述問題的VAD動態參數調整方法和裝置,以提高特殊場景下語音端點檢測的準確性。
依據本發明的一個方面,提供一種VAD動態參數調整方法,包括:
提取訓練語料中每句語音信號的情感特征向量;
將各句語音信號的情感特征向量作為神經網絡的輸入特征、將預先確定的各句語音信號的最優VAD參數序列作為神經網絡的期望輸出,采用設定的神經網絡訓練算法,對搭建的神經網絡進行訓練;
在語音處理時,利用已訓練的所述神經網絡以當前語句的前一語句的情感特征向量為輸入特征而輸出的VAD參數,對當前語句進行語音端點檢測。
依據本發明的另一個方面,提供一種VAD動態參數調整裝置,包括:
信息提取模塊,用于提取訓練語料中每句語音信號的情感特征向量;
訓練模塊,用于將各句語音信號的情感特征向量作為神經網絡的輸入特征、將預先確定的各句語音信號的最優VAD參數序列作為神經網絡的期望輸出,采用設定的神經網絡訓練算法,對搭建的神經網絡進行訓練;
檢測模塊,用于在語音處理時,利用已訓練的所述神經網絡以當前語句的前一語句的情感特征向量為輸入特征而輸出的VAD參數,對當前語句進行語音端點檢測。
本發明有益效果如下:
本發明利用深度神經網絡學習語音中的情感信息,找到語音中的情感信息和VAD模型相關參數間存在的規律,得到相應的VAD效果最優參數模型,當需要語音端點檢測時,利用最優參數模型對VAD參數進行動態預估,從而達到優化特殊場景下的VAD的效果,利用優化后的VAD進行語音端點檢測,可以提高檢測準確性,很好的解決了現有技術中僅從能量方面優化VAD,不能滿足特殊場景的需求,導致檢測準確性低的問題。
上述說明僅是本發明技術方案的概述,為了能夠更清楚了解本發明的技術手段,而可依照說明書的內容予以實施,并且為了讓本發明的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本發明的具體實施方式。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海智臻智能網絡科技股份有限公司,未經上海智臻智能網絡科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611234787.3/2.html,轉載請聲明來源鉆瓜專利網。





