日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種快速可在線應用的聲道長度歸整方法有效

專利信息
申請號: 200810097981.0 申請日: 2008-05-21
公開(公告)號: CN101447182A 公開(公告)日: 2009-06-03
發明(設計)人: 顏永紅;劉趙杰;趙慶衛;潘接林 申請(專利權)人: 中國科學院聲學研究所;北京中科信利技術有限公司
主分類號: G10L15/00 分類號: G10L15/00;G10L15/06
代理公司: 北京法思騰知識產權代理有限公司 代理人: 楊小蓉
地址: 100190北京市海淀區*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 快速 在線 應用 聲道 長度 歸整 方法
【說明書】:

技術領域

發明涉及語音識別技術中一種說話人聲學特征歸整方法,更具體地說,本發 明涉及一種快速可在線應用的說話人聲道長度歸整方法。

背景技術

語音是人的自然屬性之一。由于說話人發音器官的生理差異以及后天形成的行 為差異,在語音識別中說話人相關系統的性能要好于說話人無關系統。為了減小由 于說話人差異而引起的說話人無關系統性能的下降,聲道長度歸整是一種常用的有 效方法。聲道長度歸整是一種基于模型的特征歸整技術,依賴于說話人聲道長度歸 整模型。文獻,H.Wakita“Normalization?of?Vowels?by?Vocal-Tract?Length?and?its Application?to?Vowel?Identification,”ICASSP77(1977),首次提出應用去除說話人聲 道長度引起共振峰頻率漂移的思想來提高孤立元音的識別率。聲道不同的位置和形 狀決定了語音的產生,文獻,E.Eide?et?al.“A?Parametric?Approach?to?Vocal?Tract?Length Normalization,”ICASSP96(1996),認為說話人聲道最簡單的模型是一個長度從聲門 到唇的均勻管子,而且是一端開口一端封閉。他們還給出了不同歸整函數對最后識 別性能的影響。基于這種均勻管道的模型,說話人聲道長度的影響等于語音信號共 振峰的中心頻率乘以聲道長度的倒數。通常說話人聲道長度從女生的13cm左右到男 生的18cm以上,這些變化對語音識別都是不利的。聲道長度歸整技術的思想就是找 到某個歸整函數把訓練和測試的數據都變換到一個與說話人聲道長度無關的數據 域。基于管道模型的理論,共振峰隨聲道長度線性變化。大多數情況下歸整函數只 依賴于一個簡單的特征歸整因子。具體實施就是尋找每個說話人最佳歸整因子,然 后通過該歸整因子對頻率軸拉伸或壓縮來消除說話人聲道長度不同而帶來的影響。 聲道長度歸整技術的原理很簡單,但是有效的具體實施是相當困難的。最大的挑戰 是如何從有限的數據中有效的估算出最佳的歸整因子。傳統相當多的方法是基于最 大似然估計的兩遍解碼的方法,通過對歸整前聲學特征進行一遍解碼得到說話人說 話內容,用說話內容的文本信息和不同歸整因子(通常是以一定步長遍歷)歸整后 的特征在聲學模型上做強制性對齊,用似然值最大的歸整因子作為該人的最佳歸整 因子。這種方法能取得很不錯的效果,但是需要兩遍解碼時間。文獻,L.Lee?et al.“Speaker?Normalization?using?Efficient?Frequency?Warping?Procedures,”ICASSP96 (1996),提出了一些較為成功的方法。對于訓練數據,他們提出了一種跌代的方法, 用一半訓練數據訓練一個聲學模型,拿這個聲學模型估算另外一半數據的歸整因子, 然后用歸整后的數據在原來的聲學模型上重新估算新的聲學模型。測試的時提出了 一種文本無關的方法,選用了歸整因子相關的GMM(Gaussian?Mixture?Model)模型, 省掉了第一遍解碼時間。上述求歸整因子方法都是說話人相關,文獻,S.Wegmann?et al.“Speaker?Normalization?on?Conversational?Telephone?Speech”ICASSP96(1996),提 出了一種快速的句子相關的聲道長度歸整方法,讓聲道長度歸整方法可以在半離線 下工作提供了可能。現在報道的方法都取得了很不錯的識別效果,但是這些方法多 少有一定的局限性,都需要一定量先驗數據,所以只能工作在離線或者半離線的方 式下,難以應用于實際的系統中。在實際的系統中,特別是在線的系統,說話人信 息和說話的內容是未知的,而且系統不能容許比較長的延時,現有的方法中難以找 到一個合適的解決方案,所以很難用上聲道長度歸整技術。

發明內容

本發明的目的在于:克服已有技術的缺陷,提供一種讓聲道長度歸整技術能應 用在在線的語音識別系統中的快速可在線應用的聲道長度歸整方法。

本發明的目的是這樣實現的:

本發明的快速可在線應用的聲道長度歸整方法,包括訓練階段和測試階段,具 體步驟如下:

1)在訓練階段訓練一個與聲道長度無關的歸整后的聲學模型;

2)根據不同的歸整因子對訓練數據分類,訓練多類GMM;

3)測試時分段在多類GMM打分,快速計算聲道長度歸整因子;

4)根據識別系統的實時性需求選擇不同的段數,更新聲道長度歸整因子;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院聲學研究所;北京中科信利技術有限公司,未經中國科學院聲學研究所;北京中科信利技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/200810097981.0/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 日韩av在线网址| 国内久久久| 性欧美激情日韩精品七区| 国产在线视频99| 久久综合伊人77777麻豆| 午夜看片网| 乱子伦农村| 亚洲国产精品一区在线| 欧美日韩九区| 国产精品自拍不卡| 久久久久国产精品视频| 农村妇女毛片精品久久| 搡少妇在线视频中文字幕| 亚洲精品日韩精品| 久久精品二| 国产91丝袜在线| 久久天天躁夜夜躁狠狠躁2022| 91黄色免费看| 国产一区二区三区四| 991本久久精品久久久久| 午夜av网址| 狠狠色噜噜狠狠狠狠色综合久老司机| 国产理论一区| 黄色国产一区二区| 日韩夜精品精品免费观看| 亚洲精品乱码久久久久久国产主播| 狠狠色噜噜狼狼狼色综合久| 精品久久久影院| 久久久精品欧美一区二区免费| 91夜夜夜| 538国产精品一区二区| 一区二区欧美视频| 日本看片一区二区三区高清| 夜夜精品视频一区二区| 亚洲自拍偷拍一区二区三区| 精品少妇一区二区三区| 国产在线卡一卡二| 国产第一区在线观看| 美女张开腿黄网站免费| 亚洲欧美日韩国产综合精品二区| 国产区一二| 国产精品一二三在线观看| 欧美精品在线观看视频| 玖玖玖国产精品| 真实的国产乱xxxx在线91| 国产精品一区二区不卡| 国产精品高潮呻| 亚洲精品456| 中文字幕制服狠久久日韩二区| 国产99小视频| 欧洲在线一区| 国产精品久久久久久久久久嫩草| 高清欧美精品xxxxx| 日韩精品久久久久久久的张开腿让 | 狠狠躁日日躁狂躁夜夜躁av| 久久福利免费视频| 欧美精品一区二区三区久久久竹菊| 国产伦精品一区二区三区免| 欧美日韩一区二区三区四区五区| 午夜精品在线观看| 久久久久久久久亚洲精品一牛| 鲁丝一区二区三区免费| 中文字幕一二三四五区| 国产精品久久久久久久久久久久久久久久久久 | 国产精品久久久久久亚洲调教| 欧美一级日韩一级| 偷拍久久精品视频| 精品国产一区二区三区国产馆杂枝| 国产一级片网站| 国产三级国产精品国产专区50| 亚洲自拍偷拍中文字幕| 欧美亚洲另类小说| 久久97国产| 99久久夜色精品| 热99re久久免费视精品频软件 | 狠狠插狠狠爱| 久久午夜鲁丝片| 色天天综合久久久久综合片| 91偷自产一区二区三区精品| 精品亚洲午夜久久久久91| 国产在线精品区| 中文字幕欧美一区二区三区|