[發(fā)明專利]用于創(chuàng)建語音標(biāo)簽的方法以及設(shè)備無效
| 申請?zhí)枺?/td> | 201110046560.7 | 申請日: | 2011-02-25 |
| 公開(公告)號: | CN102651218A | 公開(公告)日: | 2012-08-29 |
| 發(fā)明(設(shè)計(jì))人: | 趙蕤;何磊 | 申請(專利權(quán))人: | 株式會社東芝 |
| 主分類號: | G10L15/08 | 分類號: | G10L15/08;G10L15/14 |
| 代理公司: | 北京市中咨律師事務(wù)所 11247 | 代理人: | 楊曉光;于靜 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 創(chuàng)建 語音 標(biāo)簽 方法 以及 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù),更具體地,涉及語音標(biāo)簽的創(chuàng)建。
背景技術(shù)
語音識別技術(shù),也稱為自動語音識別ASR(Automatic?Speech?Recognition),其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列等。從而機(jī)器可以通過語音識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。隨著信息技術(shù)領(lǐng)域的科技發(fā)展,人們預(yù)計(jì),未來幾年內(nèi),語音識別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個領(lǐng)域。而在信息技術(shù)中,人機(jī)接口重要的部分包括語音識別,其與語音合成技術(shù)的結(jié)合可以使人們甩掉鍵盤,通過語音命令進(jìn)行操作。這樣顯著地減少了設(shè)備的體積,尤其是在諸如開車的不便手動操作情況下給人們增加了便利,以及促進(jìn)了有效的交互。語音識別技術(shù)的應(yīng)用已經(jīng)成為具有競爭性的新興高技術(shù)產(chǎn)業(yè)。
語音識別技術(shù)的應(yīng)用可以包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索、聽寫數(shù)據(jù)錄入等。而語音標(biāo)簽也是語音識別技術(shù)的一個具體應(yīng)用,目前廣泛應(yīng)用在嵌入式系統(tǒng)中,如在配備有語音識別的電話上通過語音標(biāo)簽來撥打聯(lián)系人或打開應(yīng)用,或者將語音標(biāo)簽用于語音信息查詢系統(tǒng)以查詢信息等。
通常語音標(biāo)簽的創(chuàng)建過程如下:用戶向系統(tǒng)輸入注冊語音,系統(tǒng)將其轉(zhuǎn)換成代表該語音發(fā)音的標(biāo)簽,并將該發(fā)音標(biāo)簽所表示的一個詞條加入到識別網(wǎng)絡(luò)中。識別網(wǎng)絡(luò)定義可識別的語句。此過程也稱為注冊過程。例如,當(dāng)用戶在注冊過程說“李四”,系統(tǒng)就會創(chuàng)建一個標(biāo)簽來代表該語音發(fā)音,并將該語音標(biāo)簽與要表示的應(yīng)用或信息關(guān)聯(lián),例如電話號碼。
在識別過程中,語音識別系統(tǒng)基于含有語音標(biāo)簽詞條的識別網(wǎng)絡(luò)對測試語音進(jìn)行識別,以確定其內(nèi)容。
在現(xiàn)有技術(shù)中,常用的創(chuàng)建語音標(biāo)簽的方法有基于模板匹配的語音標(biāo)簽方法和基于隱馬爾科夫模型的語音標(biāo)簽方法。基于模板匹配的方法中,在注冊過程對注冊語音提取出一個或多個模板作為該注冊語音的語音標(biāo)簽,而在識別過程可以利用動態(tài)時(shí)間規(guī)整(dynamic?time?warping,DTW)算法對測試語音和模板標(biāo)簽進(jìn)行匹配。最簡單的做法就是將注冊語音的特征作為模板,測試的時(shí)候?qū)y試語音的特征同注冊語音的特征進(jìn)行比較,選取二者最接近的模板作為識別結(jié)果。
例如,注冊語音特征為T1為注冊語音的總幀數(shù)。則Xr可以作為注冊語音的模板,即語音標(biāo)簽。測試語音的特征為T2為測試語音的總幀數(shù)。測試過程即為Xr與Xt的匹配過程。通常采用動態(tài)時(shí)間規(guī)整算法,該算法是一種常用的測量兩個具有不同長度序列之間相似程度的算法,為簡明起見在此不再贅述。
基于模板匹配的方法能夠更好的描述語音中時(shí)間上的相關(guān)性。然而,基于模板匹配的方法通常需要較大的空間來儲存模板,且對于注冊語音和測試語音的差異不穩(wěn)健。
近年來,隨著基于音素(或者其它語音單元,例如音節(jié))的隱馬爾科夫模型(hidden?markov?model,HMM)在語音識別中的普遍應(yīng)用,音素序列作為語音標(biāo)簽已成為主流的語音標(biāo)簽方法。馬爾科夫模型是一個離散時(shí)域有限狀態(tài)自動機(jī),隱馬爾科夫模型是指這一馬爾科夫模型的內(nèi)部狀態(tài)外界不可見,外界只能看到各個時(shí)刻的輸出值。隱馬爾科夫模型能夠有效刻畫語音在時(shí)間上的動態(tài)變化特征,實(shí)現(xiàn)語音信號特征序列與描述語音的聲學(xué)單元(如音素、音節(jié)等)之間的匹配。此外,隱馬爾科夫模型成熟的訓(xùn)練和識別算法也為其在語音識別中的應(yīng)用奠定了基礎(chǔ)。在通常的語音識別系統(tǒng)中,一個音素就是一個包含N個狀態(tài)的HMM,一個字(或者音節(jié))就是構(gòu)成該字的多個音素的HMM串行起來構(gòu)成的HMM,而連續(xù)語音識別的整個模型就是字和靜音組合起來的HMM,其狀態(tài)的輸出為聲學(xué)特征。在該方法中,通過對注冊語音進(jìn)行音素識別而得到音素序列來作為該注冊語音的語音標(biāo)簽。
基于隱馬爾科夫模型的語音標(biāo)簽方法將音素(或者其它語音單元)序列作為語音標(biāo)簽,其相比模板標(biāo)簽占用內(nèi)存較少。其次,音素序列的標(biāo)簽詞條更容易和非語音標(biāo)簽詞條結(jié)合以構(gòu)成新的識別網(wǎng)絡(luò)。這都有助于增加語音標(biāo)簽系統(tǒng)所允許的詞條數(shù)目。
但是,音素序列的語音標(biāo)簽方法也有一定的不足:首先,音素識別錯誤是不可避免的,這會導(dǎo)致音素序列的語音標(biāo)簽不能完全代表注冊語音的發(fā)音,由此造成識別錯誤。此外,隱馬爾科夫模型HMM各狀態(tài)輸出概率分布是相互獨(dú)立的,這與語音參數(shù)向量隨時(shí)間變化的連續(xù)性相矛盾。因此在隱馬爾科夫模型中這種狀態(tài)之間不相關(guān)的假定,導(dǎo)致其不能很好的描述語音中時(shí)間上的相關(guān)性。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會社東芝,未經(jīng)株式會社東芝許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110046560.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:冷風(fēng)扇的支撐裝置
- 下一篇:可調(diào)式采暖散熱器
- 圖冊創(chuàng)建設(shè)備、圖冊創(chuàng)建方法和圖冊創(chuàng)建程序
- 一種使用創(chuàng)建接口來靈活創(chuàng)建對象的方法
- 報(bào)告創(chuàng)建系統(tǒng)、報(bào)告創(chuàng)建裝置以及報(bào)告創(chuàng)建方法
- 文本創(chuàng)建系統(tǒng)、文本創(chuàng)建裝置、文本創(chuàng)建方法
- 文檔創(chuàng)建設(shè)備、文檔創(chuàng)建系統(tǒng)及文檔創(chuàng)建方法
- 剪報(bào)創(chuàng)建方法和剪報(bào)創(chuàng)建系統(tǒng)
- 數(shù)據(jù)創(chuàng)建裝置、數(shù)據(jù)創(chuàng)建方法及數(shù)據(jù)創(chuàng)建程序
- 信息創(chuàng)建方法及信息創(chuàng)建裝置
- 報(bào)告創(chuàng)建系統(tǒng)和報(bào)告創(chuàng)建方法
- 創(chuàng)建改進(jìn)的顏色的顏色創(chuàng)建裝置及顏色創(chuàng)建方法
- 瀏覽器中關(guān)閉標(biāo)簽的裝置和方法
- 標(biāo)簽生成方法及標(biāo)簽生成裝置
- 一種帶有標(biāo)簽的電氣插座
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 基于樹形結(jié)構(gòu)的標(biāo)簽存儲方法及裝置
- 一種標(biāo)簽分離機(jī)構(gòu)
- 標(biāo)簽切割裝置及其標(biāo)簽加工機(jī)
- 標(biāo)簽檢測定位裝置及其標(biāo)簽制造設(shè)備
- 標(biāo)簽轉(zhuǎn)換處理方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





