[發(fā)明專利]一種語(yǔ)音識(shí)別方法和設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201210363804.9 | 申請(qǐng)日: | 2012-09-26 |
| 公開(kāi)(公告)號(hào): | CN103680498A | 公開(kāi)(公告)日: | 2014-03-26 |
| 發(fā)明(設(shè)計(jì))人: | 劉長(zhǎng)娥;張德明 | 申請(qǐng)(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號(hào): | G10L15/08 | 分類號(hào): | G10L15/08 |
| 代理公司: | 深圳市深佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44285 | 代理人: | 唐華明 |
| 地址: | 518129 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語(yǔ)音 識(shí)別 方法 設(shè)備 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及電學(xué)技術(shù)領(lǐng)域,特別涉及一種語(yǔ)音識(shí)別方法和設(shè)備。
背景技術(shù)
人類利用語(yǔ)言相互交流信息,語(yǔ)言包括:語(yǔ)音和文字兩種表現(xiàn)方式。通過(guò)語(yǔ)音相互傳遞信息,是人類最重要的基本功能之一。隨著信息技術(shù)的發(fā)展,人與機(jī)器之間也需要進(jìn)行大量的信息交換,目前計(jì)算機(jī)已經(jīng)開(kāi)始模擬人類交流信息的過(guò)程。
人類交流信息的過(guò)程包括:1、自然語(yǔ)言生成:將大腦產(chǎn)生的思想轉(zhuǎn)換成語(yǔ)言;2、語(yǔ)音合成:將語(yǔ)言轉(zhuǎn)換成語(yǔ)音;3、語(yǔ)音識(shí)別:識(shí)別表達(dá)語(yǔ)言的語(yǔ)音內(nèi)容;4、自然語(yǔ)言理解:理解語(yǔ)音所表達(dá)的語(yǔ)言意義。其中前兩點(diǎn)是說(shuō)者執(zhí)行過(guò)程,后兩點(diǎn)是聽(tīng)者執(zhí)行過(guò)程。其中,語(yǔ)音識(shí)別是上述過(guò)程中的“識(shí)別表達(dá)語(yǔ)言的語(yǔ)音內(nèi)容”,對(duì)于設(shè)備而言就是:識(shí)別人類所說(shuō)的語(yǔ)音,并將其轉(zhuǎn)化成文字。以下將就幾個(gè)方面對(duì)語(yǔ)音識(shí)別進(jìn)行說(shuō)明。
一、設(shè)備語(yǔ)音識(shí)別基本原理:
語(yǔ)音識(shí)別是一種模式識(shí)別系統(tǒng),語(yǔ)音識(shí)別包含如下步驟:
1、語(yǔ)言輸入;
2、預(yù)處理;
3、特征提取,作為兩個(gè)分支分別進(jìn)入4的訓(xùn)練類聚以及5~7的識(shí)別操作;
4、訓(xùn)練類聚得到模板庫(kù);
5、使用模板庫(kù)的參考模式執(zhí)行相似度比較;
6、執(zhí)行識(shí)別過(guò)程中對(duì)5中結(jié)果進(jìn)行失真檢測(cè),然后進(jìn)入7;
7、輸出識(shí)別結(jié)果。
其中,預(yù)處理部分包括語(yǔ)音信號(hào)的采樣、濾波等處理,特征提取的作用是從語(yǔ)音信號(hào)中提取出幾組能描述其信號(hào)特征的參數(shù),如能量、共振峰、倒譜系數(shù)等,以便于訓(xùn)練和識(shí)別。建立語(yǔ)音識(shí)別系統(tǒng)的過(guò)程是,先用大量語(yǔ)音進(jìn)行訓(xùn)練得到模板庫(kù),然后讀取模板庫(kù)的模板,和待識(shí)別語(yǔ)音進(jìn)行相似度比較,得到識(shí)別結(jié)果。
以下對(duì)本申請(qǐng)文件提到的名詞說(shuō)明如下:
訓(xùn)練(Training):預(yù)先分析出語(yǔ)音特征參數(shù),制作語(yǔ)音模板(Template)并存放在語(yǔ)音參數(shù)庫(kù)中,模板也可以叫做模型,主要有兩種模型:聲學(xué)模型(AM,acoustic?model)和語(yǔ)言模型(LM,language?model)。聲學(xué)模型用以從聲音信號(hào)中識(shí)別出“音”,而語(yǔ)言模型用以把音轉(zhuǎn)換成“字”。
識(shí)別(Recognition):待識(shí)語(yǔ)音經(jīng)過(guò)與訓(xùn)練時(shí)相同的分析,得到語(yǔ)音參數(shù),將它與庫(kù)中的參考模板一一比較,并采用判決的方法找出最接近語(yǔ)音特征的模板,得出識(shí)別結(jié)果,這里的識(shí)別結(jié)果表現(xiàn)為文字的形式。
失真測(cè)度(Distortion?Measures):在進(jìn)行比較時(shí)要有個(gè)標(biāo)準(zhǔn),這就是計(jì)量語(yǔ)音特征參數(shù)矢量之間的“失真測(cè)度”。失真測(cè)度是語(yǔ)音識(shí)別過(guò)程中的比較,失真測(cè)度的計(jì)算公式有多種,例如:計(jì)算語(yǔ)音特征參數(shù)矢量之間的距離,更具體地:語(yǔ)音特征參數(shù)矢量A(x1,y1)和語(yǔ)音特征參數(shù)矢量B(x2,y2)間的失真測(cè)度
主要識(shí)別框架:基于模式匹配的動(dòng)態(tài)時(shí)間規(guī)整法(DTW,Dynamic?Time?Warping)和基于統(tǒng)計(jì)模型的隱馬爾柯夫模型法(HMM,Hidden?Markov?Model)。
二、語(yǔ)音識(shí)別的模型:
聲學(xué)模型用以從聲音信號(hào)中識(shí)別出“音”,而語(yǔ)言模型用以把音轉(zhuǎn)換成“字”。
統(tǒng)計(jì)語(yǔ)音識(shí)別的最基本問(wèn)題是,給定輸入信號(hào)或特征序列O={O1,O2,...,On},和詞匯表V={w1,w2,…,wL},從V中任意選擇M個(gè)詞構(gòu)成詞序列W=(w1,w2,...,wM),求解對(duì)應(yīng)特征序列O的詞序列W*,使得:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210363804.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗(yàn)設(shè)備、驗(yàn)證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動(dòng)設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點(diǎn)設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





