[發(fā)明專利]語音的頻譜波峰的檢測(cè)以及語音識(shí)別方法和系統(tǒng)無效
| 申請(qǐng)?zhí)枺?/td> | 200710199194.2 | 申請(qǐng)日: | 2007-12-20 |
| 公開(公告)號(hào): | CN101465122A | 公開(公告)日: | 2009-06-24 |
| 發(fā)明(設(shè)計(jì))人: | 趙蕤;鄢翔;丁沛;何磊;郝杰 | 申請(qǐng)(專利權(quán))人: | 株式會(huì)社東芝 |
| 主分類號(hào): | G10L15/20 | 分類號(hào): | G10L15/20;G10L15/02;G10L15/08 |
| 代理公司: | 北京市中咨律師事務(wù)所 | 代理人: | 李 崢;楊曉光 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 頻譜 波峰 檢測(cè) 以及 識(shí)別 方法 系統(tǒng) | ||
1.一種檢測(cè)語音的頻譜波峰的方法,包括:
從上述語音的功率譜中檢測(cè)出語音頻譜波峰候選;以及
根據(jù)波峰間距和/或相鄰幀的波峰位置,去除上述語音頻譜波峰候選中的噪聲波峰,以檢測(cè)出語音頻譜波峰。
2.根據(jù)權(quán)利要求1所述的檢測(cè)語音的頻譜波峰的方法,其中從上述語音的功率譜中檢測(cè)出語音頻譜波峰候選的步驟進(jìn)一步包括:
求出上述語音的功率譜中的各個(gè)拐點(diǎn),作為該語音的頻譜波峰候選。
3.根據(jù)權(quán)利要求1所述的檢測(cè)語音的頻譜波峰的方法,其中上述根據(jù)波峰間距和/或相鄰幀的波峰位置,去除上述語音頻譜波峰候選中的噪聲波峰的步驟進(jìn)一步包括:
根據(jù)上述語音的功率譜,確定上述語音頻譜波峰候選中具有最高能量的波峰;以及
以該具有最高能量的波峰為中心,去除上述語音頻譜波峰候選中與前一波峰的距離小于波峰間距閾值的波峰。
4.根據(jù)權(quán)利要求1或3所述的檢測(cè)語音的頻譜波峰的方法,其中上述根據(jù)波峰間距和/或相鄰幀的波峰位置,去除上述語音頻譜波峰候選中的噪聲波峰的步驟進(jìn)一步包括:
對(duì)上述語音頻譜波峰候選中相鄰幀內(nèi)的語音頻譜波峰候選的位置進(jìn)行比對(duì);以及
對(duì)于上述相鄰幀內(nèi)的語音頻譜波峰候選,去除在其中一幀中出現(xiàn)、而在另一幀中的相同位置或相同位置附近并未出現(xiàn)的波峰。
5.根據(jù)權(quán)利要求1所述的檢測(cè)語音的頻譜波峰的方法,其中在從上述語音的功率譜中檢測(cè)出語音頻譜波峰候選的步驟之前還包括:
利用語音增強(qiáng)技術(shù)對(duì)上述語音的功率譜進(jìn)行增強(qiáng)。
6.一種語音識(shí)別方法,包括:
利用權(quán)利要求1~5中任意一項(xiàng)所述的檢測(cè)語音的頻譜波峰的方法,從待識(shí)別語音的功率譜中檢測(cè)出語音頻譜波峰;以及
利用上述語音頻譜波峰的信息獲得上述待識(shí)別語音的梅爾倒譜系數(shù)特征。
7.根據(jù)權(quán)利要求6所述的語音識(shí)別方法,其中利用上述語音頻譜波峰的信息獲得上述待識(shí)別語音的梅爾倒譜系數(shù)特征的步驟進(jìn)一步包括:
利用上述語音頻譜波峰的信息,從上述待識(shí)別語音的功率譜計(jì)算基于頻譜波峰的向量序列;以及
將上述基于頻譜波峰的向量序列輸入到梅爾濾波器組,以獲得該待識(shí)別語音的梅爾倒譜系數(shù)特征。
8.一種語音識(shí)別方法,包括:
從待識(shí)別語音的功率譜中檢測(cè)出語音頻譜波峰;
利用上述語音頻譜波峰的信息,從上述待識(shí)別語音的功率譜計(jì)算基于頻譜波峰的向量序列;以及
將上述基于頻譜波峰的向量序列輸入到梅爾濾波器組,以獲得該待識(shí)別語音的梅爾倒譜系數(shù)特征。
9.根據(jù)權(quán)利要求7或8所述的語音識(shí)別方法,其中利用上述語音頻譜波峰的信息,從上述待識(shí)別語音的功率譜計(jì)算基于頻譜波峰的向量序列的步驟進(jìn)一步包括:
獲得上述待識(shí)別語音的功率譜的采樣序列;
根據(jù)上述語音頻譜波峰的信息,判斷上述采樣序列中的各采樣點(diǎn)是否為波峰點(diǎn);以及
如果該采樣點(diǎn)是波峰點(diǎn),則將該采樣點(diǎn)的基于頻譜波峰的向量值設(shè)置為o(n)=v(n),其中v(n)是該采樣點(diǎn)的采樣值;否則為o(n)=0。
10.根據(jù)權(quán)利要求7或8所述的語音識(shí)別方法,其中利用上述語音頻譜波峰的信息,從上述待識(shí)別語音的功率譜計(jì)算基于頻譜波峰的向量序列的步驟進(jìn)一步包括:
獲得上述待識(shí)別語音的功率譜的采樣序列;
根據(jù)上述語音頻譜波峰的信息,判斷上述采樣序列中的各采樣點(diǎn)是否為波峰點(diǎn);以及
如果該采樣點(diǎn)是波峰點(diǎn),則將該采樣點(diǎn)的基于頻譜波峰的向量值設(shè)置為其中v(n)是該采樣點(diǎn)的采樣值;否則為o(n)=0。
11.根據(jù)權(quán)利要求7或8所述的語音識(shí)別方法,其中利用上述語音頻譜波峰的信息,從上述待識(shí)別語音的功率譜計(jì)算基于頻譜波峰的向量序列的步驟進(jìn)一步包括:
獲得上述待識(shí)別語音的功率譜的采樣序列;
根據(jù)上述語音頻譜波峰的信息,判斷上述采樣序列中的各采樣點(diǎn)是否為波峰點(diǎn);以及
如果該采樣點(diǎn)是波峰點(diǎn),則將該采樣點(diǎn)的基于頻譜波峰的向量值設(shè)置為o(n)=v(n),其中v(n)是該采樣點(diǎn)的采樣值;否則,o(n)等于分別與該采樣點(diǎn)左右相鄰的兩個(gè)波峰點(diǎn)的采樣值的插值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于株式會(huì)社東芝,未經(jīng)株式會(huì)社東芝許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710199194.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 一種頻譜重構(gòu)的確定方法及系統(tǒng)
- 一種切換頻譜的方法及設(shè)備
- 白頻譜資源獲取方法、白頻譜資源請(qǐng)求設(shè)備及系統(tǒng)
- 頻譜資源管理設(shè)備、方法、系統(tǒng)以及次系統(tǒng)設(shè)備
- 一種頻譜分配的方法和設(shè)備
- 一種降采樣頻率的電網(wǎng)諧波測(cè)量方法
- 一種頻譜共享方法及裝置
- 一種自適應(yīng)的實(shí)時(shí)頻譜數(shù)據(jù)的壓縮方法及系統(tǒng)
- 一種基于頻譜管理器的無線電空閑資源共享系統(tǒng)
- 頻譜資源管理設(shè)備、方法、系統(tǒng)以及次系統(tǒng)設(shè)備
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)





