[發(fā)明專(zhuān)利]一種語(yǔ)音信息的處理方法、裝置、設(shè)備及介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201911419785.5 | 申請(qǐng)日: | 2019-12-31 |
| 公開(kāi)(公告)號(hào): | CN111128174A | 公開(kāi)(公告)日: | 2020-05-08 |
| 發(fā)明(設(shè)計(jì))人: | 陳都;吳本谷 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京獵戶(hù)星空科技有限公司 |
| 主分類(lèi)號(hào): | G10L15/22 | 分類(lèi)號(hào): | G10L15/22;G10L15/26;G10L15/16;G10L15/02;G10L15/06;G10L25/78 |
| 代理公司: | 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 金銀花 |
| 地址: | 100025 北京市朝*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語(yǔ)音 信息 處理 方法 裝置 設(shè)備 介質(zhì) | ||
1.一種語(yǔ)音信息的處理方法,其特征在于,所述方法包括:
將待處理的語(yǔ)音信息劃分為多個(gè)第一語(yǔ)音幀,并提取每個(gè)所述第一語(yǔ)音幀對(duì)應(yīng)的第一語(yǔ)音特征;
通過(guò)預(yù)先訓(xùn)練完成的聲學(xué)模型,依次根據(jù)每個(gè)所述第一語(yǔ)音幀對(duì)應(yīng)的第一語(yǔ)音特征,確定每個(gè)所述第一語(yǔ)音幀對(duì)應(yīng)的第一輸出向量,所述第一輸出向量中包含對(duì)應(yīng)的第一語(yǔ)音幀為靜音幀的概率,以及該第一語(yǔ)音幀包含的內(nèi)容信息為每種語(yǔ)音元素的概率;
通過(guò)有限狀態(tài)轉(zhuǎn)換機(jī),根據(jù)每個(gè)所述第一語(yǔ)音幀對(duì)應(yīng)的第一輸出向量,確定所述待處理的語(yǔ)音信息中的有效語(yǔ)音段對(duì)應(yīng)的目標(biāo)語(yǔ)音元素序列,所述有效語(yǔ)音段為確定出的所述待處理的語(yǔ)音信息中的起始端點(diǎn)和結(jié)束端點(diǎn)之間包含的第一語(yǔ)音幀。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,任意相鄰的兩個(gè)第一語(yǔ)音幀之間存在設(shè)定時(shí)長(zhǎng)的重疊。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述聲學(xué)模型通過(guò)如下方式訓(xùn)練:
獲取樣本集中的任一語(yǔ)音信息樣本,將所述語(yǔ)音信息樣本劃分為多個(gè)第二語(yǔ)音幀,并提取每個(gè)所述第二語(yǔ)音幀對(duì)應(yīng)的第二語(yǔ)音特征,其中,每個(gè)所述第二語(yǔ)音幀的標(biāo)簽用于標(biāo)識(shí)對(duì)應(yīng)的第二語(yǔ)音幀為靜音幀的第一標(biāo)識(shí)值,或該第二語(yǔ)音幀包含的語(yǔ)音元素的第二標(biāo)識(shí)值;
通過(guò)神經(jīng)網(wǎng)絡(luò)模型,依次根據(jù)每個(gè)所述第二語(yǔ)音幀對(duì)應(yīng)的第二語(yǔ)音特征,獲得每個(gè)所述第二語(yǔ)音特征對(duì)應(yīng)的第二輸出向量,所述第二輸出向量中包含對(duì)應(yīng)的第二語(yǔ)音幀為靜音幀的概率,以及該第二語(yǔ)音幀包含的內(nèi)容信息為每種語(yǔ)音元素的概率;
根據(jù)每個(gè)所述第二語(yǔ)音幀對(duì)應(yīng)的第二輸出向量以及所述第二語(yǔ)音幀對(duì)應(yīng)的標(biāo)簽,對(duì)所述神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到所述聲學(xué)模型。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過(guò)有限狀態(tài)轉(zhuǎn)換機(jī),根據(jù)每個(gè)所述第一語(yǔ)音幀對(duì)應(yīng)的第一輸出向量,確定所述待處理的語(yǔ)音信息中有效語(yǔ)音段對(duì)應(yīng)的目標(biāo)語(yǔ)音元素序列,包括:
通過(guò)有限狀態(tài)轉(zhuǎn)換機(jī),根據(jù)每個(gè)所述第一語(yǔ)音幀對(duì)應(yīng)的第一輸出向量,確定每個(gè)所述第一語(yǔ)音幀為靜音幀,或?yàn)榉庆o音幀對(duì)應(yīng)的目標(biāo)語(yǔ)音元素;
根據(jù)每個(gè)所述第一語(yǔ)音幀是否為靜音幀,確定所述待處理的語(yǔ)音信息中的有效語(yǔ)音段;以及
根據(jù)所述有效語(yǔ)音段包含的第一語(yǔ)音幀對(duì)應(yīng)的目標(biāo)語(yǔ)音元素,確定所述待處理的語(yǔ)音信息中有效語(yǔ)音段對(duì)應(yīng)的目標(biāo)語(yǔ)音元素序列。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)每個(gè)所述第一語(yǔ)音幀是否為靜音幀,確定所述待處理的語(yǔ)音信息中的有效語(yǔ)音段,以及所述有效語(yǔ)音段中包含的第一語(yǔ)音幀包括:
根據(jù)每個(gè)所述第一語(yǔ)音幀是否為靜音幀,確定所述待處理的語(yǔ)音信息中的起始端點(diǎn)和結(jié)束端點(diǎn);
將所述待處理的語(yǔ)音信息中的所述起始端點(diǎn)和結(jié)束端點(diǎn)之間包含的第一語(yǔ)音幀,確定為有效語(yǔ)音段。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述根據(jù)每個(gè)所述第一語(yǔ)音幀是否為靜音幀,確定所述待處理的語(yǔ)音信息中的起始端點(diǎn)和結(jié)束端點(diǎn),包括:
依次檢測(cè)所述待處理的語(yǔ)音信息中的每個(gè)所述第一語(yǔ)音幀是否為靜音幀,若檢測(cè)到任一為靜音幀的第一語(yǔ)音幀之后連續(xù)第一數(shù)量的第一語(yǔ)音幀均為非靜音幀,則將該靜音幀的終止點(diǎn)確定為所述待處理的語(yǔ)音信息中的起始端點(diǎn);
針對(duì)在所述起始端點(diǎn)之后每個(gè)所述第一語(yǔ)音幀,若檢測(cè)到任一為非靜音幀的第一語(yǔ)音幀之后連續(xù)第二數(shù)量的第一語(yǔ)音幀為靜音幀,則將該非靜音幀的終止點(diǎn)確定為所述待處理的語(yǔ)音信息中的結(jié)束端點(diǎn)。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述確定所述待處理的語(yǔ)音信息中有效語(yǔ)音段對(duì)應(yīng)的目標(biāo)語(yǔ)音元素序列之后,所述方法還包括:
將所述目標(biāo)語(yǔ)音元素序列分別與預(yù)先保存的每個(gè)指令語(yǔ)音元素序列進(jìn)行匹配;
若所述目標(biāo)語(yǔ)音元素序列與任一指令語(yǔ)音元素序列匹配,則確定所述待處理的語(yǔ)音信息中包含該匹配的指令語(yǔ)音元素序列對(duì)應(yīng)的指令詞;以及
確定所述指令詞對(duì)應(yīng)的操作,并執(zhí)行所述操作。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京獵戶(hù)星空科技有限公司,未經(jīng)北京獵戶(hù)星空科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911419785.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提?。蛔R(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





