[發(fā)明專利]一種語音識別控制裝置和方法有效
| 申請?zhí)枺?/td> | 202110202028.3 | 申請日: | 2021-02-23 |
| 公開(公告)號: | CN112927691B | 公開(公告)日: | 2023-01-20 |
| 發(fā)明(設(shè)計)人: | 楊國振;張佩;郭傲兵;張環(huán);王欽釗;張雷;韓斌;郭理彬;程曉燕 | 申請(專利權(quán))人: | 中國人民解放軍陸軍裝甲兵學(xué)院 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/20;G10L15/25;H04R1/08 |
| 代理公司: | 北京秉文同創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11859 | 代理人: | 張文武;孫富利 |
| 地址: | 100072 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 識別 控制 裝置 方法 | ||
1.一種語音識別控制方法,其特征在于:包括如下步驟:
步驟一:通過指紋采集器(13)對用戶進行指紋采集;
步驟二:根據(jù)用戶指紋信息從語音庫中進行語音特征信息提取;
步驟三:獲取用戶發(fā)聲階段的環(huán)境語音信息;
所述步驟三中獲取用戶發(fā)聲階段的環(huán)境語音信息采用如下方法的其中一種:方法一:通過攝像機(14)拍攝環(huán)境圖樣;根據(jù)采集到的用戶指紋信息從臉部信息存儲器(15)中提取用戶臉部特征信息并在環(huán)境圖樣中鎖定該用戶;通過開口狀態(tài)檢測單元(16)檢測該用戶是否開口說話;提取該用戶開口說話階段的環(huán)境語音信息;
方法二:通過觸發(fā)控制裝置(12)觸發(fā)進行環(huán)境語音信息的截取,所述觸發(fā)控制裝置(12)內(nèi)置喚醒裝置(121)或觸發(fā)按鈕(122);
步驟四:基于用戶的語音特征信息對環(huán)境語音信息進行處理并獲得用戶語音信息;步驟四包括:
基于用戶的語音特征信息對環(huán)境語音信息進行回聲消除和降噪;
根據(jù)處理后的語音信息在語音模型庫中進行語音匹配,并得出語音詞條;
根據(jù)語音詞條在命令詞庫中匹配,找到對應(yīng)命令詞時,將命令詞發(fā)送至主機(4),如果找不到對應(yīng)命令詞,則發(fā)送語音詞條至主機(4);或者
根據(jù)語音詞條在命令詞庫中匹配,找到對應(yīng)命令詞時,將命令詞代碼發(fā)送至主機(4),如果找不到對應(yīng)命令詞,則發(fā)送語音詞條至主機(4);
步驟五:傳輸用戶語音信息。
2.一種利用權(quán)利要求1所述的一種語音識別控制方法的語音識別控制裝置,其特征在于:包括語音獲取裝置(1)、語音識別裝置(2)、信息傳輸裝置(3)、主機(4)和供電裝置(5);所述語音獲取裝置(1)包括用于采集指紋的指紋采集器(13)和用于接收語音的麥克風(fēng)(11),所述語音獲取裝置(1)還包括觸發(fā)控制裝置(12),用于控制是否接收語音信息,以及對接收到的語音信息是否觸發(fā)后續(xù)的語音識別裝置(2),所述觸發(fā)控制裝置(12)內(nèi)置喚醒裝置(121)或觸發(fā)按鈕(122),所述語音獲取裝置(1)還包括攝像機(14)、臉部信息存儲器(15)和開口狀態(tài)檢測單元(16),所述攝像機(14)用于拍攝環(huán)境圖樣;所述臉部信息存儲器(15)與所述攝像機(14)和所述指紋采集器(13)相連,用于對用戶的臉部特征信息進行存儲和讀取;所述開口狀態(tài)檢測單元(16)用于檢測用戶是否開口;所述語音識別裝置(2)包括語音處理裝置(21)、語音匹配裝置(22)和語音轉(zhuǎn)換裝置(23),所述語音處理裝置(21)與語音獲取裝置(1)相連,用于接收語音獲取裝置(1)傳輸過來的語音信息并進行處理,所述語音處理裝置(21)包括語音庫存取裝置(213)、噪音處理裝置(211)和語音發(fā)送器(212),所述語音庫存取裝置(213)用于基于指紋采集器(13)采集的指紋信息對用戶語音特征信息進行存儲和讀取,所述噪音處理裝置(211)用于基于用戶的語音特征信息對從語音獲取裝置(1)接收到的語音信息進行回聲消除和降噪,所述語音發(fā)送器(212)用于將回聲消除和降噪后的語音信息發(fā)送給語音識別裝置(2);所述語音匹配裝置(22)與語音處理裝置(21)相連,用于對處理后的語音信息進行語音匹配并得出語音匹配結(jié)果;所述語音轉(zhuǎn)換裝置(23)與語音匹配裝置(22)和語音處理裝置(21)相連,用于對語音信息進行轉(zhuǎn)換并輸出轉(zhuǎn)換后的結(jié)果,所述語音匹配裝置(22)包括語音模型存儲芯片,所述語音模型存儲芯片內(nèi)置語音模型庫,所述語音模型庫用于將從語音處理裝置(21)處獲取的語音信息與語音模型庫進行匹配,并將匹配到的語音詞條發(fā)送給語音轉(zhuǎn)換裝置(23);所述語音轉(zhuǎn)換裝置(23)包括命令詞存儲芯片,所述命令詞存儲芯片內(nèi)置命令詞庫,所述命令詞庫與所述語音模型庫具有映射關(guān)系,當語音匹配裝置(22)匹配后的語音詞條在命令詞庫中找到對應(yīng)詞時,將發(fā)送命令詞至主機(4),如果找不到對應(yīng)詞,則發(fā)送語音詞條至主機(4),所述命令詞存儲 芯片中儲存命令詞和命令詞代碼信息,當語音匹配裝置(22)匹配后的語音詞條在命令詞庫中找到對應(yīng)詞時,將發(fā)送命令詞代碼至主機(4),如果找不到對應(yīng)詞,則發(fā)送語音詞條至主機(4);所述信息傳輸裝置(3)用于將語音識別裝置(2)發(fā)出的語音信息傳輸至主機(4);所述供電裝置(5)用于對所述語音獲取裝置(1)、語音識別裝置(2)、信息傳輸裝置(3)和主機(4)進行供電。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍陸軍裝甲兵學(xué)院,未經(jīng)中國人民解放軍陸軍裝甲兵學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110202028.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種適用于饋線終端的航空插頭線序識別工具
- 下一篇:一種大米加工裝置





