[發(fā)明專(zhuān)利]連續(xù)喚醒識(shí)別功能的優(yōu)化方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201911379635.6 | 申請(qǐng)日: | 2019-12-27 |
| 公開(kāi)(公告)號(hào): | CN111128166B | 公開(kāi)(公告)日: | 2022-11-25 |
| 發(fā)明(設(shè)計(jì))人: | 李路天;甘津瑞 | 申請(qǐng)(專(zhuān)利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類(lèi)號(hào): | G10L15/22 | 分類(lèi)號(hào): | G10L15/22;G10L15/26;G10L15/30;G10L25/78;H04L67/5683 |
| 代理公司: | 北京商專(zhuān)永信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 黃謙;鄧婷婷 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 連續(xù) 喚醒 識(shí)別 功能 優(yōu)化 方法 裝置 | ||
1.一種連續(xù)喚醒識(shí)別功能的優(yōu)化方法,包括:
持續(xù)接收音頻直至檢測(cè)到喚醒詞;
對(duì)包含喚醒詞的第一音頻進(jìn)行語(yǔ)音識(shí)別以形成第一語(yǔ)音識(shí)別結(jié)果,并在預(yù)設(shè)時(shí)間內(nèi)繼續(xù)緩存所述第一音頻之后接收的第二音頻;
判斷所述第一語(yǔ)音識(shí)別結(jié)果中是否包含除喚醒詞外的語(yǔ)音;
若所述第一語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,判斷對(duì)于所述第二音頻的語(yǔ)音活性檢測(cè)是否超時(shí);
若所述語(yǔ)音活性檢測(cè)未超時(shí),對(duì)所述第二音頻進(jìn)行語(yǔ)音識(shí)別以形成第二語(yǔ)音識(shí)別結(jié)果;
若所述第二語(yǔ)音識(shí)別結(jié)果中包含除喚醒詞外的語(yǔ)音,回調(diào)所述第二語(yǔ)音識(shí)別結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其中,在對(duì)所述第二音頻進(jìn)行語(yǔ)音識(shí)別以形成第二語(yǔ)音識(shí)別結(jié)果之后,所述方法還包括:
若所述第二語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,拋出識(shí)別為空的結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法,其中,在所述判斷所述第一語(yǔ)音識(shí)別結(jié)果中是否包含除喚醒詞外的語(yǔ)音之后,所述方法還包括:
若所述第一語(yǔ)音識(shí)別結(jié)果中包含除喚醒詞外的語(yǔ)音,回調(diào)所述第一語(yǔ)音識(shí)別結(jié)果。
4.根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的方法,其中,在所述若所述第一語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,判斷對(duì)于所述第二音頻的語(yǔ)音活性檢測(cè)是否超時(shí)之后,所述方法還包括:
若所述語(yǔ)音活性檢測(cè)超時(shí),拋出識(shí)別為空的結(jié)果。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述在預(yù)設(shè)時(shí)間內(nèi)繼續(xù)緩存第一音頻之后接收的第二音頻包括:
在檢測(cè)到喚醒詞之后繼續(xù)緩存第一音頻之后接收的第二音頻直至接收到所述第一語(yǔ)音識(shí)別結(jié)果后停止緩存。
6.一種連續(xù)喚醒識(shí)別功能的優(yōu)化裝置,包括:
喚醒檢測(cè)模塊,配置為持續(xù)接收音頻直至檢測(cè)到喚醒詞;
第一識(shí)別模塊,配置為對(duì)包含喚醒詞的音頻進(jìn)行語(yǔ)音識(shí)別以形成第一語(yǔ)音識(shí)別結(jié)果,并在預(yù)設(shè)時(shí)間內(nèi)繼續(xù)緩存第一音頻之后接收的第二音頻;
識(shí)別判斷模塊,配置為判斷所述第一語(yǔ)音識(shí)別結(jié)果中是否包含除喚醒詞外的語(yǔ)音;
超時(shí)判斷模塊,配置為若所述第一語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,判斷對(duì)于所述第二音頻的語(yǔ)音活性檢測(cè)是否超時(shí);
第二識(shí)別模塊,配置為若所述語(yǔ)音活性檢測(cè)未超時(shí),對(duì)所述第二音頻進(jìn)行語(yǔ)音識(shí)別以形成第二語(yǔ)音識(shí)別結(jié)果;
回調(diào)模塊,配置為若所述第二語(yǔ)音識(shí)別結(jié)果中包含除喚醒詞外的語(yǔ)音,回調(diào)所述第二語(yǔ)音識(shí)別結(jié)果。
7.根據(jù)權(quán)利要求6所述的裝置,其中,所述裝置還包括:
錯(cuò)誤拋出模塊,配置為若所述第二語(yǔ)音識(shí)別結(jié)果中不包含除喚醒詞外的語(yǔ)音,拋出識(shí)別為空的結(jié)果。
8.根據(jù)權(quán)利要求6所述的裝置,其中,所述回調(diào)模塊還配置為:
若所述第一語(yǔ)音識(shí)別結(jié)果中包含除喚醒詞外的語(yǔ)音,回調(diào)所述第一語(yǔ)音識(shí)別結(jié)果。
9.一種電子設(shè)備,其包括:至少一個(gè)處理器,以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行權(quán)利要求1至5任一項(xiàng)所述方法的步驟。
10.一種存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,所述程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)權(quán)利要求1至5任一項(xiàng)所述方法的步驟。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911379635.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提取;識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板;訓(xùn)練語(yǔ)音識(shí)別系統(tǒng),例如對(duì)說(shuō)話(huà)者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類(lèi)或檢索
G10L15-20 .專(zhuān)門(mén)適用于不利環(huán)境
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





