[發(fā)明專利]語音識別方法及裝置在審
| 申請?zhí)枺?/td> | 201710995212.1 | 申請日: | 2017-10-23 |
| 公開(公告)號: | CN107564525A | 公開(公告)日: | 2018-01-09 |
| 發(fā)明(設(shè)計)人: | 李明;張勇 | 申請(專利權(quán))人: | 深圳北魚信息科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/30 |
| 代理公司: | 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)11371 | 代理人: | 王術(shù)蘭 |
| 地址: | 518000 廣東省深圳市南山區(qū)粵海*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識別 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于語音識別技術(shù)領(lǐng)域,具體涉及語音識別方法及裝置。
背景技術(shù)
隨著語音識別設(shè)備的廣泛使用,如何高效提高語音識別的準確率變得日趨重要,目前的語音識別有兩類方式,一類是云端在線識別,用戶使用時可以隨意講話,由產(chǎn)品設(shè)備采集到用戶講話內(nèi)容,通過通訊模組上傳到云端服務(wù)器進行語義分析理解,解析出用戶的用意,再通過網(wǎng)絡(luò)傳到產(chǎn)品設(shè)備中進行相應(yīng)的操作控制,這種方式優(yōu)點在于用戶可自由講話,比較接近人們的日常生活習(xí)慣,但缺點在于需要網(wǎng)絡(luò)才能使用,一旦網(wǎng)絡(luò)環(huán)境不佳,將產(chǎn)生無法識別或者反饋延時的狀況;另一類是本地識別,該方式通過本地識別模組進行的本地語音控制命令詞的識別,該類方式無需使用網(wǎng)絡(luò),具有響應(yīng)速度快,控制簡單等優(yōu)點,但需要事先設(shè)定好語音控制命令詞,產(chǎn)品設(shè)備需識別到完整的語音控制命令詞后才會響應(yīng),無法實現(xiàn)自由對講,體驗感不高。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,提供一種語音識別方法及裝置,用于克服現(xiàn)有技術(shù)中的缺點。
具體的,本發(fā)明提出了以下具體的實施例:
本發(fā)明實施例提供了一種語音識別方法,包括:
獲取用戶發(fā)送的語音指令;
將所述語音指令的音頻流發(fā)送給本地識別引擎;
接收所述本地識別引擎返回的本地識別結(jié)果;
當本地識別結(jié)果不在預(yù)設(shè)范圍內(nèi)時,將所述語音指令的音頻流發(fā)送給云端識別引擎;
接收所述云端識別引擎返回的云端識別結(jié)果;
當云端識別結(jié)果在預(yù)設(shè)范圍內(nèi)時,執(zhí)行所述語音指令。
作為上述技術(shù)方案的進一步改進,所述本地識別結(jié)果不在預(yù)設(shè)范圍內(nèi)具體為:所述本地識別結(jié)果對應(yīng)的置信度小于第一預(yù)設(shè)置信度區(qū)間上限;所述云端識別結(jié)果在預(yù)設(shè)范圍內(nèi)具體為:所述云端識別結(jié)果對應(yīng)的置信度大于第二預(yù)設(shè)置信度區(qū)間上限。
作為上述技術(shù)方案的進一步改進,所述方法還包括:循環(huán)執(zhí)行所述將所述語音指令發(fā)送給云端識別引擎,直至所述云端識別引擎返回的云端識別結(jié)果在預(yù)設(shè)范圍內(nèi)或者重發(fā)次數(shù)達到最大發(fā)送次數(shù)。
作為上述技術(shù)方案的進一步改進,所述方法還包括:在初始化和/或根據(jù)用戶輸入,設(shè)置所述最大發(fā)送次數(shù)。
作為上述技術(shù)方案的進一步改進,所述方法還包括:接收到用戶發(fā)送的語音指令后,開啟所述本地識別引擎,當本地識別結(jié)果不在預(yù)設(shè)范圍內(nèi)時,開啟所述云端識別引擎。
本發(fā)明實施例還提供了一種語音識別裝置,包括:
語音獲取模塊,用于獲取用戶發(fā)送的語音指令;
第一發(fā)送模塊,用于將所述語音指令的音頻流發(fā)送給本地識別引擎;
第一接收模塊,用于接收所述本地識別引擎返回的本地識別結(jié)果;
第一判斷模塊,用于判斷所述本地識別結(jié)果是否在預(yù)設(shè)范圍內(nèi),當本地識別結(jié)果在預(yù)設(shè)范圍內(nèi)時,執(zhí)行所述語音指令,當本地識別結(jié)果不在預(yù)設(shè)范圍內(nèi)時,執(zhí)行云端識別;
第二發(fā)送模塊,用于所述第一判斷模塊判斷本地識別結(jié)果不在預(yù)設(shè)范圍內(nèi)時將所述語音指令的音頻流發(fā)送給云端識別引擎;
第二接收模塊,用于接收所述云端識別引擎返回的云端識別結(jié)果;
第二判斷模塊,用于判斷所述云端識別結(jié)果是否在預(yù)設(shè)范圍內(nèi),當云端識別結(jié)果在預(yù)設(shè)范圍內(nèi)時,執(zhí)行所述語音指令,當云端識別結(jié)果不在預(yù)設(shè)范圍內(nèi)時,則發(fā)出無效指令提示;
執(zhí)行模塊,用于執(zhí)行所述語音指令。
作為上述技術(shù)方案的進一步改進,所述第一判斷模塊判定本地識別結(jié)果不在預(yù)設(shè)范圍內(nèi)的依據(jù)具體為:所述本地識別結(jié)果對應(yīng)的置信度小于第一預(yù)設(shè)置信度區(qū)間上限;所述第二判斷模塊判定云端識別結(jié)果在預(yù)設(shè)范圍內(nèi)的依據(jù)具體為:所述云端識別結(jié)果對應(yīng)的置信度大于第二預(yù)設(shè)置信度區(qū)間上限。
作為上述技術(shù)方案的進一步改進,還包括重發(fā)模塊,用于循環(huán)執(zhí)行所述將所述語音指令發(fā)送給云端識別引擎,直至所述云端識別引擎返回的云端識別結(jié)果在預(yù)設(shè)范圍內(nèi)或者重發(fā)次數(shù)達到最大發(fā)送次數(shù)。
作為上述技術(shù)方案的進一步改進,還包括設(shè)置模塊,用于在初始化和/或根據(jù)用戶輸入,設(shè)置所述最大發(fā)送次數(shù)。
作為上述技術(shù)方案的進一步改進,還包括觸發(fā)模塊,用于在接收到用戶發(fā)送的語音指令后,開啟所述本地識別引擎,當本地識別結(jié)果不在預(yù)設(shè)范圍內(nèi)時,開啟所述云端識別引擎。
采用本發(fā)明提供的技術(shù)方案,與已有的公知技術(shù)相比,至少具有如下有益效果:響應(yīng)速度快和控制簡單。本地識別不成功后將所述語音指令上送云端進行識別,消耗的網(wǎng)絡(luò)數(shù)據(jù)流量比每次上送云端識別更加節(jié)省流量。保證語音指令能夠有效識別。
附圖說明
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳北魚信息科技有限公司,未經(jīng)深圳北魚信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710995212.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





