[發(fā)明專利]一種語音控制指令的識別方法及裝置在審
| 申請?zhí)枺?/td> | 201611144824.1 | 申請日: | 2016-12-13 |
| 公開(公告)號: | CN108231063A | 公開(公告)日: | 2018-06-29 |
| 發(fā)明(設(shè)計)人: | 金杰敏 | 申請(專利權(quán))人: | 中國移動通信有限公司研究院;中國移動通信集團公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/08;G10L15/18;G10L15/22 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 朱佳 |
| 地址: | 100053 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音控制指令 特征參數(shù) 樣本語音 發(fā)音 語音樣本 語音特征參數(shù) 控制指令 預(yù)先存儲 匹配 地方方言 匹配成功 用戶體驗 語音控制 方言 判定 | ||
本發(fā)明涉及語音控制技術(shù)領(lǐng)域,特別涉及一種語音控制指令的識別方法及裝置。該方法為:獲取接收到的語音控制指令的發(fā)音和語調(diào)特點,并基于上述發(fā)音和語調(diào)特點,將該語音特征參數(shù)與預(yù)先存儲的語音樣本對應(yīng)的樣本語音特征參數(shù)進行匹配,并在判定該語音特征參數(shù)與任意一個樣本語音特征參數(shù)匹配成功時,確定上述任意一個樣本語音特征參數(shù)對應(yīng)的語音樣本表征的控制指令,并執(zhí)行上述控制指令。采用上述方法,根據(jù)語音控制指令的發(fā)音和語調(diào)特點,與預(yù)先存儲的全國區(qū)域內(nèi)各地區(qū)的不同地方方言對應(yīng)的語音樣本的樣本語音特征參數(shù)的發(fā)音和語調(diào)特點進行匹配,這樣,就可以正確識別出不同地方的方言,從而提升了用戶體驗。
技術(shù)領(lǐng)域
本發(fā)明涉及語音控制技術(shù)領(lǐng)域,特別涉及一種語音控制指令的識別方法及裝置。
背景技術(shù)
隨著科學(xué)技術(shù)的不斷發(fā)展,語音識別技術(shù)的不斷進步,越來越多的智能設(shè)備可通過語音控制來完成相應(yīng)的控制操作,這樣,在使用智能設(shè)備時,通過語音控制智能設(shè)備完成相應(yīng)的控制操作,提高了用戶使用智能設(shè)備的方便性、安全性以及娛樂性。
現(xiàn)有技術(shù)中,通常采用以下語音控制指令的識別方法來完成用戶針對智能設(shè)備的語音控制操作:
智能設(shè)備在接收到用戶發(fā)出的語音控制指令時,基于接收到的語音控制指令,以及預(yù)先設(shè)置的各語音控制指令與各控制操作代碼之間的映射關(guān)系,確定與接收到的語音控制指令相對應(yīng)的控制操作代碼,并基于上述已確定的控制操作代碼完成相應(yīng)的控制操作。
然而,采用上述語音控制指令的識別方法,只針對普通話的識別率較高,而針對不同地域的不同地方方言的識別率較低,甚至不能識別。這樣,就限制了用戶使用的語言種類,對于年齡較大,不會普通話甚至聽不懂普通話的老人,就不能很好的通過語音來控制智能設(shè)備,那么,就給老人帶來極大的不便。
綜上所述,需要設(shè)計一種新的語音控制指令的識別方法來彌補現(xiàn)有技術(shù)中存在的缺陷和不足之處。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種語音控制指令的識別方法及裝置,用以解決現(xiàn)有技術(shù)中存在的針對地方方言的識別率較低,甚至不能識別的問題。
本發(fā)明實施例提供的具體技術(shù)方案如下:
一種語音控制指令的識別方法,包括:
對接收的語音控制指令進行解析,獲取所述語音控制指令的語音特征參數(shù),其中,所述語音特征參數(shù)表征所述語音控制指令的發(fā)音和語調(diào)特點;
將所述語音特征參數(shù)與預(yù)先存儲的語音樣本對應(yīng)的樣本語音特征參數(shù)進行匹配;
在判定所述語音特征參數(shù)與任意一個樣本語音特征參數(shù)匹配成功時,確定所述任意一個樣本語音特征參數(shù)對應(yīng)的語音樣本表征的的控制指令,并執(zhí)行所述控制指令。
可選的,在對接收的語音控制指令進行解析之前,還包括:
在采集各地區(qū)的語音樣本時,分別獲取每一個語音樣本對應(yīng)的樣本語音特征參數(shù),其中,所述樣本語音特征參數(shù)表征所述語音樣本的發(fā)音和語調(diào)特點;
將獲取到的每一個語音樣本對應(yīng)的樣本語音特征參數(shù)進行分類處理,并針對每一類樣本語音特征參數(shù)設(shè)置相應(yīng)的優(yōu)先級順序;
將采集到的每一個語音樣本對應(yīng)的樣本語音特征參數(shù)存儲在指定位置。
可選的,將獲取到的每一個語音樣本對應(yīng)的樣本語音特征參數(shù)進行分類處理,包括:
采用最鄰近結(jié)點算法KNN對獲取到的每一個語音樣本對應(yīng)的樣本語音特征參數(shù)進行分類處理。
可選的,針對每一類樣本語音特征參數(shù)設(shè)置相應(yīng)的優(yōu)先級順序,包括:
將用戶在應(yīng)用程序中使用頻率達到設(shè)定門限的語言對應(yīng)的語音樣本的樣本語音特征參數(shù),設(shè)置為第一優(yōu)先級的樣本語音特征參數(shù)類;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國移動通信有限公司研究院;中國移動通信集團公司,未經(jīng)中國移動通信有限公司研究院;中國移動通信集團公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611144824.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





